Wetenschap

Kwaliteit van huisartsgeneeskundig handelen moeilijk te meten

Samenvatting

Braspenning J, Schiere AM, Van Roosmalen M, Mokkink H, Grol RPTM. Kwaliteit van huisartsgeneeskundig handelen moeilijk te meten. Een literatuuroverzicht over 1997-2003. Huisarts Wet 2004;47(4):184-7. Doel Het evalueren van het feitelijk medisch handelen in de Nederlandse huisartsenpraktijk. Methode Systematisch literatuuroverzicht over de periode 1997-2003. Resultaat Eenendertig onderzoeken voldeden aan de inclusiecriteria. De geboden informatie ging over een beperkt deel van het huisartsgeneeskundig handelen; het merendeel chronische aandoeningen (77,8%), waaronder astma en COPD (n=6), diabetes (n=5) en risicomanagement van cardiovasculaire aandoeningen (n=5). Niet alleen verschilde de manier van meten tussen de diverse aandoeningen, ook werd het handelen van de huisartsen bij dezelfde aandoening in de verschillende onderzoeken telkens anders gemeten. De overeenstemming tussen het feitelijk medisch handelen en de aanbevelingen lag gemiddeld op 62,4%, maar varieerde sterk (bereik14,3-90,1%). Conclusie De beschikbare onderzoeken bieden onvoldoende aanknopingspunten om het feitelijk medisch handelen van huisartsen valide en betrouwbaar te evalueren. Om het feitelijk medisch handelen transparant te maken is een systematische aanpak noodzakelijk waarbij er voor meer aandoeningen indicatoren moeten worden ontwikkeld.

Inleiding

Hoewel in de samenleving de behoefte aan informatie over de kwaliteit van de patiëntenzorg groeit, is de informatie over de zorg in de Nederlandse huisartsenpraktijk schaars. Nu is het nog maar de vraag of de kwaliteit van zorg te meten is. We hebben weliswaar enkele meetinstrumenten voor de praktijkvoering,1de communicatie tussen arts en patiënt234en het oordeel van de patiënt over de zorg,5678maar over valide en betrouwbare meetinstrumenten om het feitelijk medisch handelen te meten is nog weinig bekend. Wij hebben een literatuuronderzoek uitgevoerd naar meetinstrumenten om het medisch-technisch handelen in de huisartsenpraktijk te bepalen en om na te gaan of dit handelen in overeenstemming is met de geformuleerde kwaliteitscriteria, zoals NHG-Standaarden. In dit overzicht beschrijven wij de ‘kwaliteit’ van het feitelijk medisch handelen op basis van een literatuuronderzoek over een tijdsvak van bijna zeven jaar: 1997-2003. Wij onderzochten over welke aandoeningen en verrichtingen informatie bekend is over het feitelijk handelen en of dat in overeenstemming is met achterliggende aanbevelingen. Daarbij gingen wij na of een verschil in handelen gerelateerd was aan het gehanteerde kwaliteitscriterium (NHG-Standaard of andere aanbeveling); de aandoening (chronisch of niet-chronisch) en de verrichting, waarbij wij een onderscheid maakten naar preventie, diagnostiek, educatie, prescriptie, verwijzing of follow-up.

Tabel1 Gebruikte zoektermen
MESH-termen
Engelstalig: family practice/general practice AND quality of care, audit, clinical competence, feedback, guideline adherence/compliance, healthcare peer review, healthcare quality indicators/assurance, total quality management, quality control of continuous quality improvement.
Nederlandstalig: huisarts(praktijk) EN visitatie, kwaliteit van zorg, deskundigheid(sbevordering), standaarden/richtlijnen, kwaliteitsbevordering, -bewaking, -management, -verbetering, -indicatoren, borging, systeem, gezondheidszorgonderzoek, implementatie, (klinische) (deskundigheids) educatie of intervisie.

Methode

Aan de hand van zoektermen over de huisartsgeneeskunde en kwaliteit van zorg hebben wij in 2 elektronische databases (Medline en Picarta) gezocht naar Engels- en Nederlandstalige artikelen (gerefereerde tijdschriften) gepubliceerd in de periode 1997-2003 (tot november 2003). In tabel 1 staan de gebruikte MESH-termen. Dit leverde 2193 treffers op, waarvan 121 betrekking hadden op Nederlandse huisartsen. Wij hebben de artikelen beoordeeld op de volgende inclusiecriteria:

  • feitelijk handelen gemeten (geen vignetonderzoeken of opinies);
  • kwaliteitscriterium aanwezig (NHG-Standaard of mening van experts);
  • methodologische kwaliteit van het onderzoek (minimaal 5 praktijken, normale gang van zaken, gepresenteerde resultaten zijn herkenbaar af te leiden uit de analyses).

Wat is bekend?

  • Onze kennis over de kwaliteit van de geleverde zorg in de huisartsenpraktijk is beperkt.

Wat is nieuw?

  • In de afgelopen 7 jaar verschenen 31 Nederlandse onderzoeken waarin het feitelijk handelen is getoetst aan richtlijnen. De onderzoeken gaan vooral over een beperkt aantal chronische aandoeningen.
  • Betrouwbare en valide meetinstrumenten om het huisartsgeneeskundig handelen transparant te maken zijn schaars.ª

De artikelen zijn beoordeeld op vooraf ontworpen scoringsformulieren waarop naast de inclusiecriteria ruimte was voor een inhoudelijke beschrijving aan de hand van de volgende punten: onderzoeksonderwerp (aandoening en verrichting), onderzoekspopulatie (aantal huisartsen en patiënten) en de resultaten, dat wil zeggen in welke mate het feitelijk medisch handelen in overeenstemming was met het kwaliteitscriterium. Het handelen uitgedrukt in maat en getal wordt een indicator genoemd. Analoog aan de indeling van Donabedian hielden wij een onderscheid aan tussen structuur-, proces- of uitkomstindicatoren.9Voor de diabeteszorg bijvoorbeeld, is het houden van een diabetesspreekuur een structuurindicator, het wel of niet uitvoeren van voetonderzoek bij de jaarlijkse controle is een procesindicator en de HbA1c-waarde een uitkomstindicator (een proxy voor het aantal complicaties gedurende een bepaalde tijdsperiode). Als er sprake was van een interventieonderzoek, dan zijn alleen de gegevens van de voormeting gebruikt. De scoringsformulieren zijn door twee personen (JB, AMS of MH) afzonderlijk ingevuld. Eventuele meningsverschillen werden door discussie opgelost en indien nodig werd een derde persoon geconsulteerd.

De kwaliteit van het medisch handelen beoordeelden we door het in de artikelen beschreven en gemeten handelen af te zetten tegen het gehanteerde kwaliteitscriterium en uit te drukken in een percentage. Als in een artikel meer dan één meting is beschreven dan hebben wij de percentages opgeteld en gemiddeld. Het gebruikte overall percentage is steeds zodanig beschreven dat de hoogte van het percentage de mate van overeenstemming weerspiegelt tussen handelen en aanbeveling. Er is een onderscheid gemaakt naar structuur-, proces- en uitkomstindicatoren. Als in één onderzoek meerdere typen metingen (structuur, proces of uitkomst) zijn verricht, dan is/zijn voor het gemiddelde alleen de procesindicator(en) meegenomen met het oog op de mogelijke afhankelijkheid tussen de verschillende typen metingen. Met een variantieanalyse toetsten we of de volgende determinanten van invloed zijn op de mate van handelen volgens de aanbeveling: het type kwaliteitscriterium, de soort aandoening en het type verrichting. Het aantal deelnemende huisartsen(praktijken) en het aantal patiënten dan wel beslissingen zijn als covariaat in het model meegenomen. Er is eenzijdig getoetst, waarbij we een significantieniveau van p

Resultaten

Van de 121 beoordeelde artikelen voldeden 31 aan de inclusiecriteria; de lijst van geselecteerde artikelen staat op de website: http://nhg.artsennet.nl. De grootste uitval ontstond omdat er geen feitelijk handelen werd beschreven (n=77). Nog eens 5 artikelen vielen af omdat dezelfde gegevens in meerdere artikelen werden gepresenteerd (éénmaal opgenomen). Vier artikelen voldeden niet aan onze methodologische voorwaarden en in 4 artikelen werd geen kwaliteitscriterium genoemd.

De 31 onderzoeken gaan over een beperkt aantal aandoeningen: 6 over astma en COPD bij volwassen, 5 over diabetes, 5 over risicomanagement bij hart- en vaatziekten; één over cholesterol en één over hypertensie ( tabel 2, website: http://nhg.artsennet.nl). Twee onderzoeken beschrijven cervixscreening en één influenzavaccinatie. De andere onderwerpen betreffen dementie, darmklachten, HIV-infectie, (dreigende) miskraam, verloskunde, otitis media acuta, en het achterhalen van de reden van het consult. Daarnaast worden soms meerdere onderwerpen in één artikel beschreven. In één artikel worden 10 onderwerpen behandeld, waaronder otitis media acuta, diabetes en hypertensie; één artikel gaat over diverse testaanvragen bij 16 aandoeningen en één artikel gaat in op 251 voorgeschreven middelen (medicatie). Bij 16 van de 31 onderzoeken ging het om één of meerdere NHG-Standaarden. In 21 onderzoeken (77,8%) was er sprake van een chronische aandoening. De onderzochte verrichtingen liepen sterk uiteen, maar zowel preventie, diagnostiek, educatie, prescriptie, verwijzing als follow-up kwamen voor; preventie inclusief de diabeteszorg en de cardiovasculaire aandoeningen (13 onderzoeken) en prescriptie (11 onderzoeken) nog het meest. Per type verrichting werd soms één handeling gemeten, maar vaak ging het om meerdere (het maximum lag op 44).

De gedane metingen betroffen doorgaans procesindicatoren (22 onderzoeken), in vier onderzoeken was sprake van alleen structuurindicatoren en in één onderzoek ging het alleen om uitkomstindicatoren. Procesindicatoren zijn in één onderzoek gecombineerd met structuurindicatoren, in twee onderzoeken met uitkomstindicatoren en in één onderzoek met beide. De relatie tussen het type indicator en de kwaliteit van het handelen kon niet getoetst worden omdat het aantal onderzoeken met structuur- en uitkomstindicatoren te gering was: respectievelijk 6 en 4. De overeenstemming tussen handelen en aanbeveling varieerde voor de structuurindicatoren van 13,7% tot 57,4%, voor de procesindicatoren van 14,3% tot 90,1% en voor de uitkomstindicatoren van 38,9% tot 70,9%. Op itemniveau varieerde het handelen nog sterker met een minimum van 10,5% (registratie preventieve activiteiten en teamoverleg) en een maximum van 96,5% (geen testaanvragen bij darmklachten). Het gemiddelde percentage voor de procesindicatoren was 62,4% (SD 21,1).

Voor het determinantenonderzoek hebben we ons beperkt tot de procesindicatoren en eerst gekeken naar de invloed van het kwaliteitscriterium (28 onderzoeken). Huisartsen volgden in deze onderzoeken de NHG-Standaarden niet beter dan de adviezen van experts: 58,5% van de aanbevelingen uit de NHG-Standaarden werd gevolgd ( tabel 3) en 67,6% van de aanbevelingen van de experts (meestal onderdeel van het onderzoeksteam). Vervolgens hebben we in één model het soort aandoening en het type verrichting getoetst. Voor de aandoeningen hebben we op basis van de beschikbare onderzoeken gekozen voor een onderscheid in chronische en niet-chronische aandoeningen en in wel of geen preventietaken, waarbij de procesindicatoren in de diabetesonderzoeken zijn geduid als preventietaken (26 onderzoeken, zie tabel 3). Voor chronische aandoeningen is de overeenstemming tussen handelen en aanbeveling iets lager dan voor niet-chronische aandoeningen (58,7% versus 70,3%), maar dit verschil was niet significant. We vonden geen significant verschil tussen aanbevelingen voor preventieactiviteiten (64,8%) en de andere verrichtingen (59,3%). De aanbevelingen worden minder goed gevolgd als het om voorschrijven van medicatie gaat (53,3%) dan wanneer het andere verrichtingen betreft (67,1%), maar ook dit verschil voldoet niet aan het gestelde significantieniveau.

Tabel3De invloed van het gehanteerde kwaliteitscriterium, soort van aandoening en type van activiteit (preventie, prescriptie) op het
gemiddeldpercentagespreiding(SD)paantalonderzoeken
KwaliteitscriteriumNHG-Standaard:
– nee67,615,90,13512
– ja58,524,116
Chronischeaandoening:
– nee70,327,80,4315
– ja58,720,819
Preventie-activiteiten:
– nee59,320,10,25815
– ja64,826,49
Prescriptie-indicatoren:
– ja67,122,30,05814
– nee53,320,610

Beschouwing

Onze resultaten laten vooral zien dat er nog weinig harde gegevens zijn over de overeenstemming tussen het feitelijk handelen en allerlei aanbevelingen voor het medisch handelen door de huisarts. In totaal hebben we voor een periode van bijna 7 jaar (1997-2003) 31 onderzoeken gevonden. Het ging daarbij vaak om astma en COPD, diabetes en risicomanagement van hart- en vaatziekten, maar het onderzochte handelen voor deze aandoeningen liep sterk uiteen. Ook voor de andere aandoeningen zien we een breed scala aan onderzochte verrichtingen. Als we naar de mate van overeenstemming tussen handelen en de verschillende aanbevelingen kijken, dan is het meest opvallende resultaat de enorme variatie. De variatie is eigenlijk nog groter dan beschreven, omdat wij ervoor gekozen hebben de verrichtingen per onderzoek te sommeren en te middelen. Wij hebben geprobeerd om de kwaliteit van het feitelijk medisch handelen vast te stellen. Overal was het percentage handelen door huisartsen volgens de richtlijnen voor de procesindicatoren 62,4%. In tabel 2 wordt echter bij een drietal onderzoeken aangegeven dat de onderzochte praktijken al gedurende langere tijd in het meten van medisch handelen werden geschoold. Het genoemde percentage is dus eerder een overschatting dan een onderschatting. De determinantenanalyse leverde geen significante resultaten op. De aantallen onderzoeken zijn echter ook erg klein. Hoe gevarieerder de onderzoeken zijn, des te meer hebben we er eigenlijk nodig om betrouwbare uitspraken te kunnen doen. Het lijkt erop dat het voorschrijven minder conform de richtlijnen wordt uitgevoerd dan andere verrichtingen, met name bij chronische aandoeningen. NHG-Standaarden worden blijkbaar niet beter gevolgd dan andere richtlijnen, maar het gegeven dat de aanbevelingen van experts vaak afkomstig waren van het onderzoeksteam kan hierin een factor van betekenis zijn geweest. Een deel van de variatie zou nog te maken kunnen hebben met het registeren in het medische dossier. De meeste onderzoeken (n=23) hebben voor hun gegevens gebruikgemaakt van het (elektronisch) medisch dossier en in de andere acht onderzoeken is gebruikgemaakt van registratielijsten. Zoals bekend zijn niet alle gegevens terug te vinden in een medisch dossier. Onze conclusie komt overeen met die van vergelijkbare overzichtsartikelen uit de Verenigde Staten over de eerste- en tweedelijnsgezondheidszorg en uit Groot-Brittannië over de huisartsenpraktijk.1011De onderwerpen hebben ook daar voor het merendeel betrekking op chronische aandoeningen. De geconstateer- de variatie in handelen leidde daar tot een kwaliteitssysteem met feedback over de geleverde zorg en discussies over aanpassingen van de onderzoeks-, klinische en de politieke agenda. Voordat er strategieën ter verbetering ontwikkeld kunnen worden, moet volgens ons eerst een meer basale vraag beantwoord worden, namelijk in welke mate daadwerkelijk op valide wijze de kwaliteit van zorg is gemeten. Maar zelden troffen wij een systematische afweging van geschikte indicatoren aan. Over de validiteit en betrouwbaarheid van de gebruikte indicatoren werd in geen enkel onderzoek gerapporteerd. Zijn de indicatoren in de onderzoeken systematisch afgewogen? Hoe is het mogelijk dat zelfs indicatoren over dezelfde aandoeningen zo verschillend zijn? Hoe komt het dat bij de ene aandoening zoveel meer volgens een aanbeveling wordt gehandeld dan bij een andere aandoening? Veel vragen blijven nog onbeantwoord. We blijken eigenlijk niet goed te weten hoe we de kwaliteit van het huisartsgeneeskundig handelen moeten meten en welke instrumenten daarbij valide en betrouwbaar zijn. Voor een kwaliteitssysteem in de Nederlandse huisartsenpraktijk hebben we valide en betrouwbare kwaliteitsindicatoren nodig. Deze indicatoren zouden een breed palet van zorg (aandoeningen en verrichtingen) moeten beslaan. In het kader van de tweede Nationale Studie zijn binnen het Landelijk Informatie Netwerk Huisartsenzorg (LINH) gegevens verzameld voor 139 kwaliteitsindicatoren die op systematische wijze zijn geconstrueerd en zijn gebaseerd op 70 NHG-Standaarden.121314Naast indicatoren op het medisch-technische gebied zou ook aandacht moeten zijn voor andere aspecten van kwaliteit van zorg, zoals de praktijkorganisatie, de arts-patiëntcommunicatie en het oordeel van de patiënt over alle aspecten. Veel meetinstrumenten zijn al ontwikkeld,12345678maar de meeste zijn nogal arbeidsintensief als het gaat om het verkrijgen van gegevens. Transparantie van kwaliteit en doelmatigheid van zorg in de huisartsenpraktijk vereisen ook een realistische methode van gegevensverzameling. Alleen dan kan de zorg getoetst worden tegen duidelijke kwaliteitscriteria, tussen praktijken en in een tijdsbestek

Literatuur

Reacties

Er zijn nog geen reacties

Verder lezen