Wetenschap

Onderbouwing diagnostisch proces NHG-Standaarden

0 reacties
Gepubliceerd
3 augustus 2017
Dossier

Samenvatting

Verhagen AP, Bohnen, AM. Onderbouwing diagnostisch proces NHG-Standaarden. Huisarts Wet 2017;60(8):387-92.
De richtlijnen voor de huisarts (NHG-Standaarden) bevatten onder andere aanbevelingen voor het diagnostisch proces. Hoe beter deze aanbevelingen zijn onderbouwd, hoe beter het diagnostisch proces verloopt. Een richtlijncommissie onderbouwt de aanbevelingen met het beste bewijs dat voorhanden is. Ons onderzoek heeft tot doel inzicht te krijgen in de lacunes in de onderbouwing van de diagnostische aanbevelingen in richtlijnen. Hierbij gaan we ervan uit dat het gevonden bewijs voor de aanbevelingen een adequate reflectie is van de aanwezige literatuur/bewijzen.
Bij elf NHG-Standaarden over het bewegingsapparaat hebben twee beoordelaars per diagnostische aanbeveling de mate van het gevonden bewijs gescoord en in vijf categorieën ondergebracht (van geen wetenschappelijk bewijs tot een systematische review).
We vonden 101 diagnostische aanbevelingen. Ruim 37% van de aanbevelingen was met goed bewijs onderbouwd en voor ruim 36% van de aanbevelingen was er geen bewijs gevonden. Vooral aanbevelingen om geen aanvullend onderzoek uit te voeren waren gebaseerd op goed bewijs (54,2%). Bij de onderbouwing van de aanbevelingen was echter veelal sprake van onderzoek uit de tweede lijn.
Voor ruim een derde van de diagnostische aanbevelingen voor het bewegingsapparaat ontbreekt wetenschappelijk bewijs, waardoor de diagnostische onzekerheid daarvan onbekend is. Er is meer onderzoek nodig op het gebied van eenvoudige diagnostiek van het bewegingsapparaat in de eerste lijn.

Wat is bekend?

  • Valide en betrouwbare diagnostiek vermindert de diagnostische onzekerheid.

Wat is nieuw?

  • De meeste aanbevelingen in NGH-Standaarden over het bewegingsapparaat die zijn gebaseerd op de anamnese konden niet goed wetenschappelijk worden onderbouwd.
  • De meeste diagnostische aanbevelingen om iets niet te doen (bijvoorbeeld geen röntgenfoto’s) waren gebaseerd op goed wetenschappelijk bewijs.

Inleiding

Een goed en duidelijk diagnostisch proces is essentieel voor het stellen van een diagnose (werkhypothese), en de daaruit voortvloeiende prognose en het behandelplan.12 Elke vraag tijdens de anamnese en elke bevinding bij de inspectie of het lichamelijk onderzoek zijn een diagnostische test die de achterafkans op een aandoening vergroot of verkleint. Volgens de WHO betreft 5% van de kosten in de gezondheidszorg diagnostiek, maar heeft deze diagnostiek invloed op 60 tot 70% van de kosten in de gezondheidszorg.3 Verbetering van het diagnostisch proces in de huisartsenzorg en een daaraan gekoppeld rationeel aanvraagbeleid (het voorkomen van onnodige diagnostiek op basis van een onjuiste indicatie) kunnen bijdragen aan het gerichter verwijzen naar de tweede lijn.1 Idealiter zijn alle aanbevelingen in richtlijnen goed wetenschappelijk onderbouwd. Bij een gebrek aan wetenschappelijk bewijs kan men er bij richtlijnen voor kiezen aanbevelingen te doen op basis van expertopinie. Het doel van dit onderzoek is om zicht te krijgen in de mate van wetenschappelijke onderbouwing van de diagnostische aanbevelingen in NHG-Standaarden.

Methode

Onderzoeksopzet

We selecteerden NHG-Standaarden uit een gebied waar de huisarts veel mee te maken heeft, namelijk het bewegingsapparaat (hoofdstuk L), zoals beschreven in de uitgave van het Nederlands Huisartsen Genootschap, januari 2016.4

Gegevensextractie en -analyse

Twee personen voerden de gegevensextractie aan de hand van een standaardformulier onafhankelijk van elkaar uit. Een derde persoon controleerde de gegevensextractie van twee standaarden. We verzamelden algemene informatie over het jaar van uitgave en de patiëntenpopulatie en brachten de diagnostische aanbevelingen van elke standaard in drie categorieën onder: anamnese, lichamelijk onderzoek en aanvullende diagnostiek.
Per standaard inventariseerden we het aantal anamnestische aanbevelingen in items (een los item, bijvoorbeeld geslacht, of een cluster van vragen, bijvoorbeeld alle vragen naar pijn). Voor het lichamelijk onderzoek hebben we de aanbevelingen uitgesplitst in inspectie, palpatie, basisbewegingsonderzoek en specifieke tests.
Wat betreft het bewijs voor de aanbevelingen haalden we gegevens over correlaties, associaties, sensitiviteit en specificiteit uit de standaarden. Het niveau van bewijs wordt als volgt gedefinieerd: A1: een diagnostische systematische review; A2: een diagnostisch accuratesseonderzoek van voldoende grootte en kwaliteit; B: een patiëntgebonden onderzoek anders dan A; C: een niet-vergelijkend onderzoek; D: een expertopinie.

Resultaten

We hebben elf NHG-Standaarden en 101 diagnostische aanbevelingen gevonden [tabel 1]. Van de vier meest voorkomende klachten aan het bewegingsapparaat (lagerug-, nek-, schouder- en knieklachten) bestaat er alleen van nekpijn geen NHG-Standaard. De standaarden zijn gepubliceerd tussen 2005 (Aspecifieke lagerugpijn) en 2016 (Niet-traumatische knieklachten).

Anamnese

Alle standaarden bevelen aan om een anamnese uit te voeren [tabel 1], alleen het aantal items dat aan bod zou moeten komen varieert van 1 tot 10. Drie standaarden adviseren om eerst de alarmsignalen voor mogelijk ernstige pathologie na te gaan (Aspecifieke lagerugpijn, Lumbosacraal radiculair syndroom, Niet-traumatische knieklachten). Twee standaarden bevatten screeningslijsten om te screenen op een fractuur (Traumatische knieproblemen, Enkelbandletsel) en bijna alle standaarden (behalve die van Fractuurpreventie) adviseren om lokalisatie, ernst, duur, ontstaan en beloop van de klacht uit te vragen.
In twee standaarden is voor geen enkele anamnestische aanbeveling wetenschappelijk bewijs gevonden (Epicondylitis, Schouderklachten). In twee standaarden kon bij alle aanbevelingen van de anamnese bewijs worden gepresenteerd, waarbij het niveau van bewijs veelal op A1- en A2-niveau ligt (Fractuurpreventie, Traumatische knieproblemen).
Tabel1Overzicht diagnostische aanbevelingen
Aandoening (Standaard)AnamneseLichamelijk onderzoekAanvullend onderzoek
AanbevelingOnderbouwingNvB (setting)AanbevelingOnderbouwingNvB (setting)AanbevelingOnderbouwingNvB (setting)
Artritis (M90)20097 clusters items GeenInspectie (roodheid, zwelling, knobbels)GeenLab: BSE, CRPBSE en CRP onderscheid niet voldoendeB, C
Palpatie gewricht spleetPijnlijke gewricht spleet correleert met ontstekingsactiviteit (verhoogd CRP)C
Actieve/passieve ROMGeen
Bacteriële artritisSpoedverwijzingGeen
JichtartritisUrinezuurbepaling (eventueel)Hyperuremie: nvw: 96%; pvw: 19%C (2e lijn)
Geen röntgenfoto’s bij aanhoudende twijfelOnvoldoende se/spB
Uraatkristallen, niet haalbaar in HAPB, C(2e lijn)
Reactieve artritisLab-verwijzingAlleen als behandeling primaire infectie noodzakelijk isB, C
Geen röntgenfoto’sGeen
Reumatoïde artritis4 extra itemsOnduidelijkA2(2e lijn)Geen röntgenfoto’sNiet geïndiceerdA2, B(2e lijn)
Lab niet zinvolReumafactor geringe vwB(2e lijn)
Aspecifieke lage rugpijn (M54)2005Alarmsignalen: 6 clusters itemsOnduidelijkA2(1e lijn)Niet nodigGeen Lab niet zinvolVerhoogd BSE weinig specifiekA2(1e lijn)
Geen beeldvormingWeinig sensitief en specifiekA2(2e lijn)
1e consult: 6 items GeenNiet nodig GeenGeen beeldvormingWeinig sensitief en specifiekA2(2e lijn)
Bij aanhoudende problemen: 10 itemsPsychologische en sociale factoren zijn voorspellend aanhoudende klachtenA2, C(1e lijn)Niet nodig GeenLab niet zinvolGeen
Enkelbandletsel (M04) 20124 itemsGeen Inspectie (zwelling)Se: 90%B (2e lijn)-
Specifieke testsSchuifladetest: se: 86%Combinatie zwelling, pijn en schuiflade: se 96%B (2e lijn)
FractuurOttawa Ankle Rules (OAR)Uitsluiten fractuur, se: 99,6%A1(SEH)Röntgenfoto bij positieve OARGeen
Echo niet aanbevolen;Se: 92%; sp: 64%A2 (2e lijn)
Epicondylitis (M60) 20099 clusters itemsGeenPalpatie: lokalisatie pijnOnbekendBGeen röntgenfoto’s Geen
Weerstandtest: dorsaal/palmairflexie pols OnbekendBEcho niet aanbevolenOnbekendA2(1e lijn)
Fractuurpreventie (M69) 2012Verhoogd valrisico: 3 itemsEerdere val, verminderde mobiliteit en valangst verhogen valrisico AUC: 65-79%A2, B(1e lijn)MobiliteitstestsAUC: 51-67%A2(1e lijn)Botdichtheid meting niet zinvolSe/sp &lt 50% A2 (2e lijn)
Anders: 10 itemsLengteverlies > 5 cm voorspeller voor wervelfractuur A2Vertebral Fracture Assessment (VFA)Se: 64-84%; nvw: 97%, pvw: 76%A2(2e lijn)
Hand- en pols- klachten (M91)2010
Carpaletunnelsyndroom 3 itemsVrouw: OR = 9,9; Hoger BMI: OR = 1,8BProvocatietests niet zinvolOnduidelijk A2Elektrofysiologisch onderzoek, niet zinvolSe: 4-85%, sp: 52-99%A12e lijn
GanglionPalpatie vastelastische zwellingGeenAspiratie Geen
EchoOnbekendB
Artrose handACR-criteria (ouder dan 45 jaar, pijn bij bewegen, start stijfheid, startpijn)Onbekend A2(2e lijn)Inspectie/palpatie verdikking handgewrichtenGeenLab niet geïndiceerdGeen
Geen röntgenfoto’sGeen
Trigger finger 1 itemOnbekend BPalpatie flexorpeesGeen
Mallet fingerInspectie/palpatie flexiestandGeenRöntgenfoto aanbevolenGeen
Contractuur (Dupuytren)1 itemPositieve familieanamneseBInspectie/palpatie flexiecontractuurOnbekendB
Tendovaginitis (De Quervain)2 itemsGeenInspectie (roodheid, zwelling)Geen
Palpatie crepitatieGeen
Test van FinkelsteinIBB: kappa 0,79B
Lumbosacraal radiculair syndroom (M55) 2015Alarmsignalen: 2 itemsGeenSensibiliteit rijbroekgebiedGeen
7 itemsNiet-acuut begin, man, meer pijn in been en bij hoesten, niezen, persen is voorspellend voor wortelcompressie (AUC 65%)A2(1e lijn)Vinger-voerafstand Se: 85-90%; sp: 16-29%; pvw: 78-86%; nvw: 27-29%A1(1e en 2e lijn)Geen MRISe 75%; sp: 77%IBB: kappa 52-77%A1(2e lijn)
Straight leg raising test (SLR)Se: 92%; sp: 28%A1(1e en 2e lijn)Geen CT-scansSE 77%; sp: 74%A1(2e lijn)
Gekruiste SLRSe: 28%, sp: 90%: A1 (1e en 2e lijn)
Niet-traumatische knieklachten (M107) 20167 clusters itemsGeenInspectie staand/liggendGeen
Alarmsignalen: 2 itemsGeen Röntgenfoto’s indien verdenking op tumoren, osteomyelitis, enzovoortGeen
GonartroseLeeftijd > 45 jaar, activiteitgerelateerde kniepijn en ochtendstijfheid voorspellend voor gonartroseOnduidelijk BVerminderde ROM, crepitaties, pijnlijke gewrichtsspleet en benige verbreding gewrichtsspleet voorspellend voor gonartrose Onduidelijk BGeen röntgenfoto’s Se: 46-84%; sp 73-94%A1 (2e lijn)
MRI niet zinvolOnduidelijk B
Echo niet zinvolOnduidelijkB
Patellofemoraal pijnsyndroom3 clusters itemsGeenProvocatietests niet zinvolLR+ = 2,3B
Polymyalgia rheumatica (PMR) (M92) 20103 cluster itemsGeen Actieve/passieve ROMGeen Lab CRP-bepalingOnduidelijkC
Arteriitis temporalis (AT)3 cluster itemsPijn bij kauwen en dubbelzien zijn geassocieerd met AT (LR+ = 4,2); se (pijn kauwen): 34%; se (dubbelzien): 9% A1(2e lijn)Palpatie pijn, zwellingGeenLab BSE-bepalingNormale BSE sluit AT uit (LR- = 0,2)A1(2e lijn)
Schouderklachten (M08) 20085 cluster itemsGeen Inspectie vorm, standsafwijkingGeenBeeldvorming niet zinvol; geen invloed op behandelbeleidGeschikt voor detectie spierrupturen: Echo: se: 87%, sp: 96%MRI: se: 89%, sp: 93%A1(2e lijn)
Actieve/passieve ROM schouder, eventueel nekReductie exo hangt samen met glenohumerale problematiekIBB (kappa: 50-74%)B
Traumatische knieproblemen (M66) 201010 itemsMogelijk verband tussen hemartrose en letselA2, B1e lijnBallottement patellaAfwezigheid zwelling en ballottement kans op hydrops kleinA2 (1e lijn)
Kruisbandletstel4 items Kans op letsel neemt toe van 21% (1 positief item) tot 83% (3 positieve items) Bij 2 of 3 negatieve items: kans op afwezigheidletsel 90%A2 (1e lijn)Palpatie gewrichtsspleetSe: 63-76%; sp: 29-77%A1(2e lijn)MRI niet zinvolSe: 75-94%; sp: 91-99%A1 (2e lijn)
Pijn passieve flexiePvw: 41%; nvw: 77%B
Specifieke tests niet zinvolVoorste schuifladetest: se: 55-62% sp: 88-92%lachmantest: se: 85-85% sp: 91-94%‘Pivot shift’-test: se: 24-32%; sp: 98%A1(2e lijn)
Meniscusletsel3 itemsHydrops en trauma: OR = 14BSpecifieke tests niet zinvolMcmurraytest: se: 48-70%; sp: 59-97%A1(2e lijn)MRI niet zinvolSe: 79-93%; sp: 80-96%A1(2e lijn)
FractuurOttawa Knee Rules (OKR)Uitsluiten fractuur, se: 98,5%; sp: 49%A1(SEH)Röntgenfoto alleen bij vermoeden fractuurOnduidelijk A2 (2e lijn)
NvB: niveau van bewijs; A1: diagnostische systematische review; A2: diagnostisch accuratesseonderzoek van voldoende grootte en kwaliteit; B: patiëntgebonden onderzoek anders dan A; C: niet-vergelijkend onderzoek; D: expertopinie; se: sensitiviteit; sp: specificiteit; pvv: positief voorspellende waarde; rom: range of motion.

Lichamelijk onderzoek

Alle standaarden bevatten aanbevelingen over het lichamelijk onderzoek. De NHG-Standaard Aspecifieke lagerugklachten beveelt aan geen lichamelijk onderzoek te doen (expertopinie) en volgens de Standaard Traumatische knieproblemen is het uitvoeren van specifieke tests bij een verdenking op een meniscus- of kruisbandletsel niet zinvol (niveau A1).
In twee standaarden is voor geen enkele aanbeveling voor lichamelijk onderzoek wetenschappelijk bewijs gevonden (Aspecifieke lagerugpijn, Polymyalgia rheumatica en arteriitis temporalis). In vier standaarden zijn alle aanbevelingen onderbouwd (Traumatische knieproblemen, Lumbosacraal radiculair syndroom, Epicondylitis, Enkelbandletsel), waarbij het niveau van bewijs op A1- en B-niveau ligt. De aanbevelingen om wel lichamelijk onderzoek te doen zijn veelal gebaseerd op expertopinie, terwijl de aanbevelingen om geen lichamelijk onderzoek uit te voeren voornamelijk gebaseerd zijn op niveau A-bewijs (behalve in de Standaard Aspecifieke lagerugpijn).

Aanvullend onderzoek

Alle standaarden bevatten aanbevelingen voor aanvullend onderzoek. Aanvullend onderzoek wordt in acht standaarden bewust afgeraden, veelal vanwege het gebrek aan meerwaarde voor het stellen van de diagnose (Artritis (B- en C-niveau), Aspecifieke lagerugpijn (A-niveau), Epicondylitis (expertopinie, A-niveau), Fractuurpreventie (A-niveau), Hand- en polsklachten (expertopinie, A-niveau), Niet-traumatische knieklachten (A- en B-niveau), Schouderklachten (A1-niveau) en Traumatische knieproblemen (A-niveau)). Röntgenfoto’s worden alleen aanbevolen na een positieve score op de fractuurscreening (Traumatische knieproblemen, Enkelbandletsel (A1-niveau)), bij verdenking op tumoren (Niet-traumatische knieklachten (expertopinie)) en bij verdenking op een mallet finger (Hand- en polsklachten (expertopinie)).
In vijf standaarden zijn alle aanbevelingen voor aanvullend onderzoek onderbouwd (Fractuurpreventie, Lumbosacraal radiculair syndroom, Polymyalgia rheumatica en arteriitis temporalis, Schouderklachten, Traumatische knieproblemen) (A- tot C-niveau).

Niveau van bewijs

De frequenties van niveau van bewijs van de verschillende diagnostische onderdelen zijn samengevat in [tabel 2]. Hierbij valt op dat ruim een derde van het bewijs uit A1- en A2-niveau bestaat (38/101; 37,6%), voornamelijk gebaseerd op onderzoeken uit de tweede lijn, maar ook dat voor ruim een derde (37/101; 36,6%) van de aanbevelingen geen wetenschappelijk bewijs is gevonden. Dit percentage verschilt enigszins tussen de anamnese (11/28; 39,3%), het lichamelijk onderzoek (16/36; 44,4%) en aanvullend onderzoek (10/37; 27%). Opvallend is dat vooral de aanbevelingen bij aanvullend onderzoek om iets niet te doen zijn gebaseerd op A-niveau van bewijs (13/24; 54,2%). Er zijn twee standaarden waarin (nagenoeg) alle aanbevelingen bewijs op A-niveau hebben (Fractuurpreventie, Traumatische knieproblemen).
Tabel2Frequenties van niveau van bewijs in anamnese, lichamelijk- en aanvullend onderzoek
Niveau van bewijsAnamneseLichamelijk onderzoekAanvullend onderzoekTotaal
A1 3 6 8 17
A2 9 3 9 21
B 510 8 23
C 1 2 3
Aanbeveling zonder referentie (D)111610 37
Totaal 283637101

Beschouwing

Voor ruim een derde van de diagnostische aanbevelingen in de NHG-Standaarden van het bewegingsapparaat is geen wetenschappelijk bewijs gevonden. Ook is het wetenschappelijke bewijs voornamelijk gebaseerd op onderzoek dat in de tweede lijn heeft plaatsgevonden. Dit betekent dat de resultaten uit die onderzoeken lang niet altijd te extrapoleren zijn naar de huisartsenpraktijk in verband met lagere prevalentiecijfers en een andere ziektestatus. Opvallend is dat vooral de aanbevelingen om iets niet te doen (lichamelijk onderzoek of aanvullend onderzoek) zijn gebaseerd op A-niveau van bewijs.

Beperkingen

We zijn bij de evaluatie van het bewijs uitgegaan van wat er in de standaarden is vermeld (tekst, cijfers en literatuurverwijzingen). Tevens gingen we ervan uit dat als er geen bewijs is gegeven, dit ook niet bestaat, aangezien inhoudsdeskundigen verantwoordelijk zijn voor het ontwikkelen van een standaard en zij bij de ontwikkeling van de standaarden een zeer goede zoekactie uitvoeren naar bestaande literatuur. Sommige NHG-Standaarden bevatten een explicietere formulering van de achtergrond van het bewijs dan andere, waardoor een onderschatting van het niveau van bewijs kan optreden.
We onderzochten de NHG-Standaarden van het bewegingsapparaat. Het is onduidelijk of onze bevindingen representatief zijn voor alle NHG-Standaarden.

Lacunes

In 1997 startte het NHG met het programma Alledaagse ziekten, dat is gericht op onderzoek naar ‘alledaagse ziekten in de huisartsenpraktijk’. Bij de evaluatie van dit succesvolle programma bleek dat van de 33 projecten die in tien jaar tijd waren gefinancierd, er zeven deels of geheel een diagnostische vraagstelling hadden.5
Vanaf 2001 heeft de NHG de hiaten in het wetenschappelijke bewijs van de NHG-Standaarden vastgelegd in een database, de ‘lacunebak’.6 Onlangs is die lacunebak geactualiseerd. Hierin zijn geen vraagstellingen opgenomen over NHG-Standaarden die niet bestaan, zoals een standaard voor nekpijn. In de lacunebak blijkt slechts 12% van de vragen een diagnostische vraagstelling te hebben. Dit percentage verschilt sterk van het percentage aanbevelingen zonder wetenschappelijk bewijs (36,6%). Het lage percentage van diagnostische vragen in de lacunebak lijkt geen indicatie van een goede evidence-base van de diagnostische aanbevelingen.
Het Programma Alledaagse Ziekten heeft een stimulerende werking gehad op onderzoek dat is gericht op de lacunes in de NHG-Standaarden.7 Desondanks blijft de evidence-base van de diagnostische aanbevelingen mager. Daarom lijkt het goed om het bewijs voor de diagnostische aanbevelingen te verbeteren door gericht diagnostisch onderzoek binnen de huisartsgeneeskunde te stimuleren. Dit leidt tot het verbeteren van rationeel aanvraagbeleid, de onderbouwing van het vak en de kosteneffectiviteit van de eerstelijnszorg.

Conclusie

Voor ruim een derde van de diagnostische aanbevelingen in de NHG-Standaarden van het bewegingsapparaat is geen wetenschappelijk bewijs gevonden. Gerichte subsidiemogelijkheden voor diagnostisch onderzoek in de eerste lijn zijn noodzakelijk voor een verbetering van het bewijs voor de diagnostische aanbevelingen.

Dankbetuiging

We danken Caroline E.J. Lous hartelijk voor haar hulp bij het uitvoeren van de gegevensextractie en de eerste opzet van het artikel.

Literatuur

  • 1.Bindels PJ. Over diagnostiek en overdiagnostiek; rationeel aanvraagbeleid blijft de basis. Ned Tijdschr Geneeskd 2014;158:A7770.
  • 2.Heneghan C, Godlee F. Where next for evidence based health care? BMJ 2013;346:f766.
  • 3.Lewis Group. The value of diagnostics. Lewis report 2005. http://www.lewin.com/publications/publication/237/
  • 4.NHG-Standaarden voor de huisarts: https://www.nhg.org/nhg-standaarden
  • 5.Van der Wouden JC, Kortekaas MF, Dreesens D, Keuken DG, Dekker JH. Alledaagse ziekten: wat heeft 10 jaar subsidie opgeleverd? Huisarts Wet 2013;56:202-7.
  • 6.Tasche MJA, Oosterberg E, Kolnaar B, Rosmalen K. Inventarisatie van lacunes in huisartsgeneeskundige kennis, zeventig standaarden doorgelicht. Huisarts Wet 2001,3:91-4.
  • 7.Dekker J. Standaarden en onderzoek voor en door huisartsen. Huisarts Wet 2010;53:47-50.

Reacties

Er zijn nog geen reacties