Praktijk

Betrouwbaarheidsintervallen

Gepubliceerd
5 november 2014
De serie Praktische epidemiologie laat zien dat er een wetenschappelijke onderbouwing bestaat voor veel handelingen die de huisarts in de dagelijkse praktijk intuïtief uitvoert. Aan de hand van een herkenbaar praktisch gegeven in de praktijk geven we kort aan hoe de wetenschap achter dit praktijkprobleem in elkaar zit. Correspondentie: j.eekhof@nhg.org

Praktijkprobleem

Veel artikelen geven bij de uitkomstmaat ook betrouwbaarheidsintervallen weer. ‘De prevalentie van ECG-afwijkingen was 17,6% (95%-BI 15,0 tot 20,1).’1 Betrouwbaarheidsintervallen worden niet alleen gebruikt om schattingen weer te geven, maar bieden ook resultaten van toetsend onderzoek zoals in een randomized controlled trial. Wat is nu de betekenis van deze betrouwbaarheidsintervallen en wat geven ze eigenlijk weer?

Achtergrond

Bij onderzoek naar bijvoorbeeld de gemiddelde diastolische bloeddruk in een populatie (schatten) is het ondoenlijk om bij alle leden van die populatie de bloeddruk te meten. Men beperkt zich tot een steekproef die idealiter zo wordt getrokken dat ieder lid van de populatie evenveel kans heeft om erin te komen. De gemiddelde diastolische bloeddruk van die steekproef geeft een schatting van de gemiddelde diastolische bloeddruk in de hele populatie. De kans is echter groot dat een andere steekproef een andere schatting van het populatiegemiddelde zal geven. Uit een steekproef kan men een interval rondom het steekproefgemiddelde bepalen waarin met een bepaalde mate van waarschijnlijkheid het populatiegemiddelde ligt. Meestal hanteert men het 95%-betrouwbaarheidsinterval (95%-BI) rond een steekproefgemiddelde, wat aangeeft dat met een waarschijnlijkheid van 95% het ware populatiegemiddelde zich in dit interval bevindt.
Bij toetsen wordt het 95%-BI gebruikt om te bezien of een onderzoeksresultaat statistisch significant is met als drempelwaarde 5% (p-waarde &lt 0,05).
Als in een onderzoek wordt gevonden dat de verhouding in risico’s op coronaire hartziekte (relatieve risico) van een diureticum ten opzichte van een placebo gelijk is aan 0,79 (95%-BI 0,69 tot 0,92), dan is dit statistisch significant omdat de waarde 1 (risico in diureticumgroep is gelijk aan die in de placebogroep) niet binnen het betrouwbaarheidsinterval valt.

Uitwerking

Hoe wordt nu zo’n betrouwbaarheidsinterval bepaald? Een gedachte-experiment kan dit duidelijk maken. Stel: we zijn geïnteresseerd in de gemiddelde diastolische bloeddruk in een omschreven populatie. We nemen nu een steekproef in deze populatie en bepalen de gemiddelde bloeddruk en de standaarddeviatie als maat voor spreiding van de waarnemingen rond het gemiddelde (de standaarddeviatie is de rekenkundige wortel uit de variantie).
Nu gaan we in gedachten talloze malen zo’n steekproef trekken en bepalen het gemiddelde van al deze steekproefgemiddelden. De standaarddeviatie van deze gemiddelden noemt men de standaardfout (standard error, SE).2 De standaarddeviatie zegt iets over de variabiliteit (de spreiding) in de populatie; de standaardfout (SE) geeft de onzekerheid aan van de schatting van het (onbekende) populatiegemiddelde. Bij een voldoende grote steekproef (30 of meer) ligt 95% van de streekproefgemiddelden in het interval rond het populatiegemiddelde.

Voorbeeld

De gemiddelde diastolische bloeddruk van een steekproef van 60 personen (n) bedraagt 85 mmHg met een standaarddeviatie van 5 mmHg. In de door het gedachte-experiment verkregen verdeling van alle steekproefgemiddelden ligt 95% van deze steekproefgemiddelden in het interval rond het populatiegemiddelde plus en min 1,3 mmHg. Natuurlijk zijn we niet zozeer geïnteresseerd in welk interval ons steekproefgemiddelde ligt, maar in welk interval het onbekende, te schatten, populatiegemiddelde ligt. Dit interval wordt het 95%-betrouwbaarheidsinterval (95%-BI) genoemd. Bij een steekproefgemiddelde van 85 mmHg is dit dus gelijk aan [85 ± 1,3] = [83,7 – 86,3].
Ook bij toetsen kunnen we een verschil in effect van een interventie versus controle schatten. Ligt de waarde die behoort bij de nulhypothese (H0, de veronderstelling dat het effect niet bestaat) in dit interval, dan wordt deze niet verworpen.

Betekenis

Het 95%-BI wordt smaller en de schatting van het populatiegemiddelde dus nauwkeuriger naarmate de steekproefgrootte groter en/of de standaarddeviatie kleiner is.

Literatuur

  • 1.Scheltens T, De Beus MF, Hoes AW, Rutten FH, Numans ME, Mosterd A, et al. Een elektrocardiogram bij elke patiënt met hypertensie. Huisarts Wet 2011;54:122-7.
  • 2.Swinscow TDV. Statistics at Square One. London: British Medical Association, 1991.

Reacties

Er zijn nog geen reacties

Verder lezen