Falske positive og basisratefeil
For ikke altfor lenge siden, la jeg ut følgende oppgave:
La oss si det finnes en matallergitest som er 97 % sikker. I løpet av et år tester en million nordmenn seg med denne testen. 2 % av dem (20.000) har matallergi. Du er blant dem som har testet deg og fastlegen din forteller deg at du har testet positivt. Spørsmålet er: Hvor sannsynlig er det at du faktisk har matallergi?
Veldig mange, også overraskende mange leger, svarer feil på slike spørsmål. Som du ser nedenfor, er svaret betydelig lavere enn hva man umiddelbart antar, noe som er et resultat av allergitestens feilmargin (3 %) er høyere enn den faktiske forekomsten av allergiene (2 %). Fenomenet kalles "paradokset med de falske positive".
Fasiten
Utregningen du må gjennom for å kunne besvare oppgaven over, er som følger:20.000 av dem som testet seg har matallergi. Siden testen har en treffsikkerhet på 97 %, vil den korrekt identifisere 19.400 som allergikere (20.000 * 0,97 = 19.400)980.000 av dem som testet seg (1 million - 20.000) har ikke matallergi. Siden testen tar feil i 3 % av tilfellene, vil 29.400 feilaktig bli identifisert som allergikere (980.000 * 0,03 = 29.400)Tilsammen får altså 48.800 (19.400 + 29.400) beskjed om at de har testet positivt, men bare 19.400 av dem har det faktisk.
19.400 / 48.800 = 0,40
Er du blant dem som testet positivt er det med andre ord bare 40 % sannsynlighet for at du faktisk har det!
Spør legen din
Tallene ikke tatt ut av løse luften og likner dem du finner ved en del av matallergitestene som er i bruk i dag. Prikktestene (skin prick test) som brukes som brukes på diverse legekontor, gir falske alarmer (falske positive) i 50-60 % av tilfellene. Også andre tester som tas hos fastlegen sin lider av det samme og neste gang du skal teste deg for en tilstand/sykdom som ikke er spesielt vanlig, bør du stille følgende spørsmål:
Hvor stor er forekomsten av tilstanden/sykdommen jeg skal teste meg for?
Hvor stor er feilmarginen på testen?
Hvis tallet du får på første spørsmål er lavere enn tallet du får på andre spørsmål, er det stor sannsynlighet for at et eventuelt positivt prøvesvar (altså at du har sykdommen) er en falsk alarm (med mindre du tilhører en bestemt risikogruppe). Det er langt i fra sikkert at fastlegen kan svare og det er heller ikke sikkert at det finnes klare svar, men det skader ikke å spørre. Kanskje det skjerper fastlegen din og kanskje sparer du deg for noen bekymringer.
Basisratefeil
Grunnen til at mange svarer feil på slike oppgaver handler delvis om at vi mennesker har en tendens til å fokusere på spesifikke trekk ved en ting (som feks "97 % sikkerhet") og overser grunnleggende trekk (som den faktiske forekomsten av matallergi). Her er et spørsmål som tydeliggjør fenomenet:
Trond er en ekte sjakknerd. Han reiser mye og velger destinasjon ut fra museumstilbudet. Han foretrekker moderne kunst, men favorittkunstneren er likevel middelalderkunstneren Hieronymus Bosch. Hvor sannsynlig mener du det er at han er 1) dirigent i et norsk symfoniorkester og 2) en norsk bonde?
De aller fleste svarer at det er mer sannsynlig at Trond er dirigent, enn at han er bonde. Men svaret er feil. Akkurat som i matallergitesten, henger vi oss opp i noen trekk (sjakknerd og kunstinteressert), men overser det viktigste av alt: Hvor mange bønder og dirigenter det er i Norge.Det er ikke lett å si nøyaktig hvor mange bønder vi har her tillands, men per 2010 var det 55.348 årsverk i jordbruket og 46.650 gårdsbruk. Uansett hvordan man vrir og vender på disse tallene, er det mange flere bønder enn det er dirigenter. Vi har sju profesjonelle symfoniorkester i Norge og så vidt meg bekjent har hver av dem bare en dirigent. Hvis man antar at det er 50.000 bønder i Norge, blir det 7.143 bønder for hver dirigent.Det er godt mulig at det er flere dirigenter enn bønder som liker sjakk og kunst, men skal du være helt ærlig med deg selv så er det en fordom som du ikke har god statistikk på. Og du anslår vel bare sannsynlighet på bakgrunn av god statistikk, eller hva? Vel, nå har du den og det er flere tusen ganger mer sannsynlig at Trond er bonde enn at han er dirigent.Basisrate (eller base rate) er den faktiske forekomsten av en ting/hendelse vi skal vurdere sannsynligheten av. Noen ganger brukes også begrepet a priori sansynlighet eller "prior probabilitiy". Tendensen vi har til å overse basisraten (som i eksemplene over) kalles basisratefeil (base rate fallacy). Basisratefeil er nært beslektet med en av "tommelfingerreglene" (også kalt heuristikker) som hjernen bruker når den skal gjøre sannsynlighetsvurderinger, nemlig "representativitetsheuristikken" som jeg har skrevet om her.
Referanser og videre lesing
The Base-Rate Fallacy in Probability Judgements, Maya Bar-Hillel 1980
Evidental impact of base rates, Tversky & Kahneman, 1981.
The Base Rate Fallacy Controversy, Maya Bar-Hillel, 1983
Jonathan Koeheler (1995) stiller spørsmålstegn ved om det er slik at vi alltid bør ta hensyn til basisraten og henviser til forskning som viser at vi ikke er så dårlige på slike analyser som tidligere antatt.