Epidemimatematik: Test for smitte og sygdom

Test ved epidemier omhandler fx test for, om man kan smitte, og til diagnose af sygdom. Om en test er god eller dårlig afhænger af, om den 'finder de raske', og ikke erklærer folk syge, som ikke er det. Se eksempler på, hvordan der kan arbejdes med test i undervisningen.

Under en epidemi er det vigtigt at kunne identificere de smittede, så de kan undgå at smitte videre. Især når man kan smitte andre uden selv at have symptomer, er det vigtigt at kunne teste for sygdommen. Der testes også i mange andre tilfælde: for at give den rette diagnose og dermed den rette behandling, for at finde sygdom tidligt, så behandlingsmulighederne er bedre osv.

Sensitivitet, specificitet og prævalens

Den matematik, der beskriver tests, er den samme uanset formålet med testen. Om en test for en sygdom er god, afhænger af, om den finder de syge, men også af, om den 'finder de raske', altså ikke erklærer folk syge, som ikke er det. Ekstremet er, at alle erklæres syge. Så har testen fundet alle syge, men det er naturligvis ikke en god test.

Skematisk er der disse muligheder for test af en enkelt person:

Skema med mulige testresultater

Der er to ting, der karakteriserer en test:

  • Sensitiviteten
    Hvor stor en andel af de syge der får testsvaret 'syg'. Man siger, er testet positive, hvilket kan give megen forvirring, eftersom det sjældent er positivt at være syg. Hvis sensitiviteten er lav, vil mange syge ikke blive opdaget (det er de falske negative), de kommer så ikke rettidigt i behandling og de kan måske smitte andre, når de efter testen tror, de er raske.
  • Specificiteten
    Hvor stor en andel af de raske der får testsvaret 'rask', dvs. er testet negative. Hvis specificiteten er lav, vil mange raske blive testet positive (falske positive) og komme i behandling – det koster og kan måske have bivirkninger.

Tallene i skemaet afhænger imidlertid af mere end testens karakteristika, nemlig den gruppe, man tester

  • Prævalensen
    Hvor stor en andel af dem, der er testet positive er faktisk syge? Svaret afhænger af Prævalensen, nemlig hvor stor en andel af de testede, der faktisk er syge. Så det kan man ikke regne ud alene på basis af testens egenskaber (specificitet og sensitivitet).

Sensitiviteten og specificiteten er sjældent lige store. Begge skal helst være ret høje. De to tal er indbyrdes afhængige, man kan flytte grænsen for, hvornår testen betragtes som positiv – fx hvor meget antistof, eller hvor stor mængde virus, der skal være påvist, for at prøven er positiv. Det flytter på både specificitet og sensitivitet.

 

Her ser man resultatet af at teste 10.000 personer, hvoraf 1% er syge med en test med specificitet 95% og sensitivitet 80%. Der er 495+80, der er testet positive, men kun 80 er faktisk syge. Og af de 9425, der er testet negative, er der 20 syge: 

Model: Sensitivitet og specificitet

 

En anden illustration af samme test og samme prævalens med 1.000 personer: De røde er syge, de mørkegrønne er raske. De glade er testet negative, de sure er testet positive.

Eksempel: Spørgsmål med udgangspunkt i antal

Opgave

Om en test har vi fået oplyst, at der er:

  • 100 syge og 900 raske.

Testen viser:

  • Syg for 90 af de syge
  • Syg for 20 af de raske
  • Rask for 10 af de syge 
  • Rask for 880 af de raske. 

Spørgsmål

  1. Hvor stor er risikoen for, at en syg person bliver testet som rask? Og hvad er omvendt chancen for, at en syg bliver testet som syg?
  2. Hvor stor er risikoen for, at en rask person bliver testet som syg? Og hvad er chancen for, at en rask bliver testet som rask?

Bemærk

Alle disse oplysninger er normalt ikke kendt for en test. Man ved ikke, hvem der er syge, det er derfor, man tester. Når man udvikler en ny test, kan man imidlertid afprøve testen på personer, der er testet med en kendt og meget troværdig test, og dermed skaffe de ønskede data.

Eksempel: Spørgsmål med udgangspunkt i andele

Opgave

En test finder:

  • 80 % af de syge (har en sensitivitet på 80 %), dvs. ud af 100 syge vil 80 blive testet positive.
  • 90 % af de raske (har en specificitet på 90 %), dvs. ud af 100 raske vil 90 blive testet negative.

Hvis testen bruges på hele befolkningen, og ca. 1 % har sygdommen, sker følgende for 1000 personer:

  • Der er 10 syge. Af dem bliver 8 testet positive.
  • Der er 990 raske. Af dem bliver 99 personer testet positive.

I alt er 107 testet positive, men kun de 8 er syge. Det er $\frac{8}{107}$, omkring 7 %. Det er den positivt prædiktive værdi. Det er den, der er interessant for den enkelte: Hvis man er testet positiv, er der stadig 93% chance for, at man er rask!

Hvordan med dem, der er testet negative?

  • Dem er der $2+891=893$ af. Og det er $\frac{2}{893}= 0,2$%, der faktisk er syge.
  • Den negativt prædiktive værdi er 99,8 %, så man er ganske sikker på at være rask, hvis man er testet negativ.

Nu bruges samme test på 100 personer, der allerede har et eller flere symptomer. Man ved, at prævalensen da er 20 %:

  • Der er 20 syge. Af dem bliver 16 testet positive.
  • Der er 80 raske. Af dem bliver 72 testet negative.

I alt er $16 + 8 = 24$ testet positive, og de 16 er syge. Den positivt prædiktive værdi er da $\frac{16}{24}$, omkring 67 %. Det er nu den positivt prædiktive værdi.

I alt er $4 + 72 = 76$ testet negative og de 72 er raske. Den negativt prædiktive værdi er $\frac{72}{76}$, omkring 95 %.

Spørgsmål

Hvordan ændrer de prædiktive værdier sig generelt, hvis man kun tester den del af befolkningen, der har symptomer? (Prævalensen er større i gruppen med symptomer).

Eksempel: De generelle sammenhænge

De generelle sammenhænge. Herunder via betingede sandsynligheder:

Skema med mulige testresultater

I tabellen er resultatet af en test. Som udgangspunkt kender vi den nederste række, men egenskaber ved testen og en kendt prævalens kan give de andre celler.

Tabellen kan betragtes som andele af dem, der er testet, eller som de faktiske antal. Har man de faktiske antal, kan man få andele ved at dividere værdierne i alle celler med tallet ALLE. Omvendt: Har man andele og kender det samlede antal, kan alle andelene multipliceres med ALLE.

Opgave

Nedenfor ses formler for de begreber, der blev beskrevet tidligere. Forsøg i hvert tilfælde at argumentere for formlens rigtighed. Overvej, at det ikke afhænger af, om tabellen er andele eller faktiske antal.

  • Specificitet er $\frac{SN}{SN+FP}$, andelen af de raske, som er testet negative, altså sandsynligheden for at testen viser, man er rask, givet man er rask, det er den betingede sandsynlighed $P$(negativ|rask).
  • Sensitiviteten er $\frac{SP}{SP+FN}$, andelen af syge, som er testet positive, igen en betinget sandsynlighed $P$(positiv|syg).

Specificitet og sensitivitet er egenskaber ved testen.

  • Prævalensen, andelen, der er syge, er $\frac {SP+FN}{SP+FN+SN+FP}$

 

  • Den positivt prædiktive værdi er $\frac {SP}{SP+FP}$, andelen af personer, der er testet positivt, som rent faktisk er syge, sandsynligheden for at være syg, når testen viser, man er det, $P$(syg|positiv). Det afhænger ikke kun af testen, men også af prævalensen.
  • Eller man kan se på den negativt prædiktive værdi $\frac {SN}{SN+FN}$, andelen af personer, der er testet negativt, som  faktisk er raske $P$(rask|negativ).

Spørgsmål

Udnyt Bayes’ formel til at finde sammenhænge mellem eksempelvis sandsynligheden for at være syg, givet man er testet positiv og sandsynligheden for at man er testet positiv, givet man er syg. Hvilke andre sandsynligheder indgår? Genfind prævalensen som sandsynligheden for, at en tilfældig person er syg.

til: Grundskole, Erhvervsskole og Gymnasie
emne: EPIDEMIMATEMATIK

Forfatter

Lisbeth Fajstrup

Lektor, ph.d.
Institut for Matematiske Fag, AAU


Udgiver

Temaer på matematikdidaktik.dk udvikles i tæt samarbejde mellem forskere og praktikere og udgives af NCUM.
Se redaktionen og vores redaktionelle retningslinjer

Del tema Tag med