Matematikken i AI som emne i undervisningen

AI bygger på mange grene af matematik, der også indgår i matematikundervisningen. Den tværfaglige diskussion om brug af AI kan desuden kvalificeres yderligere, hvis man forstår de underliggende principper. Men hvad er AI? Og hvilken rolle spiller matematik i AI, og hvordan?

Hvad er AI?

Det er der ikke et fast svar på. Opfattelsen skifter, og det, der har været betragtet som AI, er det ikke længere. Søgning i data, som for eksempel i Google Maps, er formentlig ikke AI for de fleste nu, men det ville det have været, inden vi vænnede os til det. Et forslag er, at man fokuserer på egenskaber som autonomi og tilpasningsevne som karakteristiske for AI. Det er bestemt ikke klart, hvad man mener med disse ord, som jo er menneskelige egenskaber. Autonomi beskrives for eksempel som evnen til at udføre opgaver i komplekse miljøer uden konstant vejledning fra en bruger. Tilpasningsevne som evnen til at forbedre præstationerne ved at lære af erfaring. Når man bruger ord som ”lære af erfaring”, der beskriver menneskelige egenskaber, til at beskrive et computerprogram, skal man være meget varsom med ikke at antropomorfisere. Vi kalder det kunstig intelligens og ikke intelligens. Det er kunstige neurale netværk og ikke neuroner i hjernen. Der er også røster om, at (generativ) AI ”ræsonnerer”. Eller tænker. Det er en balance: Man vil forklare en egenskab ved at referere til noget lignende i mennesker, men risikerer dermed både at overdrive mulighederne og at skabe et billede af tænkende robotter, der kan overtage verden. En anden risiko er, at man ved at lade ”ræsonnere” eller ”tænke” betyde noget andet, end det gør i andre sammenhænge, forplumrer formidlingen af, hvad værktøjerne kan og bør bruges til.

Disse overvejelser, som kan blive ret filosofiske, kan man dykke ned i her.

Eksempler på AI, som det forstås nu, er billedanalyse, hvor et system afgør, om input er et billede af en hund. Eller Generativ AI, som, på baggrund af eksempelvis billeder af hunde, kan skabe et helt nyt billede af en hund. Eller ud fra enorme tekstmængder, generere en sammenhængende tekst, som ser fornuftig ud. Spørgsmålet er, om det nu skal opfattes som en ny definition af AI - at det nødvendigvis skal være generativt? Her er det væsentligt at understrege, at der ikke er en definition. Forståelsen af hvad der er AI, udvikler sig hele tiden.

Undervisningsforløb om AI

Modellering

Når ”maskiner” lærer fra træningsdata, det vil sige data, hvor man har et korrekt svar, som i eksemplet Træning af Kunstige Neurale netværk eller i Store Sprogmodeller, bygger ”maskinen” en model, som kan anvendes til at analysere nye data, som ikke var i træningsdata. Grundlæggende er der tale om matematisk modellering, men processen foregår ”i maskinen” og adskiller sig væsentligt fra de modeller, der bygger på kendskab til, hvordan data er fremkommet, og de underliggende lovmæssigheder, man vil forvente at se i modellen – fysikkens love for eksempel.
Som i al matematisk modellering indebærer processen et fravalg af information. En model er ikke hele virkeligheden. Der er en komprimering af data. Det sker for eksempel, når data repræsenteres ved ”bedste rette linje”, og andre sammenhænge, end at data næsten ligger på en linje, tilsidesættes. Det er modellering, og i en vis forstand repræsentation.
Dendrogrammer (se Hierarkisk klyngeanalyse) er en visuel repræsentation af mulige sammenhænge, som i større modeller forbliver skjult i maskinen.

Tværfagligt samarbejde

Diskussionen om brug af AI kan kvalificeres, hvis man forstår de underliggende principper. Det kan kombineres med etiske overvejelser, med samfundsfaglige problemstillinger om, hvordan, hvor og hvornår AI skal inddrages – GDPR kan være et aspekt, ophavsret et andet.
Data fra andre fag kan indgå som eksempler eller i et større fagligt samarbejde, hvor de sammenhænge, man finder ved eksempelvis klassificering, kan give faglige diskussioner i såvel det fag, der leverer data, som i matematik. Man kan f.eks. overveje, om data er gode nok, eller om der kan være elementer af den model, som AI-værktøjet bygger, som er uhensigtsmæssige. Her kan en matematisk indsigt i værktøjet supplere det andet fags indsigt i data.
I biologi og bioteknologi bruges DNA til gruppering af arter – dette kan gøres ved hierarkisk klyngeanalyse. Se mere om hvordan dette gøres inden for bioinformatik her.
Screeningsprogrammer for sygdomme ved brug af AI, kan forstås monofagligt i matematik, men det er oplagt at inddrage bioteknologi eller samfundsfag. Et sådant undervisningsforløb kan findes på AI-mat.
En kandidattest er en gruppering, som fortæller vælgeren, hvilke politikere, de er mest enige med. Et samarbejde med samfundsfag kan for eksempel dreje sig om, hvilke spørgsmål, der deler de politiske blokke, se mere her.

I Store Sprogmodeller udgøres data af omfattende mængder tekst. Der er flere muligheder for samarbejde med dansk eksempelvis om hyppighed af bogstaver i forskellige typer tekst, se mere her, og om det ændrer sig med tiden, se fx dansk sprognævn om bogstavshyppigheder og bogstavshyppighed på dansk, hvor det fremgår, at X, Y, Z og W er hyppigere nu end i 1970. Et andet aspekt er, hvordan de store mængder af tekst omsættes til en model. Denne proces bygger på sprogteoretiske principper, som blev formuleret længe før computerens fremkomst. Se Store sprogmodeller og sandsynlighedsteori.

Matematiske emner

Her er nogle af de emner fra matematikundervisningen, som AI bygger på og gør brug af.

Funktionsbegrebet

Et (trænet) kunstigt neuralt netværk kan betragtes som en funktion, der eksempelvis tager et billede som input og giver et binært output (ja/nej) afhængigt af, om der er en kat på billedet.
At træne netværket indebærer at finde en funktion, der bedst muligt adskiller billeder med katte fra billeder uden katte. Det er her funktionen, der er den ”ubekendte”, som skal bestemmes. Det gøres ud fra træningsdata, som består af eksempler, hvor vi kender svaret – her om der er en kat.
Inden træningen skal man overveje, hvilken type funktioner man tillader – når man finder bedste rette linje, er det et valg af funktionstype, nemlig $f(x)=ax+b$, hvor træning så finder de bedste $a$ og $b$ til at beskrive de foreliggende data. Hvad man mener med ”bedst” er et andet matematisk spørgsmål, der dækkes i de andre emner.

Optimering og afstand

Når man træner et kunstigt neuralt netværk, gælder det om at justere en funktion, $f$, så den rammer nogenlunde rigtigt i de kendte eksempler hvor man ved, hvad facit skal være. Det kender eleverne fra bedste rette linje, hvor man ikke kan få en linje gennem alle datapunkterne og altså ikke få den $y$-værdi, som er ”facit”. Der er brug for at kunne kvantificere, hvad ”nogenlunde rigtigt” skal betyde, og dermed, hvad den ”bedste” rette linje er. Hvis vi vælger den rette linje $f(x)=2x-3$, og der er et datapunkt $(5,4)$, så er $f(5)= 7$, men datapunktet har $y$-værdi $4$. Man kunne sige, fejlen er $7-4$ eller måske $4-7$ eller $|7-4|$. Valget af bedste rette linje sker typisk ved, at fejlene kvadreres, således at dette punkt bidrager med $(7-4)^2$, som lægges sammen med fejlene fra de andre kendte punkter. Der findes imidlertid mange andre måder at kvantificere den samlede fejl – man taler om at vælge en tabsfunktion, E (for error). Opgaven består herefter i at justere funktionen $f$, så tabsfunktionen minimeres.

Sandsynlighedsteori og statistik

Sandsynlighedsteori og statistik udgør et centralt fundament i enhver form for AI. Svar afhænger af de data, systemet har ”lært” fra – de såkaldte træningsdata. Statistiske metoder indgår, når man udvælger data, og i al tilgang til validering af systemet.

Store sprogmodeller kan, efter træning på en stor mængde tekst, skrive tekst, der sprogligt er korrekt. Der indgår sandsynlighedsteori: Hvilket ord følger mest sandsynligt efter det, der allerede er skrevet. I mindre skala kender vi det fra autocomplete. Sprogmodellens output er muligvis også et korrekt svar på et stillet spørgsmål, men det er ikke nødvendigvis noget, modellen eksplicit er trænet til.

Geometri – linjer, planer

Data kan ofte betragtes som punkter i plan, rum eller endda højere dimensioner. Klassifikation kan være meget geometrisk: Find en ret linje, som deler data i to. Klassificer et nyt datapunkt ud fra, om det ligger på den ene eller anden side af den linje. En anden strategi er klassifikation efter hvilke punkter det nye datapunkt ligger tættest på. Eller hvilke punkter, der ligger inden for en cirkel med en valgt radius.
I 3D indgår planer og kugleflader i opdeling og klassifikation. Se Klassificering og geometri.