Hoe werkt Generatieve AI?

Artificiële intelligentie (AI) is een technologie die taken uitvoert waarvoor normaal gesproken menselijke intelligentie nodig is, zoals teksten analyseren, beelden herkennen of beslissingen nemen. Binnen het hoger onderwijs biedt AI steeds meer mogelijkheden om je studie slimmer en efficiënter aan te pakken.

Een specifieke vorm van AI is generatieve AI (genAI). Deze technologie kan op basis van bestaande data nieuwe inhoud genereren—zoals tekst, beeld, audio of code. Een bekend voorbeeld is ChatGPT, een taalmodel dat zinnen formuleert en vragen beantwoordt op een manier die lijkt op menselijke communicatie. Het model doet dit niet door echt te begrijpen wat je zegt, maar door te voorspellen welk woord waarschijnlijk volgt. De antwoorden zijn dus gebaseerd op waarschijnlijkheid, niet op feitelijke juistheid. Daarom is het belangrijk dat je hier kritisch mee omgaat.

 

Technologieën achter generatieve AI

GenAI maakt gebruik van verschillende onderliggende technologieën, zoals machine learning, deep learning en neurale netwerken. Deze technieken zorgen ervoor dat een model patronen herkent en op basis daarvan nieuwe inhoud kan genereren. Meer uitleg over deze begrippen vind je in de begrippenlijst.

Het leerproces van een groot taalmodel verloopt doorgaans in drie fasen: tijdens de pre-training leert het model de basis van taal, in de fine-tuning fase wordt de output door mensen gecorrigeerd, en via reinforcement learning past het model zich verder aan menselijke voorkeuren aan.

 

Grote taalmodellen (LLM’s)

Een Large Language Model (LLM) is een type AI dat getraind is op enorme hoeveelheden tekst. Het kan patronen in taal herkennen en zo nieuwe zinnen voorspellen die grammaticaal en inhoudelijk kloppend lijken. LLM’s liggen aan de basis van toepassingen zoals ChatGPT en spelen een centrale rol in deze cursus. Ze zijn krachtig in het genereren van tekst, maar werken altijd op basis van waarschijnlijkheid en niet op echt begrip.

 

Voor het trainen van AI zijn goede en diverse data essentieel. Hoe beter en gevarieerder de trainingsdata, hoe betrouwbaarder de output. Slechte of eenzijdige data kunnen leiden tot bias—bevooroordeelde en subjectieve informatie.