AI Jargon ontcijferd: RAG, MCP, agents en meer

Tim Derdelinckx • 2 mei 2026

De wereld van AI draait op acroniemen en concepten die voor buitenstaanders aanvoelen als een vreemde taal. RAG, MCP, embeddings, inference, context window... Wat betekent dat allemaal en waarom is het relevant als je AI wilt inzetten in je eigen processen?

Dit artikel is geen academische les. Het is een werkende woordenlijst, geschreven vanuit de praktijk van iemand die dagelijks met deze tools bezig is.

RAG: Retrieval-Augmented Generation

RAG is vermoedelijk het meest gebruikte concept in de praktische AI-wereld van vandaag. Het idee is simpel: een taalmodel, zoals ChatGPT of Claude, weet veel, maar niet alles. Het werd getraind op een momentopname van het internet en heeft geen toegang tot jouw interne documenten, je recente e-mails of je database.

RAG lost dit op door bij elke vraag relevante informatie op te zoeken en die mee te geven aan het model. De stappen zijn:

Gebruiker stelt een vraag
Het systeem doorzoekt een kennisbank (database, bestanden, index) op relevante fragmenten. Dit wordt de vectordatabase genoemd
Die fragmenten worden samen met de vraag naar het model gestuurd
Het model antwoordt op basis van de vraag én de gevonden context

Praktisch voorbeeld: Je wilt een AI-assistent die vragen beantwoordt over je productcatalogus. Je laadt de catalogus in een vectordatabase, en telkens iemand een vraag stelt, worden de relevantste producten opgehaald en meegegeven aan het model.

Markdown (.md) bestanden

Markdown is een lichtgewicht opmaaktaal: gewone tekst met eenvoudige symbolen voor opmaak. # Titel maakt een hoofdtitel, **vet** maakt tekst vet, - item maakt een lijst. Markdown-bestanden worden door AI-tools breed gebruikt omdat:

Ze leesbaar zijn voor zowel mensen als machines
Ze eenvoudig te verwerken zijn in pipelines
Ze structuur bieden zonder zware opmaak zoals XML of HTML
Veel kennisbanken en documentatiesystemen er standaard mee werken

In de context van AI-agents worden .md-bestanden vaak gebruikt als instructiebestanden (system prompts), als kennisbronnen voor RAG, of als uitvoerformaat.

Dit is een voorbeeld van een markdown-prompt dat je rechtstreeks in ChatGPT kan plakken:

# Weeranalyse Assistent
## Context
Je bent een data-analist gespecialiseerd in meteorologie en weersvoorspellingen.
Je ontvangt dagelijkse weergegevens van een Belgische stad en moet deze analyseren om trends, afwijkingen en mogelijke risico's te identificeren.

## Doel
Voer een analyse uit van de aangeleverde weerdata en genereer inzichten die bruikbaar zijn voor:
* Lokale overheden
* Evenementenorganisatoren
* Landbouwbedrijven
* Logistieke planners

## Invoer
De gebruiker zal een tabel of dataset aanleveren met één of meerdere van de volgende velden:
| Datum | Temperatuur | Neerslag | Windsnelheid | Luchtvochtigheid | Zonuren |
| ----- | ----------- | -------- | ------------ | ---------------- | ------- |

## Analyse-opdrachten
1. Beschrijf het algemene weerbeeld.
2. Detecteer opvallende trends.
3. Signaleer uitzonderlijke waarden of anomalieën.
4. Vergelijk de gegevens met wat typisch verwacht wordt voor het seizoen.
5. Benoem mogelijke gevolgen voor:
   * Verkeer
   * Buitenactiviteiten
   * Landbouw
6. Geef een korte voorspelling indien meerdere dagen beschikbaar zijn.

## Gewenste Output
Gebruik onderstaande structuur:

### Samenvatting
Een korte managementsamenvatting van maximaal 5 zinnen.
### Belangrijkste Trends
* Trend 1
* Trend 2
* Trend 3
### Opvallende Waarnemingen
Beschrijf afwijkingen of uitzonderlijke gebeurtenissen.
### Impactanalyse
| Domein      | Impact           | Toelichting |
| ----------- | ---------------- | ----------- |
| Verkeer     | Laag/Middel/Hoog | ...         |
| Landbouw    | Laag/Middel/Hoog | ...         |
| Evenementen | Laag/Middel/Hoog | ...         |
### Aanbevelingen
Geef maximaal 5 concrete aanbevelingen.

## Schrijfstijl
* Professioneel
* Feitelijk
* Beknopt
* Geen technische meteorologische vaktaal zonder uitleg

## Voorbeeldvraag
Analyseer de volgende weergegevens volgens bovenstaande instructies:

[DATASET WORDT HIER TOEGEVOEGD]

MCP: Model Context Protocol

MCP is een open standaard (ontwikkeld door Anthropic) die definieert hoe een AI-model verbinding maakt met externe systemen. Zie het als een bibliotheek met handleidingen en video's voor een doe-het-zelver, maar ook met een schroefmachine, een boormachine, een zaag en misschien zelfs een Roger van DobbitTV: een systeem dat MCP ondersteunt kan worden aangesloten op de bibliotheek, en weet vanaf dan hoe iets moet gebeuren én kan het ook laten gebeuren.

Via een MCP-server kan een AI-model:

Bestanden lezen en schrijven op je computer
Zoekopdrachten uitvoeren in een database
E-mails ophalen uit een mailbox
Externe API's aanspreken (kalender, CRM, ...)
Browseracties uitvoeren

Het verschil met een gewone API: MCP is bidirectioneel en ontworpen voor agentic workflows waarbij het model zelf beslist wanneer en hoe het tools inzet.

Op die manier zien we nu ook meer en meer software leveranciers, zoals Adobe, Canva, Ableton ..., MCP servers aanbieden, zodat jouw AI-model taken kan uitvoeren binnen die software.

Agents en tools

Een AI-agent is een taalmodel dat niet alleen antwoorden geeft, maar ook acties kan ondernemen. Een agent heeft toegang tot "tools": functies die het model kan aanroepen. Een tool kan zo eenvoudig zijn als "zoek in Google" of zo complex als "voer een database-query uit en stuur het resultaat per mail".

Concept	Wat het doet	Voorbeeld
LLM	Genereert tekst op basis van input	GPT-4, Claude, Mistral
Agent	Gebruikt een LLM + tools om taken uit te voeren	AI die zelfstandig e-mails sorteert
Tool	Functie die een agent kan aanroepen	Websearch, database-query, API-call
RAG	Vult de context van het model aan met opgehaalde info	Productcatalogus, kennisbank
MCP	Protocol voor verbinding tussen model en systemen	Verbinding met Google Drive

Context window

Het context window is de hoeveelheid tekst die een model tegelijk kan "zien". Alles buiten het context window bestaat niet voor het model. Moderne modellen hebben grote context windows (honderdduizenden tokens), maar ze zijn niet onbeperkt. Dit is waarom RAG zo waardevol is: je gooit niet alles in het context window, maar alleen wat relevant is.

Embeddings en vectordatabases

Om tekst doorzoekbaar te maken op basis van betekenis (niet alleen trefwoorden), zet je tekst om naar embeddings: numerieke vectoren die de semantische inhoud representeren. Teksten die over hetzelfde gaan, liggen dicht bij elkaar in de vectorruimte.

Een vectordatabase (zoals pgvector, Chroma of Qdrant) slaat die vectoren op en laat je snel de meest relevante fragmenten ophalen op basis van een zoekvraag. Dit is de technische ruggengraat van RAG.

Praktische conclusie: Je hoeft embeddings en vectorwiskunde niet volledig te begrijpen om met RAG te werken. Wat telt is het principe: tekst omzetten naar een doorzoekbaar formaat zodat je model de juiste context krijgt.