AI Jargon ontcijferd: RAG, MCP, agents en meer
De wereld van AI draait op acroniemen en concepten die voor buitenstaanders aanvoelen als een vreemde taal. RAG, MCP, embeddings, inference, context window... Wat betekent dat allemaal en waarom is het relevant als je AI wilt inzetten in je eigen processen?
Dit artikel is geen academische les. Het is een werkende woordenlijst, geschreven vanuit de praktijk van iemand die dagelijks met deze tools bezig is.
RAG: Retrieval-Augmented Generation
RAG is vermoedelijk het meest gebruikte concept in de praktische AI-wereld van vandaag. Het idee is simpel: een taalmodel, zoals ChatGPT of Claude, weet veel, maar niet alles. Het werd getraind op een momentopname van het internet en heeft geen toegang tot jouw interne documenten, je recente e-mails of je database.
RAG lost dit op door bij elke vraag relevante informatie op te zoeken en die mee te geven aan het model. De stappen zijn:
- Gebruiker stelt een vraag
- Het systeem doorzoekt een kennisbank (database, bestanden, index) op relevante fragmenten. Dit wordt de vectordatabase genoemd
- Die fragmenten worden samen met de vraag naar het model gestuurd
- Het model antwoordt op basis van de vraag én de gevonden context
Markdown (.md) bestanden
Markdown is een lichtgewicht opmaaktaal: gewone tekst met eenvoudige symbolen voor opmaak. # Titel maakt een hoofdtitel, **vet** maakt tekst vet, - item maakt een lijst. Markdown-bestanden worden door AI-tools breed gebruikt omdat:
- Ze leesbaar zijn voor zowel mensen als machines
- Ze eenvoudig te verwerken zijn in pipelines
- Ze structuur bieden zonder zware opmaak zoals XML of HTML
- Veel kennisbanken en documentatiesystemen er standaard mee werken
In de context van AI-agents worden .md-bestanden vaak gebruikt als instructiebestanden (system prompts), als kennisbronnen voor RAG, of als uitvoerformaat.
Dit is een voorbeeld van een markdown-prompt dat je rechtstreeks in ChatGPT kan plakken:
# Weeranalyse Assistent ## Context Je bent een data-analist gespecialiseerd in meteorologie en weersvoorspellingen. Je ontvangt dagelijkse weergegevens van een Belgische stad en moet deze analyseren om trends, afwijkingen en mogelijke risico's te identificeren. ## Doel Voer een analyse uit van de aangeleverde weerdata en genereer inzichten die bruikbaar zijn voor: * Lokale overheden * Evenementenorganisatoren * Landbouwbedrijven * Logistieke planners ## Invoer De gebruiker zal een tabel of dataset aanleveren met één of meerdere van de volgende velden: | Datum | Temperatuur | Neerslag | Windsnelheid | Luchtvochtigheid | Zonuren | | ----- | ----------- | -------- | ------------ | ---------------- | ------- | ## Analyse-opdrachten 1. Beschrijf het algemene weerbeeld. 2. Detecteer opvallende trends. 3. Signaleer uitzonderlijke waarden of anomalieën. 4. Vergelijk de gegevens met wat typisch verwacht wordt voor het seizoen. 5. Benoem mogelijke gevolgen voor: * Verkeer * Buitenactiviteiten * Landbouw 6. Geef een korte voorspelling indien meerdere dagen beschikbaar zijn. ## Gewenste Output Gebruik onderstaande structuur: ### Samenvatting Een korte managementsamenvatting van maximaal 5 zinnen. ### Belangrijkste Trends * Trend 1 * Trend 2 * Trend 3 ### Opvallende Waarnemingen Beschrijf afwijkingen of uitzonderlijke gebeurtenissen. ### Impactanalyse | Domein | Impact | Toelichting | | ----------- | ---------------- | ----------- | | Verkeer | Laag/Middel/Hoog | ... | | Landbouw | Laag/Middel/Hoog | ... | | Evenementen | Laag/Middel/Hoog | ... | ### Aanbevelingen Geef maximaal 5 concrete aanbevelingen. ## Schrijfstijl * Professioneel * Feitelijk * Beknopt * Geen technische meteorologische vaktaal zonder uitleg ## Voorbeeldvraag Analyseer de volgende weergegevens volgens bovenstaande instructies: [DATASET WORDT HIER TOEGEVOEGD]
MCP: Model Context Protocol
MCP is een open standaard (ontwikkeld door Anthropic) die definieert hoe een AI-model verbinding maakt met externe systemen. Zie het als een bibliotheek met handleidingen en video's voor een doe-het-zelver, maar ook met een schroefmachine, een boormachine, een zaag en misschien zelfs een Roger van DobbitTV: een systeem dat MCP ondersteunt kan worden aangesloten op de bibliotheek, en weet vanaf dan hoe iets moet gebeuren én kan het ook laten gebeuren.
Via een MCP-server kan een AI-model:
- Bestanden lezen en schrijven op je computer
- Zoekopdrachten uitvoeren in een database
- E-mails ophalen uit een mailbox
- Externe API's aanspreken (kalender, CRM, ...)
- Browseracties uitvoeren
Het verschil met een gewone API: MCP is bidirectioneel en ontworpen voor agentic workflows waarbij het model zelf beslist wanneer en hoe het tools inzet.
Op die manier zien we nu ook meer en meer software leveranciers, zoals Adobe, Canva, Ableton ..., MCP servers aanbieden, zodat jouw AI-model taken kan uitvoeren binnen die software.
Agents en tools
Een AI-agent is een taalmodel dat niet alleen antwoorden geeft, maar ook acties kan ondernemen. Een agent heeft toegang tot "tools": functies die het model kan aanroepen. Een tool kan zo eenvoudig zijn als "zoek in Google" of zo complex als "voer een database-query uit en stuur het resultaat per mail".
| Concept | Wat het doet | Voorbeeld |
|---|---|---|
| LLM | Genereert tekst op basis van input | GPT-4, Claude, Mistral |
| Agent | Gebruikt een LLM + tools om taken uit te voeren | AI die zelfstandig e-mails sorteert |
| Tool | Functie die een agent kan aanroepen | Websearch, database-query, API-call |
| RAG | Vult de context van het model aan met opgehaalde info | Productcatalogus, kennisbank |
| MCP | Protocol voor verbinding tussen model en systemen | Verbinding met Google Drive |
Context window
Het context window is de hoeveelheid tekst die een model tegelijk kan "zien". Alles buiten het context window bestaat niet voor het model. Moderne modellen hebben grote context windows (honderdduizenden tokens), maar ze zijn niet onbeperkt. Dit is waarom RAG zo waardevol is: je gooit niet alles in het context window, maar alleen wat relevant is.
Embeddings en vectordatabases
Om tekst doorzoekbaar te maken op basis van betekenis (niet alleen trefwoorden), zet je tekst om naar embeddings: numerieke vectoren die de semantische inhoud representeren. Teksten die over hetzelfde gaan, liggen dicht bij elkaar in de vectorruimte.
Een vectordatabase (zoals pgvector, Chroma of Qdrant) slaat die vectoren op en laat je snel de meest relevante fragmenten ophalen op basis van een zoekvraag. Dit is de technische ruggengraat van RAG.