AI 21 juni 2026 · 16 min leestijd · Studio Koko

AI in gewone taal: de termen die je hoort maar zelden uitgelegd krijgt

Van tokens, RAG en MCP tot agentic loops, Hermes en Tailscale mesh: veelgehoorde AI-termen van 2026, in gewone taal uitgelegd voor ondernemers.

Familie stokstaartjes die samen de horizon afspeurt: een klein team dat het werk verdeelt terwijl er altijd eentje de wacht houdt, zoals AI-agents die hun werk doen terwijl jij het overzicht houdt

Je leest en hoort de hele dag over AI. Een deel is makkelijk te volgen, want iedereen heeft intussen wel eens iets aan ChatGPT gevraagd. Maar al snel wordt het te technisch, en niet alleen voor ondernemers. Ook doorgewinterde techneuten haken op een bepaald punt af.

Net daar zit dit artikel. We pakken een reeks termen die je tegenkomt en leggen ze uit in gewone taal: wat is het, wanneer is het nuttig, wanneer is het overkill en waar moet je op letten. Geen hype, en geen jargon zonder vertaling.

We beginnen bij de termen die je het vaakst hoort en werken zo naar de meer technische toe. Je hoeft ze niet allemaal te kennen. Maar snap je wat ze betekenen, dan voer je een veel beter gesprek over wat AI wel en niet voor je bedrijf kan doen. En achter bijna elke term zit trouwens een verrassend gewoon idee.

Wat zijn tokens en een context window?

Een token is het kleine stukje tekst waarin AI rekent, en het context window is hoeveel van die stukjes een model in één keer kan overzien.

Een token is ongeveer een stukje van een woord, een paar tekens groot. AI leest en schrijft in tokens, en je betaalt ook per token. Het context window is het werkgeheugen van het model: hoeveel tekst er in één keer in past, je vraag, je documenten en het antwoord samen. Als je hoort dat een model een miljoen tokens context aankan, betekent dat grofweg dat het een hele stapel documenten in één keer kan lezen.

Waarom dit telt: het verklaart twee dingen waar je echt iets aan hebt. De kost, want meer tokens is meer geld. En de omvang, want het zegt hoeveel een model tegelijk aankan, bijvoorbeeld een lang contract of een volledig dossier. Let wel op: een groter context window is niet vanzelf beter. Modellen verliezen in heel lange teksten soms de draad, en alles erin proppen maakt elke vraag duurder. Voor de meeste taken heb je het maximum niet nodig.

Wat is RAG, of AI op je eigen documenten?

RAG betekent dat de AI eerst je eigen documenten opzoekt en pas daarna antwoordt, zodat het antwoord op jouw informatie steunt en niet op algemene kennis van het internet.

De volledige term is 'retrieval-augmented generation', maar het idee is simpel. In plaats van een model te laten antwoorden uit wat het vaag onthouden heeft, laat je het eerst zoeken in een verzameling van je eigen teksten: handleidingen, offertes, je website, klantendossiers. De relevante stukjes gaan mee als context, en daarop schrijft het model zijn antwoord. Zowat elke chatbot op je eigen kennisbank werkt zo.

Dit is meteen de meest gevraagde toepassing voor bedrijven: een assistent die antwoordt vanuit jouw documentatie in plaats van vanuit het hele internet. Accurater, en je kunt de bron tonen. De waarschuwing is even simpel: het is maar zo goed als wat je erin stopt. Rommel erin is rommel eruit. En je moet bepalen welke gevoelige documenten de AI mag inzien. Verderop bij het geheugen met platte tekst zie je een eenvoudige, controleerbare manier om zoiets op te bouwen.

Wat is MCP?

MCP is een afspraak, een soort universele stekker, waarmee een AI-assistent op een vaste manier kan praten met externe tools en gegevensbronnen.

Voluit heet het Model Context Protocol. Het probleem dat het oplost: elke AI apart koppelen aan elke tool, je agenda, je boekhouding, een zoekfunctie, je documenten, was vroeger telkens maatwerk. MCP maakt daar één standaard van, zoals USB-C één stekker werd voor allerlei toestellen. Een tool die MCP spreekt, kan een AI-assistent meteen gebruiken. Anthropic introduceerde het eind 2024, en in 2025 en 2026 namen veel andere tools het over, ook de geheugen- en agenttools verderop in dit artikel.

Voor jou betekent het dat AI-assistenten steeds makkelijker aan je bestaande systemen hangen, zonder dat alles van nul gebouwd wordt. Minder maatwerk, meer hergebruik. Eén kanttekening: een stekker is geen slot. Zodra een AI via MCP bij je systemen kan, bepaalt wie wat mag zien ineens mee hoe veilig het is. Geef een assistent alleen toegang tot wat hij echt nodig heeft.

Wat is een agentic workflow?

Een agentic workflow is een vast, voorspelbaar pad waarlangs AI een taak afhandelt, stap voor stap, waarbij jij vooraf bepaalt welke stappen er zijn en in welke volgorde.

Vergelijk het met een lopende band. Elke plek aan de band doet één ding: lezen, sorteren, samenvatten, controleren. De AI doet het denkwerk binnen een stap, maar de route ligt vast. Anthropic, het bedrijf achter Claude, maakte dit onderscheid populair in een veelgelezen gids uit december 2024.

In de praktijk is het een handvol patronen die je kunt combineren:

een taak opsplitsen in vaste stappen, waarbij elke stap de volgende voedt: eerst opstellen, dan nakijken, dan bijschaven;
binnenkomend werk sorteren en naar de juiste afhandeling sturen, zodat een mail bij 'klacht', 'offerte' of 'support' belandt, elk met een eigen aanpak;
dezelfde vraag aan meerdere modellen tegelijk stellen en de antwoorden naast elkaar leggen;
een 'manager'-stap die een opdracht in deeltaken knipt en die uitdeelt aan andere stappen;
een maker en een controleur die om de beurt verbeteren tot het resultaat goed genoeg is.

Waarom dit telt voor een KMO: het saaie, voorspelbare werk leent zich hier perfect voor. Offertes voorbereiden, supporttickets sorteren, lange documenten samenvatten, gegevens uit PDF's of Excel halen. Een vast pad faalt ook op een voorspelbare manier, en dat maakt het makkelijk te controleren en bij te sturen. De eerlijke vuistregel: het meeste betrouwbare bedrijfswerk is een workflow, geen volledig zelfstandige AI.

En een agentic loop dan?

Een agentic loop is bijna het omgekeerde: je geeft de AI een doel in plaats van een vast pad, en ze blijft zelf proberen, controleren en bijsturen tot dat doel bereikt is.

Het bekendste voorbeeld heeft een grappige naam: de Ralph-loop, genoemd naar het simpele maar onvermoeibare personage uit The Simpsons. De Australische ontwikkelaar Geoffrey Huntley zette in 2025 een AI die code schrijft in een lus die telkens opnieuw dezelfde opdracht uitvoert. Elke ronde begint met een schone lei, en de voortgang wordt bewaard in gewone bestanden op de schijf. Zo verbetert de AI bij elke ronde haar eigen werk van de ronde ervoor. Anthropic vond het idee sterk genoeg om er in december 2025 een kant-en-klare versie voor Claude van te maken.

Klinkt straf, en dat is het ook, tot het misgaat.

Een lus zonder rem is gevaarlijk. Ze kan in een oneindige cirkel blijven hangen, het verkeerde doel najagen of geld blijven opstoken. In één beschreven geval bleef een agent minutenlang hetzelfde kapotte commando aanroepen, honderden keren na elkaar. Daarom draai je een loop altijd met een harde grens op het aantal rondes en op de kosten, en het liefst in een afgeschermde omgeving zodat ze niet aan je echte bestanden of wachtwoorden kan.

Het verschil in één zin: een workflow volgt een kaart die jij hebt getekend, een loop tekent onderweg zijn eigen kaart. Voor afgebakend technisch werk is een loop handig. Voor het meeste bedrijfswerk wil je de voorspelbaarheid van een workflow.

Wat zijn die Claude Code- en Codex-handoffs?

Claude Code en Codex zijn twee AI-assistenten die in het venster van een programmeur leven en zelf code lezen, schrijven en testen. Een handoff betekent dat je ze allebei inzet: de ene doet het werk, de andere kijkt het na.

Claude Code komt van Anthropic, Codex van OpenAI. Tot voor kort waren dat twee concurrerende kampen. Op 31 maart 2026 deed OpenAI iets opvallends: het bracht een officiële Codex-plugin uit die binnen Claude Code draait. Claude schrijft de code en geeft ze daarna door aan Codex voor een onafhankelijke review. Er is zelfs een strengere variant die het ontwerp actief probeert onderuit te halen en een rem die Claude niet laat afronden voor Codex heeft gekeken.

Waarom zou je twee AI's op dezelfde taak zetten? Om dezelfde reden dat je je eigen tekst slecht nakijkt: wie iets maakt, ziet zijn eigen fouten niet goed. De twee modellen zijn anders getraind, dus ze struikelen over andere dingen. Een tweede, onafhankelijk model vangt fouten en gaten die het eerste miste.

De keerzijde is simpel: je betaalt twee keer en je voegt een stap toe. Daarom houden de meeste studio's die dubbele controle voor het werk dat er echt toe doet, niet voor elke regel. Voor jou als opdrachtgever is het vooral een goed teken. 'Met AI gebouwd' hoort niet hetzelfde te zijn als 'ongecontroleerd'.

Wie of wat is Hermes?

Hermes is verwarrend, want het zijn twee dingen van dezelfde maker, het onafhankelijke AI-lab Nous Research. Hermes 4 is een AI-model dat je zelf kunt downloaden en draaien. Hermes Agent is aparte software die zo'n model laat werken als een echte assistent.

Even het verschil. Een model is het brein: Hermes 4 verscheen in augustus 2025, is gebouwd op Meta's Llama en is goed in het aanroepen van externe tools, de vaardigheid waarmee een AI echt iets kan doen in plaats van enkel praten. Hermes Agent, uit begin 2026, is de werker rond dat brein: het onthoudt dingen tussen gesprekken, gebruikt tools en kan met zowat elk model overweg.

Voor een ondernemer telt vooral het verschil tussen 'open' en 'gesloten'. Bij ChatGPT of Claude huur je de dienst: je data passeert via de servers van een Amerikaans bedrijf en je betaalt per gebruik. Een open model zoals Hermes kun je op je eigen infrastructuur draaien. Je data blijft dan binnenshuis, je hebt meer controle en bij veel volume kan het goedkoper zijn. De prijs die je daarvoor betaalt is werk: iemand moet het installeren, beveiligen en onderhouden. En Hermes is bewust minder gefilterd dan Claude of ChatGPT, wat in een bedrijfscontext eerder iets is om voorzichtig mee te zijn dan een verkoopargument.

Wanneer is dit interessant? Als je met gevoelige data werkt die niet naar buiten mag, of als je heel veel verwerkt. Voor de meeste KMO's is gewoon ChatGPT of Claude gebruiken eenvoudiger en goed genoeg. Zie open modellen als een optie voor wie een duidelijke reden heeft, niet als de standaard.

Wat is dat geheugen met Obsidian en QMD?

Dit gaat over AI een geheugen geven in de vorm van gewone tekstbestanden, zodat ze niet bij elk gesprek weer van nul begint. Het is nauw verwant aan RAG hierboven, alleen eenvoudiger en volledig in eigen beheer.

Standaard vergeet een chatbot je na elk gesprek. De oplossing die in 2026 populair werd is verrassend simpel: geef de AI een map met platte tekstbestanden die ze mag lezen en bijwerken. Obsidian is gewoon een gratis app om zulke bestanden te bekijken en aan elkaar te linken, maar de bestanden zelf zijn doodgewone notities op je eigen computer.

De aanpak is telkens dezelfde. Eén feit of onderwerp per bestandje, een paar vaste regels bovenaan voor datum en bron, plus een soort inhoudsopgave die alles verbindt. QMD verwijst hier naar een echt hulpmiddeltje met die naam, gemaakt door Tobias Lütke, de topman van Shopify. Het doorzoekt die map met notities lokaal, zonder dat er iets naar de cloud gaat, zodat de AI snel de juiste notitie terugvindt.

Waarom zou je dit willen? Omdat je je kennis in eigen handen houdt. Het is platte tekst die jij bezit, niet iets dat vastzit in de database van een leverancier. Je kunt openen, lezen en corrigeren wat de AI 'weet', en met versiebeheer zie je precies wat er wanneer veranderde. Het praktische gewin: je assistent vraagt niet elke keer opnieuw naar je diensten, je tarieven of je huisstijl.

Waar je op moet letten: verouderde of foute notities sturen de AI de verkeerde kant op, dus iemand moet af en toe opruimen. En staat er klantinformatie in, hou die map dan lokaal en denk aan de GDPR.

Cron jobs en een kanban-bord, voor AI?

Dit zijn twee oude, saaie kantoorgereedschappen die je hergebruikt om AI-agents veilig hun werk te laten doen: een timer en een takenbord.

Cron is niets meer dan een wekker voor computers: elke werkdag om zeven uur, voer deze taak uit. Zo laat je een AI-agent op een vast moment werken zonder dat er iemand op moet letten. Een kanban-bord ken je waarschijnlijk al: kolommen met kaartjes, Te doen, Bezig, Klaar. Hier wordt het de takenlijst van de agents. Een agent pakt een kaartje, zet het op Bezig, doet het werk en schuift het naar Klaar. Jij ziet het hele bord en houdt zo de controle.

Dat bord is meteen je stuur. Niets gebeurt wat geen kaartje is, en jij kunt kaartjes toevoegen, herschikken of weghalen voor een agent eraan begint. Een werkend voorbeeld is Backlog.md, waarbij elk kaartje een tekstbestand is dat in je projectmap leeft. Een ander bekend project, Vibe Kanban, was hierin invloedrijk maar wordt intussen afgebouwd. Een goede herinnering dat de gereedschappen nog snel veranderen terwijl het idee blijft.

Het nut voor een klein team: het saaie, terugkerende werk gebeurt 's nachts of vroeg in de ochtend, zodat de resultaten klaarliggen als jij binnenkomt. Denk aan een dagelijkse samenvatting, een eerste schifting van je inbox of een rapport dat zichzelf ververst. De waarschuwing erbij: een agent die op een schema draait, herhaalt ook zijn fouten op een schema. Laat een mens goedkeuren voor er iets de deur uitgaat.

En Fleet plus Tailscale mesh?

Dit gaat over de computers waarop dat alles draait. Tailscale knoopt een handvol van je eigen toestellen samen tot één klein privénetwerk waar enkel jij bij kan.

Een fleet is gewoon een verzameling machines die samenwerken: een servertje bij je thuis, een goedkope cloudcomputer, een mini-pc, je laptop. Tailscale is een zogenaamde mesh-VPN, gebouwd op de gerespecteerde open techniek WireGuard. In gewone taal: het maakt een beveiligd privénetwerk tussen je toestellen, waarbij elk toestel rechtstreeks met elk ander praat. Dat is anders dan een klassieke bedrijfs-VPN, waar alles via één centrale server moet passeren.

Wat dat oplevert: er staat niets open op het publieke internet, en toch kun je elk van je machines vanaf je telefoon bereiken, waar je ook bent. Je hoeft geen poorten open te zetten, en inloggen gaat via een account dat je al hebt. Voor een klein bedrijf is dit aantrekkelijk: het is goedkoop, het gratis tarief dekt tot zes gebruikers en je data blijft op machines die je zelf in handen hebt. Je kunt er bijvoorbeeld je eigen AI-model op draaien en het veilig vanaf je gsm gebruiken, zonder dat er iets naar buiten lekt.

Eén ding om te onthouden: je login is meteen de hoofdsleutel tot dat netwerk. Zet er dus tweestapsverificatie op. Tailscale beveiligt de weg tussen je machines, maar het beveiligt de machines zelf niet. Het is goed loodgieterswerk, geen volledige beveiliging.

Wat betekent dit voor jouw bedrijf?

Leg al die termen naast elkaar en je ziet één rode draad. Het zijn geen magische producten, het zijn saaie, betrouwbare bouwstenen: een timer, een bord, tekstbestanden, een netwerkje, twee AI's die elkaar nakijken, met oordeel aan elkaar geknoopt. Wie de stukken begrijpt, ziet ook waar de controle zit: bij wie de data bezit, de grenzen instelt en goedkeurt voor er iets verstuurd wordt.

Moet je dit zelf bouwen? Meestal niet, en zeker niet allemaal tegelijk. Voor de meeste KMO's begint het bij één goed afgebakende workflow die echt tijd bespaart, niet bij een eigen vloot agents. Maar het loont om de taal te snappen, want dan stel je de juiste vragen: welke taak wil ik automatiseren, welk model past erbij, waar blijft mijn data en wie kijkt het na?

Dat is precies de laag waar wij bij Studio Koko mee helpen. Niet de hype, wel de praktische keuzes eronder. Wil je weten welk stuk hiervan zinvol is voor jouw bedrijf, en welk stuk je beter nog even laat liggen? Neem contact op, of lees eerst onze uitleg over AI-agents.

Veelgestelde vragen

Welke van deze termen moet ik echt kennen?

Als ondernemer heb je het meest aan een handvol. Het verschil tussen een workflow en een loop, want dat bepaalt hoeveel controle je houdt. En tokens en RAG, want die bepalen wat AI kost en of ze met jouw eigen informatie kan werken. De rest hoef je niet te beheersen, maar het helpt om ze te herkennen, zodat je een gesprek met een ontwikkelaar of partner kunt volgen.

Moet ik dit allemaal zelf opzetten?

Nee. Het meeste bedrijfsnut zit in één goed gekozen workflow, niet in een hele vloot agents. Begin klein, bij een taak die vaak terugkomt en duidelijk af te bakenen is, en bouw pas uit als dat zijn waarde bewijst.

Is dit niet veel te technisch voor een klein bedrijf?

De gereedschappen zijn technisch, de ideeën niet. Je hoeft geen cron of mesh-netwerk te kunnen instellen om te beslissen welk werk je wilt automatiseren en welke data binnenshuis moet blijven. Voor de installatie werk je samen met iemand die het kent, net zoals je dat met je boekhouding of je elektriciteit doet.

Is een open model zoals Hermes veilig genoeg voor mijn data?

Zelf draaien kan net privacyvriendelijker zijn, want je data blijft op je eigen machines. Maar gratis te downloaden is niet hetzelfde als gratis in gebruik: iemand moet het model beveiligen, updaten en in de gaten houden. Zonder dat onderhoud ruil je het ene risico in voor het andere.

Wat kost het om AI-agents 24/7 te laten draaien?

Op kleine schaal valt het mee. Een privénetwerk als Tailscale is gratis tot zes gebruikers en een goedkope cloudmachine kost weinig. De grootste kost zijn de AI-modellen zelf, vooral bij loops die blijven draaien. Stel daarom altijd een harde grens in op het aantal rondes en op de kosten.

Bronnen: de Anthropic-gids 'Building Effective Agents', de Anthropic-aankondiging van het Model Context Protocol, de uitleg van Geoffrey Huntley over de Ralph-techniek, de Ralph-plugin voor Claude Code, The Decoder over de Codex-plugin in Claude Code, de Hermes 4-modelkaart van Nous Research, de documentatie van Hermes Agent, het qmd-project van Tobias Lütke, het Backlog.md-project, de uitleg 'What is Tailscale?', de Tailscale-prijzen en de Tailscale-gids om zelf een AI-stack te hosten.