Hoe-doe-je · 5 min lezen

RAG knowledge base: welke documenten wel/niet uploaden

Niet alle docs zijn goede RAG-bronnen. Hier de checklist voor wat AI moet zien én wat juist niet.

Jesse-Joe · 2026-05-10

Wat WEL

Product-FAQ · prijslijst (publieke) · retour-beleid · verzendvoorwaarden · openingstijden · contactinformatie · onboarding-handleiding · pricing-tiers · garantie-voorwaarden. Allemaal: feitelijk, ondubbelzinnig, voor publiek bedoeld.

Wat NIET

Interne salaris-info · klant-persoonlijke data (AVG!) · onuitgewerkte concepten · brainstorm-documenten · oude versies van beleid · juridische documenten met disclaimers (laat advocaat dat doen).

Het format probleem

PDF werkt het beste. DOCX prima. CSV voor product-tabellen. HTML pages (jouw site-FAQ) ook fijn. Vermijd: scans (slechte OCR), PowerPoints (te visueel), Excel met formules (alleen pure data).

Versie-beheer

Phantrium chunks 1 versie per upload. Geen automatische versionering. Best practice: hou 1 'master KB-FAQ.pdf' bij, vervang die maandelijks bij wijzigingen. Niet 5 versies tegelijk uploaden.

Test je KB met de zoek-tool

Op dashboard agent-detail: 'Test retrieval'-knop. Typ een typische klant-vraag, zie welke chunks AI gebruikt. Komt de juiste info bovendrijven? Zo nee, herschrijf je doc met duidelijkere headings en zoek-vriendelijke woorden.

Schaal-grens

Phantrium's TF-IDF werkt prima tot ~50.000 woorden per agent. Heb je groter? Splits in meerdere agents per categorie ('Webshop-FAQ-agent' vs 'Returns-agent') of upgrade naar enterprise met embedding-vectoren. Vraag dan een gesprek.

Klaar om te starten?

14 dagen gratis testen · geen credit card · cancel anytime.