Agent = Model + Harness: waarom een production-ready harness het echte verschil maakt
Wanneer een AI-agent faalt in een reële omgeving, is de eerste reactie bijna altijd "we hebben een beter model nodig". Dat is de verkeerde diagnose. In de overgrote meerderheid van de gevallen ligt het probleem niet bij het model — dat redeneert briljant. Het probleem zit in de harness: de softwarematige infrastructuur rond het model die het transformeert van iets dat antwoordt naar iets dat betrouwbaar handelt.
Dat is ook de formule waarop wij voortbouwen:
Agent = Model + Harness
Hetzelfde model, maar een betere harness — betere resultaten. Daar ligt de kracht van OpenKBS: wij bouwen een production-ready, scalable, secure harness. Deze publicatie legt uit wat dat betekent, waarom het belangrijk is voor het bedrijf en hoe de twee lagen — het model en de harness — samenkomen in het platform.
Wat een harness eigenlijk is
Als het model het brein is, dan is de harness het lichaam. Het brein kan denken, maar zonder lichaam kan het niets vastpakken, geen deur openen en het resultaat van zijn handeling niet controleren. De harness is alles wat staat tussen "het model heeft besloten wat het gaat doen" en "de handeling gebeurt veilig, traceerbaar en herhaalbaar":
- de tools die het model kan aanroepen;
- de geïsoleerde omgeving (sandbox) waarin de code wordt uitgevoerd;
- het geheugen en de opslag die sessies overleven;
- de feedback loops die de agent toelaten het resultaat te zien en te corrigeren;
- guardrails — de grenzen die voorkomen dat de agent schade aanricht;
- de observability die elke handeling van een auditspoor voorziet.
Het model op zich is stateless — het ontvangt tekst en geeft tekst terug. Al het overige dat een agent nuttig maakt in productie, is harness.
Waarom de meeste mislukkingen uit de harness komen, en niet uit het model
Dat is het cruciale inzicht: de meeste operationele mislukkingen van AI-agenten komen uit de harness, en niet uit het model zelf. De typische symptomen hebben niets te maken met de intelligentie van het model:
- Context rot — de context loopt vol of raakt vervuild en het model verliest de draad;
- Tool overload — te veel, slecht beschreven tools waartussen het model in de war raakt;
- Broze bedrading — handmatig in elkaar gezette integraties die breken bij de eerste wijziging;
- Latency — elke stap loopt via overbodige netwerkhops;
- Irrelevante retrieval — het geheugen geeft de verkeerde context terug;
- Zwakke verificatie — de agent controleert het resultaat van zijn handeling niet;
- Ontbrekende guardrails — niets stopt de agent wanneer hij een fout maakt.
Geen enkel van deze problemen wordt opgelost door een ander model te kiezen. Ze worden allemaal opgelost met een betere harness. Daarom maakt een sterke harness middelmatige modellen nuttig, terwijl een zwakke harness zelfs de beste modellen verspilt.
Laag 1 — Het model: vertrouwen via zero data retention
Wij maken geen modellen. En dat is een bewuste keuze: de beste modellen wisselen om de paar maanden, en vastzitten bij één vendor is een strategisch risico. In plaats daarvan bieden wij toegang tot alle grote providers — OpenAI, Anthropic, Google — via één AI-proxy, gehost in onze EU-infrastructuur.
Het verschil zit in de voorwaarden waaronder dit gebeurt:
- Zero data retention. De verzoeken lopen via de providers onder afspraken voor nulretentie van data — er wordt niets gelogd, niets bewaard en niets gebruikt om modellen te trainen. De data van de klant blijft niet achter bij de provider.
- Geen API-sleutels om te beheren. De klant jongleert niet met sleutels van OpenAI, Anthropic en Google — de toegang verloopt via één identificator en één facturatie in credits.
- Consolidatie van de toeleveringsketen. In plaats van een apart contract, een aparte risicobeoordeling en een aparte audit voor elke AI-vendor, werkt de klant met één leverancier. Voor gereguleerde sectoren is dat een rechtstreeks voordeel onder NIS2 en de AI Act — drastisch minder leveranciers om te beoordelen.
Met andere woorden: de modellen levert iedereen. Wij lossen het deel op dat in een enterprise-omgeving echt zwaar weegt — het vertrouwen.
Laag 2 — De harness: hier ligt onze kracht
Een production harness bestaat uit herkenbare bouwstenen. De kracht van OpenKBS is dat elk van die bouwstenen is gerealiseerd op een beheerde, geïsoleerde en gecertificeerde infrastructuur — niet als een handmatig in elkaar gezet prototype, maar als een platform.
| Bouwsteen van de harness | Realisatie in OpenKBS |
|---|---|
| System prompts / context | Lambda-functies — de context en de logica zijn code, geversioneerd bij elke uitrol |
| Tools | Project API: workers, S3, e-mail, MQTT, database — kant-en-klare tools die de agent aanroept |
| Sandboxes (isolatie) | Lambda microVM-isolatie + een afgescheiden AWS-account per klant + on-demand EC2-workers voor zware taken |
| Filesystem | S3 objectopslag met presigned URLs — beperkt in tijd en bereik |
| Memory (geheugen) | Beheerde PostgreSQL (Aurora/Neon), point-in-time restore tot 35 dagen, 6 kopieën in 3 zones |
| Feedback loops | Agent loop in Lambda: tool_use → uitvoering → observatie → herhaling en correctie |
| Guardrails | Multi-tenant isolatie, geïnjecteerde secrets, creditlimieten, OWASP security audit, AES-256 / TLS 1.2+ |
| Observability | CloudWatch-logs, worker-logs, usage collector, administratief auditlogboek |
| Toegang tot modellen | AI-proxy — alle vendors, zero retention, uniforme facturatie, geen sleutelbeheer |
Dit is geen lijst met ambities — dit is de infrastructuur die al onder elk project op het platform ligt. De ontwikkelaar vertrekt vanaf een kant-en-klare harness in plaats van die voor elke agent vanaf nul in elkaar te zetten.
Scalable by default
De Lambda-functies schalen automatisch van nul tot duizenden gelijktijdige uitvoeringen. Zware taken (videoverwerking, ML, batch) gaan naar on-demand workers met facturatie per seconde. De database kiest de juiste engine naargelang de belasting. Geen capaciteitsplanning en geen servers om te onderhouden.
Secure by design
Elke klant is fysiek geïsoleerd op het niveau van een AWS-account — een harde grens, afgedwongen door AWS IAM, en niet louter een logische scheiding. Secrets worden bij de uitrol geïnjecteerd, nooit in de code. De toegang verloopt via JWT en per-project sleutels met automatische rotatie. Elke nieuwe versie doorloopt een gestructureerde security audit.
Production-ready betekent compliant
In een gereguleerde Europese omgeving heeft "production-ready harness" nog een betekenis: compliant harness. Hier smelten de kracht van de harness en de regelgevende conformiteit samen tot één geheel.
- EU data residency — alle resources bevinden zich standaard in de AWS-regio eu-central-1 (Frankfurt). De data verlaat de EU niet.
- Geërfde certificeringen — de infrastructuur bouwt voort op AWS met meer dan 150 onafhankelijk geauditeerde certificeringen (ISO/IEC 27001, SOC 2 Type II, C5 van het BSI), inclusief lidmaatschap van de Duitse kritieke infrastructuur (KRITIS).
- Security audit bij elke versie — statische analyse voor OWASP Top 10, controle op SQL-injecties, XSS, CSRF, SSRF, command injection en CVE-kwetsbaarheden vóór productie; de rapporten zijn beschikbaar voor de regelgever.
- Afgescheiden en overdraagbaar account — bij beëindiging van het contract wordt het volledige AWS-account overgedragen aan de klant. Er wordt niets gemigreerd, er zijn geen proprietaire formaten, geen vendor lock-in.
Dezelfde harness die de agenten betrouwbaar maakt, maakt ze ook auditeerbaar. De details over NIS2 en de AI Act staan beschreven in onze afzonderlijke publicaties — NIS2 en de AI-transformatie van de productiesector en De AI Act en de conformiteit voor ondernemingen.
Wat dit betekent voor het bedrijf
De meeste bedrijven bouwen vandaag niet één AI-agent. Ze bouwen er tientallen. En zonder gemeenschappelijke infrastructuur verandert dat snel in agent sprawl — verspreide, niet-verbonden agenten die geen enkel team betrouwbaar kan beheren, auditeren of onderhouden.
De gedeelde, production-ready harness lost net dat op:
- Van demo naar productie. Het prototype dat op de laptop draait, en het systeem dat reëel verkeer in een gereguleerde omgeving doorstaat, zijn twee verschillende dingen. Het verschil is de harness.
- Governance. Eén plek voor observability, secrets, limieten en audit — in plaats van dat elke agent het wiel opnieuw uitvindt.
- Snelheid zonder risico te nemen. De teams focussen op de logica van de agent, en niet op isolatie, schaalbaarheid en conformiteit — die komen kant-en-klaar.
De conclusie is eenvoudig: succes in productie vereist dat harness engineering wordt behandeld als een aparte discipline, even belangrijk als de keuze van het model. Dat is de discipline waarin OpenKBS sterk staat.
Volgende stap
Als uw organisatie overgaat van AI-prototypes naar reële, production-agenten — vooral in een gereguleerde sector — neem dan contact met ons op. Wij bekijken uw concrete situatie en tonen u hoe een production-ready harness eruitziet voor uw bedrijf: geïsoleerd, schaalbaar, veilig en standaard conform.
De beschreven enterprise-diensten — een afgescheiden AWS-account, de security audit en de review van AI-gegenereerde code — maken deel uit van het Enterprise-plan van OpenKBS.
Deze publicatie heeft een informatief karakter en vormt geen juridisch advies.