Agent = Model + Harness: perché il harness production-ready è la vera differenza
Quando un agente IA fallisce in un ambiente reale, la prima reazione è quasi sempre "ci serve un modello migliore". È la diagnosi sbagliata. Nella stragrande maggioranza dei casi il problema non è il modello — ragiona in modo brillante. Il problema è il harness: l'infrastruttura software attorno al modello, quella che lo trasforma da qualcosa che risponde in qualcosa che agisce in modo affidabile.
È anche la formula su cui ci basiamo:
Agent = Model + Harness
Lo stesso modello, ma con un harness migliore — risultati migliori. È qui che OpenKBS è forte: costruiamo un harness production-ready, scalabile e sicuro. Questo articolo spiega cosa significa, perché conta per il business e come i due livelli — il modello e il harness — si combinano nella piattaforma.
Cos'è davvero un harness
Se il modello è il cervello, il harness è il corpo. Il cervello può pensare, ma senza un corpo non può afferrare nulla, aprire una porta o verificare il risultato della propria azione. Il harness è tutto ciò che sta tra "il modello ha deciso cosa fare" e "l'azione è avvenuta in modo sicuro, tracciabile e ripetibile":
- gli strumenti (tools) che il modello può richiamare;
- l'ambiente isolato (sandbox) in cui il codice viene eseguito;
- la memoria e lo storage che sopravvivono tra le sessioni;
- i feedback loops che permettono all'agente di vedere il risultato e correggersi;
- i guardrails — i confini che impediscono all'agente di fare danni;
- l'osservabilità (observability), che fornisce una traccia di audit per ogni azione.
Il modello di per sé è stateless — riceve testo e restituisce testo. Tutto il resto, ciò che rende un agente utile in production, è harness.
Perché la maggior parte dei fallimenti viene dal harness, non dal modello
Questa è l'intuizione chiave: la maggior parte dei fallimenti operativi degli agenti IA viene dal harness, non dal modello stesso. I sintomi tipici non hanno nulla a che fare con l'intelligenza del modello:
- Context rot — il contesto si sovraccarica o si contamina e il modello perde il filo;
- Tool overload — troppi strumenti, descritti male, tra cui il modello si confonde;
- Cablaggio fragile — integrazioni assemblate a mano che si rompono al primo cambiamento;
- Latenza — ogni passaggio attraversa salti di rete superflui;
- Recupero non pertinente — la memoria restituisce il contesto sbagliato;
- Verifica debole — l'agente non controlla il risultato della propria azione;
- Guardrails mancanti — niente ferma l'agente quando sbaglia.
Nessuno di questi problemi si risolve cambiando il modello. Si risolvono tutti con un harness migliore. Per questo un harness forte rende utili i modelli mediocri, mentre un harness debole spreca anche i migliori.
Livello 1 — Il modello: fiducia tramite zero data retention
Noi non costruiamo modelli. Ed è una scelta consapevole: i modelli migliori cambiano ogni pochi mesi, e restare bloccati su un unico vendor è un rischio strategico. Forniamo invece l'accesso a tutti i principali provider — OpenAI, Anthropic, Google — attraverso un unico AI proxy, ospitato nella nostra infrastruttura UE.
La differenza sta nelle condizioni in cui ciò avviene:
- Zero data retention. Le richieste passano attraverso i provider con accordi di zero conservazione dei dati — nulla viene loggato, nulla viene conservato e nulla viene usato per addestrare i modelli. I dati del cliente non restano presso il provider.
- Nessuna chiave API da gestire. Il cliente non deve destreggiarsi tra chiavi di OpenAI, Anthropic e Google — l'accesso passa attraverso un solo identificativo e un'unica fatturazione a crediti.
- Consolidamento della catena di fornitura. Invece di un contratto separato, una valutazione del rischio separata e un audit separato per ogni vendor IA, il cliente lavora con un solo fornitore. Per i settori regolamentati è un vantaggio diretto in ottica NIS2 e AI Act — molti meno fornitori da valutare.
In altre parole: i modelli li offrono tutti. Noi risolviamo la parte che pesa davvero in un contesto enterprise — la fiducia.
Livello 2 — Il harness: qui sta la nostra forza
Un harness di production è composto da blocchi costitutivi riconoscibili. La forza di OpenKBS è che ciascuno di essi è realizzato su un'infrastruttura gestita, isolata e certificata — non come un prototipo assemblato a mano, ma come piattaforma.
| Blocco costitutivo del harness | Realizzazione in OpenKBS |
|---|---|
| System prompts / contesto | Funzioni Lambda — contesto e logica sono codice, versionato a ogni deployment |
| Tools (strumenti) | Project API: workers, S3, email, MQTT, database — strumenti pronti che l'agente richiama |
| Sandboxes (isolamento) | Isolamento Lambda microVM + account AWS dedicato per cliente + workers EC2 on-demand per i task pesanti |
| Filesystem | Storage a oggetti S3 con presigned URLs — limitati nel tempo e nell'ambito |
| Memory (memoria) | PostgreSQL gestito (Aurora/Neon), point-in-time restore fino a 35 giorni, 6 copie in 3 zone |
| Feedback loops | Agent loop in Lambda: tool_use → esecuzione → osservazione → ripetizione e correzione |
| Guardrails | Isolamento multi-tenant, secrets iniettati, limiti di credito, OWASP security audit, AES-256 / TLS 1.2+ |
| Observability | Log CloudWatch, log dei worker, usage collector, registro di audit amministrativo |
| Accesso ai modelli | AI proxy — tutti i vendor, zero retention, fatturazione unificata, senza gestione di chiavi |
Non è un elenco di ambizioni — è l'infrastruttura che già sta sotto ogni progetto della piattaforma. Lo sviluppatore parte da un harness pronto, invece di assemblarlo da zero per ogni agente.
Scalabile per impostazione predefinita
Le funzioni Lambda scalano automaticamente da zero a migliaia di esecuzioni simultanee. I task pesanti (elaborazione video, ML, batch) vanno su workers on-demand con fatturazione al secondo. Il database sceglie il motore giusto in base al carico. Nessuna pianificazione della capacità e nessun server da mantenere.
Sicuro by design
Ogni cliente è fisicamente isolato a livello di account AWS — un confine rigido, imposto da AWS IAM, non una separazione logica. I secrets vengono iniettati al deployment, mai nel codice. L'accesso passa tramite JWT e chiavi per-progetto con rotazione automatica. Ogni nuova versione passa attraverso un audit di sicurezza strutturato.
Production-ready significa compliant
In un contesto europeo regolamentato, "harness production-ready" ha un ulteriore significato: harness compliant. Qui la forza del harness e la conformità normativa si fondono in una sola cosa.
- EU data residency — tutte le risorse sono per impostazione predefinita nella regione AWS eu-central-1 (Francoforte). I dati non lasciano l'UE.
- Certificazioni ereditate — l'infrastruttura si appoggia su AWS con oltre 150 certificazioni verificate in modo indipendente (ISO/IEC 27001, SOC 2 Type II, C5 del BSI), inclusa l'appartenenza all'infrastruttura critica tedesca (KRITIS).
- Security audit a ogni versione — analisi statica per OWASP Top 10, verifica per SQL injection, XSS, CSRF, SSRF, command injection e vulnerabilità CVE prima della produzione; i report sono disponibili per il regolatore.
- Account dedicato e trasferibile — alla cessazione del contratto l'intero account AWS viene trasferito al cliente. Nulla viene migrato, nessun formato proprietario, nessun vendor lock-in.
Lo stesso harness che rende gli agenti affidabili li rende anche auditabili. I dettagli su NIS2 e AI Act sono descritti nei nostri articoli dedicati — NIS2 e la trasformazione IA del settore manifatturiero e AI Act e la conformità per le imprese.
Cosa significa per il business
La maggior parte delle aziende oggi non costruisce un solo agente IA. Ne costruisce decine. E senza un'infrastruttura comune questo si trasforma rapidamente in agent sprawl — agenti dispersi e scollegati che nessun team riesce a gestire, auditare o mantenere in modo affidabile.
Il harness condiviso e production-ready risolve esattamente questo:
- Dal demo alla production. Il prototipo che funziona sul portatile e il sistema che regge il traffico reale in un ambiente regolamentato sono due cose diverse. La differenza è il harness.
- Governance. Un unico luogo per osservabilità, secrets, limiti e audit — invece che ogni agente reinventi la ruota.
- Velocità senza assunzione di rischio. I team si concentrano sulla logica dell'agente, non su isolamento, scalabilità e conformità — arrivano già pronti.
La conclusione è semplice: il successo in production richiede che l'ingegneria del harness sia trattata come una disciplina a sé, di pari importanza rispetto alla scelta del modello. È la disciplina in cui OpenKBS è forte.
Il prossimo passo
Se la vostra organizzazione sta passando dai prototipi IA ad agenti reali in production — soprattutto in un settore regolamentato — contattateci. Esamineremo il vostro caso specifico e vi mostreremo come si presenta un harness production-ready per la vostra azienda: isolato, scalabile, sicuro e conforme per impostazione predefinita.
I servizi enterprise descritti — account AWS dedicato, audit di sicurezza e revisione del codice generato dall'IA — fanno parte del piano Enterprise di OpenKBS.
Il presente articolo ha carattere informativo e non costituisce consulenza legale.