Agent = Model + Harness: proč je rozdíl v production-ready harnessu
Když AI agent selže v reálném prostředí, první reakce je téměř vždy „potřebujeme lepší model". To je chybná diagnóza. V naprosté většině případů problém není v modelu — ten uvažuje skvěle. Problém je v harnessu: softwarové infrastruktuře kolem modelu, která ho mění z něčeho, co odpovídá, na něco, co spolehlivě jedná.
To je i vzorec, na kterém stavíme:
Agent = Model + Harness
Stejný model, ale lepší harness — lepší výsledky. To je oblast, kde je OpenKBS silný: budujeme production-ready, scalable, secure harness. Tento článek vysvětluje, co to znamená, proč na tom záleží pro byznys a jak se obě vrstvy — model i harness — v platformě pokrývají.
Co vlastně harness je
Pokud je model mozek, harness je tělo. Mozek umí myslet, ale bez těla nedokáže nic uchopit, otevřít dveře ani ověřit výsledek své akce. Harness je všechno, co stojí mezi „model se rozhodl, co udělat" a „akce se odehrála bezpečně, dohledatelně a opakovatelně":
- nástroje (tools), které model může zavolat;
- izolované prostředí (sandbox), v němž se kód spouští;
- paměť a úložiště, které přežijí mezi sezeními;
- zpětné vazby (feedback loops), které agentovi umožňují vidět výsledek a korigovat;
- guardrails — hranice, které agentovi nedovolí napáchat škodu;
- pozorovatelnost (observability), která dává každé akci auditní stopu.
Model sám o sobě je stateless — přijme text a vrátí text. Všechno ostatní, co dělá agenta užitečným v produkci, je harness.
Proč většina selhání pochází z harnessu, a ne z modelu
To je klíčový poznatek: většina provozních selhání AI agentů pochází z harnessu, a ne ze samotného modelu. Typické symptomy nemají nic společného s inteligencí modelu:
- Context rot — kontext se přeplní nebo zanese a model ztrácí nit;
- Tool overload — příliš mnoho špatně popsaných nástrojů, mezi nimiž se model ztrácí;
- Křehké propojení — ručně poskládané integrace, které se rozpadnou při první změně;
- Latence — každý krok prochází zbytečnými síťovými přeskoky;
- Nerelevantní vyhledávání — paměť vrací nesprávný kontext;
- Slabá verifikace — agent neověřuje výsledek své akce;
- Chybějící guardrails — nic agenta nezastaví, když chybuje.
Žádný z těchto problémů se neřeší výměnou modelu. Všechny se řeší lepším harnessem. Proto silný harness dělá z průměrných modelů užitečné a slabý harness promrhá i ty nejlepší.
Vrstva 1 — Model: důvěra díky zero data retention
My modely neděláme. A je to vědomá volba: nejlepší modely se mění každých pár měsíců a být uzamčen v jednom vendorovi je strategické riziko. Místo toho dáváme přístup ke všem velkým poskytovatelům — OpenAI, Anthropic, Google — přes jednotnou AI proxy umístěnou v naší EU infrastruktuře.
Rozdíl je v podmínkách, za kterých se to děje:
- Zero data retention. Požadavky procházejí poskytovateli za podmínek nulového uchovávání dat — nic se neloguje, nic se neukládá a nic se nepoužívá pro trénink modelů. Data klienta u poskytovatele nezůstávají.
- Žádné API klíče ke správě. Klient nežongluje s klíči OpenAI, Anthropic a Google — přístup jde přes jeden identifikátor a jedno účtování v kreditech.
- Konsolidace dodavatelského řetězce. Místo zvláštní smlouvy, zvláštního hodnocení rizik a zvláštního auditu pro každého AI vendora pracuje klient s jedním dodavatelem. Pro regulované sektory je to přímá výhoda v rámci NIS2 a AI Act — dramaticky méně dodavatelů k hodnocení.
Jinými slovy: modely dává každý. My řešíme tu část, na které v enterprise prostředí opravdu záleží — důvěru.
Vrstva 2 — Harness: tady je naše síla
Production harness se skládá z rozpoznatelných stavebních bloků. Síla OpenKBS je v tom, že každý z nich je realizován nad spravovanou, izolovanou a certifikovanou infrastrukturou — ne jako ručně poskládaný prototyp, ale jako platforma.
| Stavební blok harnessu | Realizace v OpenKBS |
|---|---|
| System prompts / kontext | Lambda funkce — kontext a logika jsou kód, verzovaný při každém nasazení |
| Tools (nástroje) | Project API: workers, S3, e-mail, MQTT, databáze — hotové nástroje, které agent volá |
| Sandboxes (izolace) | Lambda microVM izolace + vyhrazený AWS účet na klienta + on-demand EC2 workers pro náročné úlohy |
| Filesystem | S3 objektové úložiště s presigned URLs — časově a rozsahově omezenými |
| Memory (paměť) | Spravovaný PostgreSQL (Aurora/Neon), point-in-time restore až 35 dní, 6 kopií ve 3 zónách |
| Feedback loops | Agent loop v Lambdě: tool_use → vykonání → pozorování → opakování a korekce |
| Guardrails | Multi-tenant izolace, injektované secrets, kreditní limity, OWASP security audit, AES-256 / TLS 1.2+ |
| Observability | CloudWatch logy, worker logy, usage collector, administrátorský auditní žurnál |
| Přístup k modelům | AI proxy — všichni vendoři, zero retention, jednotné účtování, bez správy klíčů |
Tohle není seznam ambicí — je to infrastruktura, která už stojí pod každým projektem na platformě. Vývojář vychází z hotového harnessu, místo aby ho pro každého agenta skládal od nuly.
Scalable ve výchozím nastavení
Lambda funkce se automaticky škálují od nuly po tisíce souběžných spuštění. Náročné úlohy (zpracování videa, ML, batch) jdou na on-demand workers s účtováním po sekundách. Databáze volí správný engine podle zátěže. Žádné plánování kapacity a žádné servery k údržbě.
Secure by design
Každý klient je fyzicky izolován na úrovni AWS účtu — tvrdá hranice vynucená přes AWS IAM, ne logické oddělení. Secrets se injektují při nasazení, nikdy ne do kódu. Přístup jde přes JWT a per-project klíče s automatickou rotací. Každá nová verze prochází strukturovaným auditem bezpečnosti.
Production-ready znamená compliant
V regulovaném evropském prostředí má „production-ready harness" ještě jeden význam: compliant harness. Tady se síla harnessu a regulatorní soulad slévají v jedno.
- EU data residency — všechny zdroje jsou ve výchozím nastavení v AWS regionu eu-central-1 (Frankfurt). Data neopouštějí EU.
- Zděděné certifikace — infrastruktura stojí na AWS s více než 150 nezávisle auditovanými certifikacemi (ISO/IEC 27001, SOC 2 Type II, C5 od BSI), včetně členství v německé kritické infrastruktuře (KRITIS).
- Security audit u každé verze — statická analýza na OWASP Top 10, kontrola na SQL injekce, XSS, CSRF, SSRF, command injection a CVE zranitelnosti před produkcí; reporty jsou dostupné pro regulátora.
- Vyhrazený a přenositelný účet — při ukončení smlouvy se celý AWS účet převede na klienta. Nic se nemigruje, žádné proprietární formáty, žádný vendor lock-in.
Stejný harness, který dělá agenty spolehlivými, je dělá i auditovatelnými. Podrobnosti o NIS2 a AI Act jsou popsány v našich samostatných článcích — NIS2 a AI transformace výrobního sektoru a AI Act a soulad pro podniky.
Co to znamená pro byznys
Většina firem dnes nebuduje jednoho AI agenta. Budují jich desítky. A bez společné infrastruktury se to rychle mění v agent sprawl — roztroušené, nepropojené agenty, které žádný tým nedokáže spolehlivě řídit, auditovat ani spravovat.
Sdílený, production-ready harness řeší přesně tohle:
- Z dema do produkce. Prototyp, který běží na notebooku, a systém, který ustojí reálný provoz v regulovaném prostředí, jsou dvě různé věci. Rozdíl je harness.
- Governance. Jedno místo pro pozorovatelnost, secrets, limity a audit — místo aby každý agent znovu vynalézal kolo.
- Rychlost bez přebírání rizika. Týmy se soustředí na logiku agenta, a ne na izolaci, škálování a soulad — ty přicházejí hotové.
Závěr je prostý: úspěch v produkci vyžaduje, aby se inženýrství harnessu bralo jako samostatná disciplína, rovnocenná svým významem volbě modelu. To je disciplína, ve které je OpenKBS silný.
Další krok
Pokud vaše organizace přechází od AI prototypů k reálným, production agentům — zejména v regulovaném sektoru — kontaktujte nás. Probereme váš konkrétní případ a ukážeme vám, jak vypadá production-ready harness pro váš byznys: izolovaný, škálovatelný, bezpečný a ve výchozím nastavení v souladu.
Popsané enterprise služby — vyhrazený AWS účet, audit bezpečnosti a kontrola AI-generovaného kódu — jsou součástí Enterprise plánu OpenKBS.
Tento článek má informativní charakter a nepředstavuje právní poradenství.