CAIREs leveransmodell är en agentisk PRD-till-PR-pipeline. En människa skriver en produktbeskrivning; specialiserade AI-agenter hanterar spec, tester, implementation, granskning och verifiering; människan godkänner en skärmbild. Beräkningskapacitet är flaskhalsen — inte antalet anställda.
Från en mening till levererad mjukvara. Människan dyker upp på två platser endast — när PRD:n skrivs, och när dossier-skärmbilden godkänns.
Det agentiska arbetsflödet är inte "AI-stöd för utvecklare". Det är leveransmodellen. Fyra åtaganden gör arbetsflödet distinkt.
Caire ska skala produktion 1000× utan att skala antalet anställda. Vi bygger inte team. Vi bygger leveranssystem. — CTO – AI Systems & Agent Workforce-mandat, 2026-04-29
Produktägare skriver PRD. Pipelinen tar PRD:n därifrån — spec, tester, kod, granskning, dossier, merge — utan en människa mitt i något steg.
Varje modellanrop går via en adapter. Routning är konfiguration, inte kod. När en bättre eller billigare modell kommer är rotationen en kvartalsöversyn — inte en refaktorering.
Mätningar efter merge rampar en funktion 1% → 100%. Försämring slår tillbaka flaggan. Beslutet är mekaniskt — människor bestämmer inte "okej, rampa det här".
Kassaflöde, intäkter och förbrukning är systemingångar. Orchestratorn vägrar starta en dyr körning om dagens budget är slut. Inget mänskligt "dra åt svångremmen".
Varje arkitekturbeslut i pipelinen mäts mot en fråga: gör det att vi levererar fler funktioner per sekund, per dollar (och per token)? Mätvärdet är medvetet litet i absoluta tal. Det som spelar roll är banan.
Klocktid från PRD-intag till mergad PR. Att pressa det här betyder att parallellisera steg, cacha specifikationer och ta bort mänskliga rundresor. Varje levererad funktion landar en rad i .compound-state/agent-service.db med sin förlupna tid.
Total modellutgift över alla åtta steg, per mergad PR. Billigare leverantörer, mindre modeller för enklare routning, batch-API:er, prompt-cachning — varje hävstång pekar tillbaka hit. Orchestratorn vägrar körningar vars projicerade kostnad skulle överskrida dagens budget.
Totala in- + ut-tokens i pipelinen, per mergad PR. Ju renare specifikation och ju snävare dossier-kontrakt, desto färre tokens bränner editorn på iteration. Tokens är en ledande indikator för kostnad.
En optimerings-mathematician-agent läser genomflödesloggen varje vecka och föreslår routningsförändringar — annan modell per roll, annan batch-storlek, annan cachstrategi. CPO/CTO-agenten ratificerar. Spärrhaken rör sig bara åt ett håll.
Den här sidan rör sig själv med mätvärdet. Nya routningsvinster, nya agent-promptar, nya dossier-format — varje förbättring som puffar funktioner-per-sekund-per-dollar landar här som en uppdatering.
Varje steg producerar en kontrollerad artefakt. Nästa steg vägrar starta utan den. Pipelinen är ett kontinuerligt flöde, inte en checklista — varje steg lämnar över ett typat resultat.
De två återinträdes-kanterna (P1 hittad → återinträd editor) är de enda looparna. Allt annat är ett enkelriktat kontrakt från PRD till mergad commit.
| # | Steg | Utdata | Drivs av |
|---|---|---|---|
| 0 | Intag-normalisering Konvertera chatt, brief eller Cursor-plan till en portabel PRD. |
Kanonisk PRD-sökväg + funktionsslug. | Orchestrator |
| 1 | PRD En människa skriver beskrivningen: ändring, framgångsmått, icke-mål. |
wiki/plans/<funktion>-ÅÅÅÅ-MM-DD.md |
Människa (enda obligatoriska steget) |
| 2 | Spec Architect-agenten emitterar Gherkin-acceptansscenarier. |
wiki/specs/<funktion>.md |
Architect (resonemangsmodell) |
| 3 | Test-stubbar Test-writer kompilerar varje scenario till ett misslyckande test. |
Vitest + Playwright-tester som misslyckas vid första körningen. | Test-writer (mellanmodell) |
| 4 | Implementation Editor itererar på diff:en tills varje test passerar. |
Kod i en isolerad worktree; alla mål-tester gröna. | Editor (mellanmodell) |
| 5 | Självgranskning Tre reviewer-subagenter granskar diff:en parallellt. |
P1 / P2 / P3-fyndlista, eller "ren". | resolver-reviewer · dashboard-reviewer · perf-reviewer |
| 6 | Verifiering & dossier Type-check, lint, tester, Playwright-trace + skärmbild. |
docs/dossiers/<funktion>/{trace.zip, screenshot.png, summary.json} |
Verifier (mellanmodell) |
| 7 | Granskningsloop Externa review-bot-kommentarer återinträder editor på P1 / P2. |
Varje fynd åtgärdat eller motargumenterat med motivering. | Reviewer-feedback (mellanmodell) |
| 8 | Merge + bevis Auto-merge köad; dossier-skärmbild levereras för mänskligt godkännande. |
Mergad commit på main + skärmbild till mänsklig kanal. |
Orchestrator + GitHub Merge Queue |
Kontraktet är skarpt: ingen dossier, ingen merge. Varje stegs utdata är en typad, persisterad artefakt som nästa steg läser — och som en människa, en revision eller en framtida agent kan spela upp.
Det agentiska arbetsflödet får inte människor att försvinna — det gör dem strategiska. Varje roll har en eller två snäva platser att kliva in. Allt annat är mjukvara.
wiki/plans/ med ett framgångsmått och explicita icke-mål.summary.json för hoppade scenarier eller tomma Playwright-trace.docs/dossiers/<funktion>/ på en mergad PR — full Playwright-trace, skärmbild, konsollogg.Pipelinen riktar in sig på stadig produktutveckling — det arbete som i ett traditionellt team fyller standups och sprintar. Större arkitektoniska drag får fortfarande en mänsklig-ledd plan.
En ny banner, en ny sida, en formvariation. PRD namnger acceptansscenarierna; pipelinen skriver vitest- + Playwright-tester; Editor implementerar; Verifier fångar skärmbild-dossiern.
PRD ramar in buggen som ett misslyckande scenario. Test-writer kompilerar det; Editor fixar; resolver-reviewer + perf-reviewer fångar N+1-försämringar innan PR:n öppnas.
Genomflödesrad, KPI-kakel, dashboard-diagram. Spec namnger datakällan; tester verifierar formen; dossiern visar mätningen renderas med realistisk seed-data.
Kvartalsvis: optimerings-mathematicianen föreslår en routningsändring baserat på kostnad, godkännandegrad, latens. CPO/CTO-agenten ratificerar. En config-redigering; adaptern hanterar resten.
Granskningsomgång som agentic-workflow-granskningen själv: identifiera avvikelse, fixa dokumentet, kör yarn wiki:lint, leverera. Wiki-bara PR:er använder samma åtta steg med verifier i lättläge.
Ny CSV-adapter, ny gate-leverantör, nytt externt flöde. PRD namnger kontraktet; tester täcker gränssnittet; dossier bevisar integrationen med riktiga fixtures och en inspelad trace.
Autonoma loopar utan skyddsräcken är hur AI-projekt bränner budgetar och levererar försämringar. Varje steg av pipelinen är inhägnat. Editor-agenten sitter i centrum, omgiven av mekanismer som antingen kan sakta ner den, omdirigera den eller stoppa den helt.
Åtta oberoende skyddsräcken. Inget enskilt förebygger buggar ensam; tillsammans gör de autonom leverans säker nog att människans enda obligatoriska handling är att läsa en skärmbild.
Editor kan inte leverera beteende som specifikationen inte namnger. Avvikelse mellan PRD och spec är i sig ett P2-fynd för verifier — och specifikationen är kort nog att rymmas i varje agents kontext, så avvikelse är alltid bevisbar.
MAX_ITERATIONS = 8 på editorns inre loop, plus max 3 återinträdes-cykler från review eller Codex-feedback. Träffa taket och körningen visar fel till en människa — den mal aldrig vidare.
Den valfria PIPELINE_BUDGET_ENFORCEMENT-flaggan (av i pilot, på när intäkter är verkliga) vägrar fler modellanrop när per-körning-kostnaden skulle överskrida taket. I pilot är människan enda PRD-producenten, så kostnaden är implicit begränsad.
En grön CI-körning är nödvändig men inte tillräcklig. Dossiern — Playwright-trace, slutskärmbild, konsollogg, maskinläsbar sammanfattning — bevisar att funktionen faktiskt renderades. Granskare kan spela upp tracet; människan ser skärmbilden.
Samma pipeline, tre sätt att gå in i den. Välj vägen som matchar stunden — en PRD i versionskontroll, ett formulär på Dashboard, ett meddelande på Telegram. Varje väg producerar samma dossier och samma merge-beslut.
Skriv wiki/plans/<funktion>-ÅÅÅÅ-MM-DD.md, skapa en isolerad worktree med ./scripts/git/worktree-add.sh, och pipelinen körs mot den grenen. Reviewer-subagenter granskar diff:en, verifier fångar dossiern, merge-kön landar PR:n. Bäst för utvecklare som levererar i versionskontroll.
Klistra in en PRD-sökväg, klicka start, se pipelinens framsteg på localhost:3010. Dossier-visaren visar skärmbild, konsollogg och maskinläsbar sammanfattning inline. Godkänn / Avvisa är en knapp — ingen GitHub-rundresa krävs. Bäst för produktägare som vill ha ett UI, inte ett CLI.
Posta en PRD-länk till interface-agent. Samma backend kör pipelinen; dossier-skärmbilden postas tillbaka till den ursprungliga tråden. Svara godkänn och den merger. Den lättaste möjliga vägen — ett notis och en bild. Bäst för grundaren som läser på en telefon mellan möten.
Pipelinen bygger på tre öppna mönster och en disciplin. Inget här är skräddarsytt för skräddarsydhetens skull.
En dyr resonemangsomgång producerar specifikationen; många billiga redigeringsomgångar implementerar mot den. ~1/14 av kostnaden för att köra varje anrop på resonemangsmodellen — kostnadsdrivaren är editorn, inte arkitekten.
Klarspråk är för oprecis för att koordinera flera agenter. Acceptansscenarier i Gherkin är korta nog att rymmas i varje agents kontext, precisa nog att kompilera till misslyckande tester, och greppbara.
En grön CI-körning är nödvändig men inte tillräcklig. Dossiern — trace, skärmbild, konsollogg, maskinläsbar sammanfattning — bevisar att funktionen faktiskt renderades, i en verklig webbläsare, i tillståndet specifikationen namngav.
Externa review-bots (Codex, CodeRabbit) postar kommentarer efter varje push. Pipelinen pollar dem, behandlar P1/P2 som misslyckande tester, och återinträder editorn automatiskt. Disciplinen är obligatorisk.
Hur CAIRE komponerar AI-agenter till ett operativsystem för hemtjänstleverans.
VRPTW, NP-svårighet och den hybrida människa-AI-optimeringsmodellen som driver schemaläggning.
Hur CAIRE hanterar AI-reglering, granskningsspår och ansvarsfull driftsättning i sjukvård.
Tolv guider beskriver varje steg i detalj — vision och mandat, agentroller, dossier-mönstret, granskningsåterkopplingen och orkestreraren som binder ihop allt.
Läs den långa versionen AI-OS för verksamheter