Agentiskt arbetsflöde

Darwin som orkestrerare

Telegram → Darwin → PR-med-skärmbild. Orkestreraren som ersätter den mänskliga CTO:n i loopen.

Maskinöversatt från engelska — källa: darwin-as-orchestrator.md.

Implementeringsstatus: Designanteckning — Darwin existerar idag som agent-service-runtimen (Darwin Dashboard). Att koppla den som orkestrerare för PRD-till-PR-pipelinen är arbetet denna sida beskriver.

Byggt idag: Darwin-runtime på localhost:3010 (be-agent-service/apps/server/src/index.ts), SQLite-state på .compound-state/agent-service.db, launchd-jobslots, interface-agent Telegram-brygga, 30 namngivna agenter i be-agent-service/agents/prompts/ (engineering / management / marketing / optimization).

Mål-tillägg: POST /api/prd-to-pr/<feature>-ändpunkt, in-process pipeline-runner som driver de åtta stegen, dossier-visnings-rutt på Dashboarden, Telegram → pipeline-routnings-regel i interface-agent. Insats + ordning spårat i darwin-component-map.md §(c).

Visionen säger att människor definierar vad; agenter exekverar hur. Darwin är implementeringen: en enskild adresserbar entitet (Telegram, så småningom webb-UI) som tar en PRD och returnerar en mergad PR med bevis. Människans enda obligatoriska handling är att läsa skärmbilden.

Detta är vägen till att ersätta den mänskliga CTO:n med agent-CTO:n som beskrivs i vision-and-mandate.md.

Flöde från ända till ända

1. Människa postar PRD-länk till Telegram
       ↓
2. interface-agent tar emot, validerar frontmatter, postar bekräftelse
       ↓
3. interface-agent → orkestrerare (engineering-team)
       ↓
4. orkestreraren kör 7-stegs pipelinen (PRD → PR med dossier)
       ↓
5. Efter merge postar Darwin dossier-skärmbilden tillbaka till Telegram
       ↓
6. Människan tittar på skärmbilden, svarar "approve" eller "reject"
       ↓
7a. approve → klart. Skala-eller-stäng-av-agenten tar över för rampning.
7b. reject → öppna spec igen för förtydligande, återgå till steg 2.

Vad Darwin är, idag

Per darwin-dashboard.md:

Vad som saknas för Darwin-som-orkestrerare:

Beslut: orkestrerar-runtime är en tunn intern Node-loop

Registrerat 2026-04-30 för att stoppa nästa byggare från att omtvista detta. Pipeline-runnern bor inuti be-agent-service som en tunn (~200 LOC) Node-tillståndsmaskin, inte som en LangGraph (Python)-sidecar eller något externt arbetsflödesengine.

Resonemang:

Varför en enda orkestrerare

Om vi bygger N agenter som alla gör "PRD-till-PR" med små variationer får vi N versioner av spec-formatet, N granskar-feedback-loopar, N dossier-format. Visionsregeln "människor definierar vad" implicerar ett enda, väldefinierat gränssnitt — många orkestrerare bryter mot det.

Darwin är den valda orkestreraren eftersom:

Vad Darwin behöver från detta avsnitt

Sidorna i detta avsnitt definierar kontrakten som Darwins orkestrerare måste implementera:

Frågeställning Definierad i
Vilka steg som finns, vad de producerar prd-to-pr-pipeline.md
Vilken agent som kör vilket steg agent-roles-and-model-routing.md
Hur modeller väljs model-and-vendor-agnosticism.md
Vad "spec" betyder spec-as-contract.md
Vad "bevis" betyder verification-and-evidence.md
När editorn ska köras igen reviewer-feedback-loop.md
Hur man rampar / tillbakarullar efter merge scale-or-kill.md
Vilka budgetbegränsningar som gäller throughput-and-business-signals.md

Att ersätta den mänskliga CTO:n

Visions-citat:

Caires långsiktiga flaskhals ska vara compute, inte headcount.

CTO-ersättningen sker när:

  1. PRD:er går rakt till Darwin utan att gå genom en mänsklig engineering manager.
  2. Routnings-beslut över de fyra agent-teamen (engineering, optimization, marketing, management) kommer från cpo-cto (agenten), inte människan.
  3. Skala-eller-stäng-av-beslut sker dagligen utan att en människa beslutar "låt oss rampa detta" eller "låt oss stänga av det".
  4. Budget-allokering sker vid ledningsagent-kadens (CEO + CPO/CTO) med människan som endast ratificerar vid kvartalsvisa kontrollpunkter.

Varje punkt är en konkret, testbar övergång. Vi är inte vid någon av dem ännu. Ordningen de ska landa i:

  1. PRD → Darwin → PR (detta avsnitts huvud-deliverable). Lättast. Fångar arbetet med högsta volym.
  2. Skala-eller-stäng-av-automation. Härnäst. Tar bort den dagliga ramp/tillbakarullnings-overheaden.
  3. Budget-allokering av ledningsagenter. Trea. Kräver finansintegration + förtroendekalibrering.
  4. Tvärteam-routning av cpo-cto. Sist. Kräver att (1)–(3) är solida; annars fattar tvärteam-routern beslut med dåliga inputs.

Var människan fortfarande dyker upp

Efter att allt detta landat:

Det är allt. Allt annat är mjukvara. Det är visionen.

Korsreferenser