KI-Agenten wirklich steuern: Ein 8-Phasen-Workflow gegen das Agentic-Chaos

Wer KI-Agenten ohne Struktur laufen lässt, bekommt schnell mehr Baustellen als vorher. Ein 8-Phasen-Workflow, der die Kontrolle zurückgibt.

Sikko Hühsam 8. April 2026

Zwei Stunden zuvor hat der KI-Agent noch zielgerichtet gearbeitet. Dann wurde ein Feature umgebaut, das bereits funktionierte. Dann drehte er sich im Kreis bei einem Bug. Und jetzt sitzt man da — mit mehr offenen Baustellen als vorher und der Frage, ob die KI tatsächlich Arbeit abnimmt oder nur neue produziert.

Dieses Szenario ist keine Ausnahme. Es ist das Standardergebnis, wenn KI-Agenten ohne Struktur eingesetzt werden.

Der Ausweg ist kein besseres Modell. Es ist ein Workflow.

Die Dumpzone: Warum KI-Agenten nicht unbegrenzt smart sind

Bevor es um den Workflow geht, lohnt sich ein Blick auf eine unterschätzte Einschränkung: das [[Kontextfenster]].

Jedes Sprachmodell hat einen Bereich, in dem es besonders gut arbeitet — und einen deutlich größeren, in dem es merklich nachlässt. Grob vereinfacht: Die ersten 100.000 Tokens einer Session sind zuverlässig. Was danach kommt, nennt man Dumpzone.

In langen Sessions läuft man unweigerlich in diese Zone. Das Modell widerspricht sich, vergisst frühere Anforderungen oder baut inkonsistenten Code. Nicht weil das Modell schlechter geworden ist — sondern weil lange Konversationen schlicht nicht das sind, wofür es optimiert wurde.

Die Lösung: regelmäßige Kontext-Resets. Nicht alles verwerfen, sondern die Erkenntnisse jeder Phase in einem Markdown-Dokument festhalten und im nächsten Schritt als Übergabe neu einbringen.

Der 8-Phasen-Workflow

Dieser Workflow setzt auf kurze, klar abgegrenzte Phasen — jede mit einem definierten Output, der als Übergabe in die nächste Phase dient. Das Muster ist immer gleich: arbeiten, zusammenfassen, Kontext resetten, weitermachen.

Phase 1: Brainstorm

Der Agent wird nicht direkt aufgefordert, etwas zu bauen. Stattdessen dient er als Sparring-Partner: Welche Lösungsrichtungen gibt es? Was spricht dafür, was dagegen? Welche Alternativen werden übersehen?

Der Output dieser Phase ist ein Markdown-Dokument mit strukturierten Überlegungen — kein Code, noch keine Entscheidung.

Phase 2: Alignment

Die häufigste Ursache für fehlgeschlagene KI-Projekte ist kein technisches Problem. Es ist ein Verständnisproblem: Mensch und Agent meinen dasselbe Wort, aber unterschiedliche Dinge.

In dieser Phase stellt der Agent Fragen — so lange, bis beide dasselbe Bild vom Ziel haben. Ein hilfreicher Ansatz: Der Agent wird angewiesen, intensiv nachzufragen, bevor er irgendetwas baut. Das klingt nach Zeitverlust. Es spart später Stunden.

Auch diese Phase endet mit einem Markdown-Dokument.

Phase 3: Plan — Vertical statt Horizontal

Jetzt geht es um Zerlegung. Und hier liegt einer der wichtigsten Unterschiede.

Horizontal Slicing: Erst das gesamte Frontend bauen, dann die Logik, dann die Daten. Das Problem: Man kann nichts testen, bis alles fertig ist. Fehler werden spät entdeckt — und sind dann teurer zu beheben.

[[Vertical Slicing]]: Ein winziger, aber vollständiger Schnitt durch alle Schichten. Zum Beispiel: nur der „Buchen”-Button, komplett funktionsfähig — mit Interface, Logik und Datenbankanbindung. Dann der nächste Slice. So entstehen früh testbare Ergebnisse.

KI-Agenten neigen von sich aus zum horizontalen Slicing. Man muss sie explizit auf den vertikalen Ansatz hinweisen — und das zahlt sich aus.

Phase 4: Implementierung

Jetzt wird der Plan umgesetzt — ein Vertical Slice nach dem anderen. Kontext-Reset zu Beginn dieser Phase. Während der Implementierung: den Kontextverbrauch im Blick behalten, nicht in die Dumpzone laufen lassen.

Phase 5: Testing

Hier geht es nicht in erster Linie um technische Tests. Es geht um das Gefühl: Wie lässt sich das, was gebaut wurde, tatsächlich bedienen? Zu viele Buttons? Zu viel Text? Umständliche Abläufe?

Das Feedback, das ein Mensch an dieser Stelle gibt — aus echter Nutzungsperspektive — kann kein Agent ersetzen. Genau das ist der Punkt.

Phase 6: Recap

Diese Phase wird am häufigsten übersprungen. Und das ist der teuerste Fehler.

Der Agent erklärt, was er gebaut hat: Ablauf, Struktur, Zusammenhänge — auf Wunsch als Diagramm. Das klingt nach Zeitverschwendung. Es ist das Gegenteil.

Wer nach mehreren Iterationen nicht mehr versteht, was der Agent gebaut hat, verliert die Entscheidungshoheit. Ab diesem Punkt entscheidet de facto der Agent — und das Produkt entwickelt sich in die Richtung, die er für plausibel hält, nicht in die Richtung, die das Unternehmen braucht. Der Recap ist der Moment, in dem man die Kontrolle bewusst behält.

Phase 7: Refactor

KI-Agenten neigen dazu, komplexen Code hinzuzufügen. Diese Phase zwingt zur Gegenrichtung: vereinfachen, entfernen, was nicht gebraucht wird.

Hilfreiche Fragen an den Agenten:

Würde ein neuer Entwickler den Ablauf ohne Rückfragen verstehen?
Was ist der kleinste Schritt, der die Codebasis besser macht?
Welcher Refactoring-Schritt verbessert die Struktur, ohne das Verhalten zu verändern?

Wer das Aufräumen auf später verschiebt, baut auf wachsendem Chaos. Und der Agent ahmt das Chaos nach.

Phase 8: Commit

Kleine, atomare Commits. Dann: die Markdown-Dokumente aus den vorherigen Phasen löschen.

Sie haben ihren Zweck erfüllt. Wer sie im Repository lässt, riskiert, dass der Agent sie in künftigen Sessions einliest — und sich damit verwirrt. Die Wahrheit steckt jetzt im Code. Die Dokumente sind im Commit-Verlauf gesichert, falls sie noch einmal gebraucht werden.

Danach beginnt der Zyklus neu — mit dem nächsten Vertical Slice aus dem Alignment-Dokument.

Was tun, wenn kein Bug mehr weicht?

In späten Iterationen tauchen manchmal Bugs auf, die sich hartnäckig halten. Die effektivste Strategie: dem Agenten beibringen, selbst zu verifizieren.

Nicht: „Haben Sie das behoben?” — sondern: „Wie können Sie selbst überprüfen, ob dieser Bug behoben ist?”

Das gibt dem Agenten ein Werkzeug, mit dem er eigenständig iterieren kann, ohne dass jede Überprüfung beim Menschen landen muss. Für einfachere Fälle reicht oft ein neuer Chat mit einer präzisen Fehlerbeschreibung und dem Protokoll der bisherigen Lösungsversuche.

Kontrolle ist kein Gegenteil von Geschwindigkeit

Dieser Workflow fühlt sich zunächst wie Mehraufwand an. Das täuscht.

Die kurzen Phasen erzwingen regelmäßige Übergabepunkte — genau dort, wo KI-Agenten ohne Struktur typischerweise entgleisen. Die Markdown-Dokumente machen Entscheidungen nachvollziehbar und übertragbar. Der Kontext-Reset verhindert, dass sich frühe Fehler durch die gesamte Session ziehen.

Das iterative, kurzgetaktete Vorgehen entspricht dabei dem, was gute Softwareentwicklung schon immer ausgezeichnet hat. KI produziert Code schneller als je zuvor. Aber die Richtungsentscheidungen bleiben beim Menschen — wenn man dafür sorgt, dass sie es bleiben.

So ist es richtig.

Häufige Fragen

Antworten auf Ihre Fragen

Was ist die 'Dumpzone' beim Arbeiten mit KI-Agenten?

Als Dumpzone bezeichnet man den Bereich des Kontextfensters, in dem ein Sprachmodell deutlich schlechter performt. Die ersten ~100.000 Tokens einer Session sind zuverlässig. Was danach kommt, ist fehleranfälliger: Das Modell widerspricht sich, vergisst frühere Anforderungen oder produziert inkonsistenten Output. Regelmäßige Kontext-Resets mit Markdown-Übergabedokumenten sind das Gegenmittel.

Was bedeutet Vertical Slicing im Kontext von KI-Projekten?

Statt zuerst das gesamte Frontend, dann die Logik, dann die Daten zu bauen (Horizontal Slicing), implementiert man immer einen vollständigen Schnitt durch alle Schichten auf einmal — z.B. nur den 'Buchen'-Button, aber komplett funktionsfähig. So entstehen früh testbare Ergebnisse, und der Agent bekommt echtes Feedback statt ins Leere zu bauen.

Warum ist der Kontext-Reset zwischen Phasen so wichtig?

KI-Modelle neigen in langen Konversationen dazu, frühere Anforderungen zu vergessen oder inkonsistente Entscheidungen zu treffen. Ein Kontext-Reset mit einem Markdown-Dokument als strukturierter Übergabe verhindert, dass sich Fehler aus früheren Phasen fortpflanzen — ohne dass man von null anfangen muss.