Zurück zum Blog
KI-Workflows

Mit ChatGPT + MCP die Kosten für Coding Agents und LLM-APIs senken

Zuerst ChatGPT + MCP für Planung, Retrieval und Änderungsspezifikation nutzen, und erst danach einen Coding Agenten für die Teile einsetzen, die weiterhin Ausführung benötigen.

mcp llm ops coding agents ai agents cost optimization

Viele Teams setzen Coding Agents noch immer für Arbeit ein, die früher und günstiger erledigt werden könnte.

Der eigentliche Fehler ist nicht, einen Coding Agenten zu verwenden. Der eigentliche Fehler ist, ihn zu früh einzusetzen, also bevor die Aufgabe eingegrenzt, präzisiert und in ein sauberes Ausführungsproblem überführt wurde.

Die praktische Antwort ist einfach: Zuerst ChatGPT + MCP für Reasoning, Planung, Retrieval und Änderungsspezifikation verwenden. Erst danach einen Coding Agenten für die Ausführung einsetzen, die ChatGPT nicht direkt übernehmen kann.

Darin liegt der Kostenvorteil.

Wenn die Planungsarbeit zuerst in ChatGPT stattfindet, werden später weniger usage-limitierte oder separat berechnete Coding-Agent-Aufrufe benötigt. Wichtiger noch: Die verbleibenden Aufrufe sind besser eingegrenzt.

Der typische Fehler

Ein typischer Workflow sieht so aus:

  • einen Coding Agenten öffnen
  • ihn das Repository untersuchen lassen
  • ihn das Problem selbst finden lassen
  • ihn entscheiden lassen, was geändert werden soll
  • ihn die Änderung ausführen lassen
  • und dann wiederholen, weil die ursprüngliche Anfrage noch immer zu vage war

Das ist verschwenderisch, weil dasselbe teure System für zwei unterschiedliche Aufgaben verwendet wird.

Die erste Aufgabe ist Reasoning:

  • das Problem verstehen
  • die wahrscheinliche Ursache identifizieren
  • entscheiden, was geändert werden soll
  • die richtigen Randbedingungen definieren

Die zweite Aufgabe ist Ausführung:

  • Dateien bearbeiten
  • Befehle ausführen
  • den Patch anwenden
  • das Ergebnis validieren

Diese beiden Aufgaben müssen nicht im selben Stadium vom selben System erledigt werden.

Die Kernidee

Die Kernidee ist einfach:

Mit ChatGPT + MCP so viel Denk- und Planungsarbeit wie möglich zuerst erledigen. Einen Coding Agenten erst dann einsetzen, wenn die verbleibende Aufgabe so konkret ist, dass sie überwiegend Ausführung ist.

Das bedeutet, ChatGPT sollte zuerst:

  • den richtigen Kontext aus Tools abrufen
  • das eigentliche Problem klären
  • den Umfang eingrenzen
  • wahrscheinliche Ursachen identifizieren
  • festlegen, welche Dateien oder Komponenten geändert werden müssen
  • einen konkreten Implementierungsplan formulieren
  • präzisieren, was der Ausführungsagent tun soll

Ab diesem Punkt muss der Coding Agent das Problem nicht mehr von Grund auf verstehen.

Er erhält stattdessen einen deutlich engeren und klareren Auftrag.

Warum das Kosten spart

Der Einsparmechanismus ist einfach.

Wenn Planung und Reasoning zuerst in ChatGPT stattfinden, muss der Coding Agent weniger Budget für Exploration ausgeben.

Das reduziert Verschwendung auf mehreren Ebenen:

  • weniger explorative Aufrufe
  • weniger wiederholte Repository-Inspektion
  • weniger Retry-Schleifen durch vage Prompts
  • weniger Kontextladen nur zum Verstehen der Aufgabe
  • kleinerer Ausführungsumfang, sobald der Coding Agent eingesetzt wird

Das Ergebnis ist nicht, dass Ausführung kostenlos wird.

Das Ergebnis ist, dass bezahlte oder usage-limitierte Ausführungskapazität für den Teil des Workflows reserviert wird, der sie tatsächlich benötigt.

Ein zusätzlicher Vorteil ist die Wiederverwendbarkeit von Kontext. Wenn derselbe Code oder dieselbe Spezifikation an einem Ort liegt, auf den mehrere Systeme zugreifen können, können unterschiedliche Modellumgebungen über dasselbe Material reasoningfähig werden, ohne die Vorarbeit jedes Mal neu aufzubauen. In der Praxis erleichtert das die Arbeitsteilung zwischen einem System für Planung und einem anderen für Ausführung. Beispielsweise kann Code auf lokaler Festplatte durch lokale Agent-Umgebungen wie Hermes oder OpenClaw genutzt werden, während Dokumente in einem geteilten Drive auch in anderen workspace-nativen Assistenten weiterverwendet werden können.

Ein generisches Softwarebeispiel

Angenommen, ein Team weiß, dass ein jüngstes Release eine Regression eingeführt hat, aber der ursprüngliche Fehlerbericht ist noch unscharf.

Der verschwenderische Workflow wäre, dem Coding Agenten eine breite Anfrage zu geben wie:

„Sieh dir das Repository an, finde den Fehler, überlege dir den Fix und implementiere ihn."

Dadurch muss der Agent Budget gleichzeitig für Repository-Erkundung, Diagnose und Implementierung aufwenden.

Ein besserer Workflow sieht anders aus.

Zuerst mit ChatGPT + MCP den relevanten Kontext sammeln:

  • das fehlschlagende Ticket
  • die zugehörige Änderungsanfrage
  • das betroffene Modul
  • den jüngsten Diff
  • die Fehlermeldung
  • das erwartete Verhalten

Dann mit ChatGPT die eigentliche Denk-Arbeit leisten:

  • den wahrscheinlichen Fehlmechanismus identifizieren
  • bestimmen, welche Dateien am wahrscheinlichsten betroffen sind
  • die kleinste sichere Änderung definieren
  • festlegen, welche Tests nach dem Fix bestehen sollten

Danach wird der Ausführungsprompt für den Coding Agenten deutlich enger:

„Bearbeite diese Dateien. Nimm diese Änderungen vor. Erhalte dieses Verhalten. Führe diese Prüfungen aus."

Das ist eine sinnvollere Nutzung eines Coding Agenten.

Ein zweites Beispiel

Dasselbe Muster gilt nicht nur für Bugs, sondern auch für Feature-Änderungen.

Eine vage Anfrage an einen Coding Agenten könnte lauten:

„Füge diesem Workflow rollenbasierte Freigaben hinzu."

Das klingt spezifisch, ist es aber meist nicht. Der schwierige Teil ist oft nicht das Schreiben des Codes, sondern die Entscheidung:

  • wo der Freigabestatus gespeichert werden soll
  • welche bestehenden Abläufe betroffen sind
  • welche Edge Cases relevant sind
  • welches Berechtigungsmodell verwendet werden sollte
  • was bei Rollback oder Retry passieren soll

Diese Reasoning-Arbeit kann zuerst in ChatGPT erledigt werden.

Sobald das geschehen ist, wird die Ausführungsaufgabe deutlich klarer:

  • diese Modelle aktualisieren
  • diese Felder hinzufügen
  • diese Handler anpassen
  • diese Validierung ergänzen
  • diese Tests aktualisieren

Auch hier bleibt der Coding Agent nützlich. Er wird nur später und mit einem präziseren Briefing eingesetzt.

Was ChatGPT zuerst leisten sollte

In diesem Workflow ist ChatGPT nicht nur ein kleiner Helfer neben dem Coding Agenten.

Es ist das System, das so viel wie möglich von der vorgelagerten Denk-Arbeit absorbieren sollte.

Dazu gehören:

  • die Anfrage klären
  • Annahmen identifizieren
  • Implementierungsoptionen vergleichen
  • wahrscheinliche Fehlermodi erkennen
  • entscheiden, was geändert werden sollte und was nicht
  • den Ausführungsplan entwerfen
  • den finalen Handoff-Prompt für den Coding Agenten formulieren

Genau diesen Schritt überspringen viele Teams.

Sie wechseln direkt von einer vagen Anfrage in eine teure Ausführungsumgebung und wundern sich dann, warum der Coding Agent schnell Usage verbraucht, ohne zügig zu konvergieren.

Wo ein Coding Agent weiterhin sinnvoll ist

Dies ist kein Argument gegen Coding Agents.

Es ist ein Argument dafür, sie für den Teil der Arbeit zu verwenden, für den sie am besten geeignet sind.

Ein Coding Agent ist weiterhin sinnvoll, wenn die Aufgabe nun konkret genug ist, dass sie Folgendes erfordert:

  • Dateibearbeitung
  • Befehlsausführung
  • Testläufe
  • Patch-Anwendung
  • Validierung innerhalb der realen Codebasis
  • iterative Ausführung in der tatsächlichen Umgebung

Genau dort liegt seine Stärke.

Der entscheidende Punkt ist, dass ihm nicht länger die Aufgabe „finde alles selbst heraus" übergeben werden sollte.

Grenzen

Dieser Workflow hat klare Grenzen.

Erstens braucht ChatGPT weiterhin Zugang zu nützlichem Kontext. MCP oder Connectors sind wichtig, weil sie ChatGPT erlauben, vor Beginn der Ausführung die relevanten Dateien, Notizen, Tickets oder Dokumente einzuziehen.

Zweitens funktioniert dieser Ansatz nur dann gut, wenn die Planung tatsächlich spezifisch ist. Wenn ChatGPT nur vage Empfehlungen liefert, muss der Coding Agent weiterhin zu viel Explorationsarbeit übernehmen.

Drittens bleibt Ausführung wichtig. Manche Aufgaben lassen sich nicht direkt in ChatGPT abschließen und benötigen weiterhin einen Coding Agenten oder einen API-getriebenen Ausführungspfad.

Schluss

Die praktische Schlussfolgerung ist direkt.

Verwende keinen Coding Agenten für die gesamte Denk-Arbeit, wenn ChatGPT den größten Teil dieser Denk-Arbeit zuerst übernehmen kann.

Nutze ChatGPT + MCP, um Kontext zu holen, das Problem zu durchdenken und die genaue Änderung zu spezifizieren. Übergib anschließend nur den Teil an einen Coding Agenten, der weiterhin echte Ausführung erfordert.

Darin liegt der eigentliche Arbitrage-Effekt.

Es ist nicht nur günstiger. Es erzeugt auch sauberere Ausführungsaufträge, und genau das macht den gesamten Workflow meist zuverlässiger.