BLOG | BÜRO DES CTO

Kontext ist der neue Schutzbereich: KI-Agenten mit programmierbarer Application Delivery steuern

Lori MacVittie Miniaturbild
Lori MacVittie
Veröffentlicht am 22. Juli 2025

Im Bereich AIOps hält sich ein hartnäckiger und gefährlicher Mythos: „MCP ist nur eine weitere API.“

Na klar. SOAP war einfach XML, das sich mehr einbildete.

Agentenbasierte Architekturen, besonders solche, die auf dem Model Context Protocol (MCP) basieren, arbeiten mit expliziten Kontextblöcken, die jede Anfrage begleiten. Dabei geht es nicht um neuronale Eingebungen oder „LLM-Gedächtnis“. Es ist ein serialisierter, strukturierter und betrieblicher Kontext—denken Sie an JSON, nicht an Atmosphären—den wir bei jedem Aufruf übergeben, damit Agenten Ziele, Rollen, Richtlinien und den Workflow-Zustand genau verfolgen können.

Aber die Realität ist: Kontexte verändern sich. Wenn das passiert, geraten Ihre Agenten nicht nur ins Straucheln. Sie handeln überzeugt falsch, reagieren unberechenbar oder werden schlichtweg riskant.

Das Problem ist, dass diejenigen, die bereits mit KI-Agenten experimentieren und sie einsetzen, deutlich voraus sind. Und das stimmt. Unsere aktuellste Forschung zeigt, dass 9 % KI-Agenten schon produktiv nutzen, 29 % einen klaren Plan für den nächsten Schritt haben und weitere 50 % sich in den „Anfangsstadien“ der Erarbeitung befinden. Nur 11 % machen sich überhaupt keine Gedanken über KI-Agenten.

Sie handeln schnell. Schneller als die Branche.

Sie finden kaum echte Compliance-Tools, Sicherheitsmaßnahmen oder bewährte Vorgehensweisen. Nahezu keine Lösungen adressieren Sicherheitsrisiken, die sich parallel zu jeder neuen Technologie ergeben.

Außer der Programmierbarkeit. Genau hier kommt Ihre Plattform für Anwendungsbereitstellung und -sicherheit ins Spiel. Nicht als rein leitender Kanal, sondern als programmierbarer Wächter für kognitive Hygiene und Kontextdisziplin.

Wie Kontext tatsächlich übertragen wird

Kontext ist keine abstrakte Größe. Sie steckt direkt in der Nutzlast. Eine echte MCP-Anfrage sieht so aus:

POST /agent/v1/invoke HTTP/1.1

Host: agentmesh.internal

Autorisierung: Bearer xyz123

Content-Type: application/json

X-MCP-Version: 1.0

{

"Kontext": {

    "Benutzer": { ... },

    "ziel": "...",

    "vorherige Nachrichten": [ ... ],

    "task_state": { ... },

    "Sicherheit": { ... }

  },

"input": { "prompt": "Stellen Sie es jetzt mit einer kurzen Grafik dar." }

 }

Dieser Kontextblock ist unverzichtbar. Er bildet das Arbeitsgedächtnis des Agenten. Er enthält alles, was der Agent „weiß“ und alle Annahmen, auf denen seine Handlungen basieren. Jeder Schritt trägt ihn weiter: unkomprimiert, oft ungeprüft und mit jeder Weitergabe deutlich weniger aktuell.

Wie sich Kontext verschiebt – und warum Sie das beachten sollten

Genau dieses Gepäck verursacht letztlich die Kontextverschiebung. Eine Drift entsteht, wenn:

  • Alte Ziele und Aufgaben bleiben bestehen, obwohl der Benutzer weitergegangen ist.
  • Vorherige Nachrichten sammeln sich an, erhöhen den Umfang der Anfragen und verwirren die Agenten.
  • Sicherheitsetiketten bleiben auch dort haften, wo sie stören.
  • Mehrere Agenten aktualisieren denselben Thread, ohne überflüssige Daten zu entfernen.

Wenn Agent Nr. 4 den Staffelstab erhält, trifft er Entscheidungen basierend auf veralteten Anweisungen, überholten Zugriffskontrollen und Zielen, die inzwischen kaum noch jemand verfolgt. Agenten beschweren sich nicht. Sie produzieren selbstsicher Fehlinformationen und geben das Problem weiter.

Programmierbarkeit: Der Kontext-Manager, den Sie wirklich brauchen

Wenn Sie Ihre Plattform zur Bereitstellung von Anwendungen immer noch nur als Load Balancer sehen, gratuliere ich Ihnen. Sie spielen Dame, während alle anderen Schach spielen.

In agentischen Architekturen ist die programmierbare Anwendungsbereitstellung die einzige Ebene, die über Folgendes verfügt:

  • Volle Einsicht in jede Anfrage
  • Das Recht, den Kontext zu prüfen, zu verändern, zu blockieren oder zu bereinigen
  • Unabhängig von der Meinung oder dem Gedächtnis eines einzelnen Agenten

Kontextkürzung am Edge

Verhindern Sie, dass Agenten bei jeder Anfrage die gesamte Menschheitsgeschichte mitschleppen.

  • Beschränken Sie prior_messages auf die letzten N Austauschvorgänge.
  • Lassen Sie Ziele automatisch mit Ablaufzeit oder bei Statusänderung verfallen.
  • Setzen Sie task_state zurück, wenn die Absicht von Fortsetzung auf neue Aufgabe wechselt.

Sie setzen Speichergrenzen und kognitive Regeln schon durch, bevor der Agent mit der Verarbeitung der Eingabe beginnt.

Klassifizierung und Richtliniendurchsetzung

Wenn Ihr Kontextblock security.classification = vertraulich anzeigt und Sie gleich eine öffentliche Zusammenfassungs-API verwenden, brauchen Sie eine programmierbare Richtlinienüberwachung am Edge, die sensible Felder blockiert, redigiert oder maskiert und bei jeder Anfrage den Zugriffsbereich überprüft. Große Sprachmodelle (LLMs) hinterfragen Ihre Regeln nicht, sie gefährden einfach die Daten.

Erkennung von Absichtswandel

Hat ein Benutzer von „Quartalskennzahlen zusammenfassen“ zu „Präsentation erstellen“ gewechselt? Du musst den Kontext zurücksetzen, nicht nur anhäufen. Ändert sich die Absicht der Anfrage, enthält der Kontext aber veraltete Ziele und Aufgabenstände, brich den Kontext ab und beginne neu. So vermeidest du, dass Agenten Probleme von gestern mit heutigen Daten lösen.

Anwendungstelemetrie und Überwachung von Abweichungen

Ihre Servicebereitstellungsschicht sollte folgende Aspekte überwachen:

  • Token-Größen von Kontextblöcken im Zeitverlauf
  • Wachstumsraten von prior_messages
  • Muster der Diskrepanz zwischen Ziel und Aufgabe je Agent

So erkennen Sie Überladung und Änderung im Kontext, bevor sie außer Kontrolle geraten. Monitoring liefert Ihnen klare Antworten, wenn die Führung wissen will, warum Ihre „autonomen Agents“ wie überhebliche Praktikanten agieren.

Sie brauchen eine Kontextpflege, nicht nur eine Firewall

LLMs verarbeiten gerne jeden Kontext, den Sie ihnen geben, und verursachen schnell Chaos, wenn Sie nicht achtsam sind. Agenten warnen Sie nicht, wenn sich der Kontext verschiebt, Ziele überholt sind oder die Aufgabenhistorie belastet wird. Ihre programmierbare Bereitstellungsschicht tut es nicht nur, sie muss es tun.

Sie ist die einzige neutrale Ebene, die alles im Blick behält und Richtlinien konsequent durchsetzt.

Im Zeitalter der Agenten-KI steuert Ihre Plattform zur Anwendungsbereitstellung den Datenverkehr nicht nur. Sie schützt semantisch, überwacht die Einhaltung von Vorgaben und ist Ihre letzte verlässliche Verteidigung gegen überhebliche Agenten mit Root-Zugriff.

Denn wenn Sie zulassen, dass Drift und Aufblähung die Oberhand gewinnen, verlieren Sie. Sie verlieren nicht nur die Kontrolle, sondern auch das Vertrauen in Ihren gesamten KI-Stack.