BLOG

Mit der NVIDIA Cloud Partner Referenzarchitektur sorgen wir von F5 für beschleunigte und sichere KI-Inferenzen in großem Umfang

Ahmed Guetari Miniaturbild
Ahmed Guetari
Veröffentlicht am 28. Oktober 2025
Ash Bhalgat Miniaturbild
Ash Bhalgat
Veröffentlicht am 28. Oktober 2025

Ahmed Guetari, Vice President Product Management – Service Provider bei F5, und Ash Bhalgat, Senior Director AI Networking und Security Ecosystems bei NVIDIA, haben diesen Blogbeitrag gemeinsam verfasst.

KI erreicht eine Phase, in der Ihre Inferenzleistung und Sicherheit darüber entscheiden, ob Sie die Erwartungen Ihrer Kunden erfüllen. Im Wandel der Token-Ökonomie ist KI-Infrastruktur mehr als reine Rechenleistung. Sie orchestrieren, schützen und skalieren heute Ihre Inferenzfunktionen – von der Cloud bis ins Edge-Rechenzentrum. Wenn Sie als Cloud-Betreiber generative KI- und Inferenzplattformen entwickeln, müssen Sie GPU-Effizienz bestmöglich ausschöpfen, die Token-Kapazität erhöhen, Latenz senken und jede Ebene Ihrer KI-Infrastruktur absichern.

F5 löst diese Herausforderungen, indem wir Inferenz mit der NVIDIA Cloud Partner (NCP) Referenzarchitektur skalieren. Mit diesem wichtigen Leitfaden zeigen führende KI-Cloud-Anbieter, wie sie GPU-beschleunigte Infrastrukturen entwerfen, aufbauen und betreiben. Die Referenzarchitektur vereint erstklassige Technologien für Computing, Netzwerke, Speicher und Sicherheit, damit NVIDIA Cloud-Partner zuverlässige und leistungsstarke KI-Services skalierbar bereitstellen können.

Mit dieser Zusammenarbeit ermöglichen wir, dass F5 BIG-IP eine Schlüsselrolle übernimmt, um im NVIDIA-Ökosystem eine sichere und leistungsstarke Inferenz bereitzustellen.

F5 verbindet Netzwerk-, Sicherheits- und Application-Delivery-Funktionen nahtlos, damit Sie gemeinsam mit NVIDIA intelligente, tokenbasierte KI-Plattformen betreiben können. Gemeinsam definieren wir den Betrieb von KI im großen Maßstab neu, indem wir Ihnen die Geschwindigkeit, den Schutz und die Intelligenz liefern, die Sie für die neue Token-Ökonomie benötigen.

NCP-Referenzarchitektur: Deine Grundlage für die KI-Cloud

Mit der NCP-Referenzarchitektur setzen Sie auf ein durchdachtes Fundament für die Bereitstellung von KI-Clouds. Sie profitieren von schneller NVIDIA-Rechenleistung, leistungsfähigen Netzwerken und intelligenten Softwarefunktionen, kombiniert mit innovativen Technologien führender Partner im Ökosystem – für Cloud-KI-Lösungen, die leistungsstark, skalierbar und sicher sind.

Mit dieser Architektur statten wir GPU-gestützte KI-Workloads durch F5 BIG-IP mit intelligenter Datenverkehrsverwaltung, Zero-Trust-Sicherheit, erweiterten Services und umfassender Transparenz aus. So können Sie Inferenzdienste zuverlässig bereitstellen, skalieren und absichern.

Die Token-Ökonomie gewinnt an Bedeutung und die NCP-Referenzarchitektur setzt neue Maßstäbe

Für KI-Cloud-Anbieter und Unternehmen sind Token die neue Währung – gemessen an Durchsatz, Gesamtlatenz, Zeit bis zum ersten Token, Energieeffizienz und Kosten je Token. Euer Erfolg steht und fällt mit der Infrastruktur, die euch mit GPU-Clustern verbindet. Damit ihr leistungsstarke KI-Services bereitstellen könnt, müssen Anforderungsweiterleitung, Schutz, Transparenz, Mandantenfähigkeit und Richtliniendurchsetzung ohne Engpässe und immer mit Leitungsgeschwindigkeit laufen.

Die NCP-Referenzarchitektur legt diesen Bauplan verbindlich fest. Sie beschreibt, wie du Sovereign Clouds und AI Clouds effizient bei Compute, Netzwerken, Speicher, Telemetrie und Sicherheit miteinander verbindest. NVIDIA BlueField-3 DPUs bilden das zentrale Element für den Nord-Süd-Datenverkehr in solchen Architekturen.

F5 stärkt das Multi-Cloud-Ökosystem als führender Infrastrukturanbieter und bringt Netzwerk-, Sicherheits- und KI-basierte Kontrollen direkt in das Referenz-Fabric ein.

F5: Wir machen NCP KI-Clouds noch schneller, sicherer und effizienter für Sie

F5 hat bereits beeindruckende Ergebnisse erzielt, indem wir NVIDIA-Technologie integriert haben. Im April 2025 haben wir die allgemeine Verfügbarkeit von F5 BIG-IP Next for Kubernetes – beschleunigt durch NVIDIA BlueField-3 DPUs bekannt gegeben. Mit dieser Lösung überträgst du Netzwerkverarbeitung, Durchsetzung von Sicherheitskontrollen und Traffic-Intelligenz auf die DPU und schaffst dadurch freie Kapazitäten auf den CPUs für deine geschäftskritischen Anwendungen. SoftBank, ein NCP, der kürzlich erfolgreiche PoC-Tests in der Cloud durchgeführt hat, konnte herausragende Leistungsergebnisse erzielen.

F5 BIG-IP bietet dir weit mehr als hohe Leistung: Wir erfüllen die Anforderungen von NCPs punktgenau – mit einheitlicher Richtlinienkontrolle für Ingress und Egress, Service Mesh, effektiver DDoS-Abwehr, Zero-Trust-Umsetzung, API-Schutz, Workload-Isolierung und umfassender Multi-Tenant-Transparenz – und das alles in einem Schritt.

Gemeinsam mit Ihnen verfeinern wir die Routing-Logik für Large Language Models (LLM), entwickeln eine token-basierte Netzwerk-Datenverkehrsverwaltung und integrieren die Unterstützung für das Model Context Protocol (MCP). So gewinnen Sie mehr Kontrolle und Intelligenz direkt im Datenpfad.

Indem wir die NCP-Referenzarchitektur unterstützen, machen wir BIG-IP zu einer festen Grundlage für Aufbau, Betrieb und Steuerung von KI-Clouds.

Steigern Sie Ihren KI-Durchsatz: 30 % mehr Tokens, 60 % schnellere TTFT

Frühe Validierungsergebnisse sprechen klar für die Lösung. Stellen Sie F5 BIG-IP Services gemeinsam mit der NVIDIA Plattform für beschleunigtes Computing bereit, erhöhen Sie die Token-Generierung um über 30 % und reduzieren die Zeit bis zum ersten Token (TTFT) um 60 %.

Sie profitieren von längeren, kontextbezogenen Antworten, schnelleren Inferenzzyklen und senken Ihre Kosten pro Token um 30 %. Durch mehr Token pro Watt steigern wir mit dieser Integration Ihre Performance und Energieeffizienz – beides Schlüsselfaktoren für die neue KI-Ökonomie.

Als Cloud-Kunde profitieren Sie erheblich davon, auf NCPs zu setzen: Sie erreichen schneller echte Mehrwerte, senken Ihre Betriebskosten und bieten Nutzern in jedem Bereitstellungsmodell ein besseres Erlebnis.

Sie profitieren nicht nur von kleinen Verbesserungen – wir erreichen einen echten Qualitätssprung darin, wie Sie mit AI Cloud Services bereitstellen, schützen und monetarisieren.

Drei zentrale Säulen des F5-Beitrags zur NCP-Referenzarchitektur

Wenn Sie F5 in die NCP-Referenzarchitektur integrieren, profitieren Sie von höherer Performance, mehr Sicherheit und einer erweiterten Funktionalität für Ihre KI-Dienste – insbesondere in den folgenden Kernbereichen:

1. Mehr Performance: Konzipiert für die Token-Ökonomie: F5 BIG-IP arbeitet reibungslos mit NVIDIA-GPUs, DPUs, modernen Netzwerken und Softwareplattformen wie NVIDIA Dynamo und NVIDIA NIM zusammen, damit du den KI-Inferenzdurchsatz optimal ausschöpfen kannst. Mit der F5-Lösung steuerst du Prompt-Weiterleitung, Lastausgleich und Inferenzleistung optimal – so beseitigst du Engpässe und erreichst mehr Token pro Sekunde und Cluster.

In einer Umgebung, in der jedes Token zu Umsatz und Modellgenauigkeit beiträgt, sichern Sie sich mit diesen Fortschritten mehr Produktivität, schnellere Reaktionen und höhere Profitabilität. Gemeinsam heben F5 und NVIDIA das volle Potenzial beschleunigter Infrastruktur in der sich entwickelnden Token-Ökonomie – dort, wo Effizienz und Performance Ihre Geschäftsergebnisse unmittelbar bestimmen.

2. KI-Inferenz braucht eine neue Sicherheitsstrategie: KI-Inferenz im großen Maßstab eröffnet neue Angriffsflächen – von Datenrisiken bis zum Missbrauch von Modelle-Endpunkten. F5 integriert umfassende Expertise in Anwendungssicherheit und Richtliniendurchsetzung direkt in die Referenzarchitektur von NVIDIA, sodass du deine GPU-Clouds vom Kern bis zum Edge durch mehrschichtige Sicherheit stärkst. Dazu zählen:

  • Schützen Sie Ihre Inferenz-APIs mit leistungsstarker DDoS-Abwehr und anpassungsfähiger Abschirmung gegen unerwünschten Datenverkehr.
  • Du erzielst Zero-Trust-Sicherheit und steuerst Identitäten richtlinienbasiert in jeder Umgebung.
  • Sie sichern Ihren Datenverkehr mit umfassender Layer-7-Firewall und MCP-Sicherheitsfunktionen durchgängig ab.
  • Wir schützen Ihre Daten umfassend, sodass Sie weltweite Compliance- und Datenschutzstandards zuverlässig erfüllen.

Sie profitieren von einer zuverlässigen KI-Fabric, in der starke Performance und umfassender Schutz Hand in Hand gehen. So skalieren Sie Ihr Unternehmen sicher, ohne bei Sicherheit oder Compliance Abstriche zu machen.

3. Erweiterte Funktionen und KI-native Steuerung: Mit der Partnerschaft zwischen F5 und NVIDIA sichern Sie sich neue Mehrwertdienste, die Kontrolle, Transparenz und Intelligenz über Ihre GPU-Cluster hinweg ausbauen – weit über Durchsatz und Sicherheit hinaus. Mithilfe von Funktionen wie LLM-Routing, granularer Token-Steuerung, adaptiver Beobachtbarkeit und kontextbewusster Datenverkehrslenkung steuern Sie die Platzierung von Workloads und den Ressourceneinsatz für KI in Echtzeit optimal.

Mit diesen Funktionen liefern wir Application Delivery auf Enterprise-Niveau für den KI-Bereich, damit jedes Token, jedes Modell und jede Nutzerinteraktion präzise und effizient ablaufen. So machen wir aus Komplexität gezielte Kontrolle und verbinden klassische Anwendungen mit der dynamischen Welt der generativen KI.

Eine neue Grundlage für KI-Infrastrukturen

Wenn wir die Fähigkeiten von F5 entlang der NCP-Referenzarchitektur ausrichten, schaffen wir gemeinsam eine neue Grundlage – eine, in der Durchsatz, Kosten pro Token, Latenz, Energieeffizienz und Sicherheit im Zentrum jeder KI-Infrastruktur stehen.

Mit dieser Basis skalierst du KI-Clouds vorhersehbar, monetarisierst sie transparent und passt sie flexibel an, wenn sich Modelle und Workloads weiterentwickeln. NCPs, Unternehmen und souveräne Clouds profitieren jetzt von einem validierten Referenz-Stack, der dir sowohl Vertrauen als auch hohe Performance garantiert.

F5 wird nicht einfach Teil des NVIDIA-Ökosystems. Zusammen bringen wir die Token-Ökonomie voran, bei der jede Mikrosekunde, jedes Watt und jeder Token zählt. F5 gestaltet als strategischer Wegbereiter eine sichere, leistungsstarke und wirtschaftlich skalierbare KI-Infrastruktur. Gemeinsam mit NVIDIA ermöglichen wir Ihnen, Token effizienter, schneller, sicherer und intelligenter zu generieren.

Gemeinsam mit Ihnen – als unsere Kunden, Partner und Mitgestalter – schaffen wir die nächste Generation von KI-Services ohne Kompromisse. Erfahren Sie mehr auf unserer F5 und NVIDIA Webseite.