ブログ

F5がNVIDIA Cloud Partnerのリファレンスアーキテクチャを活用し、AI推論を大規模かつ迅速に、そして安全に実現します

アハメド・ゲタリ サムネイル
アハメド・ゲタリ
2025年10月28日公開
アッシュ・バルガットのサムネイル
アッシュ・バルガット
2025年10月28日公開

F5のサービスプロバイダー向けプロダクトマネジメント担当バイスプレジデント、Ahmed Guetariと、NVIDIAのAIネットワーキング&セキュリティ エコシステム担当シニアディレクター、Ash Bhalgatが共同で執筆しています。

AI の時代では、推論性能とセキュリティで顧客の期待に応えることが成功の鍵となります。 トークンエコノミーが進化する今、AIインフラストラクチャは単なる処理能力だけではありません。 クラウドからエッジデータセンターまで、推論力を最適に制御し、守り、柔軟に拡張できる体制が求められます。 生成AIや推論プラットフォームを構築するクラウド運用者にとって、GPU効率の最大化、トークン容量の拡大、レイテンシの低減やAIインフラストラクチャの全層を守る対応は、今や待ったなしの課題です。

F5はNVIDIA Cloud Partner(NCP)リファレンスアーキテクチャを活用して推論処理の拡張に取り組み、こうした課題を解決します。 この重要な設計図では、主要なAIクラウド プロバイダがGPUアクセラレーテッド インフラストラクチャをどのように設計・構築・運用するかを明確に示しています。 リファレンスアーキテクチャは、コンピューティング、ネットワーク、ストレージ、セキュリティなど幅広い領域で優れた技術を組み合わせることで、NVIDIA Cloud Partnerが高信頼かつ高性能のAIサービスを大規模に提供できるようサポートします。

今回の協業により、F5 BIG-IP は NVIDIA エコシステム内で安全かつ高スループットなインファレンス環境を支える重要な役割を担います。

F5 は、NVIDIA と連携し、ネットワーク、セキュリティ、アプリケーション デリバリーの機能を緊密に統合して、インテリジェントなトークン駆動型 AI プラットフォームを実現します。 私たちは、AI の大規模運用のあり方を再定義し、新たなトークンエコノミーに必要なスピード、保護、インテリジェンスをあなたに提供します。

NCPリファレンスアーキテクチャ: あなたのAIクラウドを支える基盤

NCPリファレンスアーキテクチャによって、AIクラウドを展開するための柔軟で実用的なフレームワークを活用できます。 NVIDIAの高速コンピューティングとネットワーク、ソフトウェア機能を、信頼できるエコシステムパートナーの先進テクノロジーと組み合わせて、クラウドで高性能・スケーラブル・安全なAIソリューションを提供します。

このアーキテクチャで、F5 BIG-IP は GPU 活用の AI ワークロードに高度なトラフィック管理やゼロトラスト セキュリティ、先進のサービス、可観測性を提供し、NCP の推論サービスを安心して展開・拡張・保護できるようサポートします。

トークン経済の成長とNCPリファレンスアーキテクチャ

AI クラウド プロバイダや企業にとって、トークンは新たな価値基準です。あなたはスループット、総レイテンシ、最初のトークン取得までの時間、エネルギー効率、トークンごとのコストで価値を測ります。 ユーザーとGPUクラスターを結ぶインフラストラクチャが、成果を左右します。 高性能なAIサービスを実現するには、リクエスト ルーティング、保護、可観測性、マルチテナンシー、ポリシー施行のすべてを、ボトルネックなくラインレートで動作させなければなりません。

NCPリファレンスアーキテクチャがこの青写真を具体化しています。 ソブリンクラウドやAIクラウドで、コンピューティング、ネットワーク、ストレージ、テレメトリ、セキュリティをどう連携させるかを定義しています。 NVIDIA BlueField-3 DPUsが、これらのアーキテクチャで北南トラフィックの中核を担っています。

F5 は、第一級のネットワーク インフラストラクチャ プロバイダーとしてこのエコシステムに参加し、ネットワーク、セキュリティ、AIに対応した制御機能をリファレンス ファブリックへ直接組み込みます。

F5: NCP AIクラウドのパフォーマンス、セキュリティ、効率をあなたと共に加速します

F5 は、すでに NVIDIA テクノロジーとの統合によって大きな成果を生み出しています。 2025年4月、F5 はNVIDIA BlueField-3 DPU により高速化された F5 BIG-IP Next for Kubernetesの一般提供を発表しました。 ネットワーク処理やセキュリティ管理、トラフィックに関するインテリジェンスを DPU に任せることで、CPU をビジネス アプリケーションのために有効活用できます。 最近クラウドで概念実証(PoC)テストを行った NCP のソフトバンクは、極めて高いパフォーマンスを確認しています。

F5 BIG-IP なら、純粋なパフォーマンスだけではなく、NCP に必要なイングレス/エグレスのポリシー制御、サービスメッシュ、DDoS攻撃対策、ゼロトラストの実現、API保護、ワークロードの分離、マルチテナントの可観測性といった運用要件にも、1回の処理でしっかり対応できます。

私たちは、LLMのルーティングロジックやトークン対応のトラフィック測定・ガバナンス、Model Context Protocol(MCP)のサポートを強化し、データ パスにより高い制御とアプリケーション インテリジェンスを実現しました。

NCPリファレンスアーキテクチャに対応することで、BIG-IPをAIクラウドの構築・展開・運用の中心に据えられます。

AIの処理能力を加速: トークン数30%アップ、TTFTを60%短縮

初期検証の結果が、非常に有望であることを示しています。 F5 BIG-IP サービスを NVIDIA のアクセラレーテッド コンピューティング プラットフォームと組み合わせて導入すると、トークン生成数が30%以上向上し、最初のトークン発行までの時間(TTFT)は60%短縮されます。

これらの成果によって、より長くコンテキストを反映した応答や高速な推論サイクルを得られ、トークンごとのコストも30%削減できます。 ワットあたりの処理トークン数が増え、エコシステム統合によってパフォーマンスとエネルギー効率の両方が向上し、AIの新しい経済価値を確実に高めます。

クラウドをご利用の方は、NCP上で運用することで、より早く価値を実現し、運用コストを抑え、あらゆる導入モデルでユーザー体験を高められます。

これらの成果によって、AIクラウドがサービスを提供し、守り、収益化する仕組みそのものが大きく進化していることがわかります。

NCPリファレンスアーキテクチャにおけるF5の3つの主要な役割

F5 をNCPリファレンスアーキテクチャに組み込むことで、AIサービスを導入するあなたはパフォーマンス向上、セキュリティ強化、そして機能拡張を主要な分野で確実に実感できます。

1. パフォーマンス向上: トークンエコノミーに最適化: F5 BIG-IP は NVIDIA の GPU、DPU、ネットワーキング ファブリック、ソフトウェア プラットフォーム コンポーネント(NVIDIA Dynamo、NVIDIA NIM)ともしっかり連携し、AI推論のスループットを最大化します。 F5 のソリューションなら、プロンプトのルーティングや負荷分散、推論効率を高めて、ボトルネックを排除し、クラスタ単位で 1 秒あたりに処理できるトークン数をさらに増やせます。

すべてのトークンが収益やモデル精度に直結する環境では、こうした成果によって、あなたの生産性や対応スピードが高まり、より大きな収益を得られます。 F5とNVIDIAが連携することで、効率とパフォーマンスが直接ビジネス成果につながる新たなトークンエコノミーで、加速化されたインフラストラクチャの力を最大限に活かせます。

2. AI推論のために進化したセキュリティ: 大規模なAI推論には、データ流出やモデルエンドポイントの悪用など、新たな攻撃リスクが生じます。 F5は、アプリケーション セキュリティとポリシー適用の高い専門性をNVIDIAのリファレンス アーキテクチャに組み込み、コアからエッジまでGPUクラウドを多層的に守ります。 主な要素は次の通りです。

  • インテリジェントなDDoS対策と、推論APIを守る適応型トラフィックシールドをご活用ください。
  • さまざまな環境でゼロトラストを実現し、ポリシーベースでIDを確実に管理できます。
  • エンドツーエンドのトラフィックの一貫性を守るレイヤー7のファイアウォールとMCPセキュリティを提供します。
  • 世界中のコンプライアンスやプライバシー基準に対応するため、包括的なデータ保護を提供します。

パフォーマンスと保護を両立させた信頼性の高いAIファブリックを提供し、NCPを利用するあなたが安全やコンプライアンスを犠牲にせず、安心して拡張できる環境を実現します。

3. 機能拡張とAIネイティブな制御: F5とNVIDIAの連携によって、スループットやセキュリティの枠を超え、GPUクラスター全体にわたる制御力・可視性・インテリジェンスを高める新たな付加価値サービスを提供します。 LLMルーティングやきめ細かなトークン管理、柔軟な可観測性、コンテキストに応じたトラフィック制御などを活用し、あなたはAI運用環境のワークロード配置やリソース利用をリアルタイムで最適化できます。

これらの機能によって、AI領域にもエンタープライズ グレードのアプリケーション配信を実現し、あなたのあらゆるトークンやモデル、ユーザー操作まで、正確かつ効率的に処理できます。 F5は、複雑さをきめ細かな制御に変換し、従来のアプリケーションと急速に進化する生成AIの世界をつなぎます。

AIインフラストラクチャの新たな信頼基盤

F5の強みをNCPリファレンス アーキテクチャに結び付けることで、AIインフラストラクチャ設計でスループット、トークン単価、レイテンシ、電力効率、セキュリティを最優先に考え、新たな基盤を共に築いていきます。

私たちがこの基盤の上に構築するAIクラウドは、モデルやワークロードの変化に合わせ、規模拡大がしやすく、収益化も明確に行え、素早く適応できます。 NCP、企業、ソブリンクラウドの皆様は、信頼性と高いパフォーマンスを両立した認証済みのリファレンススタックを安心して活用できます。

F5 は単なる NVIDIA エコシステムの参加ではありません。 あなたとともに、私たちはマイクロ秒もワットも、そしてトークンも無駄にしないトークン経済をさらに前進させます。 F5 は、安全性・高性能・経済的なスケーラビリティをそなえた AI インフラストラクチャを支える戦略的パートナーとして、NVIDIA と連携し、あなたがトークンをより効率的に、スピーディーに、安全かつスマートに生み出せるようサポートします。

あなたとともに、次世代のAIサービスを妥協なく築くために協力できることを心から楽しみにしています。 詳しくは、F5とNVIDIAのウェブページをご覧ください。