Ahmed Guetari(F5 서비스 공급자 제품 관리 부문 부사장)와 Ash Bhalgat(NVIDIA AI 네트워킹 및 보안 생태계 수석 이사)가 이 블로그 게시물을 함께 작성했습니다.
AI를 성공적으로 활용하려면, 추론 성능과 보안이 고객의 기대를 충족하는 핵심 기준이 됩니다. 변화하는 토큰 경제 시대에 AI 인프라는 단순한 연산 능력을 넘어서고 있습니다. 여러분은 클라우드부터 엣지 데이터 센터까지 추론 역량을 체계적으로 관리하고, 안전하게 보호하며, 효과적으로 확장해야 합니다. 여러분이 생성 AI와 추론 플랫폼을 구축할 때 GPU 효율을 극대화하고, 토큰 처리량을 높이며, 지연을 줄이고, AI 인프라 전체를 안전하게 보호해야 합니다.
F5는 NVIDIA Cloud Partner(NCP) 참조 아키텍처를 활용해 추론을 확장하고, 여러분이 직면한 과제를 해결합니다. 이 핵심 설계안은 주요 AI 클라우드 제공업체가 GPU 가속 인프라를 설계하고 구축하며 운영하는 방식을 명확히 제시합니다. 참조 아키텍처는 컴퓨팅, 네트워킹, 스토리지, 보안 등 최고의 기술을 아우르며, 여러분이 안정적이고 높은 성능의 AI 서비스를 대규모로 제공할 수 있도록 지원합니다.
이번 협력을 통해 F5 BIG-IP가 NVIDIA 생태계에서 안전하고 빠른 추론을 구현하는 핵심 역할을 합니다.
F5는 NVIDIA와 함께 네트워킹, 보안, 애플리케이션 딜리버리 역량을 한층 더 긴밀하게 통합하여, 지능적이고 토큰 기반의 AI 플랫폼을 실현합니다. AI를 대규모로 운영하는 방식을 완전히 새롭게 정의하며, 새로운 토큰 경제를 뒷받침하는 데 필요한 속도, 보호, 인텔리전스를 제공합니다.
NCP 참조 아키텍처는 AI 클라우드 구축에 필요한 완벽한 프레임워크를 제공합니다. 당사는 NVIDIA의 가속 컴퓨팅, 네트워킹, 소프트웨어 역량을 주요 파트너사의 혁신 기술과 결합하여, 클라우드 환경에서 여러분이 고성능·확장성·보안성을 모두 갖춘 AI 솔루션을 사용할 수 있도록 지원합니다.
F5 BIG-IP는 이 아키텍처에서 GPU 기반 AI 워크로드를 위한 고급 트래픽 관리, 제로 트러스트 보안, 다양한 서비스를 제공하고 가시성을 강화합니다. 이렇게 하면 여러분이 NCP에서 추론 서비스를 더욱 신뢰할 수 있게 배포, 확장, 보호할 수 있습니다.
AI 클라우드 서비스 제공업체와 기업에서는 처리량, 전체 지연 시간, 첫 토큰 도달 시간, 에너지 효율성, 토큰당 비용으로 토큰 가치를 평가합니다. 여러분이 사용자와 GPU 클러스터를 연결하는 인프라를 갖춰야 성공을 이끌 수 있습니다. 고성능 AI 서비스를 제공하려면 트래픽 라우팅, 보호, 관찰, 다중 테넌시, 정책 적용 등 모든 요소가 병목 없이 회선 속도로 동작해야 합니다.
NCP 참조 아키텍처는 이 청사진을 명확하게 제시합니다. 당신이 주권 클라우드와 AI 클라우드를 컴퓨팅, 네트워킹, 스토리지, 텔레메트리, 그리고 보안까지 어떻게 효과적으로 연결할 수 있는지 정의합니다. NVIDIA BlueField-3 DPU가 이러한 아키텍처에서 남북 트래픽의 중심 역할을 합니다.
F5는 네트워킹, 보안, AI 기반 제어를 레퍼런스 패브릭에 직접 적용해, 인프라를 효과적으로 지원하는 핵심 파트너로 여러분의 생태계에 함께합니다.
F5는 이미 NVIDIA 기술을 접목해 뛰어난 성과를 만들었습니다. 2025년 4월, F5는 NVIDIA BlueField-3 DPU로 가속화된 Kubernetes용 F5 BIG-IP Next의 공식 출시를 알렸습니다. 이 솔루션을 사용하면 네트워크 처리, 보안, 트래픽 분석을 DPU에 맡겨, CPU를 비즈니스 애플리케이션에 집중할 수 있습니다. 최근 클라우드 PoC 테스트를 진행한 NCP SoftBank는 뛰어난 성능을 확인했습니다.
F5 BIG-IP은 뛰어난 성능을 넘어, 통합 인그레스/이그레스 정책 제어, 서비스 메시, 분산 서비스 거부(DDoS) 방어, 제로 트러스트 적용, API 보호, 워크로드 격리, 멀티 테넌트 가시성까지 NCP에 요구되는 운영 조건을 한 번에 충족할 수 있습니다.
우리는 협업을 통해 대형 언어 모델(LLM) 라우팅 로직, 토큰 기반 트래픽 측정과 거버넌스, Model Context Protocol(MCP) 지원을 개선하여 데이터 경로에서 더욱 정교하게 제어하고 스마트하게 운영할 수 있도록 했습니다.
BIG-IP가 NCP 참조 아키텍처를 지원하면서, 이제 여러분은 AI 클라우드를 구축하고 운영하며 관리할 때 BIG-IP를 핵심에 둘 수 있습니다.
우리가 진행한 초기 검증 결과는 매우 인상적입니다. 여러분이 F5 BIG-IP 서비스를 NVIDIA 가속 컴퓨팅 플랫폼과 함께 활용하면 토큰 생성이 30% 이상 향상되고, 첫 토큰 생성 시간(TTFT)은 60% 단축됩니다.
이러한 성과 덕분에 더 길고 맥락을 이해한 응답, 더 빠른 추론 사이클, 그리고 토큰당 비용이 30% 줄어드는 효과를 얻을 수 있습니다. 여기에 와트당 더 많은 토큰 처리를 더하면, 성능과 에너지 효율성을 모두 높일 수 있어 AI 비즈니스의 경쟁력을 강화해 드립니다.
클라우드 고객 여러분은 NCP를 활용해 더 빠르게 가치를 실현하고, 운영 비용을 줄이며, 모든 모델에서 사용자 경험까지 높일 수 있습니다.
이 성과는 단순한 개선을 넘어섭니다. 이제 AI 클라우드를 통해 여러분이 서비스를 제공하고 보호하며 수익까지 효과적으로 창출할 수 있습니다.
NCP 참조 아키텍처에 F5를 포함하면 AI 서비스를 도입하는 고객에게 성능 향상, 보안 강화, 기능 확장 등 다양한 이점을 더 쉽게 제공합니다. 특히 아래 주요 영역에서 효과를 얻을 수 있습니다.
1. 성능 향상: 토큰 경제에 최적화된 구조: F5 BIG-IP는 NVIDIA GPU, DPU, 네트워크 패브릭, 소프트웨어 플랫폼 구성 요소(NVIDIA Dynamo, NVIDIA NIM)와 자연스럽게 연동해 AI 추론 처리 성능을 극대화합니다. F5 솔루션을 활용하면, 프롬프트 라우팅과 부하 분산, 그리고 추론 효율을 최적화해 병목을 없애고 클러스터별 초당 더 많은 토큰을 처리할 수 있습니다.
모든 토큰이 수익과 모델 정확도에 영향을 주는 환경에서, 여러분은 이런 성과를 통해 생산성을 높이고, 더 빠르게 대응하며, 수익성을 극대화할 수 있습니다. F5와 NVIDIA가 협력해 신흥 토큰 경제에서 가속화된 인프라의 잠재력을 완전히 실현할 수 있도록 지원합니다. 여러분은 효율성과 성능을 바탕으로 비즈니스 성과를 직접적으로 끌어올릴 수 있습니다.
2. AI 추론에 최적화된 새로운 보안: 대규모 AI 추론 환경에서는 데이터 노출부터 모델 엔드포인트 악용까지 다양한 새로운 공격 경로가 생깁니다. F5는 애플리케이션 보안과 정책 적용 노하우를 NVIDIA의 레퍼런스 아키텍처에 직접 반영해, 여러분의 GPU 클라우드를 핵심부터 엣지까지 여러 겹으로 탄탄하게 보호합니다. 여러분이 받는 보호에는 다음 내용이 포함됩니다.
성능과 보안이 함께하는 신뢰할 수 있는 AI 패브릭을 통해, 여러분은 안전과 준수를 지키면서도 자신 있게 비즈니스를 확장할 수 있습니다.
3. 확장된 기능과 AI 네이티브 제어: 처리량과 보안을 뛰어넘어, F5와 NVIDIA의 협업은 GPU 클러스터 전반에서 제어, 가시성, 인텔리전스를 높이는 새로운 부가 가치 서비스를 제공합니다. LLM 라우팅, 세분화된 토큰 관리, 적응형 관측, 상황 인지 기반 트래픽 제어와 같은 기능을 활용해 여러분은 AI 워크로드 배치와 리소스 사용을 실시간으로 최적화할 수 있습니다.
우리는 이러한 기능을 통해 AI 분야에서도 엔터프라이즈 수준의 애플리케이션 제공을 실현합니다. 여러분의 모든 토큰, 모델, 사용자 상호작용을 정확하고 효율적으로 처리합니다. F5는 복잡함을 통제력으로 바꿔주며, 기존 애플리케이션과 빠르게 진화하는 생성형 AI 환경을 연결해드립니다.
저희는 F5의 역량을 NCP 참조 아키텍처와 연계하여, 처리량, 토큰당 비용, 지연 시간, 전력 효율, 보안을 AI 인프라 설계의 핵심 요소로 자리잡을 수 있도록 새로운 기준을 마련하고 있습니다.
이 기반 위에 AI 클라우드를 구축하면 모델과 워크로드 변화에 맞춰 예측 가능하게 확장하고, 투명하게 수익을 창출하며, 빠르게 대응할 수 있습니다. 이제 NCP, 기업, 그리고 주권형 클라우드는 믿을 수 있고 뛰어난 성능을 갖춘 검증된 참조 스택을 활용할 수 있습니다.
F5는 단순히 NVIDIA 생태계에 합류한 게 아닙니다. 우리는 힘을 합쳐 매 순간, 에너지, 토큰 하나까지 중요한 토큰 경제를 앞당기고 있습니다. F5는 안전하고 고성능이며 경제적 확장성이 뛰어난 AI 인프라를 실현하는 전략적 파트너로서 NVIDIA와 협력해 여러분이 토큰을 더 빠르고 효율적이며 안전하고 스마트하게 생성할 수 있도록 지원합니다.
여러분인 고객, 파트너, 혁신가들과 함께 타협 없는 차세대 AI 서비스를 만들어 가길 기대합니다. 더 자세히 알고 싶다면 F5와 NVIDIA 웹페이지를 방문해 주세요.