보도자료

F5, NVIDIA와 협력하여 빠르게 진화하는 AI 환경을 위한 성능, 멀티 테넌시 및 보안 기능 확장

2025년 6월 11일 게시
연락처

댄 소렌슨
F5
(650) 228-4842
d.sorensen@f5.com

홀리 랭커스터
우리. 연락
(415) 547-7054
hluka@we-worldwide.com

Sesterce 검증은 고객이 AI 우선 애플리케이션 제공의 가치를 수용하도록 돕기 위해 F5와 NVIDIA 간의 협력적 혁신을 강조합니다.

파리  F5(나스닥: 모든 앱과 API를 제공하고 보호하는 글로벌 선두 기업인 FFIV는 오늘 NVIDIA BlueField-3 DPUNVIDIA DOCA 소프트웨어 프레임워크 로 가속화된 F5 BIG-IP Next for Kubernetes를 위한 새로운 기능을 발표했습니다. 이는 고객 Sesterce의 검증 배포를 통해 더욱 강조되었습니다. 세스터체 는 차세대 인프라와 주권형 AI 분야를 전문으로 하는 유럽의 선도적인 통신사로서, 가속 컴퓨팅과 인공지능의 요구를 충족하도록 설계되었습니다.

F5 애플리케이션 전송 및 보안 플랫폼을 확장하여 NVIDIA BlueField-3 DPU에서 기본적으로 실행되는 Kubernetes용 BIG-IP Next는 대규모 AI 인프라에 고성능 트래픽 관리 및 보안을 제공하여 AI 애플리케이션의 효율성, 제어력, 성능을 더욱 높여줍니다. 올해 에 발표된 뛰어난 성능 이점과 더불어, Sesterce는 다음 영역을 포함한 여러 핵심 기능에 걸쳐 F5 및 NVIDIA 솔루션의 검증을 성공적으로 완료했습니다.

- 클라우드 수준의 기대치를 충족하기 위해 향상된 성능, 멀티 테넌시, 보안을 제공하며 , 초기에는 GPU 활용도가 20% 향상되었습니다.

- NVIDIA Dynamo 와 KV Cache Manager를 통합하여 대규모 언어 모델(LLM) 추론 시스템의 추론 지연 시간을 줄이고 GPU 및 메모리 리소스를 최적화합니다.

- BlueField DPU의 스마트 LLM 라우팅은 여러 모델이 필요한 워크로드에 대해 NVIDIA NIM 마이크로서비스와 효과적으로 실행되어 고객에게 사용 가능한 모든 모델 중 최상의 모델을 제공합니다.

- 역방향 프록시 기능 과 확장성과 보안성이 향상된 LLM을 위한 보호 기능을 포함한 모델 컨텍스트 프로토콜(MCP)의 확장 및 보안을 강화하여 고객이 MCP 서버의 성능을 빠르고 안전하게 활용할 수 있도록 지원합니다.

- 강력한 F5 iRules 기능을 통한 강력한 데이터 프로그래밍 기능을 통해 AI 애플리케이션과 진화하는 보안 요구 사항을 지원하기 위한 빠른 사용자 정의가 가능합니다.

Sesterce의 CEO 겸 공동 창립자인 Youssef El Manssouri는 "F5와 NVIDIA의 통합은 테스트를 실시하기 전부터 매력적이었습니다."라고 말했습니다. "저희의 연구 결과는 AI 환경에서 대용량 Kubernetes 유입 및 유출을 통한 F5의 동적 부하 분산의 이점을 강조합니다. 이러한 접근 방식을 통해 트래픽을 보다 효율적으로 분산하고 GPU 사용을 최적화하는 동시에 고객에게 추가적이고 고유한 가치를 제공할 수 있습니다. F5가 향상된 멀티 테넌시를 포함하여 점점 더 많은 NVIDIA 사용 사례를 지원하게 되어 기쁘고, 차세대 AI 인프라를 지원하기 위해 두 회사 간에 추가적인 혁신이 이루어지기를 기대합니다."

새로운 솔루션 기능의 주요 내용은 다음과 같습니다.

  • Kubernetes용 BIG-IP Next를 사용한 LLM 라우팅 및 동적 부하 분산

이 협업 솔루션을 사용하면 생성 AI를 지원하는 비용이 덜 들고 가벼운 LLM으로 간단한 AI 관련 작업을 라우팅하는 동시에 복잡한 쿼리에 고급 모델을 사용할 수 있습니다. 이러한 수준의 사용자 정의 가능한 인텔리전스를 통해 라우팅 기능은 도메인별 LLM을 활용하여 출력 품질을 개선하고 고객 경험을 크게 향상시킬 수 있습니다. F5의 고급 트래픽 관리 기능은 쿼리가 가장 적합한 LLM으로 전송되도록 보장하여 대기 시간을 줄이고 첫 번째 토큰까지의 시간을 단축합니다.

F5의 최고 혁신 책임자인 쿠날 아난드는 "기업들은 고급 AI 환경을 구축하기 위해 여러 LLM을 점점 더 많이 배포하고 있지만, LLM 트래픽을 라우팅하고 분류하는 데는 컴퓨팅 부하가 많이 걸려 성능과 사용자 경험이 저하될 수 있습니다."라고 말했습니다. "F5 BIG-IP Next for Kubernetes는 NVIDIA BlueField-3 DPU에서 직접 라우팅 로직을 프로그래밍하므로 LLM 트래픽을 전달하고 보호하는 데 가장 효율적인 방법입니다. 이것은 단지 시작일 뿐입니다. "저희 플랫폼은 AI 인프라에 새로운 가능성을 열어줍니다. 기업 AI가 계속 확장됨에 따라 NVIDIA와 함께 공동 혁신을 더욱 심화하게 되어 기쁩니다."

  • NVIDIA Dynamo 및 KV Cache 통합을 통해 대규모 분산 AI 추론을 위한 GPU 최적화

올해 초에는 NVIDIA Dynamo가 출시되어 대규모 분산 환경에서 생성 AI와 추론 모델을 배포하기 위한 보완 프레임워크를 제공했습니다. NVIDIA Dynamo는 스케줄링, 라우팅, 메모리 관리 등의 작업을 조율하여 분산 환경에서 AI 추론을 실행하는 복잡성을 간소화하고, 동적 작업 부하에서도 원활한 작동을 보장합니다. 특정 작업을 CPU에서 BlueField DPU로 오프로드하는 것은 F5와 NVIDIA 솔루션을 결합한 핵심 이점 중 하나입니다. F5를 사용하면 Dynamo KV 캐시 관리자 기능이 용량에 따라 요청을 지능적으로 라우팅하고, 키-값(KV) 캐싱을 사용하여 이전 작업의 정보를 유지함으로써 프로세스 속도를 높여 생성적 AI 사용 사례를 가속화할 수 있습니다(리소스를 많이 소모하는 재계산이 필요 없음). 인프라 관점에서 볼 때, KV 캐시 데이터를 저장하고 재사용하는 조직은 이러한 목적으로 GPU 메모리를 사용하는 것보다 훨씬 적은 비용으로 이를 수행할 수 있습니다.

NVIDIA의 AI 네트워킹 및 보안 솔루션, 생태계 및 마케팅 부문 수석 이사인 애쉬 발갓(Ash Bhalgat)은 "NVIDIA BlueField-3 DPU로 가속화된 BIG-IP Next for Kubernetes는 기업과 서비스 제공업체에 단일 제어 지점을 제공하여 트래픽을 AI 팩토리로 효율적으로 라우팅하고 GPU 효율성을 최적화하며 데이터 수집, 모델 학습, 추론, RAG 및 에이전트 AI를 위한 AI 트래픽을 가속화합니다."라고 말했습니다. "또한 F5의 다중 테넌시 지원 및 iRules를 통한 향상된 프로그래밍 기능은 NVIDIA Dynamo Distributed KV Cache Manager 지원과 같은 지속적인 통합 및 기능 추가에 적합한 플랫폼을 제공합니다."

  • F5 및 NVIDIA를 통한 MCP 서버 보호 강화

모델 컨텍스트 프로토콜(MCP)은 Anthropic에서 개발한 개방형 프로토콜로, 애플리케이션이 LLM에 컨텍스트를 제공하는 방식을 표준화합니다. F5와 NVIDIA의 통합 솔루션을 MCP 서버 앞에 구축하면 F5 기술이 역방향 프록시 역할을 수행하여 MCP 솔루션과 이를 지원하는 LLM의 보안 기능을 강화할 수 있습니다. 또한 F5 iRules가 지원하는 전체 데이터 프로그래밍 기능은 빠르게 진화하는 AI 프로토콜 요구 사항에 대한 신속한 적응과 복원력을 촉진하는 동시에 새로운 사이버 보안 위험에 대한 추가 보호 기능을 제공합니다.

World Wide Technology의 글로벌 서비스 제공업체 부문 수석 부사장인 Greg Schoeny는 "에이전트 AI를 구현하는 조직은 LLM의 보안과 성능을 개선하기 위해 MCP 배포에 점점 더 의존하고 있습니다."라고 말했습니다. F5와 NVIDIA는 광범위한 Kubernetes 환경에 고급 트래픽 관리 및 보안을 제공함으로써 프로그래밍 기능 및 자동화 기능과 함께 통합된 AI 기능 세트를 제공하고 있습니다. 이는 현재 업계의 다른 곳에서는 볼 수 없는 기능입니다.

NVIDIA BlueField-3 DPU에 배포된 F5 BIG-IP Next for Kubernetes가 이제 일반적으로 출시되었습니다. 추가적인 기술 세부 정보와 배포상의 이점에 대해 알아보려면 www.f5.com 으로 이동하여 이번 주 VivaTech 2025 이벤트의 일부인 NVIDIA GTC Paris에 참여한 회사를 방문하세요. 자세한 내용은 F5의 블로그 에서 확인할 수 있습니다.

세스테르체 소개

2018년에 설립된 Sesterce는 고성능 컴퓨팅과 인공지능 인프라를 전문으로 하는 유럽의 선도적인 통신사입니다. 가치 사슬에 대한 완전한 통제력을 바탕으로 회사는 스타트업, 대기업, 학술 기관의 요구 사항에 맞춰 유연하고 자주적이며 지속 가능한 솔루션을 제공합니다. 세스터체는 윤리적, 환경적 기준을 고수하면서 혁신가들이 확장할 수 있도록 지원하여 AI 인프라 분야에서 유럽의 선두주자가 되는 것을 목표로 합니다.

이러한 정신에 따라 Sesterce는 인프라 위에 "AI 네이티브" 서비스 계층도 제공합니다. 이 계층은 이기종 실시간 스트림을 수집하고 변환하는 고급 데이터 준비를 제공하고, 대규모 모델을 개발하거나 배포하는 조직에 VLLM(매우 큰 언어 모델)에 대한 전담 지원을 제공하며, AI 네이티브 스타트업과 기존 기업 모두를 위해 설계된 모듈식 비즈니스 인텔리전스 솔루션을 제공합니다. 또한 Sesterce는 유럽 주권 및 기밀 유지 표준을 완벽하게 준수하는 개인 AI 및 추론 환경을 통해 종단 간 개인 정보 보호 및 제어를 보장합니다.

F5에 대하여

주식회사 F5 (나스닥: FFIV)는 모든 앱을 제공하고 보호하는 글로벌 선두 기업입니다. 30년간 축적된 전문성을 바탕으로 F5는 업계 최고의 플랫폼인 F5 애플리케이션 전송 및 보안 플랫폼(ADSP)을 구축하여 온프레미스, 클라우드, 엣지, 하이브리드 및 멀티클라우드 환경 등 어디에서나 모든 앱과 API를 제공하고 보호합니다. F5는 빠르고, 가용성이 뛰어나고, 안전한 디지털 경험을 제공하기 위해 세계 최대 규모이자 가장 진보된 조직과 협력하고 혁신하는 데 전념하고 있습니다. 우리는 함께 서로의 번영을 돕고 더 나은 디지털 세상을 만들어 나갑니다.

더 많은 정보를 원하시면 f5.com을 방문하세요.
f5.com/labs 에서 F5 Labs 위협 연구를 살펴보세요.
F5, 파트너 및 기술에 대해 자세히 알아보려면 팔로우하세요. 블로그 | 링크드인 | X | 유튜브 | 인스타그램 | 페이스북

F5, BIG-IP, BIG-IP Next 및 iRules는 미국 및 기타 국가에서 F5, Inc.의 상표, 서비스 마크 또는 상호명입니다. 여기에 나와 있는 다른 모든 제품 및 회사 이름은 해당 소유자의 상표일 수 있습니다.

# # #

이 보도 자료에는 위험과 불확실성을 수반하는 미래 사건 또는 미래 재무 성과와 관련된 미래예측진술이 포함될 수 있습니다. 이러한 진술은 '~일 수 있다', '~할 것이다', '~해야 한다', '기대한다', '계획하다', '예상하다', '믿는다', '추정하다', '예측하다', '잠재적', '지속하다' 등의 용어 또는 이러한 용어의 부정형 또는 이와 유사한 용어를 통해 식별할 수 있습니다. 이러한 진술은 예측일 뿐이며 실제 결과는 회사가 SEC에 제출한 서류에서 확인된 사항을 비롯한 여러 요인에 따라 진술에서 예상한 것과 크게 달라질 수 있습니다.