조직에서 AI 기술을 점점 더 많이 도입함에 따라 대규모 언어 모델(LLM)을 최신 독점 데이터로 최신 상태로 유지하는 것이 어려울 수 있다는 것을 알게 되었습니다. 이로 인해 AI 추론을 강화하여 보다 정확하고 유용한 응답을 제공하기 위해 보충 데이터를 추가하는 검색 증강 생성(RAG)이 도입되었습니다. 이러한 추가 데이터를 LLM에 안전하게 전송하는 작업은 까다로울 수 있으며, 안전한 연결을 위한 솔루션이 필요합니다.
전통적인 LLM은 강력하지만 훈련 데이터에 제한이 있으며 조직별 정보에 접근할 수 없습니다. RAG를 사용하면 LLM이 생성 중에 외부 지식 소스를 쿼리하여 모델의 광범위한 지식과 조직의 독점 데이터를 모두 반영하는 출력을 생성할 수 있습니다.
그러나 대부분의 조직이 멀티클라우드, 하이브리드 IT 환경으로 전환함에 따라 데이터가 여러 소스에 분산되는 경우가 많습니다. 이러한 배포 방식으로 인해 RAG를 효과적으로 구현하기 어렵습니다. 조직에서는 규모에 맞춰 성능과 비용 효율성을 유지하는 동시에 모든 관련 데이터 소스에 대한 안전한 액세스를 보장해야 하기 때문입니다. 이러한 과제를 해결하려면 모든 소스의 데이터 저장소를 LLM과 안전하게 연결할 수 있는 수단이 필요합니다. 이것이 F5, NetApp, Google Cloud가 힘을 합쳐 솔루션을 제공하는 이유입니다.
대규모 언어 모델에서 관련 데이터를 얻고 이를 컨텍스트와 결합하여 정확하고 상황에 맞는 정보를 생성하는 검색기를 포함하는 기본 RAG 워크플로입니다.
F5 분산 클라우드 서비스 에는 클라우드와 온프레미스 환경에서 앱과 데이터를 연결하는 안전한 멀티클라우드 네트워킹이 포함되어 있습니다. F5 글로벌 네트워크의 프라이빗 백본을 사용하는 F5 Distributed Cloud Network Connect는 NetApp과 협력하여 필요한 시간과 장소에 맞춰 데이터를 빠르고 안전하게 이동하고 저장합니다.
특히 RAG의 경우, Distributed Cloud Network Connect는 클라우드 또는 온프레미스의 NetApp 스토리지를 Google Cloud의 Vertex AI 플랫폼을 비롯한 LLM 에 연결하여 안전하고 빠르며 관련성 있는 추론을 제공합니다. 이 솔루션은 하이브리드 및 멀티클라우드 환경에서 분산된 데이터 소스에 액세스하기 위한 원활한 프레임워크를 만듭니다.
F5의 안전한 멀티클라우드 네트워킹 기능은 기반이 되어 다양한 환경에서 효율적이고 안전한 데이터 액세스를 제공하는 동시에 중앙 집중화된 관찰 및 오케스트레이션을 유지합니다. 조직에서는 Google Cloud NetApp Volumes , Google Cloud용 NetApp Cloud Volumes ONTAP 및 기타 NetApp 데이터 스토리지 시스템 과 Distributed Cloud Network Connect를 사용하여 AI 워크로드에 필요한 안전한 연결과 빠른 성능을 제공할 수 있습니다.
Google Cloud의 Vertex AI 플랫폼은 통합된 데이터 액세스를 활용하여 RAG가 컨텍스트 기반 LLM 애플리케이션을 개발할 때 용이하도록 솔루션을 완성합니다. 이 플랫폼의 효율적인 리소스 활용과 안전한 AI 인프라는 조직이 AI 운영을 확장하는 동시에 비용 효율성을 유지하는 데 도움이 됩니다.
이 공동 솔루션은 다음과 같은 여러 가지 장점을 제공합니다.
F5, NetApp, Google Cloud가 힘을 합쳐 고객이 하이브리드 및 멀티클라우드 환경에서 RAG를 안전하게 구현할 수 있도록 지원합니다.
조직은 F5, NetApp 및 Google Cloud 인프라에 대한 기존 투자를 활용하여 안전한 RAG 솔루션을 만들 수 있으므로 AI 역량을 향상하고자 하는 기업에게 실용적인 선택입니다. 이러한 파트너십을 통해 조직은 보안과 통제를 유지하면서도 AI 기반 통찰력을 얻기 위해 데이터를 활용할 수 있습니다. RAG 애플리케이션의 데이터 액세스를 간소화함으로써 조직은 인프라 복잡성을 관리하는 대신 AI에서 가치를 창출하는 데 집중할 수 있습니다.
F5 분산 클라우드 서비스는 Google Cloud Marketplace 에서 제공됩니다.