인공지능(AI)이 계속 발전함에 따라 고성능 하드웨어에 대한 수요가 급증하고 있습니다. 조직에서는 복잡한 AI 모델과 워크로드를 실행하는 데 필요한 컴퓨팅 성능을 따라잡는 것이 점점 더 어려워지고 있습니다. 여기서 GPU as a Service(GPUaaS)가 등장합니다.
GPUaaS는 클라우드에서 강력한 그래픽 처리 장치(GPU)에 대한 주문형 액세스를 제공함으로써 기업이 AI 인프라에 접근하는 방식을 혁신하고 있습니다. 비용이 많이 드는 하드웨어 투자의 필요성을 없애고, 원활한 확장을 가능하게 하며, 기존 클라우드 서비스와 원활하게 통합되며, 운영도 간소화됩니다. 하지만 GPUaaS는 정확히 어떻게 작동하며, AI 기반 조직의 필수 솔루션이 되는 이유는 무엇일까요?
동남아시아 국가 연합(ASEAN)에서는 점점 더 많은 기업이 특정 지역적 과제를 해결하기 위해 이 분야에 진출하면서 GPUaaS 시장이 확대되고 있습니다. 이러한 성장을 이끄는 주요 요인 중 하나는 언어입니다. 오픈소스 대규모 언어 모델(LLM)은 주로 영어로 훈련되었으며, 문화적 뉘앙스가 풍부한 지역 언어를 다루는 데 어려움을 겪는 경우가 많습니다. 따라서 조직에서는 모국어로 더 정확하고 관련성 있는 응답을 보장하기 위해 로컬 데이터를 사용해 이러한 모델을 다시 교육하거나 세부적으로 조정해야 합니다.
동시에 GPUaaS를 사용하면 얻을 수 있는 이점이 늘어나 도입이 촉진되고 있습니다. 확장성을 통해 사용자는 프로젝트 요구 사항에 따라 GPU 리소스를 손쉽게 조정할 수 있습니다. 탄력성을 통해 사용량에 따른 요금 지불 모델을 통해 조직은 사용한 만큼만 비용을 지불함으로써 전체 비용을 줄일 수 있습니다. GPUaaS는 최첨단 기술에 대한 즉각적인 액세스를 제공하여 신속한 프로토타입 제작과 배포를 용이하게 하며, 유연성을 높이고 출시 시간을 단축합니다.
또 다른 중요한 고려 사항은 데이터 중력, 거주권, 주권입니다. 데이터 중력이란 더 나은 성능과 효율성을 위해 데이터가 해당 위치로 애플리케이션과 서비스를 끌어들이는 경향을 말합니다. 많은 경우, 거주 및 주권 규정으로 인해 데이터는 특정 위치에 저장되어야 하며, 이는 GPUaaS 제공업체가 사용자 기반 근처에 위치해야 한다는 것을 의미합니다. 국가가 자체 인프라, 데이터, 리소스를 활용해 AI를 개발하는 능력을 강조하는 주권형 AI도 지역화된 GPUaaS에 대한 수요를 형성하는 데 중요한 역할을 합니다.
마지막으로, ASEAN 지역 내 클라우드 서비스 공급업체(CSP)의 GPU 비용과 제한된 공급은 GPUaaS를 도입할 때 고려되는 요소입니다. Dell의 최근 보고서 에 따르면, 온프레미스 AI 배포는 CSP 기반 솔루션에 비해 최대 75%의 비용 절감 효과를 낼 수 있습니다. GPUaaS는 비용 효율적인 대안을 제공하여 기업이 상당한 양의 하드웨어에 미리 투자하지 않고도 고성능 GPU에 액세스할 수 있으므로 해당 지역에서 AI 역량을 확장하려는 기업에 매력적인 옵션입니다.
GPUaaS의 이점은 광범위한 채택을 촉진하는 데 도움이 되지만, 고유한 우려 사항도 가지고 있습니다. 가장 중요한 문제 중 하나는 데이터 보안입니다. GPU에서 전송되는 데이터는 가로채기나 무단 액세스에 취약할 수 있습니다. 게다가 원격 GPU에서 데이터를 처리하려면 다양한 데이터 보호 규정과 규정 준수 요구 사항을 충족해야 할 수도 있습니다. 또 다른 우려 사항은 성능입니다. 인터넷이나 개인 연결에 대한 의존성과 GPU 성능 변동은 애플리케이션 속도와 응답성에 영향을 미칠 수 있습니다. GPUaaS는 안정적이고 고속의 연결에 의존하며, 최적의 성능을 위해 공용 인터넷보다 개인 네트워크를 선호하는 경우가 많습니다.
F5는 단일 콘솔을 통해 GPUaaS 공급업체를 포함하여 퍼블릭 및 프라이빗 클라우드를 위한 혁신적인 멀티클라우드 SaaS 기반 네트워킹, 트래픽 최적화 및 보안 서비스를 제공합니다.
모든 네트워크 위에 암호화된 메시 패브릭 오버레이를 형성함으로써, 조직은 GPUaaS 공급자(AI 팩토리)에 연결하여 AI 추론, 임베딩 또는 교육을 수행할 수 있습니다. 전체 네트워크 및 애플리케이션 세분화를 통해 모든 오버레이 연결은 기존 네트워크 언더레이 위에 구축되어 비공개적이고 안전합니다. 또한 F5 암호화 메시 패브릭은 건강한 AI 구성 요소에 대한 트래픽을 동적으로 모니터링, 감지, 최적화하고 전달하여 디지털 복원력 문제를 해결하고 AI 애플리케이션이 항상 작동하고 사용 가능한 상태를 유지하도록 보장합니다.
아래는 GPUaaS 공급업체의 AI 팩토리를 활용한 LLM 검색 증강 생성(RAG) 배포의 예입니다. 데이터는 암호화되어 보안 메시를 통해 안전하게 전송되므로 전송 중인 데이터에 대한 우려가 없습니다. 또한 GPUaaS 공급자에서 저장 중인 데이터가 발생하지 않습니다. 조직의 저장된 코퍼스 데이터는 변경 없이 원래 위치에 그대로 유지됩니다. 이 아키텍처는 지연에 민감한 애플리케이션에 대한 AI 추론이 에지(퍼블릭 클라우드 또는 지사)에서 실행될 수 있도록 합니다.
AI 애플리케이션(예: 에이전트형 RAG 지원 챗봇)을 인터넷에서 접근할 수 있게 되면 사이버 공격으로부터 AI 애플리케이션을 보호하기 위해 클라우드 네트워크 기반 웹앱 및 API 보호(WAAP) 서비스를 고려하는 것이 중요합니다.
단일 관리 콘솔이 있는 플랫폼을 활용함으로써 이제 암호화된 메시 패브릭을 통해 북쪽/남쪽 및 동쪽/서쪽을 횡단하는 API를 포함하여 모든 트래픽에 대한 규정 준수, 관찰 및 제어가 가능해졌습니다.
게다가, 본질적으로 복잡하고 이기종인 멀티클라우드 인프라를 관리하기 위해서는 NetOps 및 SecOps 팀이 공용 인터넷과 암호화된 개인 메시를 통한 트래픽을 관찰하고 제어할 수 있어야 합니다.
AI 도입이 가속화됨에 따라 장기적인 성공을 보장하려면 AI 시스템의 회복력을 구축하는 것이 중요합니다. GPUaaS는 확장 가능하고 효율적인 솔루션을 제공하지만, 조직은 데이터 보안, 성능 변화, 규정 준수와 같은 과제를 해결해야 합니다. 이러한 문제를 해결하고 GPUaaS의 유연성을 활용함으로써 기업은 AI 기반 워크로드의 증가하는 수요를 충족할 수 있는 더 나은 입지를 확보할 수 있습니다.
AI 회복력이 조직의 역량 강화에 어떤 도움이 될 수 있는지 알아보려면 10월 15일부터 17일까지 샌즈 엑스포 앤 컨벤션 센터에서 열리는 GovWare 컨퍼런스 부스 P06에 방문하세요. 그곳에서 이러한 추세와 솔루션에 대해 더 자세히 논의할 예정입니다.