BLOG

GPU como servicio: El catalizador del crecimiento de la IA en la ASEAN: oportunidades y desafíos

Miniatura de Chin Keng Lim
Chin Keng Lim
Publicado el 14 de octubre de 2024

A medida que la inteligencia artificial (IA) continúa avanzando, la demanda de hardware de alto rendimiento se dispara. A las organizaciones les resulta cada vez más difícil mantener el ritmo de la potencia informática necesaria para ejecutar modelos y cargas de trabajo de IA complejos. Aquí es donde entra en juego la GPU como servicio (GPUaaS).

Al ofrecer acceso a pedido a potentes unidades de procesamiento de gráficos (GPU) a través de la nube, GPUaaS está transformando la forma en que las empresas abordan la infraestructura de IA. Elimina la necesidad de realizar costosas inversiones en hardware, permite un escalamiento perfecto y se integra sin problemas con los servicios de nube existentes, todo ello al tiempo que simplifica las operaciones. Pero, ¿cómo funciona exactamente GPUaaS y por qué se está convirtiendo en la solución preferida por las organizaciones impulsadas por IA?

Desbloquear el potencial de la IA en la ASEAN

En la Asociación de Naciones del Sudeste Asiático (ASEAN), el mercado de GPUaaS se está expandiendo a medida que más actores ingresan al espacio para abordar desafíos regionales específicos. Un factor clave que impulsa este crecimiento es el idioma. Los modelos de lenguaje grande (LLM) de código abierto se entrenan predominantemente en inglés y a menudo tienen dificultades con idiomas locales que son ricos en matices culturales. Como resultado, las organizaciones necesitan volver a entrenar o ajustar estos modelos con datos locales para garantizar respuestas más precisas y relevantes en los idiomas nativos.

Al mismo tiempo, los beneficios de utilizar GPUaaS están ayudando a impulsar su adopción. La escalabilidad permite a los usuarios ajustar sin esfuerzo los recursos de la GPU según las necesidades del proyecto. Mientras que la elasticidad, a través de un modelo de pago por uso, permite a las organizaciones reducir los gastos generales al pagar solo por lo que usan. GPUaaS también otorga acceso inmediato a tecnología de vanguardia, lo que facilita la creación rápida de prototipos y la implementación que aumenta la flexibilidad y reduce el tiempo de comercialización.

Otra consideración importante es la gravedad, la residencia y la soberanía de los datos. La gravedad de los datos se refiere a la tendencia de los datos a atraer aplicações y servicios a su ubicación para lograr un mejor rendimiento y eficiencia. En muchos casos, los datos deben residir en ubicaciones específicas debido a las regulaciones de residencia y soberanía, lo que significa que los proveedores de GPUaaS deben estar ubicados cerca de sus bases de usuarios. La IA soberana, que enfatiza la capacidad de una nación para desarrollar IA utilizando su propia infraestructura, datos y recursos, también juega un papel importante en la conformación de la demanda de GPUaaS localizada.

Por último, el costo y el suministro limitado de GPU dentro de los proveedores de servicios en la nube (CSP) en la ASEAN son factores a considerar a la hora de adoptar GPUaaS. Según un informe reciente de Dell , las implementaciones de IA locales pueden generar ahorros de hasta un 75 % en comparación con las soluciones basadas en CSP. GPUaaS ofrece una alternativa rentable que permite a las organizaciones acceder a GPU de alto rendimiento sin invertir en una cantidad significativa de hardware por adelantado, lo que la convierte en una opción atractiva para quienes buscan escalar sus capacidades de IA en la región.

Equilibrar los beneficios y los riesgos de GPUaaS

Si bien los beneficios de GPUaaS ayudan a impulsar su adopción generalizada, también traen consigo su propio conjunto de preocupaciones. Una cuestión clave es la seguridad de datos, ya que los datos transmitidos hacia y desde las GPU pueden ser vulnerables a interceptaciones o acceso no autorizado. Además, el procesamiento de datos en GPU remotas puede implicar el cumplimiento de diversas regulaciones de protección de datos y requisitos de cumplimiento. Otra preocupación es el rendimiento, ya que la dependencia de Internet o de la conectividad privada y el rendimiento fluctuante de la GPU podrían afectar la velocidad y la capacidad de respuesta de las aplicação . GPUaaS depende de conexiones estables y de alta velocidad, y a menudo favorece las redes privadas en lugar de Internet público para lograr un rendimiento óptimo.

¿Cómo ayuda F5?

F5 ofrece servicios innovadores de redes, optimización del tráfico y seguridad basados ​​en SaaS multicloud para nubes públicas y privadas, incluidos proveedores de GPUaaS, a través de una única consola.

Al formar una superposición de tejido de malla encriptada sobre cualquier red, las organizaciones pueden conectarse a un proveedor de GPUaaS (fábrica de IA) para inferencia, integración o entrenamiento de IA. Con una segmentación completa de la red y de las aplicação , toda la conectividad superpuesta es privada y segura, construida sobre una red subyacente existente. Además, la malla encriptada de F5 aborda los desafíos de resiliencia digital al monitorear, detectar, optimizar y entregar dinámicamente el tráfico a esos componentes de IA saludables, lo que garantiza que sus aplicações de IA estén siempre disponibles y en funcionamiento.

A continuación, se muestra un ejemplo de una implementación de generación aumentada (RAG) de recuperación LLM, que aprovecha una fábrica de IA de un proveedor de GPUaaS. Como los datos se transportan de forma segura a través de la malla segura con encriptación, no hay preocupaciones acerca de los datos en tránsito; tampoco hay datos en reposo en el proveedor de GPUaaS. Los datos del corpus de una organización en reposo permanecen en la ubicación original sin ningún cambio. Esta arquitectura también permite que se realice la inferencia de IA para aplicações sensibles a la latencia en el borde (una nube pública o incluso sucursales).

Si la aplicação de IA (como un chatbot habilitado con RAG de Agentic) se hace accesible desde Internet, es importante considerar un servicio de protección de API y aplicaciones web basado en red en la nube (WAAP) para proteger la aplicação de IA de ciberataques.

Figura 1: Un ejemplo de una implementación de generación aumentada (RAG) de recuperación LLM, que aprovecha una fábrica de IA de un proveedor de GPUaaS
Figura 1: Un ejemplo de una implementación de generación aumentada (RAG) de recuperación LLM, que aprovecha una fábrica de IA de un proveedor de GPUaaS

Al aprovechar una plataforma con una única consola de administración, ahora es posible tener cumplimiento, observabilidad y control de todo el tráfico, incluidas las API que recorren de norte a sur y de este a oeste la estructura de malla cifrada.

Figura 2: El descubrimiento de API, la gestión de la postura y la protección de API son fundamentales para la seguridad de AI LLM.
Figura 2: El descubrimiento de API, la gestión de la postura y la protección de API son fundamentales para la seguridad de AI LLM.

Además, el tráfico a través de Internet público y la red privada cifrada debe ser observable y controlable por los equipos de NetOps y SecOps para gestionar lo que es esencialmente una infraestructura multicloud compleja y heterogénea.

Figura 3: La red multicloud y la capacidad de observación son esenciales en una implementación de IA distribuida, que puede abarcar centros de datos locales, nubes privadas, nubes públicas y el borde.
Figura 3: La red multicloud y la capacidad de observación son esenciales en una implementación de IA distribuida, que puede abarcar centros de datos locales, nubes privadas, nubes públicas y el borde.

¿Quieres saber más?

A medida que se acelera la adopción de IA, desarrollar resiliencia en los sistemas de IA es fundamental para garantizar el éxito a largo plazo. GPUaaS ofrece una solución escalable y eficiente, pero las organizaciones deben afrontar desafíos como la seguridad de datos, la variabilidad del rendimiento y el cumplimiento normativo. Al abordar estas inquietudes y aprovechar la flexibilidad de GPUaaS, las empresas pueden posicionarse mejor para satisfacer las crecientes demandas de cargas de trabajo impulsadas por IA.

Si desea explorar cómo la resiliencia de la IA puede empoderar a su organización, visítenos en la próxima conferencia GovWare en el stand P06, del 15 al 17 de octubre, en Sands Expo and Convention Center, donde discutiremos estas tendencias y soluciones con más detalle.