Durante los últimos meses, F5 ha analizado en profundidad las fábricas de IA. Al comienzo de nuestra serie, definimos una fábrica de IA como una inversión masiva en almacenamiento, redes y computación que satisface requisitos de inferencia y entrenamiento de alto volumen y alto rendimiento. Las fábricas de IA, al fin y al cabo, son una analogía de cómo se crean, perfeccionan e implementan los modelos y servicios de IA. Al igual que una planta de fabricación tradicional que transforma materiales en productos terminados, las fábricas de IA crean aplicações de IA.
En este artículo del blog, describiremos las similitudes y diferencias entre una aplicação de IA y una aplicação moderna, destacando las necesidades de entrega y seguridad y analizando estas aplicações de IA modernas en el contexto de la Arquitectura de referencia de IA de F5 .
Las aplicações modernas han experimentado una evolución significativa, impulsada por la necesidad de agilidad, escalabilidad y experiencias de usuario mejoradas. La llegada de la computación en la nube ha marcado un punto crucial en esta evolución, proporcionando las bases para sistemas altamente distribuidos que pueden escalar de manera eficiente y operar sin problemas en múltiples entornos. La modernización de aplicação es la evolución hacia sistemas basados en API, lo que llevó a la arquitectura a ser híbrida y multicloud.
Las aplicações de IA aumentan la dependencia de las API y establecen la nube híbrida y multicloud como la nueva normalidad. Las tecnologías de contenedorización han revolucionado aún más la implementación de aplicação al permitir entornos consistentes y aislados para el software independientemente de la infraestructura subyacente. Estos avances no sólo son fundamentales para las aplicações modernas tradicionales, sino que también sirven como columna vertebral para las fábricas de IA. La agilidad que brindan la computación en la nube y la contenerización son esenciales para gestionar las intensas demandas computacionales del entrenamiento y la implementación de modelos de IA.
Las herramientas de orquestación como Kubernetes son esenciales para gestionar aplicações en contenedores a escala. Kubernetes automatiza la implementación, el escalamiento y la gestión de estas aplicações. En los flujos de trabajo de IA, Kubernetes coordina la implementación de cargas de trabajo de IA en múltiples sistemas, asignando recursos de manera eficiente y permitiendo un escalamiento perfecto de los modelos de IA.
Un aspecto crítico de este proceso es MLOps, que aborda los desafíos únicos de desarrollar, entrenar y poner en funcionamiento modelos de IA. MLOps admite la integración y entrega continuas (CI/CD), lo que garantiza que los modelos de IA se prueben, actualicen e implementen continuamente. Además, la adopción de arquitecturas de microservicios ha transformado el desarrollo de aplicação modernas al dividir los sistemas monolíticos en servicios más pequeños que se pueden implementar de forma independiente. Este enfoque acelera la CI/CD, lo que genera actualizaciones de software más rápidas y confiables.
La seguridad siempre ha sido una piedra angular en la evolución de las aplicações modernas. Con el aumento de amenazas cibernéticas sofisticadas, las aplicações modernas han integrado medidas de seguridad avanzadas como firewalls de aplicação web (WAF), protección distribuida contra denegación de servicio (DDoS) y seguridad de API. Es fundamental distinguir entre los ataques DDoS de capa 3/4 dirigidos a las capas de red y transporte y los ataques DoS de capa 7 dirigidos a la capa de aplicação .
A medida que avanza la IA, el modelo de amenaza evoluciona, especialmente para los modelos de lenguaje grandes (LLM) a los que se accede a través de interfaces de procesamiento del lenguaje natural (PLN). Los riesgos para los LLM incluyen vulnerabilidades como las destacadas en el Top 10 de OWASP para aplicações LLM, como ataques de inyección rápida y amenazas de extracción de datos, junto con ataques DoS específicos del modelo. Estos avances de seguridad garantizan que las aplicações de IA sigan siendo resistentes y seguras, manteniendo la integridad y confiabilidad de las soluciones impulsadas por IA frente a las amenazas cambiantes.
Si ha estado siguiendo nuestra serie sobre fábricas de IA, hemos explorado temas como seguridad de API , segmentación de red , gestión de tráfico , generación aumentada por recuperación (RAG) y unidades de procesamiento de datos (DPU) . Demos un paso atrás y analicemos cómo una fábrica de IA encaja en la arquitectura de referencia de IA de F5, cómo las fábricas de IA producen aplicações de IA y los requisitos para entregarlas y protegerlas.
Con base en nuestras casi tres décadas de experiencia ayudando a los clientes a ofrecer aplicações de alto rendimiento, F5 desarrolló una arquitectura de referencia de IA que incluye siete bloques de construcción (inferencia, RAG, gestión de corpus RAG, ajuste, capacitación, integración de servicios externos y desarrollo) y cuatro tipos de implementación (IA-SaaS, alojado en la nube, autoalojado y alojado en el borde). Para obtener más información sobre estos temas, visita nuestro blog que define una fábrica de IA . Como las aplicações de IA son las más modernas de las aplicações modernas, conectadas con API y extremadamente distribuidas, esta arquitectura de referencia aborda los desafíos de rendimiento, operaciones y seguridad que son esenciales para ofrecer aplicações de IA.
Dos de los componentes básicos más comunes para las fábricas de IA son el entrenamiento y la inferencia; sin embargo, cada componente es necesario para crear una aplicação de IA completamente funcional. Algunas organizaciones pueden construir una fábrica de IA para gestionar las funciones necesarias para el entrenamiento o la inferencia. Otros pueden confiar en terceros para consumir servicios para el entrenamiento de modelos o proporcionar infraestructura para la inferencia.
Las aplicações de IA en esencia están distribuidas y potencialmente se ejecutan en plataformas de contenedores Kubernetes distribuidas. Esta es la definición exacta de una aplicação moderna y de donde proviene nuestra frase, “una aplicação de IA es simplemente la más moderna de las aplicações modernas”. ¿Pero qué significa esto para las empresas que están construyendo fábricas de IA? Las aplicações de IA necesitan los mismos servicios de entrega y seguridad que las aplicações modernas actuales, como el ingreso de Kubernetes, la salida de múltiples inquilinos, la gestión del tráfico basada en DNS, la resiliencia y la observabilidad. Por razones de seguridad, se requieren protección DDoS, protección de aplicação web y API y tecnologías de optimización.
Si bien puede parecer sorprendente que nos centremos en las características de entrega y seguridad comunes a la IA y a las aplicações modernas, en lugar de centrarnos únicamente en las preocupaciones de seguridad específicas de la IA, este enfoque es intencional. Las aplicações de IA presentan riesgos únicos, pero a menudo se pasan por alto los aspectos básicos de la seguridad y la entrega de aplicação en favor de características nuevas e innovadoras. Al abordar primero las necesidades compartidas de seguridad y entrega (lo que llamamos las necesidades más fáciles de abordar), las organizaciones pueden realizar mejoras inmediatas utilizando su experiencia existente en seguridad de aplicaciones. Si bien las aplicações de IA pueden involucrar nuevos componentes, aún dependen en gran medida de interacciones web y API, que están dentro de las capacidades de los equipos actuales de NetOps y SecOps. Al comenzar con estrategias de seguridad y entrega comprobadas, los equipos pueden construir una base sólida y abordar gradualmente los desafíos únicos que plantean las aplicações de IA.
Aspectos destacados de la arquitectura de referencia de IA de F5 no solo el resultado de la fábrica de IA, sino también los desafíos y riesgos para lograr que la aplicação de IA tenga éxito para los objetivos comerciales de la organización. Para ello, decidimos utilizar un par de listas complementarias de los 10 principales riesgos y desafíos: el OWASP Top 10 for LLM Aplicações y el F5 Aplicação Delivery Top 10 . Hemos mapeado cada componente y la interconexión de los bloques de construcción y delineamos dónde se aplican los OWASP LLM Top 10 y el F5 Aplicação Delivery Top 10. En el caso siguiente, vea un ejemplo de inferencia de IA.
La arquitectura de referencia de inteligencia artificial de F5 destaca el bloque de construcción de inferencia con los 10 mejores de entrega de aplicação de F5 y los 10 mejores de OWASP LLM superpuestos.
Cada componente y punto de interconexión dentro de una aplicação de IA se beneficia de las protecciones de seguridad y entrega bien establecidas diseñadas para aplicações modernas. Esto no quiere decir que estas protecciones convencionales sólo sean suficientes para proteger las aplicações de IA. Al aprovechar estas soluciones de seguridad y entrega comprobadas como base, las organizaciones pueden lograr una mejora significativa en la postura de seguridad y entrega de sus aplicações de IA. Desde este sólido punto de partida, los equipos pueden desarrollar progresivamente habilidades especializadas y adoptar las herramientas avanzadas necesarias para abordar los desafíos y riesgos únicos que presentan las aplicações de IA.
En este momento, la arquitectura de referencia de IA F5 está disponible como vista previa . Los clientes tendrán la oportunidad de explorar la Arquitectura de Referencia de IA completa en una experiencia interactiva a partir de fines del próximo mes en AppWorld , la principal conferencia sobre seguridad y entrega de aplicação de F5.
F5 es líder en distribución y seguridad de aplicação . Soluciones como F5 BIG-IP proporcionan servicios esenciales que incluyen equilibrio de carga, gestión del tráfico y seguridad. Estas capacidades comúnmente conocidas para las aplicações tradicionales son igualmente críticas para que las aplicações de IA brinden los más altos niveles de confiabilidad, rendimiento y protección.
Para las empresas que construyen fábricas de IA, las capacidades en las que confían de F5 para la entrega y seguridad de aplicação son las capacidades necesarias para las fábricas de IA. F5 BIG-IP Local Traffic Manager , combinado con hardware especialmente diseñado con F5 rSeries y VELOS , permite la ingesta de datos de alto rendimiento para entrenamiento y ajuste, y protege las aplicações de IA de las amenazas de seguridad más exigentes. Los servicios de nube distribuida de F5 permiten la creación de redes multicloud seguras y la protección de aplicação web y API. Además, recientemente anunciado, F5 BIG-IP Next para Kubernetes implementado en DPU NVIDIA BlueField-3 descarga la gestión del tráfico y la seguridad de la CPU a la DPU para una infraestructura de IA a gran escala, lo que desbloquea mayor eficiencia, control y rendimiento para las aplicações de IA.
Para obtener más información sobre cómo F5 puede proteger y escalar las fábricas de IA, comuníquese con su equipo de cuentas de F5 hoy mismo. El enfoque de F5 en la IA no termina aquí: explore cómo F5 protege y distribuye aplicações de IA en todas partes .
¿Está interesado en aprender más sobre las fábricas de IA? Explora otros dentro de nuestra serie de blogs sobre fábricas de IA: