Las aplicaciones impulsadas por IA son cada vez más comunes y experimentan un crecimiento significativo de usuarios. Un análisis de datos de 2023 descubrió que, si bien las descargas de nuevas aplicaciones móviles solo aumentaron un 1 % año tras año, las 20 aplicaciones principales que habían integrado IA en sus conjuntos de funciones experimentaron un crecimiento promedio del 11 %.1 Sin embargo, implementar y proteger fácilmente los modelos de IA para impulsar estas aplicaciones puede ser una barrera para los desarrolladores y los equipos de TI.
La nueva generación de aplicaciones inteligentes utiliza automatización de IA basada en entradas de datos (por ejemplo, una aplicación de seguros que monitorea el clima severo) o podría usar aprendizaje automático para adaptar y mejorar la experiencia del usuario. Gartner estima que para 2026, el 30% de las nuevas aplicações utilizarán IA para impulsar interfaces de usuario adaptativas y personalizadas, frente a menos del 5% actual.2
Pero muchas organizaciones carecen de las habilidades para construir o utilizar los modelos de IA que necesitan. Según una encuesta del Foro Económico Mundial, los ejecutivos estiman que hasta el 40% de su fuerza laboral total podría necesitar volver a capacitarse para trabajar de manera efectiva junto con la IA.3 En respuesta, están surgiendo nuevas soluciones que permiten a los desarrolladores aprovechar los modelos de IA con un código mínimo.
Los modelos de IA también requieren una potencia informática significativa, lo que puede generar limitaciones. Si bien colocar modelos de IA cerca de la fuente de entrada reduce la latencia para la inferencia, las ubicaciones de borde a menudo carecen de los recursos necesarios para un rendimiento de IA aceptable.
Para abordar la facilidad de uso para los desarrolladores y la optimización de recursos, Intel desarrolló OpenVINO, un kit de herramientas de código abierto que acelera la inferencia de IA al tiempo que ofrece un espacio más pequeño y un enfoque de "escribir una vez, implementar en cualquier lugar". Permite a los programadores desarrollar soluciones de IA escalables y eficientes con relativamente pocas líneas de código. OpenVINO también puede convertir y optimizar modelos de IA para ejecutarlos en centros de datos, en la nube o en el borde.
Si bien OpenVINO hace que la IA sea más accesible para escenarios del mundo real, como la inferencia de IA, necesita funciones de seguridad y entrega muy similares a las de las aplicações . Una implementación de OpenVINO puede constar de cientos o miles de servidores de modelos basados en contenedores. Para proporcionar resultados de inferencia de manera confiable a los usuarios o aplicações, necesita una forma de monitorear el estado del servidor y administrar el tráfico. F5 NGINX Plus puede proteger servidores del modelo OpenVINO.
Si bien es posible utilizar la versión de código abierto de NGINX con OpenVINO, el uso de NGINX Plus agrega características valiosas como alta disponibilidad, controles de estado activos y soporte galardonado. NGINX Plus también proporciona equilibrio de carga y terminación SSL para que las aplicaciones y los usuarios puedan conectarse de manera confiable y segura con sus servidores del modelo OpenVINO.
Para mejorar la disponibilidad, NGINX Plus se puede implementar como un par activo-pasivo. Esto crea una solución de alta disponibilidad, que utiliza el servidor principal para procesar activamente el tráfico mientras que el servidor de respaldo monitorea el estado y toma el control en caso de que ocurra un problema. El almacenamiento en caché de contenido y la terminación SSL mejoran el rendimiento al reducir la carga en los servidores del modelo OpenVINO.
Las comprobaciones de estado activas en NGINX Plus supervisan sus servidores modelo para garantizar que el tráfico solo se envíe a los servidores disponibles. Proteja y valide el tráfico entrante cifrado utilizando certificados mTLS y use análisis y paneles de control para anticipar o solucionar problemas con sus servidores. La naturaleza liviana de NGINX Plus, así como el soporte de primer nivel para la instalación, implementación y depuración, hacen que sea fácil de adoptar para las necesidades de sus aplicação impulsadas por IA.
La combinación de NGINX Plus y OpenVINO facilita la incorporación de IA a aplicaciones en cualquier lugar de forma segura y consistente. Implemente fácilmente en centros de datos, nubes o sitios perimetrales manteniendo la disponibilidad y el rendimiento.
El uso de NGINX Plus con OpenVINO es sólo parte de una colaboración continua entre F5 e Intel. Obtenga más información sobre la asociación en f5.com/intel .
1.Data.ai, Estado de la telefonía móvil 2024 , enero de 2024
2.Gartner: Crece la demanda de aplicações inteligentes impulsadas por IA , septiembre. 2023
3.Foro Económico Mundial, Por qué debemos reducir la brecha de habilidades para aprovechar el poder de la IA , enero de 2024