BLOG | OFICINA DEL CTO

No existe un modelo único para gobernarlos a todos con la IA generativa.

Miniatura de Lori MacVittie
Lori MacVittie
Publicado el 25 de junio de 2024

Según los titulares, OpenAI es el único juego de IA generativa del mercado. Se menciona en todas las conversaciones sobre IA, incluso en ésta. Pero no es el único servicio que existe ni el único modelo disponible. 

De hecho, la adopción de IA generativa para las empresas no es tan homogénea como los titulares podrían hacernos pensar.  

Nuestra investigación más reciente descubrió que las organizaciones, en promedio, funcionan con casi tres modelos diferentes. La razón detrás de esa elección parece estar impulsada por casos de uso. 

Por ejemplo, no sorprende ver que las operaciones de seguridad como caso de uso graviten hacia modelos de código abierto, que pueden entrenarse de forma privada sin temor a exponer procesos y datos corporativos confidenciales. Lo mismo ocurre con la creación de contenido, que a menudo requiere compartir datos confidenciales con una modelo. Tampoco es sorprendente ver casos de uso de automatización de flujo de trabajo que recurren a los servicios alojados de Microsoft, ya que muchas organizaciones están estrechamente vinculadas a las soluciones de Microsoft tanto locales como en Azure

Ningún modelo por sí solo podrá satisfacer todos los requisitos técnicos y comerciales de la creciente lista de casos de uso de IA generativa para empresas. 

Esto genera algunos desafíos en lo que respecta a la entrega y seguridad de las aplicaciones y las operaciones generales, ya que las diferentes opciones de modelos implican diferentes patrones de implementación. 

Patrones emergentes de implementación de IA

Están surgiendo tres patrones básicos de implementación. La diferencia principal gira en torno a la responsabilidad operativa de escalar los servicios de inferencia. En todos los patrones, la organización es responsable de la entrega y la seguridad de la aplicación.    

  1. SaaS administrado . En un patrón de implementación administrado por SaaS, las aplicações de IA utilizan API para acceder a un servicio administrado por IA, como OpenAI ChatGPT. La responsabilidad operativa de la escala recae en el proveedor.  
  2. Gestionado en la nube . Los patrones implementados y administrados en la nube aprovechan los servicios de IA alojados proveedor de nube . Todavía se puede acceder a estos servicios a través de una API, pero pueden ser privados para la empresa o compartidos. Las aplicaciones de IA también pueden estar en la nube pública o en las instalaciones locales. Cuando el servicio es privado, la empresa asume la responsabilidad de escalar los servicios de inferencia, lo que puede ser un desafío ya que la mayoría de las organizaciones tienen poca experiencia en escalar modelos de lenguaje grandes. Cuando el servicio es compartido, las organizaciones delegan la responsabilidad al proveedor de nube, pero deben considerar factores como cuotas y costos basados ​​en tokens como parte de sus operaciones. 
  3. Autogestionado . Modelos de código abierto Lo más probable es que se implementen con un patrón autogestionado, tanto en la nube pública como en las instalaciones locales. Se puede acceder a los modelos a través de API o directamente a través de una aplicação. En este patrón, las organizaciones asumen la responsabilidad total de escalar, proteger y monitorear los servicios de inferencia. 

(Para profundizar en estos patrones, puedes consultar este blog de Chris Hain)

Hay numerosos proveedores que alojarán modelos de código abierto para respaldar un patrón administrado por SaaS y muchos proveedores de nube que también ofrecen código abierto como servicio.

Los modelos de OpenAI no solo están disponibles en un patrón administrado por SaaS a través de OpenAI, sino también como un patrón administrado por la nube a través de Microsoft. Mistral, un popular modelo de código abierto, se puede implementar en los tres patrones. Es por esto que vemos el caso de uso como el principal impulsor de la elección del modelo, dado que las empresas pueden elegir mezclar y combinar, por así decirlo, modelos y patrones de implementación.

Las organizaciones ya están sintiendo la presión con respecto a las habilidades necesarias no sólo para entrenar modelos sino también para operarlos y protegerlos. Por lo tanto, la combinación de modelos por caso de uso tiene más sentido para muchas organizaciones con experiencia operativa limitada. Concentrar los recursos en aquellos casos de uso que, por razones de seguridad o privacidad, no pueden implementarse en patrones compartidos en última instancia producirá los mejores resultados.   

Cuidado con la miopía operativa

Pero tenga cuidado con el peligro de la miopía operativa, que puede generar silos dentro de la organización. Hemos visto que eso sucede con la computación en la nube y sin duda lo veremos nuevamente con la IA generativa para empresas. Pero siendo conscientes del peligro de aislar las operaciones y la seguridad por modelo, se espera que las organizaciones puedan evitar la complejidad y el riesgo que esto implica y elegir estratégicamente modelos y patrones de implementación que aprovechen al máximo los recursos operativos, las capacidades y los presupuestos. 

Estos son los primeros días, y cuando usted lea esto, sin duda habrá nuevos proveedores y nuevos modelos con nuevas capacidades. Pero los patrones de implementación seguirán siendo en gran medida los mismos, lo que permite una planificación más estratégica con respecto a las operaciones, desde los presupuestos hasta el personal y los servicios de aplicaciones que necesitará para proteger y escalar cualquier modelo que elija.