ブログ | CTO オフィス

ジェネレーティブ AI では「すべてを支配する 1 つのモデル」は存在しません

ロリ・マクヴィッティ サムネイル
ロリ・マクヴィッティ
2024年6月25日公開

見出しによると、OpenAI は唯一の生成型 AI ゲームです。 これは、AI に関するあらゆる会話で言及されており、この会話でも言及されています。 しかし、これが唯一のサービスではなく、利用できる唯一のモデルでもありません。 

実際のところ、企業における生成 AIの導入は、見出しで想像されるほど均一ではありません。  

当社の最新の調査では、組織は平均してほぼ 3 つの異なるモデルで運営されていることがわかりました。 その選択の理由はユースケースによって決まるようです。 

たとえば、セキュリティ運用のユースケースが、プロセスや機密性の高い企業データを公開する心配なく非公開でトレーニングできるオープンソース モデルに傾倒するのは当然のことです。 コンテンツ作成でも同様で、多くの場合、モデルと機密データを共有する必要があります。 多くの組織がオンプレミスとAzureの両方で Microsoft ソリューションと密接に結びついているため、ワークフロー自動化のユースケースが Microsoft のホスト型サービスに注目するのも不思議ではありません。 

企業ユースケース向けの生成 AIの増え続けるリストに対するすべての技術的要件とビジネス要件を満たす単一のモデルはありません。 

モデルの選択によって展開パターンも異なるため、アプリの配信、セキュリティ、一般的な運用に関していくつかの課題が生じます。 

新たな AI 導入パターン

3 つの基本的な展開パターンが出現しています。 主な違いは、推論サービスのスケーリングに関する運用上の責任にあります。 すべてのパターンにおいて、アプリの配信セキュリティは組織が責任を負います。    

  1. SaaS マネージド。 SaaS マネージド デプロイメント パターンでは、AI アプリケーションはAPI を使用して、OpenAI ChatGPT のような AI マネージド サービスにアクセスします。 スケールの運用責任はプロバイダーにあります。  
  2. クラウド管理。 クラウド管理の展開パターンは、クラウド プロバイダーがホストする AI サービスを活用します。 これらのサービスは引き続き API 経由でアクセスされますが、企業専用にすることも共有することもできます。 AI アプリ自体もパブリック クラウドまたはオンプレミスにある場合があります。 サービスがプライベートの場合、企業が推論サービスのスケーリングの責任を負いますが、ほとんどの組織は大規模な言語モデルのスケーリングの経験がほとんどないため、これは困難な場合があります。 サービスを共有する場合、組織はクラウド プロバイダーに責任を委ねますが、運用の一環として、割り当てやトークンベースのコストなどの要素を考慮する必要があります。 
  3. 自己管理型オープンソース モデルは、パブリック クラウドとオンプレミスの両方で、自己管理パターンで展開される可能性が最も高くなります。 モデルには、API 経由でアクセスすることも、アプリケーション経由で直接アクセスすることもできます。 このパターンでは、組織が推論サービスのスケーリング、セキュリティ保護、監視の全責任を負います。 

(これらのパターンについてさらに詳しく知りたい場合は、Chris Hain のブログをご覧ください)

SaaS 管理パターンをサポートするオープンソース モデルをホストするプロバイダーは数多くあり、オープンソースをサービスとして提供するクラウド プロバイダーも数多くあります。

OpenAI モデルは、OpenAI 経由の SaaS 管理パターンだけでなく、Microsoft 経由のクラウド管理パターンとしても利用できます。 人気のオープンソース モデルである Mistral は、3 つのパターンすべてで展開できます。 企業がモデルと展開パターンを組み合わせて選択できることを考えると、ユースケースがモデル選択の主な推進力になると考えるのはこのためです。

組織はすでに、モデルのトレーニングだけでなく、モデルの運用とセキュリティ保護に必要なスキルに関してプレッシャーを感じています。 したがって、運用の専門知識が限られている多くの組織にとって、ユースケースごとにモデルを一致させることが最も理にかなっています。 セキュリティやプライバシー上の理由から共有パターンで展開できないユースケースにリソースを集中させることで、最終的には最良の結果が得られます。   

運用上の近視眼に注意

しかし、組織内でサイロ化につながる可能性がある運用上の近視眼の危険性には注意してください。 クラウド コンピューティングではこのような現象が見られましたが、企業向けの生成 AI でも同様の現象が再び見られることは間違いありません。 しかし、運用とセキュリティをモデルごとに分離することの危険性を認識した上で、組織が複雑さとリスクを回避し、運用リソース、機能、予算を最大限に活用するモデルと展開パターンを戦略的に選択することが期待されます。 

これらはまだ初期段階であり、この記事を読む頃には、新しい機能を備えた新しいプロバイダーや新しいモデルが登場していることは間違いありません。 ただし、展開パターンはほぼ同じままであるため、予算から人員配置、選択したモデルを保護および拡張するために必要なアプリ サービスまで、運用に関してより戦略的な計画を立てることができます。