ブログ | CTO オフィス

Gen AI アプリ: 実験から生産へ

約束、約束。 生成 AI 対応アプリケーションは、人間の生産性を高め、ひいてはビジネス利益の向上を約束します。 多くのユースケースにおいて、実験から実稼働までの道のりは、コナミの 1981 年のビデオ ゲーム「フロッガー」と同様に、依然として慌ただしく危険なものとなっています。 カエルはまず混雑した道路を渡り、次に流れの速い川を渡って家に帰らなければなりません。 カエルはじっと座っていられないが、本質的な危険があるため常に前に飛び出すこともできない。

企業はカエルです。 通りや川には、目もくらむほどの AI テクノロジーが溢れかえっています。 安全なスペース(オープンストリートと浮き丸太)は、自家製のプロジェクトとベンダーの提供です。 車、トラック、カメ、そして外洋は、生成 AI の倫理的、法的、プライバシー、および正確性に関する危険性です。家庭はその逆で、生成 AI アプリケーションを実稼働に導入するとビジネスの利益が急増します。

生成 AI が急速に普及したことにより、企業内には激しい緊急感が生まれています。 しかし、モデルの進化のスピードは、組織によっては麻痺状態に陥る恐れがあります。なぜなら、組織の足元があまりにも速く崩れていくため、組織は絶え間ない急速な変化に直面しても方向を見定めることができないからです。 生成 AI を導入する秘訣は、フロッガーのゲームを始めるのとまったく同じです。とにかく飛び込んでみましょう。

基本的な生成 AI の使用例から始めて、企業がどれが望ましいかを判断したら、実験を開始できます。 AI 対応アプリケーションを構築する場合でも、サードパーティの製品を試す場合でも、あるいはその両方でも、最初のトライアルにより、ビジネスに何が必要かが正確に明らかになります。 この初期段階で成功するための鍵は、安全性と有効性に関する本番環境の要件を満たすアプリケーションの最小バージョンにコミットすることです。 これが組織の基盤となります。 そこから、どのモデルの進歩が重要か、そして購入するよりも構築する方が賢明かどうかを判断しながら前進することができます。

生成 AI を導入しようとしている組織では、必然的にその進行を遅らせる 2 つの「落とし穴」があります。それは、社内でのモデルのトレーニングとプライベート データ リポジトリです。 基礎モデルの進歩のペースは現在、数週間から数か月で測定され、下流バージョンは毎日更新されます。 証拠が必要な場合は、HuggingFaceモデル トラッカーをご覧ください。 この記事を書いている間に取得したページは、1 分以内に更新されたモデルでほぼ 1 ページ分を占めています。 2 分以上前のモデルを見つけるには、折り返し部分をスクロールする必要があります。

AI に投げかけられた質問に答えるために必要なデータが公開されている場合は、API 経由で使用できるさまざまな基礎モデルがすでに存在している可能性があります。 一方、データが公開されていない場合は、推論中にそのデータを送信するか、モデルを非公開で構築または取得して展開するかを決定する必要があります。 モデルにアクセスするために料金を支払うことは、社内で独自のモデルを構築またはライセンス供与し、ホスティングおよび保守するよりも確実に速く、おそらく安価です。 あなたの会社のスーパーパワーは何ですか? 大規模言語モデル (LLM) の構築や保守以外の場合は、構築してホストするのではなく、購入するほうがよいでしょう。

また、プライベート データについては、LLM 使用のためのコンテキスト ウィンドウとカスタム オプションが急速に成熟しており、クラウド コンピューティングで既に受け入れられているものと同様のエンタープライズ グレードのセキュリティとコンプライアンスが、ほとんどの企業で満たされています。 実際、2023 年には、モデル プロバイダーからデータに関するトレーニングが明確に聞かれることはありませんでしたChatGPT Enterprise を例に挙げると、SOC 2 タイプ 2 準拠、SAML SSO、保存時および転送中のデータの暗号化、データ保持とドメイン検証をサポートする専用ワークスペースが備わっており、悪くないと思いませんか? まあ、フォーチュン 500 社の 92% にとっては、それで十分だと思われます。

生成 AI の可能性を信じる組織は、固有の危険性や日々の LLM の改善によって麻痺する必要はありません。 目を大きく開いて飛び込むことで成功することができます。 実験の最初のサイクルにより、自信が生まれ、安全かつ倫理的な使用で最もメリットが得られるタスクを優先順位付けできるようになります。 これらは、実稼働モードで組織全体に展開する必要があります。これにより、評価者と実装者に休憩時間が与えられ、組織は生産性の向上を測定し、次の一連のタスクの優先順位を決定し、LLM へのアクセスを構築するか購入するかを判断する時間ができます。