では、はっきりさせましょう。AI アーキテクチャでコンテキスト(セッション)がどこにあるかを理解することが非常に重要だからです。 僕がブログで「dang」という言葉を使ったので、あなたもその重要さがわかるはずです。 ええ、本当にそう感じています。
独自の LLM 対応アプリを構築し、OpenAI API を使用してそれを実行する場合、ChatGPT は使用されません。 あなたはモデルと話しています。 生のもの。 そして、アプリがGPT-4を呼び出すという理由だけで ChatGPT のように動作すると考えているなら、それはすでに間違いです。
多くの人が誤解していますが、それはOpenAIのブランド戦略がわかりにくかったからです。 「ChatGPT」の体験—記憶やトーン、文脈を把握し、6つ前の質問の内容をスムーズに追跡して、突然海洋植物学の博士号を幻覚することがない仕組み—は魔法ではありません。 それはアーキテクチャによるものです。 そして、そのアーキテクチャはAPIを使うだけで無料では提供できません。
ChatGPT アプリは階層化された管理された体験です。 以下を結びつけています:
API には、それらの機能はデフォルトで一切備わっていません。
GPT-4(あるいは他のどのモデルであっても)を直接呼び出すときは、ステートレスな形式で生のメッセージを渡し、コンテキストの枠が溢れたり断片化したりしないことに期待するしかありません。 これはデジタル執事ではなく、何の情報も持たない空のモデルです。
ChatGPT では、推論サーバーがコンテキストウィンドウ全体を管理しています。 あなたが入力すると、サーバーが記憶し(限界まで)、アプリが関連する内容をほぼ正確に追跡してくれます。 さらにその上にメモリシステムがあり、OpenAI が慎重にどの情報を戻すかを調整しています。
API を活用していますか? あなたが推論サーバーです。 つまり、以下のことです。
もし間違えてしまっても(初期は誰でもそうです)、モデルがセッション途中でユーザー名を忘れたり、入れていないデータを勝手に作り出した場合は、その責任はあなたにあります。
ChatGPTには記憶があります。 あなたにはありません。 自分で構築しなければ使えません。 API利用時はステートレスです。 あなたがすべてのコンテキストや記憶、進行を管理します。 ChatGPTアプリを使うと、OpenAIがそれらをすべて対応します。 それが組み込まれています。
ChatGPTの「メモリ」は、単にプロンプトに貼ったメモではありません。 私たちはセッションを超えてユーザーの情報、好み、目標、制約を記憶し、適切なタイミングでそれらをプロンプトに文脈的に反映させる仕組みを持っています。 あなたのアプリにも同じような機能を搭載するには、次のものが必要です。
つまり、インフラストラクチャのことです。
だから、多くの自社開発AIアプリが使いにくく感じるのです。 彼らはLLMをチャットボットとして扱い、システムの一部であるツールとしてではないからです。 その結果は? 会話が途切れ、同じ指示を繰り返し、不自然な後退が起こり、ユーザーは苛立ちます。
APIを基盤にするなら、それが意図的かどうかにかかわらず、インフラストラクチャを築いていることになります。 ユーザーがChatGPTのような体験を期待するなら、あなたは必ずそれを実現しなければなりません。
しかし、それは始まりにすぎません。 それがエンタープライズグレードのアプリ配信スタックの上に構築されているなら—そうですよね? そうですよね?ならばプラットフォームの他の部分も当然機能してくれなければなりません。
ここで、アプリケーション配信とセキュリティのチームが活躍します。
AIネイティブアプリはステートフルでチャットベース、しかも多くはリアルタイムに動きます。 つまり:
これは単なるパンフレットサイトではありません。 ここで動的なインターフェイスを提供しています。 CDNをただ導入して終わりにはできません。
LLM はプロンプトで動作を制御できます。 つまり、プロンプト自体が攻撃の入口になっているのです。
セキュリティ管理は常に進化させるべきです。
さらに、ユーザーレコードをコンテキストウィンドウに挿入すると発生するデータガバナンスの問題も見逃せません。
ChatGPT は磨き上げられた製品です。 OpenAI API は素のツールです。 この二つを混同すると、あなたのスタックは崩壊します。
賢く構築しましょう。 成長著しいAIポートフォリオを支えるために、エンタープライズレベルのアプリ配信とセキュリティのスタックを構築してください。 AIエージェントを開発し、エージェント型アーキテクチャを積極的に取り入れるときに、その重要性を実感するでしょう。 もしコンテキストの変化や幻覚がエンドユーザー向けAIの課題だと思っているなら、エージェントAIがビジネスや運用用AIに与える影響をぜひ見届けてください。