RAG は、検索拡張生成の略です。 この頭字語は、ライブ データまたは頻繁に更新されるデータを取得してベース AI システムまたは AI モデルを拡張し、よりコンテキストに基づいた回答を提供するという基本原則を強調しています。
検索拡張生成 (RAG) は、外部で利用可能なデータ (多くの場合、独自またはドメイン固有のデータ) を大規模言語モデル (LLM) を使用するワークフローに統合する、生成 AI の効果的な手法として登場しました。 RAG は関連するコンテキストを取得し、リクエストを行う直前にそれを追加のプロンプト コンテキストとして追加します。これにより、トレーニング データ セットのみを活用できるスタンドアロン モデルで可能だったものを超えて、AI 応答の効率と精度が向上します。
RAG は、AI における基本的な課題、つまり、基盤となる LLM が古い情報でトレーニングされている場合でも、静的モデルを最新かつ最も関連性の高いデータで最新の状態に保つ方法に対処するために使用されます。 一般的な RAGapplicationsには次のようなものがあります。
ほとんどの生成 AI モデルは、固定されたトレーニング サイクル中に情報を学習します。 トレーニングが終了すると、モデルは特定の時点まで、または特定のデータ制約内でのみ知識を保持します。 RAG は、推論時、つまりユーザークエリが到着した瞬間に外部ソースから最新の関連データを取得することで、その知識を拡張します。
RAG が確実に機能するために、組織は多くの場合、ベクター データベースまたはナレッジ グラフを通じて簡単にアクセスできる、構造化データと非構造化データで構成される最新のコーパスを維持します。 このコーパスを適切に管理するには、データの取り込み、クレンジング、埋め込み、インデックス作成を行い、検索エンジンがコンテキストに適した情報を迅速に分離できるようにします。
コンテキスト ウィンドウの拡張などの AI の進歩により、モデルが膨大な量のテキストをネイティブに考慮できるようになり、消費者にとっての RAG の重要性が低下するように見えるかもしれません。 しかし、マルチクラウド環境全体に分散された膨大な量のデータを持つエンタープライズ レベルの組織では、依然として急速に変化する広範囲に分散されたデータ ソースの問題に直面しています。 RAG は、モデルのコンテキスト ウィンドウに過負荷をかけたり、データが拡散するリスクを冒したりすることなく、最も関連性の高い承認済み情報を選択的に利用することで、この課題に対処します。 AI が企業のワークフローにさらに深く統合されるにつれて、RAG は、タイムリーでコンテキストが豊かで、高精度な出力を提供するための重要な戦略であり続けるでしょう。
F5 は、マルチクラウド環境全体にわたる分散された異種データ ソースを AI モデルにシームレスに接続することで、検索拡張生成 (RAG) の安全な接続を実現する上で重要な役割を果たします。 企業が高度な AI アーキテクチャを採用するにつれて、F5 はF5 分散クラウド サービスを使用して企業データへの高性能で安全なアクセスを保証します。 分散クラウド サービスは、ポリシーベースの制御、統合 Webapplicationファイアウォール (WAF)、転送中の暗号化をサポートし、ネットワークとセキュリティに対する統一されたアプローチを提供します。 F5 は、さまざまなストレージの場所から安全かつリアルタイムで選択的なデータ取得を可能にすることで、企業がスケーラビリティ、レイテンシ、コンプライアンスに関する課題を克服し、機密性の高い企業情報を保護しながら AI モデルを効率的に運用できるよう支援します。
F5 がエンタープライズ AI 導入をどのように実現するかについては、こちらをご覧ください。