今更聞けない「RAG(検索拡張生成)」とは?
RAGとは「Retrieval Augmented Generation」の頭文字をとった新しいAIシステムの事で、日本語では検索拡張生成と呼ばれています。蓄積された社内情報と外部の最新情報を組み合わせて活用する手段として注目されています。
完全に外部のデータのみを読み込んだ「生成AI」に加え、社内に蓄積されたデータを読み込む事で社内情報も得ることができる、制限付きのAIシステムのことを指し、大企業などで導入されています。
こんな作業を効率化できます
RAGシステムでは検索などの単純作業に加え、以下のことができるようになります。
- チャットボットで対話
- 文章の要約や翻訳
- 社内情報の質問
- フェイク情報(ハルシネーション)の低減
RAGの仕組み
検索フェーズ
検索フェーズでは自社に蓄積された情報やAPIを用いて外部の情報を取得します。あらかじめ読み込んだ社内文章への検索、またChat GPTなどを用いて、外部の情報を取得します。
通常のChatGPTに加え、社内情報も持っていることから顧客情報など「検索しても出ない情報」を得ることができます。(事前に情報をAIへアップロードしていた場合)
生成フェーズ
検索フェーズで得た情報をもとにユーザーの質問への回答を生成します。通常のChatGPTなどと操作感は変わらず、似たような原理となっています。
RAGシステムの懸念点
作業の効率化が見込めるRAGシステムにも懸念点は残されています。社内情報のみならず外部情報も用いてユーザーへ回答を出力するため、誤情報を含んでいます。
RAGから得た情報をそのまま信頼するのではなく、ユーザーによるファクトチェックは必須となります。
また情報流出のトラブルも発生しています。RAGを使用する際は意図しない情報流出を防ぐためにアクセス制限や読み込む情報の制限などを設定しておく必要があります。
このシステムには「やり直してくれない」というデメリットがあり、一度検索を行い、得た情報を元に回答を生成するのみに留まっています。その事から、ユーザーが同じ質問をしたとしても、得られる出力が変わることが多々あります。
RAGとファインチューニングの違い
RAGの他にも似たようなシステムで「ファインチューニング」が挙げられます。RAGは社内システムなど幅広い分野で、また最新情報を必要とするケースに適したシステムです。社内での検索や文章生成、企画書の生成などに使うことができます。
反対にファインチューニングは特定分野や特定のタスクに特化したシステムとなっています。特定の製品に関するレビューの生成など、より細かなタスクに適しています。
RAGの応用「Agentic RAG」
RAGの弱点を埋めた新しいシステム「Agentic RAG」も出現しています。従来のシステムに比べ柔軟性があり、必要な情報を取得できるまでループが可能となっています。
RAGは直接図書館で文庫本を探しているとしたら、Agentic RAGは博識な受付の人が追加されたような形と考えていただければなんとなく理解できると思います。その受付の人を「エージェント」と呼びます。
Agentic RAGは従来のRAGに比べとても賢いですがその分時間がかかります。また何らかの理由で失敗するケースも考えられます。
コメント