皆様、ご機嫌いかがでしょうか。Sophyです。
日々進化をし続ける生成AIですが、仕事の場面だけではなく日常生活においても活用の幅が広がっていますね。リサーチや画像生成はもちろんのこと、日記感覚で使用する人もいるようです。かく言う私も、ちょっとした疑問などは生成AIに相談しています。
さて、今回のブログでは、そんな生成AIの活用に関連して、企業におけるLLMの実用性を高める【RAG】について調べていきたいと思います。
RAGの基本
RAGとは?
RAGとは、RetrievalーAugmented Generation(検索拡張生成)の略で、LLM(大規模言語モデル)の性能を向上させる手法の一つです。
ご存じかもしれませんが、皆さんが使用している生成AIは、一般に公開されているオープンデータ(公開情報)の情報を基に回答が生成されます。そのため、クローズドデータ(公開されていない企業特有の情報など)に関する質問に対しては、回答を得ることができません。また、AIが学習した時点で得た知識を基にしているため、最新情報にも対応しきれていない場合があります。
そこで登場するのが【RAG】です。
RAGを構築することで、外部データベースや社内ナレッジからも情報を探すことが可能となり、そこから得た情報を基にするため、専門的でより精度の高い回答を生成します。
RAGのメリット
上記にも記載した通り、RAGを構築することによって、外部のデータベースを参照することができるようになります。実際に社内で蓄積しているデータを扱うため、根拠性や信頼性を高めることができます。さらに、整備するデータによっては、専門性を高めることも可能です。
また、AIへの再トレーニング(ファインチューニング)や追加データの作成に使うリソースも削減できるため、経済的な面の効率化にもつながることが期待されます。
RAGの課題
1.データの質
RAGを構築する上で、データベースの質は検索精度に大きな影響を与えます。AIが扱いやすい構造のデータ(構造化データ)に処理したのちに保管することで、精度の高い回答が得られます。
構造化データ(AIが扱いやすいデータ):
Excelの表などのように、行と列が整理されているデータ
非構造化データ(AIが扱いづらいデータ):
文章データ(WordやPDFなど)やデザイン性の高いスライド・グラフなど、フォーマットがバラバラなデータ
企業に保管されているデータのほとんどは、非構造化データだと言われています。
2.コスト
RAGを活用するには、データベースの整備や検索モデルの構築など初期コストが発生します。
活用する目的を明確にし、使用頻度や生成AIの機能で代替ができるか?などを十分に考えた上で、導入を検討しましょう。また、最初から全ての課題を解決しようとせず、部分的に試していくスモールスタートがおすすめです。
RAGの導入事例
・社内FAQチャットボット
「経費精算のルール」や「申請手順など」、社員からの問合せに関する一次回答を自動化することで、担当部署の対応工数を削減します。導入の際に、データが不足している場合でも、回答データを追加していくことで精度向上が見込めます。
・社外の問合せ対応
過去のデータを基に、顧客からの問合せ対応をサポート。完全な自動化をしなくても、回答メールの作成を補助するなど、担当部門の負担削減が期待されます。
・営業アシスタント
過去の提案や顧客情報、契約書のデータの検索時間を短縮。また、資料や文書作成の補助にも活用できることから、効率化に繋がるとされます。
AIツールを使ってみよう
先にも少し述べましたが、RAGを本格的に導入しようとすると、データベースの整備やデータベースを連携するアプリケーションの実装など、いくつかの手順が必要になります。必然的に、時間もコストもかかるため、導入のハードルが上がります。
そこで今回は、複雑な手順を踏まずに、簡単にRAGを構築できるAIツールをご紹介します。
本日ご紹介するのは【Dify】です。
Difyは、様々なLLMを活用したAIアプリケーションをノーコードで構築することができる、オープンソースのプラットフォームです。
独自のテキストデータをデータソースとして登録し、プラットフォーム内でLLMと連携させることで簡単にRAGを構築することができます。チャットボットアプリなども簡単に作れるため、初めてRAGを活用したい方にはおすすめのツールです。
参考:Dify
最後に
今回は、RAGについて調べてみました。
社内に蓄積したデータを有効的に活用できる素晴らしい技術だと感じますが、導入にあたっては、使用頻度や予算、使用する目的などを明確にすることが重要ですね。