あなたはAIに「学習させてる」と安易に言っていませんか? もしかしたら、それは「学習」ではなく「参照」させているだけかもしれません。今回は、AI解像度が劇的に上がる「学習」と「参照」の決定的な違いを、AI技術「RAG(ラグ)」の解説を通じてお届けします。RAGとは、AIに外部の知識を与える技術のこと。企業独自のチャットボットなどが、なぜ最新情報や社内情報に答えられるのか?その裏にはRAGがいます。しぶちょー曰く、GPTのメモリ機能なども実はAIがあなたを理解して「学習」したのではなく、毎回「カンペ」を「参照」しているだけ。この違いがわかると、AIの見え方がガラッと変わります。「RAGはオワコン?」という噂の真相から、AIクローン「カネリンRAG」の作り方まで。AIに驚き疲れたあなたにこそ聞いてほしい、衝撃の事実が満載です。
【目次】
(00:00) オープニング&今週のテーマ「今さら聞けない、ラグの話」
(01:01) 2024年に大流行した「RAG」、今はオワコン?
(02:38) RAGはAI理解に超重要!知らないと落ち着けない理由
(04:45) RAGの正体「検索拡張生成」とは?
(06:07) LLMの弱点「最新情報を知らない」をどう補うか
(08:15) RAGは「学習」じゃない!AIにカンペを渡す仕組み
(11:42) 犯罪捜査にも使える?独自データベースとRAGの可能性
(14:00) RAGがオワコンと言われる本当の理由
(15:08) RAGを組むのは難しい?検索技術の裏側
(17:50) キーワード検索 vs ベクトル検索、意味空間の話
(22:14) AI開発の泥臭い作業①:チャンク分けとオーバーラップ
(27:05) AI開発の泥臭い作業②:ハイパーパラメータ調整
(28:50) ゴミを入れたらゴミが出る!データ前処理の重要性
(34:00) RAGの発展系?最近流行りの「グラフRAG」とは
(38:32) AI解像度を見分ける魔法の言葉「学習」
(39:53) あなたのAIは「学習」or「参照」?衝撃の事実
(42:40) GPTのメモリ機能はカンペだった!AIはあなたを理解してない?
(47:00) RAGは「カンペ仕分けマシン」、でもAIも使ってる?
(56:20) RAGとファインチューニングはどう違う?
(58:39) チャットボットの裏にはRAGがいる!
(1:01:11) クローンAI「かねりんRAG」は作れる?
(1:06:27) RAGが消えたもう一つの理由:AIエージェントへの吸収
(1:09:46) まとめ:「学習」と「参照」を意識して落ち着こう
(1:10:41) エンディングトーク
【今回の放送回に関連するリンク】
【今回の要チェックキーワード】
RAG(Retrieval-Augmented Generation):外部の知識データベースから関連情報を検索し、それをもとに生成するAIの手法。
ベクトル検索(Vector Search):テキストなどの意味を数値ベクトルに変換し、「意味の近さ」で類似情報を探す検索方法。
キーワード検索(Keyword Search):単語やフレーズの一致をもとに情報を探す、従来型の検索方法。
ハイブリッド検索(Hybrid Search):ベクトル検索とキーワード検索を組み合わせて、精度と再現性を両立させる検索方法。
グラフベース検索(Graph-Based Search):情報同士の関係をグラフ構造で表し、「つながり」や「関連性」をたどって検索する方法。
チャンク(Chunk):長い文章や文書をAIが扱いやすい単位に分割したデータのかたまり。
埋め込み処理(Embedding):テキストや画像を、意味を保持したまま数値ベクトル(多次元の点)に変換する処理。
検索クエリ(Search Query):検索エンジンやAIに「何を探すか」を指示するための入力文。
ファインチューニング(Fine-Tuning):既存のAIモデルを特定のデータで再学習させ、目的に合わせて精度を高める手法。
—----------------------------
【番組の概要】
日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。
★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。
【番組公式ハッシュタグ】
#おちつきAI
【番組公式X】
https://x.com/ochitsuki_AI