今回の深掘りテーマは「AI音声生成の進化」。かつては自分の声のAIを作るのに何時間も原稿を読み上げる必要がありましたが、今やたった10秒のデータで人間の声を完コピできてしまう驚きの現在地へと到達しています。番組序盤では、本物のしぶちょーとAIボイスを聞き分けるガチンコクイズを実施!かねりんも見事に騙されてしまったその恐るべきクオリティは必聴です。さらに、お馴染みのゆっくりボイスから最先端ツール「ElevenLabs」に至るまでの技術的な進化や、声の権利に関するディープフェイクの脅威についてもやさしく解説しています。AIが流暢に喋り、ポッドキャストすら自動生成できてしまう時代に、あえて人間がマイクに向かう「対談」の価値はどこにあるのか?テクノロジーの光と影を見つめながら、おちついて一緒に考えてみましょう。
【目次】
(00:00) オープニング:日々のAIニュースにおちつきを
(00:36) 今日のテーマ「なぜAI音声生成はこれほど進化したのか?」
(05:41) 【クイズ】どっちがAI?本物のしぶちょーの声を当てろ!
(15:44) 音声合成の歴史:ゆっくりボイスからWaveNetへの進化
(25:05) 音声生成のパラダイムシフト:波形予測から言語モデルへ
(35:36) 最新ツール「ElevenLabs」の紹介と驚きの機能
(37:24) 声の権利とディープフェイク:AIボイスを使った詐欺の脅威
(49:30) AIが完璧に喋る時代、ポッドキャストと対談の真の価値
(55:09) 幻のボツ回をリベンジ?AIかねりん生成計画の幕開け
(63:38) エンディング:おちついて過ごしていきましょう
【今回の放送回に関連するリンク】
ElevenLabs
https://elevenlabs.io/ja
WaveNet
https://deepmind.google/research/wavenet/
WALL-E
https://www.microsoft.com/en-us/research/project/vall-e-x/
【今回の要チェックキーワード】
メルスペクトログラム(Mel-spectrogram):音声を「時間×周波数の強さ」の画像的表現に変換し、周波数軸を人間の聴覚に近いメル尺度にした特徴量である。多くのTTSで中間表現として使われ、テキスト→メル→波形という二段構えの構成を作りやすい。
Neural Audio Codec(ニューラル音声コーデック):音声を連続値の波形ではなく、離散的なトークン列へ圧縮(エンコード)し、そこから復元(デコード)する仕組みである。音声をトークン化できると、生成モデルを「言語モデル的」に設計しやすくなる。
Codec Language Model(音声トークンの言語モデル):ニューラル音声コーデックが作った「音声トークン列」を生成するモデルである。テキスト生成のLLMが単語トークン列を出すのと同様に、音声トークン列を出して音声を作る枠組みであり、ゼロショット音声合成や音声変換の基盤になり得る。
WaveNet:音声波形をサンプル単位で逐次生成するニューラル生成モデルの代表例である。高品質化に寄与した一方、逐次生成は計算コストが高く、後続研究では高速化(並列生成・軽量ボコーダ)へ発展していった。
ElevenLabs:AI音声合成および音声生成技術を提供する企業である。自然なイントネーションや感情表現を重視したニューラルTTS(Text-to-Speech)を主力とし、少量の音声サンプルから特定話者の声を再現する「音声クローニング」機能で注目を集めた。
WALL-E:音声を“トークン列”として扱い、言語モデルのように次トークン予測で音声を生成する「Neural Codec Language Model(神経コーデック言語モデル)」である。
—----------------------------
【この番組への参加方法】
おちつかないXポストを見かけたときは?
→気になるXポストのリプ欄に
@ochitsuki_AI
#おちつきAI
をつけて下さい。
しぶちょー&かねりんが直接見に行き、手動判定します(配信ネタにもします)
判定結果は、公式Xアカウントの引用ポストで、
☕️:怪しい。注意が必要なポスト。
🍵:安心して読んでいいポスト。
【番組の概要】
日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。
★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。
【番組公式 ChatGPTチャットグループ】
https://chatgpt.com/gg/v/691b48555b8481a3a24cb14ea712ab3d?token=-JYncy7OaplgoZBg1Bgh2A
【番組公式ハッシュタグ】
#おちつきAI
【番組公式X】
https://x.com/ochitsuki_AI
【公式ツール】
・おちつきAI RAG
https://ochitsuki-airag.com/
・GPTチャット
https://chatgpt.com/gg/v/691b48555b8481a3a24cb14ea712ab3d?token=-JYncy7OaplgoZBg1Bgh2A