[12月23日:速報回]SAM Audioの音声分離が魔法!?ChatGPT AppsのSpotify連携/Gemini 3 Flash/AGI Lab忘年会レポ(ep.27) | Pody

[12月23日:速報回]SAM Audioの音声分離が魔法!?ChatGPT AppsのSpotify連携/Gemini 3 Flash/AGI Lab忘年会レポ(ep.27) | Pody

AIサマリー

📝 エピソード概要

2025年12月下旬の最新AIトレンドを凝縮してお届けする「速報回」です。 Gemini 3 FlashやChatGPTの画像生成進化、自律型エージェントManus 1.6の実践報告など、実用性の高い技術ニュースを幅広く網羅しています。技術的な進化だけでなく、SNSでの「驚き屋」論争やリアルなコミュニティの熱量まで、現役エンジニアとプロデューサーの視点で「おちついて」解説します。

🎯 主要なトピック

Gemini 3 Flashの衝撃: 2.5 Proを凌駕する性能と3倍の速度を誇り、特に画像・動画のマルチモーダル認識において圧倒的な速さを実現しています。
ChatGPTの進化（画像生成・Apps）: 指示追従性が向上したGPT Image 1.5や、Spotify連携によりポッドキャスト検索のあり方を変えるChatGPT Appsの可能性を議論。
「アダルトモード」とディープフェイク: 2026年解禁の噂を機に、有名人のフェイク画像問題やAIの民主化がもたらすリスクについて考察しています。
Microsoft TRELLIS と SAM Audio: オープンソースの3D生成モデルと、特定の話者や音を分離・抽出できるMetaの最新音声AIを紹介。
Manus 1.6による爆速開発: 自律型エージェントを使い、わずか2時間でポッドキャスター向けのURL抽出ツールを開発した実践レポ。
AGI Lab（旧ChatGPT研究所）忘年会: 質の高い情報が集まるコミュニティの意義と、リアルな交流から得られる洞察について。

💡 キーポイント

マルチモーダルの実用化: Gemini 3 Flashは、テキストだけでなく「動画や音声をぶち込んで即座に解析する」フェーズにおいて、極めて高い実用性を持っています。
ポッドキャスト検索の変革: ChatGPT AppsのSpotify連携により、従来のタイトル検索ではなく「特定のテーマについて話している回」を会話を通じて探せるようになります。
自律型エージェントの現在地: Manus 1.6は高いコストを要するものの、エンジニアの補助ツールとして「一撃で動くものを作る」能力が飛躍的に向上しています。
「驚きすぎない」視点: SNS上の過度な期待（驚き屋）に対し、実際のツール性能を冷静に見極め、自身のワークフローにどう組み込むかを重視する姿勢が強調されています。

※収録日：2025/12/22 深夜

★今回の配信は、生成AIの最新トレンドをライトに紹介する『速報回』です。通常の『深掘り回』では1テーマをじっくり掘り下げていますが、速報回では即時性の高いネタをサラっと扱います。

【関連リンク】

かねりんがオススメしているWeb3(Crypto)関連書籍

https://note.com/kanerinx/n/nec2bc9395c3c

例のツイート

https://x.com/kanerinx/status/2001698377525006342

【目次】

(00:00) オープニング：2025年12月22日深夜のAIニュース速報

(01:11) Gemini 3 Flash：2.5 Proを超える性能と爆速マルチモーダルの実力

(07:16) GPT Image 1.5：ChatGPTの画像生成が進化。指示追従性と編集機能

(13:45) ChatGPT「アダルトモード」：2026年解禁の噂とディープフェイクのリスク

(24:04) ChatGPT Apps本格始動：Spotify連携で変わるポッドキャストの探し方

(31:08) SNSでの「驚き屋」論争：かねりんとしぶちょーの視点と正義感の形

(42:35) Web3とAIの交差点：分権の思想とエンジニア視点のものづくり

(54:11) Microsoft TRELLIS：オープンソースの大規模3D生成モデルが登場

(57:42) SAM Audio：特定の音を抽出・分離するMetaの最新音声AIモデル

(01:04:45) Manus 1.6：自律型エージェントでWebアプリを2時間で開発

(01:15:40) AGI Lab忘年会レポート：コミュニティの質とリアルイベントの意義

(01:21:03) エンディング：年末年始も「おちつき」ながらAIを学び続けよう

【今回取り上げたトピック】

(1)Gemini 3 Flash リリースhttps://blog.google/intl/ja-jp/company-news/technology/gemini3-flash/

(2)GPT Image 1.5 リリース

https://openai.com/ja-JP/index/new-chatgpt-images-is-here/

(3)ChatGPTの｢アダルトモード｣、2026年に登場か

https://www.gizmodo.jp/2025/12/chatgpts-adult-mode-is-coming-in-2026.html

(4)ChatGPTのアプリストアが本格公開/開発者向けに「ChatGPT Apps」の申請受付を開始

https://openai.com/ja-JP/index/developers-can-now-submit-apps-to-chatgpt/

(5)Microsoft TRELLIS.2 公開

https://cginterest.com/2025/12/17/microsoft、40億パラメータを持つ最先端の大規模3d生成モ/

(6)SAM Audioの実力はいかに？

https://weel.co.jp/media/tech/sam-audio/

(7)Manus１.6 何が凄いのか？

https://manus.im/ja/blog/manus-max-release

(8) .ChatGPT研究所　忘年会に行ってきました！

—----------------------------

【番組の概要】

日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。

★ご感想やコメントは、番組公式ハッシュタグをつけてX（旧Twitter）でポストしていただけるとありがたいです。

【番組公式 ChatGPTチャットグループ】

https://chatgpt.com/gg/v/691b48555b8481a3a24cb14ea712ab3d?token=-JYncy7OaplgoZBg1Bgh2A

【番組公式ハッシュタグ】

#おちつきAI

【番組公式X】

https://x.com/ochitsuki_AI

👤スピーカー(2)

しぶちょー(MC)

AIエンジニア / 技術士(機械部門) / 大手機械メーカー

AI（ディープラーニング）の実装スキルを証明する「E資格」を保有。機械（ハードウェア）への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。2025年UJA科学広報賞審査員特別賞を受賞。著書に『集まれ設計１年生はじめての締結設計』。

🔗sibucho_labo 🔗Voicy

かねりん（金田勇太）(MC)

KANERIN Podcast Studios 代表 / 一般社団法人地方WEB3連携協会理事 / KANERIN Podcast Studios

2017年から暗号資産業界へ参入。グローバルプロジェクトのコンサルティング、情報分析等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。

🔗kanerinx 🔗Voicy

番組公式ページへ ↗