エピソード一覧
EP.045
ポッドキャスター失業の危機!?音声生成AI ElevenLabsの実力と、AI時代の対談の真価(ep.45)

ポッドキャスター失業の危機!?音声生成AI ElevenLabsの実力と、AI時代の対談の真価(ep.45)

01:07:09 2026.02.20ElevenLabs音声生成ポッドキャストAI活用クリエイティブ音声AITTS

この回の概要

今回の深掘りテーマは「AI音声生成の進化」。かつては自分の声のAIを作るのに何時間も原稿を読み上げる必要がありましたが、今やたった10秒のデータで人間の声を完コピできてしまう驚きの現在地へと到達しています。番組序盤では、本物のしぶちょーとAIボイスを聞き分けるガチンコクイズを実施!かねりんも見事に騙されてしまったその恐るべきクオリティは必聴です。さらに、お馴染みのゆっくりボイスから最先端ツール「ElevenLabs」に至るまでの技術的な進化や、声の権利に関するディープフェイクの脅威についてもやさしく解説しています。AIが流暢に喋り、ポッドキャストすら自動生成できてしまう時代に、あえて人間がマイクに向かう「対談」の価値はどこにあるのか?テクノロジーの光と影を見つめながら、おちついて一緒に考えてみましょう。【目次】(00:00) オープニング:日々のAIニュースにおちつきを(00:36) 今日のテーマ「なぜAI音声生成はこれほど進化したのか?」(05:41) 【クイズ】どっちがAI?本物のしぶちょーの声を当てろ!(15:44) 音声合成の歴史:ゆっくりボイスからWaveNetへの進化(25:05) 音声生成のパラダイムシフト:波形予測から言語モデルへ(35:36) 最新ツール「ElevenLabs」の紹介と驚きの機能(37:24) 声の権利とディープフェイク:AIボイスを使った詐欺の脅威(49:30) AIが完璧に喋る時代、ポッドキャストと対談の真の価値(55:09) 幻のボツ回をリベンジ?AIかねりん生成計画の幕開け(63:38) エンディング:おちついて過ごしていきましょう【今回の放送回に関連するリンク】ElevenLabshttps://elevenlabs.io/jaWaveNethttps://deepmind.google/research/wavenet/WALL-Ehttps://www.microsoft.com/en-us/research/project/vall-e-x/【今回の要チェックキーワード】メルスペクトログラム(Mel-spectrogram):音声を「時間×周波数の強さ」の画像的表現に変換し、周波数軸を人間の聴覚に近いメル尺度にした特徴量である。多くのTTSで中間表現として使われ、テキスト→メル→波形という二段構えの構成を作りやすい。 Neural Audio Codec(ニューラル音声コーデック):音声を連続値の波形ではなく、離散的なトークン列へ圧縮(エンコード)し、そこから復元(デコード)する仕組みである。音声をトークン化できると、生成モデルを「言語モデル的」に設計しやすくなる。 Codec Language Model(音声トークンの言語モデル):ニューラル音声コーデックが作った「音声トークン列」を生成するモデルである。テキスト生成のLLMが単語トークン列を出すのと同様に、音声トークン列を出して音声を作る枠組みであり、ゼロショット音声合成や音声変換の基盤になり得る。WaveNet:音声波形をサンプル単位で逐次生成するニューラル生成モデルの代表例である。高品質化に寄与した一方、逐次生成は計算コストが高く、後続研究では高速化(並列生成・軽量ボコーダ)へ発展していった。ElevenLabs:AI音声合成および音声生成技術を提供する企業である。自然なイントネーションや感情表現を重視したニューラルTTS(Text-to-Speech)を主力とし、少量の音声サンプルから特定話者の声を再現する「音声クローニング」機能で注目を集めた。WALL-E:音声を“トークン列”として扱い、言語モデルのように次トークン予測で音声を生成する「Neural Codec Language Model(神経コーデック言語モデル)」である。—----------------------------【この番組への参加方法】おちつかないXポストを見かけたときは?→気になるXポストのリプ欄に@ochitsuki_AI#おちつきAIをつけて下さい。しぶちょー&かねりんが直接見に行き、手動判定します(配信ネタにもします)判定結果は、公式Xアカウントの引用ポストで、☕️:怪しい。注意が必要なポスト。🍵:安心して読んでいいポスト。【番組の概要】日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。【番組公式 ChatGPTチャットグループ】https://chatgpt.com/gg/v/691b48555b8481a3a24cb14ea712ab3d?token=-JYncy7OaplgoZBg1Bgh2A【番組公式ハッシュタグ】#おちつきAI【番組公式X】https://x.com/ochitsuki_AI【公式ツール】・おちつきAI RAGhttps://ochitsuki-airag.com/・GPTチャットhttps://chatgpt.com/gg/v/691b48555b8481a3a24cb14ea712ab3d?token=-JYncy7OaplgoZBg1Bgh2A【パーソナリティ(MC)】▼しぶちょー・AIエンジニア・技術士(機械部門) 「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」https://x.com/sibucho_labohttps://voicy.jp/channel/3963▼かねりん(金田勇太)・KANERIN Podcast Studios 代表・一般社団法人 地方WEB3連携協会 理事「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」https://x.com/kanerinxhttps://voicy.jp/channel/2534【プロデューサー】かねりん https://x.com/kanerinx【サウンド・アーキテクト】Aviv Haruta https://x.com/oji_pal【カバーアートデザイン】UTA https://x.com/uta_dib【制作/著作】KANERIN Podcast Studios--------------------------------------------------※画像引用元:https://www.arbaaa.com/ai-tools-101-step-by-step-elevenlabs-guide-to-create-realistic-ai-voices-more-2/【各種ポッドキャストスタンドへのリンク】Spotifyhttps://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2oApple Podcasthttps://podcasts.apple.com/us/podcast/id1841316430Amazon Musichttps://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/YouTubehttps://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCDLISTENhttps://listen.style/p/ochitsukiai

この回でわかること

タイムスタンプ

感想・お便りを送る

Xで #おちつきAI をつけてポスト、またはフォームからお便りをどうぞ。