
少し前までAIで楽曲制作にハマっていた私(佐藤)。その熱が少し冷めて、最近は読み上げに挑んでみている。「SUNO」でも読み上げをできなくはないのだが、基本が曲作りに最適化されたAIであるため、どうしても音楽がついてきてしまう。場合によっては、序盤こそスムーズに読み上げてはくれるけど、後半が近づくと急に歌い出すこともしばしば……。
そこでGoogleのツールを使って、純粋な読み上げに挑戦してみたところ、SUNOよりもはるかに自然な語り口で読み上げられると判明。そこで過去にGeminiが作った漫才台本を読み上げさせてみた。
・使用したツール
使用したツールは「Google AI Studio」と「Google Cloud Agent Platform」である。それぞれの特徴と違いをカンタンに説明すると、まずGoogle AI Studioは個人開発者やクリエイターが、「Geminiの能力を手軽に試せる実験室」だ。個人がAIを使った実験を行ったり、個人的なアプリの試作に適している。
一方のGoogle Cloud Agent Platformは、Google Cloudが企業向けに展開している、組織全体の業務を自動化する「AIエージェントを構築・管理するための企業用プラットフォーム」である。社内業務の自動化や高度なカスタマーサポートAIの構築などに向いている。
Google AI Studioは無料ですぐに使えるのに対して、Google Cloud Agent PlatformはGoogle Cloud(従量課金制)の契約が必要となっている。私はGoogle Cloudの無料トライアルで今回実験を行った。
さて、まずはじめに、Google AI Studioの「Speech and Music」機能で、「Gemini 3.1 Flash TTS Preview」を用いて読み上げを試した。これは「テキスト読み上げ(Text-to-Speech = TTS)」に特化した専用のAIモデルである。
話者(Speaker)の設定ができるので、2つの異なる声を使って読み上げさせたつもりだったが、生成された音声の違いはよくわからなかった。
また約2分30秒の漫才台本を、1度に全文生成することができなかったので、4つに分けてファイルをダウンロードし、それをつないで1本にまとめなければならなかった。ファイルごとに声質が変わってしまったため、ややまとまりがないように感じられる。
続いてGoogle Cloud Agent Platformでも同じくGemini3.1 Flash TTS Previewで同じく読み上げに挑む。こちらは話者を切り替える機能がなかったため、漫才の2人の声は同じものとなっている。
AI Studioよりもさらに自然な発話ではあるけど、話が進むにつれて声質が変わってしまっている。始めと終わりで声の感じが全然違うな。
そして今一度、以前生成したSUNOのバージョンを、しゃべりの部分(ボーカルパート)だけを分離して聞き比べてみた。
SUNOで生成した当初は、かなり自然なやり取りでなおかつしっかりとした抑揚で聞きやすいと思っていたのだが、Googleの2つのツールと比べると、SUNOは明らかに機械的な声であると感じられた。
しかしながら、漫才っぽさは2つのツールを凌駕している。音楽生成に特化しているためだろうか、展開を重視したやり取りができている気がする。
3つのツールで読み上げを試みた結果、漫才はまだまだ人間の領域からはほど遠い気がする。とはいえ、AIの進化は日進月歩。1年後には遜色のないレベルにまで到達していても不思議ではないだろう。
参考リンク:SUNO、Google AI Studio、Google Cloud Agent Platform
執筆:佐藤英典
イラスト:Gemini
▼SUNOでテレビショッピング
▼SUNOで落語の「寿限無」
佐藤英典


【AI実験】テレビショッピング風の台本を楽曲制作AI「SUNO」で読み上げさせたらどうなるのか?
【未来のM-1!?】AIを駆使して台本作りから読み上げまで「漫才」づくりに挑んでみたら、思った以上に上手くいって少し怖くなった
【検証】楽曲制作AIに『平家物語』を読み込ませたら、どんな曲を生成するのか? 完成されたリズムはいわば「鎌倉ラップ」
楽曲制作AI「SUNO」でも上手くアレンジできない曲を力技で強制的に蘇らせる方法 / AIをミュージシャン・スタジオとして使う
【検証】楽曲制作AIに古典落語『寿限無』を流し込んだらどうなる? 現状は微妙だが1年後、AI寄席の未来が見えた
運転免許証、うっかり失効しちゃってるゥゥゥウウウ! 再取得手続きで自分を殴りたくなった瞬間5選
【4コマ】魔王軍はホワイト企業 2040話目「指導⑯」
【ジョブチューン】セブンの不合格商品は本当にダメなのか? 2つ食べてみたら1勝1敗だった
【4コマ】魔王軍はホワイト企業 2039話目「指導⑮」
カルディのコーヒーバッグを4年買い続けてきた私が「夏の新作」で気づいた変化 / 物価高での苦悩が見え隠れするようだった
3年ぶりにアメ横名物の「チョコレートたたき売り」(1000円)に行ったら、さすがにもう値上げしてほしくなった
【女ひとり飲み】飲み放題90分550円! 読者おすすめの店「独楽寿司」でニセンベロしてみた
【食べ放題1380円】創業95年の内モンゴル料理店に行ってみた! 日本初上陸した『徳順源』のバイキングはガチ中華の入門的内容
【4コマ】魔王軍はホワイト企業 2034話目「指導⑩」
【4コマ】魔王軍はホワイト企業 2035話目「指導⑪」
素人が「エアコン洗浄セット」(5980円)で内部を水洗いしてみたら、もう業者を呼ばなくていい気がしてきた
今年は久々に当たり年かも! カルディ「レモンバッグ」が販売開始! ガラス製プレートに保冷バッグまで入って1980円!!
【圧巻の光景】120分1万3000円高級海鮮食べ放題『銀座八芳』はこの世の楽園のごとし! トコトン堪能するための「正しい攻略法」をお教えしよう
アパホテルで「串カツ田中の朝食ビュッフェ」だと…? 1700円の価値があるのか突撃してみた / 宿泊なしでもOK
【本日発売】「ローソンの福袋」(2160円)があまりにパンパンに詰まってて、持って帰るのちょっと恥ずい
中国「渡航自粛要請」から2週間が経った京都市内「祇園」「清水寺」「錦市場」の様子を見に行ってみた
黄ばんだスマホケースを『オキシ漬け』したらこうなった / TPU素材の変色は復活するのか?
【青切符】4月から自転車新ルール! ヘルメット9種比較
「秋刀魚は焼くんじゃなく茹でろ」ってSNSでバズってたから “焼き” と “茹で” を食べ比べてみた → ワタの味が変わってる!
ごっつええ感じの東野幸治の鼻歌『唐沢空回り』をAIでフルアレンジ! ファンク、ジャズ、トラップ、レゲエの中で1番ふさわしいジャンルはどれだ!?
楽曲制作AI「SUNO」で、若い頃に完成を諦めた自作曲を蘇らせる / そして俺はもう1度音楽をやってみようと思う
文章を書くだけで作曲できる音楽生成AI「Suno」を使ってみた → めっちゃ便利だけど…
誰でもできる! Geminiを使った「プロンプト講座」:自分をモデルに『ハイブランド広告風』プロフィール画像を作ってみよう
AIはAIを使えるか? 「Gemini」に「Siri」を操作するように仕向けたら、緩い漫才になって笑えた
音源のない自作曲をスマホ録音して「SUNO」でアレンジ、子どもの鼻歌でもフルバンドにできる楽曲制作AIの理想的な使い方
知識経験ゼロでOK! 楽曲制作AI「SUNO」を使った生歌(鼻歌)でオリジナル曲を作る方法 / スマホに歌ってワンタップだけ
誰でもできる! Geminiを使った「プロンプト講座」:コーディネートの参考画像の作り方
【アプリで簡単】作曲AI「Suno」でロケットニュースの歌を作ってもらった結果 → いい歌すぎて泣いた
【AIめし】夜食の献立を生成AIに任せる生活にしたら良いことしかなかった
【投票企画】それぞれが使っている「生成AI」が考えた一発ギャグを全力でやってみた! 1番面白いのはどれだ!?