ロケットニュース24

【AI実験】テレビショッピング風の台本を楽曲制作AI「SUNO」で読み上げさせたらどうなるのか?

10分前

相変わらず私(佐藤)は楽曲制作AIの「SUNO」に夢中だ。とはいえ、若き日に作った自作音源は全部読み込ませてひと通り曲の形にしてしまったため、以前ほど熱を上げてはいない。20代の頃にやり残した宿題を終えてしまって、50代の初期衝動は一旦落ち着いている

それでもアレコレと用途に合わせて曲作りに励んでいる。以前の記事でAI漫才に挑み、それなりにしゃべりもイケることがわかったので、今回はテレビショッピング風の台本を用意して、それを読み込ませてみることにした。SUNOはしっかりテレショップしてくれるのか!?

・テレビショッピング風

以前挑んだAI漫才では、ボケ担当とツッコミ担当の声質に違いが出ず、聞き分けがやや難しかったものの、それでも話の抑揚はしっかりとついていた。

それに続いて挑んだ落語(寿限無)では、序盤こそ噺家(はなしか)然とした感じで話し始めたものの、肝心の「寿限無寿限無……」のところでナゾの大合唱が起きてしまう始末。現段階ではAI落語は難しいが、1年後には落語も学習して、遜色なく再現できるのではないかと思う。

そして今回は、テレビショッピングに挑戦。再現する内容はGeminiに考えてもらい、以下のようにした。文中の括弧([])はSUNOへの指示文(プロンプト)である。


[TV Show Intro Music]

[Spoken / Energetic Male Host]
さあ!本日ご紹介するのは、大人気、最新式の全自動コードレス掃除機です!
これね、驚くほど軽いんですよ。
なんと、500ミリリットルのペットボトル1本分しかありません!

[Spoken / Female Assistant]
ええーーーっ!?そんなに軽いんですか!?

[Spoken / Energetic Male Host]
そうなんです!しかも、吸引力は従来品の、およそ3倍!
グングン吸います、これでもかっていうくらい吸うんです!
今なら、交換用の特大フィルターも、セットでお付けしちゃいます!

[Pause]

[Spoken / Dramatic High-energy Pitch]
さあ、気になるお値段ですが……
普段なら、3万9800円のところ、なんと、今回は!
驚きの、1万9800円!
1万9800円でのご提供です!

[Spoken / Crowd Cheers and Applause]
えええーーーっ!!!(大歓声)

[Spoken / Fast-paced Outro]
今から30分間、オペレーターを、大幅に増やして、お待ちしています!
お電話は、フリーダイヤル、ゼロイチニーゼロの、ハチハチハチまで、今すぐどうぞ!」


「[Spoken / Energetic Male Host]」とは元気な男性司会者がしゃべることを意味している。この内容に対して、別途スタイルを指定するために以下のプロンプトを投げ込んでいる。

「Upbeat synth-pop background music, hyper energetic high-pitched male vocals, rapid-fire fast talk, jingle style, enthusiastic Japanese sales pitch, non-musical narrative, dramatic inflections」

(アップテンポなシンセポップのBGM、ハイテンションで高音の男性ボーカル、早口のトーク、ジングル風のスタイル、熱のこもった日本語のセールストーク、歌ではないナレーション、ドラマチックな抑揚)


落語の時のように歌い出させないために「熱のこもった日本語のセールストーク、歌ではないナレーション」と命じた。そうしたところ、かなり高い精度でテレショップを再現することに成功した。

ギリギリまで歌い始めるのをガマンしていたようだが、最後の電話番号を読み上げるところで、残念ながら歌唱してしまったのだ。しかしながら、よく耐えたと言ってやりたい。落語の時には1人だった噺家が合唱団を従えて、盛大に歌い始めてしまったので、それに比べれば上出来と言えるだろう。



・詩の朗読

SUNOでは日夜世界中のユーザーが楽曲制作に明け暮れているので、膨大な情報を処理しつつ、学習を重ねているはずである。そのおかげかどうかわからないけど、読み上げの精度は段々高くなっている気がする。

日本語での読み間違いも少なく、言葉の持つニュアンスもある程度くみ取っていると感じる。テレショップのついでに、詩の朗読も試みた。私が綴った以下の散文詩も読み込ませてみることにしたのだ。

これは昨年末のイベントで、私自身が実際に朗読した内容の一部(一部読み上げ用に修正)だ。


[Spoken Word]
人生とは何か? この問いに正確に答えられる人は、そうそういないだろう。
私は長らく文章をしたためてきた。今のようなネットがない時間の中で、誰かに読まれることのない日記であったり、ささやかな詩(し)であったり、時にはただ気持ちを吐き出すためだけに書きなぐった文字の羅列であったり。

そうして自分と向き合う時間の中で、何度となく浮かび上がってくる疑問があった。それこそが「人生とは何か」だ。

人生とは何か? その命題を考えるときに、ある人物を思い起こす。その人とは若き日にお世話になった、画家先生だ。はたちの頃に出会ったあの人は、私によく言っていた。

「佐藤くん、人生は帳尻を合わせる。そういうものだよ」

いわんや、よきおこないを重ねていればそれにふさわしい報いがある。逆もまた真なり。詰まるところ、よいだけの人生も悪いだけの人生もないのだと。

今にして思えば、あれは私へのアドバイスではなく、先生は自らに言い聞かせていた節がある。なぜなら、先生はそれほどまともに仕事をしていたわけではなく、それゆえに倹(つま)しい生活をしていた。何度か金を無心したこともあったのだ。なるほど、人生は帳尻を合わせるものなのだと、つくづくに思う。

はたして、人生は帳尻を合わせる。それが原則だとしたならば、輝きもいずれくすみ色褪せていくものなのだろうか? 否、答えは否だ。

私はそう信じている。帳尻をおそれて輝きを失うのは、人生そのものの否定にほかならないからだ。

片時であったとしても、輝くこと。輝くことに賭けることこそが、人生の本質だ。私はそう信じている。仮に輝きが一瞬だったとしても、その一瞬は永遠にもまさる。すなわち、一瞬の輝きを求めることこそ、人生ではないのだろうか?


これもでき得る限り、朗読であることを強調する指示を出して、歌わせないように仕向けている。そうしたところ、最初から最後まで歌うことなく読み上げた。

上手く言葉と言葉の間をとって、余白を入れつつ見事に読み上げている。ただし、なぜか終わりが近づくにつれて声が小さくなってしまった


SUNOはやはり楽曲制作に特化したAIなので、展開に大きな変化を起こすような処理が行われているらしい。それゆえに、同じ調子で読み上げさせ続けるのは向かない可能性がある。

正直読み上げだけを求めるなら、他のツールを利用した方が良いのだが、内容との親和性の高いBGMを求めるなら、別ツールを使わずにSUNOで完結する方が手間が少ない。



少し余談を記しておくと、本当はテレビショッピング風の読み上げは、別のAIツールで動画化するつもりだった。しかしAIの動画生成ツールはまだ手軽にできるレベルではなく、時間もお金(生成用のクレジット)がかかってしまう。

その上、おかしな動画を生成する可能性が高い。そのため、今回は動画生成は断念した。まだ手軽にできるというレベルではないが、高額なプランを利用して、YouTubeなどに生成動画を投稿している人は大勢いる。

あと半年から1年の間に、動画生成AIはさらに進化しそうだ。いずれにしても、SUNOが楽曲制作以外の用途でも使えそうなので、もう少しその可能性を模索していきたいと思う。


参考リンク:SUNO
執筆:佐藤英典
イラスト:Gemini

▼SUNOに台本を読み込ませて挑んだ、AI漫才

モバイルバージョンを終了