Googleは2019年2月4日、難聴者・聴覚障がい者向けのユーザー補助サービスとして、「Live Transcribe」をリリースした。このアプリは、音声をリアルタイムで文字に変換してスマホの画面上に表示するというもの。

公開されているデモンストレーションの動画を見ると、かなり高い精度で言葉を認識しているようなので、モノマネでも通用するのか、確かめてみた!

・現バージョンはベータ版

このアプリは、現在ベータ版として公開されている。2014年にリリースされた「Android 5.0 Lollipop」以降のバージョンを搭載したスマホで利用できるとのことなので、Pixel3にインストールして検証することにした。ちなみに日本語でのアプリの表記は、「音声文字変換」となっている。


・画面は真っ黒

インストールして起動すると、最初にマイクへのアクセスを求められるので、これを「許可」する。


起動すると画面は真っ黒だ。話しかけるまで、何も表示されない。端末に向かって発話しない限り、文字は表示されない。周りの雑音を拾って、デタラメな文字列が並ぶということもない。


画面下には「設定」があり、ここで文字サイズや変換する言語、「冒とく的な表現を隠す」などの項目を切り替えることができる。


・処理がはやい

実際に端末に向かってしゃべると、すぐに文字が表示される。その速度には、ちょっと驚かされる。



当編集部のものまね王、P.K.サンジュンに寅さんのマネと古畑任三郎のマネをしてもらったところ、8~9割の精度で発話を文字に変換できることがわかった。


「あ~」とか「うん」といったような、発話の “間” は認識しないのだが、それでも即座に文字として表示される技術はかなり高いと言えるだろう。多少の間違いはあるものの、言わんとする内容を読みとるには十分だ。


・コピペできない……

このスピードならテープ起こしなどの作業が相当捗ると思ったが、残念ながら文字をコピペできない。口述筆記で記事をかけると思ったのだが、それは出来ないようだ。残念……。しかしユーザー補助のサービスとしては、ベータ版として十分な機能を有しているので、今後さらに開発が進むことに期待したい。

参照元:LiveTranscribe(音声文字変換:ベータ版)
Report:佐藤英典
ScreenShot:Live Transcribe(Android)

▼モノマネで挑戦