ロケットニュース24

【激突】長文を3行にまとめる要約AIイライザダイジェスト vs ロケットニュース24の記事「全員、反町」

2021年8月30日

東京大学松尾研発・AIスタートアップの株式会社ELYZAが凄いAIを発表した。その名も『ELYZA DIGEST(イライザ ダイジェスト)』。入力したテキストデータを3行に要約するAIで、社内検証では人間に匹敵する正確な内容の要約文を出力できるという結果になったという。

日本語でAIが人間に匹敵する要約を出力するって超凄い。だって、主語とか省略しまくりやん。文脈読めないと厳しくね? とりあえず一般公開されているイライザダイジェストのデモサイトで、ロケットニュース24の記事「全員、反町」を要約してみたぞ。

・AIの壁

リリースによると、AI活用が進んでいるのは、対話の音声データや紙のスキャン画像を「テキストデータに変換できる」段階までとのこと。そのテキストデータを「言葉として理解し活用すること」には大きな壁があった。要は、そのままメモることはできるけど意味は理解できないということだ。

特に、日本語はその分野で最先端技術の実用化が遅れていたらしい。で、ざっくり言うと、そんな状況を打破すべく公開されたのが要約AI「イライザダイジェスト」ということである。

3行ならぬ2ブロックにまとめてみたが、詳細が気になる方は「ELYZA DIGEST」についてのリリースを見ていただければと思う。「書籍・小説・ニュース記事のような誤字脱字の少ない綺麗な文章だけでなく、議事録・対話テキストのような乱雑な文章・文字列であっても対応可能」と言うから凄い。

・人間が要約してみたらこうなる

つまりは、ニュース記事なら問題ないわけだ。そこでロケットニュース24で先日公開された『【衝撃】オッサン5人が美容室で「全員、反町隆史にしてください」と言ったらヤバイことになった / あるいは反町だらけのビーチボーイズ』という記事を要約してみることにした。ちなみに、私(中澤)がこの記事を3行で要約するなら……

「オッサン5人で美容室に行き「反町隆史にしてください」と言った。中澤は髪が足りず、原田は松井秀樹に、砂子間はただのオッサンに、あひるねこはあひるねこに、Yoshioは中井貴一になった。反町は内面から反町であることが判明」


──という感じである。

・URLから要約

イライザダイジェストはURLからの翻訳も可能なため、まずは、記事のアドレスを打ち込んで、「要約スタート」を押してみたところ……

「ロケットニュース24の美容師が、反町隆史の髪型を4人紹介している。前髪のウェーブに努力の後が垣間見えるが、毛量の不足が深刻だという。前髪のウェーブに努力の後が垣間見えるが、毛量の不足が深刻とのこと。」(ELYZA DIGESTより引用)

めっちゃ毛量の不足を強調してくるやん


・記事全文を打ち込んで要約

もっと色々あったはずだが……と思って改めて見てみると、そう言えばこの記事は2ページものだった。2ページ目はアドレスが違うため、アドレス入力すると1ページ目しか読み込まれないのかもしれない。そこで、記事の内容を直に打ち込んで改めて要約してみると……

「ロケットニュース24のカリスマ美容師が、反町隆史に挑む理由を考察している。髪の長さも鑑み、それぞれのに合った反町をオーダーしてみた。原田たかしは「相棒」時代の反町、砂子間正貫は「相棒」時代の反町など。」(ELYZA DIGESTより引用)

全員、相棒になっとるやないか


原田たかしは「GTO」で砂子間正貫は「男たちの大和」である。Yoshioとあひるねこは「相棒」なので、前述の2人が「相棒」になると、私以外の4人全員が「相棒」になってしまう。全然髪の長さを鑑みていない

・本文に関係ない部分を削除して要約

あと、さっきから美容師さんがロケットニュース24編集部員みたいになっている。小見出しとかを文章に組み込んで読み取ってしまっているのかもしれない。そこで、そういった本文に関係ない部分を削除。三度目の正直イッケェェェエエエ!

「ロケットニュース24の美容師が、反町隆史に挑む理由を考察している。反町は、髪の長さや長さ的な問題はクリアしているため。反町になるには、髪質以外も必要であると美容師は語る。」(ELYZA DIGESTより引用)

美容師が辛辣になった


上記の通り、要約AIイライザダイジェスト vs ロケットニュース24の記事「全員、反町」の対決はロケットニュース24の圧勝という結果に。「乱雑な文章・文字列であっても対応可能」と言うにはまだまだ甘いな。出直してこい。ってなわけで、株式会社ELYZAの代表・曽根岡さんに話を伺ってみた。


曽根岡さん「今回公開したイライザダイジェストは最初期の最も小さいデモモデルで、処理の問題で読み込めるのは2500字までとなっています。もちろん、今後精度を上げていく予定です。

現在、損害保険ジャパン株式会社と共同で対話テキストの要約AIの開発に取り組んでおり、カスタマーセンターの会話をAIで要約するという試みも進んでいます。そういった流れの過程で、また精度を上げた要約AIのモデルを公開する可能性もあるかもしれません」


──と、出直す気満々だった。ちなみに、イライザダイジェストのような技術は「NLP」という分野で、英語圏ではすでに、NLPの最先端技術を実用化したサービスや事例が誕生しているのだという。

未だSF的なイメージが拭えないAI。少しずつだが、こういった未踏への挑戦が未来を創り上げていくのかもしれない。

参考リンク:ELYZA DIGESTPRTIMES
執筆:中澤星児
Photo:Rocketnews24.

モバイルバージョンを終了