
前からものすごく気になっていたChatGPTの有料版「GPT-4」。迷った末思い切って登録したよ。いやー何だか大きな買い物をした気分だよ。
GPT-4では、様々なファイルを読み込ませて内容を説明させることが出来ると言われている。これ、場合によってはめっちゃ便利なんじゃね?
というわけで、今回はGPTさんに色んなファイルを読み込ませて検証していくよ!
・検証方法
方法は簡単、ChatGPTではアップロードできるファイルの種類に制限がないから、今回はパソコンにあるファイルを片っ端から読み込ませる。
そんで読み込ませたら、「このファイルを説明して」と命令する。返ってきた答えと実際のファイルの内容を照らし合わせて、精度を検証していく。
・画像
まずは、チャットのスクリーンショット。
画像内の文字はおそらく簡単に「読んで」くれるだろう。試してみると……
正確に言葉使いを判別し、文章の要点をまとめて答えてくれる。良いね。英語のメッセージが来て訳分からんくなったら、スクショしてGPTさんに説明してもらうという使い方が出来そうだ。
適当に描いた手描きのイラストはどうだろう?
文字はあるが、さすがにこれは難しすぎるか? 結果は……
「進行方向」の文字をなぜか「運行方向」、「我」をなぜか「押」と読み間違えてる。漢字は苦手なのか(共感できるぞ)?
そんで、GPTさんによると、これは「チケットの選択や操作を指示するためのガイド」だと。
正解は前の記事で使った列車の座席の向きを表すイラストだけど、うーんやっぱりこれじゃ分かりにくすぎるか(コンテクスト無しじゃ人間でも難しいよこれ)。
ちなみに、赤い丸や矢印が使われてるってのはちゃんと理解できている。もうちょっと良いイラストだったら精度が上がるんじゃないか?
ってことで頑張って棒人間を描いたよ。僕の傑作だ。
これならGPTさんもわかってくれるだろう。どうだ!
なんで英語なんだよ。訳すと……
「この画像は、シンプルな赤い線で描かれた棒人間の絵のようです。この図は、大きな丸い頭と、基本的な線で描かれた2本の腕と2本の足を持つ体を持っています。スタイルは非常に子供っぽく抽象的で、子供のスケッチブックや何気ない落書きに見られる種類の絵に似ています」
おおおお! さすがGPTさん! 僕の傑作をちゃんとわかっているではないか!!!!!
それで、検証してて気づいたんだけど、命令を英語でするか日本語でするかによって答えがちょっと違うんだよね。例えば、前の記事で使った駅の写真。
日本語で命令するともちろん日本語で答えが戻ってくるが、
英語で命令すると答えが少し違ってくるんだ。
違う点だけを挙げると「伝統的な服装をした女性が立っています」が「紫色の長いドレスとヘッドスカーフを被った人が」。「Satpam(警備員)」という言葉は英語バージョンのほうがしっかり認識できてる。
使っている言語やタイミング(?)で答えが微妙に違ってくるのはなかなか面白い。他にも色々な画像で試してみたけど、GPTさんは画像のトーンまで認識できていたよ。
んで、次はPDFだ。文章だけのPDFと画像付きのPDF2種類用意したので、それをGPTさんに与えて検証していきたいと思う。
まずは文章だけのPDF。これは期末テストの課題用に作ったプログラミングコードが書かれてあるPDF、2ページ目にはコードの説明がインドネシア語で書かれている。
なぜか英語で返って来た。
訳すとこんな感じ(これもGPTさんを使ったよ)。
「このドキュメントはC言語でのプログラミング課題のようです。「TUGAS PENGANGGANTI UAS – OOP」というタイトルで、Aqil Gama Rahmansyahさんによって提出されたもので、学生IDは【略】です。
コードには、与えられた文字列の中で括弧の正しいペアリングをチェックするメイン関数が含まれています。ユーザーからの文字列を読み取り、開いた括弧と閉じた括弧の数を数え、括弧が正しくマッチしているかどうかを判断します。
括弧の数がバランスが取れていて、エラーがなければ、ペアリングが正しいと印刷され、そうでなければエラーを示します。このドキュメントには、コードの論理に関する説明も箇条書きで含まれています」
説明がない数字を「学生ID」と完璧に当てたことに加えて、コードの仕様、そしてコードの説明を箇条書きで含んだのもちゃんと述べている。GPTさんはプログラミング言語を理解する能力がとてつもなく高いのでこれは朝飯前ってところか。
次はこれ、キリスト教の『主の祈り』を自分の人工言語に訳したもの。
果たしてGPTさんは「人工言語」だってことがわかるのか?
こっちもなぜか英語だけど、訳すと……
「Adnaunon plad (Lord’s Prayer).pdf」というタイトルの文書は、「主の祈り」を架空または創作された言語で表現したものであり、それに音声ガイドと英語訳が添えられているようです。
祈りの各行は、創作された言語での表現、その音声発音、そして英語訳の3部分から成り立っています。この文書は、教育的、言語学的、または娯楽目的で、他言語における祈りの理解を容易にするために構成されています。
翻訳されたフレーズは、主の祈りの伝統的な構造に従っており、名前の神聖さ、王国の来臨、日々の糧、赦し、邪悪からの救済を扱っています」
──ちゃんと人工言語だってことを認識できているぞ!
あと、試しに画像付きのPDFで検証してみたんだけど、GPTさんはドキュメント内の画像を「見る」ことができなかった。画像ファイルならOKだけど、ドキュメント内の画像はアカンのか……。
・DOCX
ドキュメント内の文章を理解できるってことがわかったところで、Microsoft Office Wordのファイル形式 DOCXファイルはどうだろう?
検証に使うファイルはこれ。期末テストの課題としてグループで書いたAIのレポートだ。レポートでは、AIがどのようにして機能するかがインドネシア語と英語で書かれている。
GPTさんに読み込ませてみると……
おおお、細かく解説してくれるではないか……ってあれ? 「文章全体の内容を把握するには、さらに詳細な分析が必要ですが、初めの部分から……」ってドキュメント全体を「読んでいない?」
内容からして、序論部分までしか解説していない感じだが。
──と、返ってきた解説内容を読んでいると、文章の最後にコマンドアイコンがあることに気付いた。
クリックできるらしいからクリックしてみると……
なんと解析に使ったコードがコメント付きで書いてあるではないか! 読んだところ、GPTさんはドキュメントの最初の1000文字を抜き取って、そこから解説しているらしい。
言い換えれば、GPTさんはドキュメント全体を「見ていない」のだ! なにー!
まぁ、たしかにドキュメントの最初の1000文字だけでどんな内容かは見当がつくが、長いドキュメントを与えて内容を要約させるって運用はできなさそうか……。
・PPTX
ではでは、プレゼンテーションに使うファイルはどうだろうか? PDFやDOCXと違って文章が少ないことが多いので、これはちょっと難しいんじゃないか? そもそも読み込めるかな?
ってことで検証に使うファイルはこれ、「遺伝的アルゴリズム」に関する資料。すまない、パソコンに転がってるファイルってこんなのしかないんだよ……。とにかく、やってみよう。
と、ここでエラー。「PPT」ってファイルはバージョンが古いようで、新しいバージョンの「PPTX」しかサポートしていないようだ。困ったなぁ。
というわけで、ファイルを変えて「電気エネルギー技術」に関する資料。
前のファイルと違ってこいつは画像多め。PDFの検証でドキュメント内の画像は「見られない」とわかったので、これはどうだろうか?
おお! ちゃんと認識できてるし、解析もできている! 実はこいつもワードのファイルと同じく、最初の1000文字を抜き取って解析している。でもまぁワードのファイルよりは文字数が少ないことが多いので、もっと広い範囲をカバーできるってこと。
ちなみに、このファイルでは5ページ目の半分のところ(赤で塗った部分は読まれていない)まで解析している。
全体で57ページもあるけど、5ページしか解析してないかぁ……。
・ソースコードファイル
上で記した通り、GPTさんはプログラミング言語を理解する能力が高い。てか何度GPTさんにプログラミングを助けてもらったのやら……。では、ファイルをまるごと与えるとどうだろうか。
これは先程のPDFであった「文字列の中で括弧の正しいペアリングをチェック」するプログラムのコード。検証してみると……
うんうん、思った通りの答えが返ってきた。しかし、細かく解説してくれるなぁ。コードを理解するのにめっちゃ便利だよマジで。
が、これも他のファイルと同じく最初の1000文字を抜き取って解析しているので、メッチャクチャ長いコードを解説してもらうってのはさすがにできないんだよね……。
・音楽
ここからは不可能な領域。今までは文章や画像ファイルだったが、音楽ファイルはどうだろうか? 音楽を再生してそれを聞かせるんじゃなくて、音楽ファイルそのものを与える。もしかしたらデジタル信号を解析してどんな音楽か解説できるかも。
使うのは、魔王魂さんの『シャイニングスター』。この音楽、メッチャクチャ可愛くて好きなんだよね。ちなみに、無料ダウンロードできるぞ。
さてさてどうだろうか。
んんんんやはりねーーーー。なぜか英語で返ってきたんだけど、簡単に訳すと「音楽ファイルだと思うけど俺は聞けないからプロに聞け」とのこと。そりゃそうだよね。
・EXEファイル
最後のファイルはアプリの実行ファイル。このファイルはもう機械言語(0と1だけの言語)だ。
パソコンのOSをUSBに焼き込むアプリの実行ファイルだが、GPTさんはわかるのだろうか?
毎度謎の英語での回答。訳すと……
「rufus-4.4.exe」というファイルは、Windows用の実行可能ファイルで、一般的にRufusと関連しています。Rufusは、Microsoft Windows用の無料でオープンソースのポータブルアプリケーションで、USBフラッシュドライブやLive USBをフォーマットし、ブータブルUSBを作成するために使用されます。
バージョン番号「4.4」はソフトウェアの特定のバージョンを示しています。Rufusは、オペレーティングシステムがインストールされていないシステム上でブータブルISO(Windows、Linuxなど)からインストールメディアを作成したり、DOSからBIOSやその他のファームウェアをフラッシュしたりするためによく使用されるツールです。
システム管理者やブータブルUSBドライブを作成する必要がある個人にとって、広く使われているツールです」
──とファイル名からどういうアプリか解説してくれる。なるほどね(力尽きてしまった人間)。
・まとめ
画像ファイルか文章ファイルなら問題なく解析し、それに基づいた回答を出してくることがわかった……が、注意としてデカいファイルには基本的に向いていない(長い文のファイルとか)。
簡単に言うと精度バケモンである。画像とか特にすごくて、細かい特徴を見抜くのはもちろん、画像の「主」になるモノだけじゃなく、背景やトーンと画像全体をちゃんと「見ている」。
AIの作成に触れている者として、これは本当に本当にすごいのである。GPTさんはいかにして学習したのか。学習したデータの量はどれほどなのか……マジで知りたい。
こんな優秀なAI、正直良い買い物したと思うよ。これからはとことん使わせてもらうぞ。
──最後に、これから登録することを考えてる人に忠告がある。GPT-4には制限があって、なんと3時間毎に40メッセージしか送れない。超えるとChatGPT-4は使えなくなる。無料版のChatGPT-3.5は普通に使えることを考えたら、これどうなのよ?
まぁとにかく、楽しい検証でした! Sampai Jumpa Lagi!!
参考リンク:ChatGPT公式サイト
執筆:アキル
Photo:RocketNews24
アキル
































生成AIの気持ちを理解するために「さとうGPT」になってみた!
【知ってた?】難解な「史上最高難易度級の間違い探し」を一発攻略するAdobe Acrobat Proの『比較機能』がスゴい!
BingのAIチャットに「笑える記事を書いて」とお願いしたら最終的にバグったけど『BingとChatGPTがギャグ対決をするとこうなる』って記事を書いてきた
巷で大絶賛の最新AI『GPT-4o』に「新宿でオススメのモーニング」を聞いて食べに行った結果…なぜこうなった!
【楽天系フィッシングメールに要注意】最新事例その3:ニセ「楽天市場」からの『注文内容ご確認(自動配信メール)』
高級レザーパンツ(革パン)を買ったんで、お店で丈詰めしようとしたら「えーっ?」となったんで自分でやった
鳥貴族の食べ飲み放題「トリキ晩餐会(税込3900円)」が思ってたより最高だった / 忘年会に最適だと思った2つの理由
いつも混んでる「焼肉きんぐ」、中国の渡航自粛要請で今なら空いているかも!? 確かめに行ったら…席に着くと同時にピンチが始まった
【衝撃】人生初の「スタミナ破滅系ラーメン」が超強烈だった
【天国】錦糸町の名銭湯「黄金湯」に泊まってみた / 昭和と令和が融合した銭湯天国を満喫!
【本日発売】「ローソンの福袋」(2160円)があまりにパンパンに詰まってて、持って帰るのちょっと恥ずい
中国「渡航自粛要請」から2週間が経った京都市内「祇園」「清水寺」「錦市場」の様子を見に行ってみた
中国の「渡航自粛勧告」から2週間、現在の「奈良公園」で目の当たりにした意外な光景
【中国渡航自粛】ガチ中華だらけの上野・アメ横に行ってみたら → 取材拒否の連続に…
【極論】焼肉って結局ウインナーが一番うまくないか? 「ウインナーだけ焼肉」やってみた結果 …
中国「渡航自粛勧告」から1週間経った、東京・浅草を見に行ってみた
【納得】ガストの「ジョブチューンで唯一不合格だった」メニューを食べてみた → 不合格にする気持ちがわかった
【検証】10年間ほぼ毎日飲んでる「コーヒー」を1週間断ってみたらこうだった
【は?】楽天で見つけた「在庫処分セール半額おせち」を買ってみた結果 → 届いた数日後にブチギレかけた
【雑草対策】カインズで598円「撒くだけで防草できる人工砂」の効果がヤバ過ぎた / お財布にも環境にも優しい超画期的アイテム
【検証】「スタバはどのサイズを頼んでも量は一緒」という動画が出回る → 実際に試してみた
【事故】楽天で買った『訳ありB級フルーツ福袋』を開封した翌日、妻から信じられないLINEが来た「メロンが…」
【スゲエ】「もう恋なんてしないなんて言わないよ絶対」ってどういう意味? ChatGPTに聞いてみたら衝撃の結果に
【続・注意喚起】ついに楽天カード株式会社を装うフィッシングメールが本物と見分けのつかないクオリティに!
【バレンタイン】妻 VS チャットGPT「好みに合うチョコレートを買ってくれるのはどっちだ選手権」を開催してみた
【衝撃】デヴィ夫人が横領事件について「メルマガ」の添付画像で詳細告白! その画像がヤバい!!
【100均検証】ダイソーの新商品「ブルートゥーススピーカー(ポータブルタイプ)」が予想してたより良い感じ / USBメモリ&マイクロSDにも対応
1000円カットで「このまま短くして」と約3年言い続けたら…妻が「美川憲一さんっぽくなってる」と言い出したのでAIに判定してもらった結果
【いまさら感動】コンビニの「ネットワークプリント」を初めて利用したらハイテクすぎて笑った! ここだけ西暦2112年くらいだろ
【検証】アニメイト池袋オリジナル福袋(3000円)の中身の値段を計算したらとんでもないことになったでござる / 2021年福袋特集
【検証】古いパソコンにAndroid入れたら最強じゃね? → 違う意味で予想通り
【わけがわからないよ】2015年に中国で起きた “Xファイル的事件簿” 8選
『X-ファイル』のテーマ曲をメジャーキーに変えたらこうなった! ネットの声「子供向けの教育番組にピッタリ!!」「結婚式でも使えそう」など