この間、本の表紙がいくつか写っている写真の画像が複数枚ある、その写っている本のタイトルを列挙するっていう作業があった。普通に考えれば、画像を見ながら書名を書き出していくって流れになるんだけど、ふと思ってChatGPTに投げてみた。投げた時のプロンプトはこんな感じ。
この写真は、書籍の表紙を撮影した写真です。一つの写真に複数の書籍の表紙が映っています。映っている書籍の名称を一覧にしてください。
一覧にする場合は以下の書式でお願いします。
– 映っている写真のファイル名:書籍名書籍名が分からない場合は、以下のようにしてください
– 映っている写真のファイル名:読み取り不可
で、複数枚の画像をアップしてみたところ、ほぼほぼの精度でタイトルの一覧を作ってくれた。いや、できるだろうとは思ってたけど、全体で約30冊くらい写ってた本のうち、ちゃんと読み取れなかったのは1冊だけ。その1冊も指示通りちゃんと「読み取り不可」にしてくれて、写ってる写真の名前も出してくれているので安心。しかも、丁寧に「読み取り不可(白い表紙の冊子)」ってところまで書いてくれる。
できるとは思ってたけど、この精度でやってくれるとは思ってなかったので、マジですげーってなった。
で、これをやってみての率直な感想として、生成系AIで仕事がなくなるって話のリアリティが湧いてきた。今までは、生成系AIは人間よりいい感じにやってくれる(精度、量、回数、コスト)みたいな話だった。
今回の作業は、ぶっちゃけて言うとあんまり高度ではない(技術的にではなく作業内容的に)。このくらいなら新卒の社員に任せても何も問題ないレベル。いや、高校生のアルバイトでもなんでもいい。けど、圧倒的な速度がある。つまり、Slackなんかで画像を送って、作業指示を出すのと同じ速度で結果が返ってくる。
これは自分にとってある意味衝撃的で、「誰かに頼むより早い」が「結果が出てくるまでの時間が短い」ではなく、本当の意味で「頼んでいる時間(依頼する文章を書いている時間)より早い」。さっきのChatGPTのプロンプトだって、もしSlackやメールで誰かにお願いするなら、さすがにもう少し丁寧に書くと思うし、相手のスケジュール感や、どのくらいでできそうかの確認なんかも書くと思う。
生成系AIを使うと、そんな文章を書いている間に結果が出てくる。いや、これはもう違う話だろってなる。馬車が車になって電車になって飛行機になって移動時間が短くなったとしても0にはならない。
精度、量、回数、コストでの差別化ならまだしも、0になっちゃうともうどうしようもない感じがある。今回の件は、それが0になったような感じ。注文する前にものが届いているレベル。
今までイメージがあった、新人や経験の浅い人たちから仕事がなくなるって話。そういう人たちも生成系AIを使うことで何とかなるんじゃないかと思ったけど、これは無理だよ。0になるんだから…。って話に今更ながらに気が付いてしまった。
そして、このイメージの先がAIエージェントという世界になるんだろうなぁ。はてさて、世の中、どうなっていくのやら。