生成系AI × プログラミング = RPAの進化系?

考えたこと
考えたこと

ちょっと前までRPAというやつが流行っていて、自分もたまに使ってみたり、RPAであるシステムができるかどうかを検討したりしていたんだけどさ。だけど、最近の生成系AIを見ていると、もうRPAとか言ってるレベルじゃない気がする。

自分が今どうやっているかっていうと、処理はWindows上のWSLで動いているUbuntu用にPythonのプログラムを書いてもらって、それを起動するWindowsのバッチファイルから起動している。いや、言葉にするとよくわからないけど、まぁそんな感じで動かしている処理がいくつかあるわけです。

特に今度出たChatGPTのo3-mini-highはコーディングとか得意っぽいので、これでさらにいい感じになるんじゃないかな。いまこの記事を書いている時点ではまだちょっとしか使ってないけど、たとえば、Evernoteからエクスポートしたenexっていう形式をepub形式に変換してください。環境はWindows上のWSLで動いているUbuntu、enexファイルはドラッグ&ドロップで渡すのでバッチファイルを作ってください、みたいな感じ。実際にはもう少しちゃんと前提を書いたり、ステップを踏んだりしているけど、ある程度のものはこんな感じでできちゃう。

なに言ってんだって言われるかもしれないけど、このくらいニッチなプログラムでも、サクサクっと作ってくれるのがすごいってことを言いたいわけ。

ヘタなRPAを頑張るくらいなら、この方法でいろんなことができるようになる。もちろん、ブラウザを操作したり、アプリを操作したりっていうのは難しいけど、いや、そもそもそういうところにフォーカスするとRPAって地獄を見るぞ的な気持ちはある。

とは言いつつ、直近の生成系AIというか、この業界の目標はエージェント型AIで、今でも既にChatGPTがブラウザを操作してWebサイトへ直接アクセス、操作できるような世界が来ている。これが近い将来、ブラウザからアプリケーション、OSまで下りてくる。というルートもある。

どちらが主流になるのか分からないけど、どちらにしても、ところでRPAってなんでしたっけ?っていう非常に間抜けな話が出てきそう。もちろん、RPA自体が抱えている「環境の変化に弱い、ベンダーロックインされる」という課題は、エージェント型AIでも同じかもしれない。

でも、その中間ポイントとしての一定の処理をするプログラムをサクッと作って動かしていくってアプローチは、正直かなり汎用性の高いものとして残っていくんじゃないかな。こういう複数の小さな処理を生成系AIで作って、その間のインターフェイスを定義して、つなげて、結果を得る。まさにLinuxのパイプみたいなものが汎用的に下りてくる気がする。きっと、環境側では、サンドボックス内で構築から実行までをやるんだろうな。

そうなったときに必要なのが、プログラミング的な素養だったり、Linuxのパイプ的なセンスだったり、エンジニア的な知識だったりする気がしてきている。そもそも、何をやるか、どうやるかをイメージできないと、適切な指示は出せないわけで。データだけ渡して「いい感じにやっといて」では通用しない(当面はね)。

もちろん、生成系AIの発展がすさまじく、曖昧な質問に対していい感じに答えて、実行までしてくれるようになるかもしれないし、もしかすると、やりたいことなんかなくても生成系AIが生成したものが正解の答えになるかもしれない。はてさて。

タイトルとURLをコピーしました