shimojik
しもじま
サマリー
- 今年は生成AIの仕事が増えているが、プロンプトを書くようなシンプルな作業ではなくAPIを使ったシステム構築が主流になっている。
- プロンプトエンジニアリングは一時期話題になるも、その後の発展によりプロンプトの複雑化が進み、プログラミング的思考が求められている。
- 一方で、プロンプトを書くことは誰でもできるため、その価値については軽視されがちである。
- 2023年に入り、精度が向上したGPTや他社からの新しいモデルの登場により、プロンプトエンジニアリングに対する関心が薄れつつある。
- しかし、良いプロンプトを書くことは難しく、ビジネスにおいても適切なプロンプトで良い出力を得ることが重要である。
- プロンプトの重要性を理解し、共有することが新しいプロジェクトを始める際の鍵である。
- プロンプトを書くことの難しさはHTMLやCSSの設計に似ているが、見た目の簡単さからその難易度を過小評価しがちである。
- 人間はプロンプトを書くことに慣れておらず、AIの進化とともにプロンプトを書くことの面倒さが増している。
- 生成AIを使いこなすには、AIを扱える人に作業を依頼するなど、分担が必要になるかもしれない。
- 生成AIを組み込んだサービスの開発においては、インターフェースの設計が今後重要になってくる。
記事
生成AIの仕事の変化
今年は去年と比べてだいぶ生成AIの仕事が増えてきている感じがするなと思うんですけど、生成AIの仕事って言ってもそれこそプロンプトをこんな風に書けばいいですよねみたいなライトなものはあんまり伸びている印象がなくて、というよりはAPIを使ってシステムを組むみたいな話が増えてきているかなという感じが最近しているんですけど、そういう中でよく話題に昇るのがプロンプトの立ち位置みたいなところなんですよ。
プロンプトエンジニアリングの変遷
これは去年の1月2月ぐらいの段階でも結構揶揄されるみたいなのがあったりとかいうのがあったり、僕もそこに気持ちが追いついていないみたいなところもあるので同じ気持ちがあったりもするんですけど、これを最近気持ちの整理がついてきたので整理しておきたいなというのを思うんですが、何の話かというと生成AIを使うとなるとやっぱりプロンプトを書くというのが最初の入り口としてくるわけですけど、プロンプトを書くというのがTwitterとかでそういうポストをしているような人たちのブランディングにもよるんだと思うんですけど、すごいチープな位置付けで固まっている感じがあるんですよね。
これは去年の1月2月の段階でプロンプトエンジニアリングみたいな言葉がどんどん広がっていく中で、プロンプトエンジニアリング笑いみたいな感じの雰囲気もあり、そういう中でプロンプトエンジニアリング自体僕は面白いなと思っていたのでいろいろ追っていたんですが、その時点ではそうだったんですよ。2月とか3月とかでだんだんプロンプトが複雑化していきにプログラミングの思考みたいな、それこそオブジェクト思考とかみたいなものを取り入れたりとかっていうのをやったりとか、いろんな発展というかいろんな形がある中で、そのプロンプトをめちゃくちゃ書いている人たちの裏側でというか、一方でプロンプトって別に誰でも書けるから、プロンプトエンジニアリングとかって言うほどのものかなみたいなのだったりとか、あとはそれをできるようになる必要がなくてもっと絵が進化していくんじゃないかみたいなことがあったりとか、背景があってそれがまだ去年2023年の2月3月4月とかぐらいだと思うんですけど、そこからなんだかんだ精度がチャットGPTの精度が上がったりとか、他のGoogleが出したりいろいろ出てきたりとか、Facebookが出したモデルとかいろいろ、Facebookが出したモデルについてはあんまり一般的ではないので、ちょっと違うかもしれないですけど、そういうのがあったりとかする中で若干そういう系の話が薄れてきてはいたと思うんですよ。
プロンプトエンジニアリングの現状と課題
つまりプロンプトエンジニアリングみたいな感じの雰囲気がちょっとずつ減っていくと、特に人が興味を示さなくなるという期間が夏ぐらいから冬それこそ年末ぐらいまであったんじゃないですかねっていうのがあって、一方でその間もプロンプトについて発言してる人たちがいっぱいいて、冒頭にも言ったようにその人たちの僕は結構影響結構あるんじゃないか、やっぱその人目に触れる投稿をするっていうことが重要であるということと、人目に触れるためにチープな表現になってしまうっていうことがぐるぐる回ってるみたいな感じになってしまって、何回か僕が過去にこの中でも言ってるんですけど、一行目の引きの言葉みたいなものがこれを知らない人はもうダメです終わりですみたいな書き方から始まるとか、驚きました…みたいなところから始まるとか、そういう個人的にはすごく好きではないんですけど、そういう嫌な引き方から始まるものが増えていくと、ストレートな表現だけしかない世界線がもしあったとしたら、もうちょっと違った世界があったんじゃないかなと思っているんですけど、そうならなかったっていうのがあったわけですよ。
それがそういう期間ある意味停滞っていうかそんなに盛り上がってない期間も、逆に盛り上がってないからこそそういうものだけが出続けた結果、何となくそういう生成AI系のバシバシ使っていくぜみたいなアウトプットをしている、まさにTwitterとかで投稿しているような人たちが、その人たちが悪いというよりその人たち自体が僕は悪いと思っていなくて、その人たちの投稿の仕方が良くない人たちが結構いると思っていて、それによるプロンプトに対する軽視みたいなものがあって、それ自体はまあそれは流行り的なものもあるししょうがないかなと思いつつ、これが年明けてだんだん生成AI系の話がいろいろとある中で、最近感じているのがプロンプトって書くのむずいぞみたいな、書くのむずいぞっていうのは僕も書くのむずいぞって日頃から思ってるんですけど、思ってたよりむずいぞという前提に立つまでに時間がかかるということですね。
プロンプトの難易度とプロジェクトへの影響
つまりイメージとしてはそんなに難しくないという印象を持っていて、ビジネスに当たる時にその前提で取り組もうとするんだけど、あれプロンプトうまく出ないななんか書き方悪いんですかねみたいな感じで軽くなっちゃう。でもそこの良いプロンプトを書いて良い出力、プロンプトがどうっていうより良い出力を出してもらうために必要なことっていうのは、そのノードだと達することができないということを最初にある意味リセットして、そっちがちゃんとマインドリセットをするというマインドセットを変えて、向き合っていくみたいなフェーズが必要になっていて、時間がかかるなという感じが最近してるんですよね。
すいませんちょっと外工事してるんでガタガタ言ってますが、というのがあって、その第一印象との違いみたいなものを崩すのが一瞬で崩れたらいいんですけど、割と時間かかるかなという感じがするんですよね。というのを最近踏まえて、僕としては新しいプロジェクトを始めるにあたって、一緒にやる人たちがプロンプトを書くということはかなり深いやることいっぱいあって、そこを例えば2,3日ある程度プロンプト書いたからといって書けるようになるものではないということを、どうやって全員がまず同じマインドに立って、マインドを持ってプロジェクトに取り組むかということが、そのマインドをみんなが持っている状態にいかに早くするかということが、プロジェクトのスタートラインみたいなところで重要だと思うんですよね。
プロンプト作成の難易度と学習曲線
ここをどういうふうにすればいいかっていうのが本当に難しいなって思うぐらい、そこがギャップがでかいなというのを感じている。そう考えるときにやっぱり自然言語だから第一印象として書けるだろうみたいな、わかるだろうみたいな、そのテクニックがチープなものであるだろうみたいなところが、あるという印象みたいなのがなかったときの難易度ってどれぐらい難しいんだろうみたいな、最近それを考えてて、ちょうど近しいものこれなんじゃないかなって思ったのがHTMLとCSSだったんですよ。このHTML CSS、特にCSSなんか設計するのめちゃくちゃ難しかったりするので、大規模になればかなり設計難しいみたいなところがあるんですけど、ただ一定の基本的な部分を理解するのにかかる時間って、そんなに時間かかるものでもないし、その設計みたいなものもある意味テクニックっぽいものも結構あるかなと思うので、この入り札でさらにそこからいくらでも深くなるみたいなところの深さみたいな。大規模になればかなり設計難しいみたいなところがあるんですけど、ただ一定の基本的な部分を理解するのにかかる時間って、そんなに時間かかるものでもないし、その設計みたいなものもある意味テクニックっぽいものも結構あるかなと思うので、この入り札でさらにそこからいくらでも深くなるみたいなところの深さみたいなのは、それはLLMに関しても同じプロフト核についても同じだと思うので、ちょっと印象と難しさの感じが似てるなっていう感じがするんですよ。だけどやっぱりHTML CSSっていうのはちょっと見た目がいかついので、それとそのプロフトと比べると若干ハードル高いように見えて、通行に見えてしまう。見えてしまうってこともないんですけど、そういう違いがあるだけで結構似てるなみたいな。逆に言えばそれぐらい人間はHTMLとCSSって基本的に書かないじゃないですか。ワードプレスを使うわけですよとかノートを使うわけです。ワードプレスさえ設定しないわけですよみたいな。こういう世界線においてプロンプトみたいな難しいもの、HTML CSSぐらい難しい、難しいって言うと語弊があるんですけど、難しいと言うとするとそのHTMLプラスCSSぐらい難しいプロンプトを人間が書き続けるわけがないんじゃないかと、っていうのを最近思った時にそこからもう1回2023を振り返ってみると、2023の頭、まあ2020の末でもいいんですけど頭とかにあった、チャットGPTオンリーみたいな、しかも超シンプルにチャットだけするだけ、あの段階のめちゃくちゃプレーンなところから、1年以上経ってた今標準の機能として、有料機能とはいえ標準に使える機能として、ファンクションコーリングとか入っているわけですよ。ファンクションコーリングを普通に使う前提ってこともないかもしれないですけど、普通に使えるところに一般的なAPIモードじゃない方で、表示されている搭載しているぐらいに、その1年とか1年ちょっとの間に、主役的に進化してきたわけですよね。そこから1年遡ったあの時のあのシンプルさの時に、人間は1回やりとりするみたいな、シンプルな使い方をしたっていうので、ユーザー数が一気に伸びましたみたいな話題性はあったのは、もちろんその通りだと思うんですけど、それを継続的に使うほどのシンプルさがなかったと、複雑である難しいということを、1年前のあのシンプルな状態でも人間が使えなかった、なかなかということを認めて、さらにそこから猶予期間が丸1年あって、1年の間に徐々にある意味ゆっくり進化、その精度はすごい勢いで上がっているかもしれないですけど、機能としてはゆっくり進化しているわけですよね。ゆっくり進化しているこのゆっくりさよりも、圧倒的に人間が使う密度とか回数が少なかったわけですよ。ということを1年振り返って考えたときに、プロンプトを書くということが難しさと、事実人間が1年間かけてプロンプトっていうのは、原始的な状態でさえほぼ触れられなく、今となってはかなり進化してきちゃったみたいな、GPTをはじめとするそういうLMKのサービスがそうであるという、これをトータルで踏まえたときに、人間はプロンプトを書かないぞみたいな、プロンプトというかテキストを書かないぞみたいなのが、前提にありますよというのが、さっきの話に戻るんですけど、プロンプトを書くというのは難しいですよね、というのはどういうふうに認識共有をするといいか、みたいな話なんですけど、そのときに現状難しい、CSSとHTMLぐらい難しいということと、この1年振り返って使えませんでしたという、この2つを組み合わせると、割と納得感あるんじゃないかなということで、これで認識を揃えて、第一歩進められるみたいな感じがあるかもな、みたいなことを最近思いつつ、そういう話を最近することが多くなってきているんですけど、という感じがしてますね。だからこれが進化して、もっとプロンプトを書かなくても、人間が思う通りのものを出してくれるようになりますよ、みたいなことが来たとしても、今のこの状況は多分変わらなくて、まさに先行してそれに近いことが起きているのが、ミッドジャーニーで、ミッドジャーニーって、可愛い犬で写真っぽいやつぐらいの、雑なプロンプトを書くと、結構綺麗なやつが出てきてくれます。あとはそれをアップコンバートするツールとかにかければ、もう写真になりますみたいなところまで、現状来てますが、ただそれを使って、あなたが作りたいもの、あなたが書きたい、あなたが撮りたい写真に近づけることができますか、っていうと、それはまた別問題じゃないですか。なぜなら人間はもっとわがままなので、ちょっと何か違うんだよなみたいな、これは仕事をしていると、過去にもデザイナーが、人間との擦り合わせでも、無限に発生していたことだと思うんですね。優秀なデザイナーだっていう人に、発注してみたけど、いやかっこいいんだけど、なんちゅうからこみたいなのが、擦り合わせで発生するみたいな、人間はそれをお互いに組み取りながら、やるみたいなことをやって、ある意味しょうがないと思うわけですよ。自分の100点にいかないとしても、脳機みたいなのがあって、その手前で、ここで一旦切り上げようみたいなことが、発生したりとかっていうのがあるんですけど、AIもその近いことがあるかもしれないですけど、ただAIに対してやっぱり、見せてるみたいな概念が、早めに来るなと思っていて、つまり、なんかこっちなんだよな、やっぱりAIちょっとまだだみたいな、そういう切り捨て方を、一年間、多分人間がたくさんしてきたんじゃないか、ということがこれから先も、永遠に続くであろうと、となると、一方で、この一年間の中で、自分が実力したいものを、限りなく出力できるように、チューニングし続けた、それこそ同じ鉛筆を与えられても、自由自在に、動物の絵を描ける人と、僕がそうなんですけど、小学生が描くような動物の絵ぐらいしか、小学生全般がまた、絵が下手なわけじゃないと、典型的な小学生が描くような絵しか描けない、そこから成長してないみたいな、鉛筆一本でも違うみたいなことが、プロンプトというテキスト一個で、全然違うところまで来てるわけですよね、ということをずっと試行錯誤してきた、ずっとする人なんですけど、試行錯誤のフェーズまでいっていて、なかなか上手くいかない、そこの延長には、自分が作りたいものというのの、ゴールもあると思うんですけど、やっぱこう、きれいな犬の写真の、草原走っている、やつ、もっといいやつ、この感覚というのが、多分AIが進化すればするほどもっと強くなる、なぜなら人間がAIに対する期待も高まっていって、プロフトチューニングできる人たちが、すごくいいものを出してくると、それぐらいは自分でできると思うけど、出そうと思ったら出ない、じゃあもうちょっとAI進化するの待つかみたいな、さっきも言いましたけどそれを、人間は2023ずっと繰り返してきたわけですよ、っていうことが、絵の世界だと特に分かりやすい、ミッドジャーニーがとにかくV6とかで、すごいクオリティ上がってきてるんで、ということから、考えたときの、そのAIが進化すればするほど、より、パッと見のクオリティが、高いのに自分が思っているものと、違うというギャップの、吸い合わせの難しさみたいなものっていうのは、その内部構造に当たるような、プロンプトが、どうなっているのか、どう伝えたらよかったのかみたいな、そのある意味、2023頭とかもっと前の、原始的なプロンプトのところまで、立ち返らないといけないと、でもそんなことは原始的なものだけ与えられているときで難しかったのに、こんなに便利になったのに、もう一回原始的な、例えば電卓があるのに、大人で電卓があるのに、電卓でやるのは、もう一回基礎からやるかみたいなのを言ったら、「いや、それで電卓でやったらいいんじゃないの?」みたいな感じに。でもこれ、電卓と違うのは、その答えみたいなものは出るようで、出ないみたいなものがしたら、という後半ごちゃっとしたんですけど、ということがずっとこうあって、なんか、プロンプトっていうのは、僕もそうでしたけど、今も葛藤してるんですけど、思っているよりもとにかくめんどくさいものである。難しいというとちょっと違うんですけど、違う気がしてるんですけど、難しいというよりは、めんどくさいものであると、AIの進化に伴いめんどくささが上がってくる、みたいな、そういう感じになっていくと、そうなるとどういう世界になるかというと、そのAIを扱える人にAIを扱って何か出力してもらうということがいい、自分では扱えないから、みたいな、生成物のクオリティを求めれば求めるほど、そういう感じの分担みたいになってくるかな、と思うんですね。
サービス開発とAIの未来
と思うので、サービスを作るというときも、なんか、質問みたいなもの、QAみたいなものは、チャットと違うのでいいんですけど、チャットというよりは、ワンポチみたいなものの概念に近いかみたいな、インターフェースの作り込みみたいなことが、今後重要になっていくんじゃないかな、っていうのを、そういうの最近、生成AI、LMを組み込んだサービスの開発、みたいな色々増えていく中で、ここの今言ったようなところをモヤモヤ考えながら、今言って、こういう形で進めていくと良さそうだなみたいなことで、最近は考えてたりします。ここら辺は、もっともっとブラッシュアップさせたいな、と思っているので、この辺りの話、したいというか、興味ある人は、僕の今思っていることが全ての答えだともちろん思っていなくて、これを今思っていて、さらにブラッシュアップしていきたいな、っていうのを思っていますので、よかったら声かけていただけると嬉しいです。