戻る

shimojik

しもじま

2024/02/17 18:54

サマリー

  • ジェミニープロのバージョン1.5がリリースされ、トークン数が1000万トークンまで扱えるようになった。
  • 1000万トークンは約700万字から800万字程度の日本語文字数に相当し、一般的な辞書一冊分の文字数に匹敵する。
  • トークン数の増加により、検索精度が1000万トークンで99.2%、100万トークンで99.7%となり、53万トークンまでは100%の再現度がある。
  • Gemini Pro 1.5はテキストだけでなく動画の扱いも可能で、検索や情報整理の精度が向上している。
  • この技術の進歩は開発方向性を再考させるほどの影響があり、テキストのマークダウン化やJSON化など、より効率的な検索が可能なテキスト整理が重要になる。
  • 現時点では一部のユーザーのみが体験できる状態であり、広く利用可能になることが期待されている。

記事

ジェミニープロのアップデートとその影響

昨日リリースが出てたジェミニープロの1.5、バージョン1.5が出ていて、その後にオープン映画ソラっていう動画生成のを出してたので、そこでそっちが盛り上がっていたので、少し盛り上がりにかけるところはあったんですが、このジェミニープロっていうのが1.0だったのに1.5になりましたと。ここで大きく変わったのが、これがすごくて扱えるトークン数が1000万トークンもできるようになりましたと。これ僕100万トークンだと思ってたんですけど、1000万トークンだと。1000万トークンっていうのが、これはツイッターで見た情報なので正しいか調べてないんですが、今調べようかな。公示円が総文字数が1500万文字で、普通の一般的な辞書が400万文字程度ということなので、今回の1000万トークンっていうのが、日本語だとこのトークンの計算がちょっと難しいというか、トークナイザーっていうので計算しないとわからないんですけど、それで計算するとだいたい1000万字使えるみたいな、1000万字っていうのは日本語で言うと800万字ぐらいか、少なくとも700万字ぐらいいけるかなっていう、文字の組み合わせによるんですけど、という感じかなということで、公示円と比べれば半分ぐらい、普通の辞書だと丸一冊入りますというぐらいの文字数までが生きるようになりましたというのがデジタンですよ。

Gemini Pro 1.5の潜在的な影響

生きるようになりましたっていうのは、そもそもどういうことかということなんですけど、それこそチャットGPTでもGPT説を作るときに、そのGPTsにナレッジとしてファイルをアップしたとしても、ファイルの文字数結構いってもうまく返ってこなかったりするので、そもそもその、いけますよって言われたから、それが使えますよっていうこととイコールなのかっていうと、そうじゃないっていうのがあるんですけど、今回出てたこのGemini 1.5 Proに関しては、これはGoogleがプレスで出してるので、これから使えるようになっていって検証をより正確にしていくっていう話だと思うんですが、1000万トークンにおいての検索精度が99.2%、100万トークンだと99.7%ということのようですね。細かいなって話ですけど、53万トークンまでは100%の再現度っていうことなので、検索を正確にとってくるとはちょっと違うんですけど、違うんですけど、違うと思うんですけど、ちょっと僕は正確に理解しないので。ただ、これがかなり精度としてこれだけ高いと。1000万トークンで99.2%だとして、99.2%の感覚でいうのは、普通にPDF1ファイルをGPT図に入れて検索させるとしても全然そんな感覚がないので、これをAPI経由だとしても別にあんまり変わらない感じがあるんですよね。

開発の新たな方向性

アシスタントを作るっていうのがGPT図みたいなやつがAPIのほうであるんですけど、それもあんまり変わらない感じがするので、となるとこれがある程度近い、ここで公表されているっていうか、Google側が主張しているパーセントにある程度近いのであれば、かなりのゲームチェンジになるんじゃないかという感じはしますね。今、ジェミニ使っているとジェミニが出力する文章というのはGPTと比べると一段劣る感が現状あるという感じがするんですけど、ただこれ、結局その生成させる文字を作るところはGPTでやるとしても、どの情報を取ってくるかみたいなところをジェミニのほうでやるとか、また今回はプロの1.5なので、プロの1.5で検索してきた情報をウルトラのほうに投げるみたいなことができるようになれば、となるとかなり使い勝手としては良くなるんじゃないかなと。あくまでこれ使ってみてそれくらいの精度が出るのか。そもそも日本語だと英語で違うと思うので、日本語だとどれくらいこれが下がるのかみたいなところの実際のところがどうなのかということが気にはなるんですけど、ただ大きな進展としてこの方向に行ったということは一つ事実だと仮に認めるとすれば、我々は実装するときに検索という部分の開発、それこそベクトルデータベースとかを組み込む、そのためにテキストをチューニングするみたいな、これにどれくらいリソースを注いだらいいんだろうというのが改めてわからなくなる感じがします。こうなるとやっぱりその部分とかでさえ、そこはまだ結構残りそうな感じはあったかなと思うんですけど、そういうところでさえ実装しないというか、そこに手を加えない。ある意味ちょっとここはお任せするという形、それこそこのGemini Pro 1.5とかが出てきたらさらに精度が上がるということのその成長速度の方がベクトルデータベースでチューニングするというのと比べて圧倒的に早い、いい可能性がある。しかもこの今回言っているGemini Pro 1.5に関してはテキストだけじゃなくて動画もいけるとかって話をしているので、そうなってくるとPDFから情報を取ってきて、情報整理してベクトルデータベースを入れて検索できるようにしてとか、という話ではなくなる。コストの問題があるので、これも下がってくると思うんで、みたいなことを考えて、これは本当にどこにリソースを割きながら開発をしていくかということが重要だなと思いますね。

テキスト情報の整理と将来の展望

そういう中で、まだここは結構やるべきところとして大きいんじゃないかっていうのは、テキストのマークダウン化みたいなところ、あとは画像をテキストで説明するみたいなものをちゃんとマークダウンの中にうまく入れるとかっていう、そういうテキスト情報として参照しやすいものになっているということ。もっと言ったら、JSON化しておくとかも含めて、そういう確実な検索ができるようなものみたいなものの整理とかを含めたテキストの整理ですかね。逆に言えば、これぐらいしか力を入れられるところがないという見方もできるんじゃないかと思うぐらい、今回のこの発表がすごい大きな開発を今進めている上での方向性をちゃんと考え直さないといけないなっていうのを改めて思ったという発表でした。ということで、まだ使えないと思うので、かなり一部のユーザーしか使えないみたいな感じで、ちょっとずつ拡出、広げていくということみたいなので、まだ使えなくて、Wishlistに登録するっていうのだけやってみましたけど、早くこれは体験してみたいですね。

記事リライト

ジェミニープロ1.5の革新とその波及効果

ジェミニープロは最近、1.5バージョンへとアップデートされ、この変更が大きな話題を呼んでいます。特に注目されているのは、扱えるトークン数が大幅に増加し、なんと1000万トークンに達したことです。これは、以前の100万トークンから見ると、想像以上の進化です。この数字を日本語に換算すると、約700万から800万字の情報を処理できることになります。これは、一般的な辞書一冊分に匹敵する量であり、ジェミニープロの能力の飛躍的な向上を物語っています。

Gemini Pro 1.5がもたらす可能性

このアップデートにより、ジェミニープロは従来よりもはるかに多くの情報を扱えるようになりました。しかし、これが実際の検索精度やユーザー体験にどのように影響するかは、これからの検証次第です。Googleによるプレスリリースによれば、1000万トークンにおける検索精度は99.2%に達するとのこと。これは、大量の情報を扱いながらも高い精度を保つことができることを意味し、ジェミニープロの潜在能力の高さを示しています。

開発の新たな展開

ジェミニープロ1.5の登場は、開発者にとって新たな可能性を開くものです。これまでのテキストベースの情報処理に加え、動画コンテンツも扱えるようになったことは、情報収集や検索の方法を根本から変える可能性を秘めています。このような進化は、開発者がどのようにリソースを配分し、どの技術に注力するかという戦略を再考するきっかけにもなります。

今後の方向性と課題

ジェミニープロ1.5のアップデートは、情報の整理や検索技術に新たな視点をもたらしました。しかし、この技術が実際にどの程度の影響を与えるか、特に日本語コンテンツにおける精度や利便性はまだ未知数です。今後の課題としては、テキスト情報の整理や検索アルゴリズムの最適化が挙げられますが、ジェミニープロ1.5の潜在能力を最大限に引き出すためには、これらの技術的な挑戦に対応する必要があります。

ジェミニープロ1.5のアップデートは、情報技術の領域において大きな一歩を踏み出したことを示しています。今後もこの技術の進化に注目し、その可能性を探求していくことが重要です。

ストーリー

サマリー

ジェミニープロのバージョン1.5がリリースされ、トークン数が1000万トークンまで扱えるようになり、検索精度と情報整理の効率が大幅に向上した。

経緯

私は長年、情報収集と整理の効率化に取り組んできました。この新しい技術の可能性を皆さんと共有することで、私たちの作業効率をさらに向上させたいと思います。

課題

従来の検索ツールや情報整理ツールでは、大量のデータを効率的に扱うことに限界がありました。

課題である理由

私自身、研究やプロジェクトのために膨大な量の情報を扱う際、情報の見落としや検索の不正確さによる時間の浪費を経験しました。同じ悩みを抱える人は少なくありません。

課題に至る経緯

プロジェクトの進行中、従来のツールを使っても情報の海から必要なデータを見つけ出すことが難しく、作業の遅延を招いていました。

課題「解決」へ至る経緯

ジェミニープロ1.5のリリースを知り、1000万トークンの扱いや動画コンテンツの検索機能を試したところ、これまでの課題が劇的に解決しました。

課題解決のまとめ

ジェミニープロ1.5を使用することで、大量のテキストデータや動画コンテンツも高精度で迅速に検索・整理できるようになり、作業効率が大幅に向上します。

エンディング

ジェミニープロ1.5は私たちの情報処理を革新する可能性を秘めています。この技術を活用して、より創造的で生産的な作業をしましょう。