使えるの?Gemini Pro1.5の100万トークンの実力を検証してみた
HTML-код
- Опубликовано: 2 авг 2024
- こんにちは、にゃんたです。
今回は、先日一般公開されたGeminiPro1.5を検証してみました。
Geminiは画像や音声が強いモデルですが、実用性が気になるかと思います!
色々検証してみたので何かコメントあればお願いします😆
■LINE公式で限定コンテンツ配布中!
▼登録はこちらから行えます▼
liff.line.me/2004040861-3Jvq4bAG
今ならキーワード「プロンプト」と入力すると
・ChatGPTのプロンプトまとめ
・Caludeのプロンプトまとめ
を無料でお渡ししています!
■チャプター
00:00 オープニング
01:39 Gemini Pro 1.5とは?
07:31 使ってみよう!
19:25 エンディング
■Google AI Studio
aistudio.google.com/app/promp...
■以前の関連動画
本当にGemini Pro1.5は凄いのか?論文を読んで解説してみた
• 本当にGemini Pro1.5は凄いのか?...
OpenAI最新のEmebddingモデルって何が凄いのか解説してみた
• OpenAI最新のEmebddingモデルっ...
■Udemy
ChatGPTAPIの使い方講座も作成しているので興味があれば是非!(クーポン発行してます!)
linktr.ee/nyanta_youtuber
■X, インスタグラム
/ vtuber_nyanta
/ vtuber_nyanta
■note
note.com/nyanta123
■言語モデル関連のおすすめ書籍
[書籍]大規模言語モデルは新たな知能か――ChatGPTが変えた世界
amzn.to/3YhtYCk
[紹介動画]一流研究者による大規模言語モデルの解説がわかりやすい
• 一流研究者による大規模言語モデルの解説がわか...
■にゃんた愛用のガジェット達
HHKBのキーボード(タイピングが心地よい!)
amzn.to/3VHE4Nd
パームレスト(外出時もタイピングの位置が安定する)
amzn.to/3Rtcz7G
マウス(手の負荷が下がる!)
amzn.to/3KI72q7
iiyamaモニター(ChatGPT用にディスプレイが必要・・・!)
amzn.to/3VpljNd
モニターアーム(コスパ良かった!)
amzn.to/4bZMTaJ
■連絡先(全て返信できないかもしれません!)
vtuber.nyanta@gmail.com
※上記製品リンクURLはAmazonアソシエイトのリンクを使用しています。
---------------------------------------------------------------------------
■楽曲提供
フリーBGM DOVA-SYNDROME : dova-s.jp/
効果音ラボ : soundeffect-lab.info/
■編集
にゃんた妻
一言:無料なのは嬉しいポイントですね😄
---------------------------------------------------------------------------
#AI #生成AI #python #プログラミング #Gemini
にゃんた様へ
何時も素晴らしい優秀な、分析 解析 ありがとうございます!!!
このトークン数は、驚愕致しました。!!✌️
動画ありがとうございます。geminiはほとんどキャッチアップできてなかったので参考になります。ultraが出たら触ろうと思っているんですがね。。。
コメントありがとうございます!
需要あるかな~と思ってたので、
そのように言っていただける人がいてよかったです😆
結構用途が限定されるのでUltraが出てからでも良いかもですね!
疑似的だけど、動画を理解できるのはGeminiの強みですね!すぐに(疑似的じゃない)動画入力を受け付ける実用的なモデルが出てきちゃいそうな気もしますがw
なんかスコアが良かったとしても、
言語モデル(Ultra)の評価方法が疑わしかったので
Gemini全般信じられなくなってしまってますよね笑
一見、文字起こしの精度は高そうだけど、よく見てみると、
ジェミニが勝手に文章を追記してしまっている。
聞き取り誤りによる誤植とは違い、勝手な創作文章が入って
いるため、起こした文章を使って要約をすると、その要約文の
内容はオリジナルの意図とずれてしまう恐れがある。
動画をアプロードして、テロップとかいい感じに動画編集してくれないかなぁー。英語とかにも。
そこまでやってくれた実用的ですよね~🤔
自社でこれほど精度の高いモデルを保有しているにもかかわらず、自社サービスで積極的に活用していないのは不思議です。
サーバーサイドで使われているのかもしれませんが...、もっと活用の幅はあるはずです。
前にも提案しましたが、誹謗中傷対策に生成AIを使った文章修正や、翻訳、検索窓としての活用とか。
Geminiの技術力に期待し、より便利でスタンダードなサービスを目指してほしいですね。
コメントありがとうございます😆
検索機能とか、RUclipsとかに要約機能を付けてしまうと
滞在時間が短くなって活用が苦しいとかもあるかもですね🤔
確かに翻訳とかでGemini Pro搭載されていたら結構使う人多そうですよね!
動画ありがとうございます。音楽生成AIの uDio で生成した歌の歌詞(英語)で uDio が表示してきた歌詞が明らかに違うだろうという部分があったので、Gemini Pro 1.5 に曲をアップロードして文字起こしして貰ったら何とかできました。まあ完全ではありませんでしたが、かなり手間は減らせたかと思います。
コメントありがとうございます!
音楽生成に使ってらっしゃるのですね🤔
少しでも役に立ったようで良かったです😆
プログラム組ませてるのだけど、
チャットgptみたいな
コピーボタンないのよね。。
どうにかならないの?
動画ありがとうございます。何度も「srtファイル形式で文字起こしをしてください」と入れても「現在、srtファイル形式での文字起こしに対応できません」と返ってきます。
何か条件があるのでしょうか?それとも現在は対応しなくなったのでしょうか?何か情報があればどなたか教えてください。よろしくお願いいたします。
自己解決しました。ありがとうございました。