GPT-4V识图能力怎么用?21个使用场景,帮你超越99%的人。
HTML-код
- Опубликовано: 26 окт 2024
- OpenAI在9月底公布了多模态ChatGPT的预告,从10月初已经陆续给Plus用户提供了可上传图片的Vision识图能力、语音对话能力,以及直接将DALL·E 3接入ChatGPT的文生图能力,如果你还不了解这个信息的话,可以先看我上个视频。
在我看来,最令人兴奋的还是ChatGPT获得了识图的能力,毕竟语音对话更多还是情感类的场景使用,有一些基于GPT API开发的工具也能获得类似提升;而至于文生图则依然有Midjourney、Stable Diffusion等替代。但是结合了大语言模型的对图片的理解则完全是全新的。
我获得了识图能力大概有一周的时间,从实际体验来说,有点像是GPT-4刚刚发布时带给我的震撼,GPT-4V对于图片上的内容确实有相当好的理解,我梳理了在生活与旅游、工作、学习等三类场景下GPT-4V的21种使用方式,希望对你有所启发。
如果你想了解和学习更多ChatGPT使用方式与技巧的话,欢迎订阅我的专栏「ChatGPT精进指南」:xiaobot.net/p/...
如果你对学习ChatGPT使用技巧,了解更多工作、学习上的使用场景感兴趣,欢迎订阅我的专栏「ChatGPT精进指南」:xiaobot.net/p/AIclass (需复制到微信打开)
谢谢博主的分享。学习了 GPT的强大功能
非常实用,感谢
非常感谢分享,目前小白,学习中
不错,认识更多GPT的功能
学习到了很多用法,上个月底就推送了,简单试了一下,但是一直没时间研究
怎么上传图片?
謝謝
❤很好
谢谢分享
請問gtp-4v跟gtp-4有什麼不同的地方,最近正想購入gtp-4怕裡面無法使用你影片介紹的功能
现在ChatGPT的GPT-4就包含vision能力了,可以用的
太出色了
我也觉得
求更多86个潜在场景
我也是plus用户,为什么没有图片输入功能呀
再等等
第20个,应该是个Gitar,Not Ukulele。因为是6弦不是4弦。
一键三连了😊
客观端有图片输入功能了吗
有
博主可以换设备了
That's a guitar but not a ukulele
视频有点残影😂😂😂😂😂😂😂😂
好像是摄像机帧数有点低😅
1
1.5x
86来来来
GPT-4V的86种使用场景:xiaobot.net/post/319374b1-8c08-45a9-89a3-207c77d5d055
86
内容都挺好的就是up主的“chatgpt”的发音稍微纠正一下吧,听着很难受。
🤣
求更多88个潜在场景