超越GPT-4o视觉能力？本地部署Qwen2-VL多模态视觉大模型！超越人类的视觉理解能力，精准识别X光片判断骨折、CT扫描检测癌症，还能识别手写体汉字与英文！#qwen2 #aigc #ai

离谱！完全不懂编程，我竟然4小时靠AI复刻出月入$600k的APP的同款，方法居然这么简单?（无代码开发）

比《人類大歷史》更重要的書：《連結》最完整解析，原來我們對 AI 的看法錯了！？

Marvel Rivals | Winter Celebration, Joyful Jubilation

Superman - Teaser Trailer Tomorrow

I.N "HALLUCINATION" | [Stray Kids : SKZ-PLAYER]

本地部署Molmo-7B多模态大模型媲美Llama3.2-90B！全方位测评：图像识别、视频分析，打造多模态视觉AI助手！轻松实现监控视频快速找人！一站式掌握多模态AI技术，引领智能新时代!

AI超元域

Просмотров 7 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 12 янв 2025

Комментарии • 47

@ChrisChenok 17 дней назад
Windows没法弄吗？😮😢
@zdhpeter Месяц назад
Thanks!
@AIsuperdomain Месяц назад
谢谢支持🤝🤝🤝
@CCNA整理哥 3 месяца назад ⁺²
有影片內視頻分析的代碼嗎？
下方描述欄的連結好像只有圖片分析的程式碼
@wayne8863 3 месяца назад ⁺¹
7B D里的D是什么意思？😅
@sshorse 3 месяца назад ⁺³
感謝您做這期視頻，沒想到這麼快就來了，謝謝。不過本來預期能不能用Arc A750 or A770 等級的跑一個小模型，看來還想多了😂 如果 intel 最新的 200V 系列有機會跑的動，感覺得很有實用價值
@AIsuperdomain 3 месяца назад
谢谢支持🤝🤝
@or3670 3 месяца назад
@@AIsuperdomain 这大模型一个比一个卷，玩不动了快
@or3670 3 месяца назад
@@AIsuperdomain 刚出个Liama3.090B 一下子又出现一个新的多模态大模型卷死了
@mi71918 3 месяца назад ⁺¹
酷，有測試過給予特定人像的臉或全身，配合模型自帶的記憶性，實現圖像找人嗎？
白話點說就是，用照片找人
或者更進階的，把人的影像embedded成vector storage 理論上multi-modal 也是把照片經過transformer轉換
實現類似 face recognition + dataset的效果
我看目前測試的都是一張圖，然後對應敘述，並沒有類似討論串記憶性的demo，但我使用gpt4o是有圖像記憶性的
@AIsuperdomain 3 месяца назад
好的等我发一期影片详细演示
@or3670 3 месяца назад
@@AIsuperdomain 原来是套壳qwen
@CCNA整理哥 3 месяца назад
能在colab上執行嗎？本地電腦一直出錯😢
@chugoh 3 месяца назад ⁺¹
我們可以上載2張圖，來實現在A照片里找B照片里裏一個特定人物的臉嗎？
@AIsuperdomain 3 месяца назад
可以实现
@zacharyzheng9326 3 месяца назад
这个molmo-7b是在你本地运行的吗？请问你的电脑配置是？
@snsnendxj 3 месяца назад ⁺¹
Ovis1.6-Gemma2-9B 阿里开源的可以测试下吗
@AIsuperdomain 3 месяца назад
OK 我尽快安排
@CCNA整理哥 3 месяца назад ⁺¹
需要把模型下載到本地嗎
@AIsuperdomain 3 месяца назад
代码会自动下载模型到本地，不需要手动下载
@yung-mingchiu2364 3 месяца назад
請問跑 Molmo-7B 時，實際所有用的 VRam 是多少?
@AIsuperdomain 3 месяца назад ⁺²
使用watch -n 1 nvidia-smi命令查看VRam，推理的时候占用大概35GB
@jayhu8046 3 месяца назад
大佬什么时候出一期将该模型转换为ollam模型
@AIsuperdomain 3 месяца назад
ollama还不支持多模态模型，到视频发布为止，还没有任何LLM Interface框架支持这个模型
@donzhu4996 3 месяца назад
3090 24G能带的动么？
@AIsuperdomain 3 месяца назад
应该没问题
@STAR_JUE 3 месяца назад
請問顯存的佔用多少？
@AIsuperdomain 3 месяца назад
使用watch -n 1 nvidia-smi命令查看显存情况，推理的时候占用大概35GB
@jdandrew-n1j 3 месяца назад
@@AIsuperdomain4090显卡的显存才24G，用起来会不会特别卡？
@AIsuperdomain 3 месяца назад
应该会卡
@manyaccscom 3 месяца назад
相比于llama 11b这个模型呢，llama 11b只需要22G的显存就可以跑
@AIsuperdomain 3 месяца назад
11b的llama3.2效果不如这个7b的molmo
@manyaccscom 3 месяца назад
@@AIsuperdomain 贫穷限制了我啊，molmo这个要求的显存太大了
@wayne8863 3 месяца назад
都说了才7b
@888TON 3 месяца назад
多发点rag项目
@AIsuperdomain 3 месяца назад ⁺¹
好的没问题
@888TON 3 месяца назад
@@AIsuperdomain 居一
@jarade815 3 месяца назад
提示词只支持英文？
@AIsuperdomain 3 месяца назад
可以用中文
@vincentn1371 3 месяца назад
👍👍👍
@AIsuperdomain 3 месяца назад
谢谢支持
@jdandrew-n1j 3 месяца назад
4090能跑么
@AIsuperdomain 3 месяца назад
4090显存是24GB吧，应该没问题
@varyli 3 месяца назад
0秒找到可能存在幸存者偏差😂
@AIsuperdomain 3 месяца назад
这个例子在前几期多模态大模型的视频中都详细演示了
@ddwinhzy 3 месяца назад
Molmo
@AIsuperdomain 3 месяца назад
对

Следующие

Автовоспроизведение

超越GPT-4o视觉能力？本地部署Qwen2-VL多模态视觉大模型！超越人类的视觉理解能力，精准识别X光片判断骨折、CT扫描检测癌症，还能识别手写体汉字与英文！#qwen2 #aigc #ai

超越GPT-4o视觉能力？本地部署Qwen2-VL多模态视觉大模型！超越人类的视觉理解能力，精准识别X光片判断骨折、CT扫描检测癌症，还能识别手写体汉字与英文！#qwen2 #aigc #ai

离谱！完全不懂编程，我竟然4小时靠AI复刻出月入$600k的APP的同款，方法居然这么简单?（无代码开发）

离谱！完全不懂编程，我竟然4小时靠AI复刻出月入$600k的APP的同款，方法居然这么简单?（无代码开发）

比《人類大歷史》更重要的書：《連結》最完整解析，原來我們對 AI 的看法錯了！？

比《人類大歷史》更重要的書：《連結》最完整解析，原來我們對 AI 的看法錯了！？

Marvel Rivals | Winter Celebration, Joyful Jubilation

Marvel Rivals | Winter Celebration, Joyful Jubilation

Superman - Teaser Trailer Tomorrow

Superman - Teaser Trailer Tomorrow

I.N "HALLUCINATION" | [Stray Kids : SKZ-PLAYER]

I.N "HALLUCINATION" | [Stray Kids : SKZ-PLAYER]

The WORST dog matting I have ever seen in my 13 years as a pet groomer | EXTREME transformation

The WORST dog matting I have ever seen in my 13 years as a pet groomer | EXTREME transformation

全网最深度分析：Lunar Lake能否帮英特尔逆天改命？

全网最深度分析：Lunar Lake能否帮英特尔逆天改命？

一合盖就发热？windows笔记本，为什么连个待机都做不好？【差评君】

一合盖就发热？windows笔记本，为什么连个待机都做不好？【差评君】

2024年AI到底从何学起？AI绘图、AI大语言模型、AI生成视频、AI生成语音各个赛道下都有哪些值得学习的项目 midjourney、SDwebUI、comfyUI、DALL-E3各有什么优势？

2024年AI到底从何学起？AI绘图、AI大语言模型、AI生成视频、AI生成语音各个赛道下都有哪些值得学习的项目 midjourney、SDwebUI、comfyUI、DALL-E3各有什么优势？

【AI编年史】ChatGPT诞生后的700多天，世界发生了什么?

【AI编年史】ChatGPT诞生后的700多天，世界发生了什么?

微调Llama 3大模型！简单几步即可轻松打造自己的专属大模型！无需本地配置即可轻松完成！#llama3 #meta #finetune #aigc #ai #llm #gpt4 #gpt5

微调Llama 3大模型！简单几步即可轻松打造自己的专属大模型！无需本地配置即可轻松完成！#llama3 #meta #finetune #aigc #ai #llm #gpt4 #gpt5

【人工智能】大语言模型需要更好的视觉基础来理解含义 | 谢赛宁 | DiT作者 | 多模态语言模型的视觉缺陷 | 基于视觉搜索引导的多模态大模型 | GPT-4V | CLIP | SEAL

【人工智能】大语言模型需要更好的视觉基础来理解含义 | 谢赛宁 | DiT作者 | 多模态语言模型的视觉缺陷 | 基于视觉搜索引导的多模态大模型 | GPT-4V | CLIP | SEAL

半块RTX4090 玩转70B大语言模型

半块RTX4090 玩转70B大语言模型

颠覆传统AI智能体！微软发布Magentic-One能智能完成各种操作！AI从此不止会聊天！智能浏览网页、自动编程、多Agent协作让AI更懂你的需求，效率提升无限可能！完整部署和使用教程！#ai

颠覆传统AI智能体！微软发布Magentic-One能智能完成各种操作！AI从此不止会聊天！智能浏览网页、自动编程、多Agent协作让AI更懂你的需求，效率提升无限可能！完整部署和使用教程！#ai

如何知道一个大模型在推理和训练时需要多少显存？

如何知道一个大模型在推理和训练时需要多少显存？

Урок ЛЕПКИ (смешное видео, приколы, юмор, поржать, прикол)

Урок ЛЕПКИ (смешное видео, приколы, юмор, поржать, прикол)

ЧТО ДЕЛАТЬ, ЕСЛИ ПРОСПАЛ ШКОЛУ!? МАМА УЗНАЛА! НУЖНО БОЛЬШЕ ЭНЕРГИИ В РОБЛОКС

ЧТО ДЕЛАТЬ, ЕСЛИ ПРОСПАЛ ШКОЛУ!? МАМА УЗНАЛА! НУЖНО БОЛЬШЕ ЭНЕРГИИ В РОБЛОКС

ТЫ В ДЕТСТВЕ С ДРУГОМ И ШКОЛА😂#shorts

ТЫ В ДЕТСТВЕ С ДРУГОМ И ШКОЛА😂#shorts

Revenge Success ✅💯😂 #shorts #trending #funny #comedy #viralvideo

Revenge Success ✅💯😂 #shorts #trending #funny #comedy #viralvideo

Про госпитализацию, предновогодние хлопоты без меня, и первые шаги после операции.

Про госпитализацию, предновогодние хлопоты без меня, и первые шаги после операции.

Британцы снова нас шокируют своими приспособлениями! #uk #секрет #энерголикбез

Британцы снова нас шокируют своими приспособлениями! #uk #секрет #энерголикбез

БАЛДЁЖНЫЙ ПОДКАСТ - ЖИЗНЬ ПОСЛЕ 30

БАЛДЁЖНЫЙ ПОДКАСТ - ЖИЗНЬ ПОСЛЕ 30

с бобром готовим полено 🪵🥴 #шортс #тикток

с бобром готовим полено 🪵🥴 #шортс #тикток