重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

Поделиться
HTML-код
  • Опубликовано: 6 фев 2025

Комментарии • 40

  • @orangkong2110
    @orangkong2110 6 дней назад

    你视频发布速度好快啊!👍Qwen2.5-VL 7B和Deepseek Janus Pro 我这两天本地部署了玩了一下,总体而言,Q识别率高,不仅场景描述,还能有一定识别推理,能识别书法里的比较工整的非繁体字,行书和草书不行,发票不行,falsh-attention 我怎么也装不起来,所以可能速度一般;D速度很快,基本图片描述还可以,但是深度一点的识别推理不行,书法文字不能识别,文生图速度一般,生成的不大符合。

  • @superwaterrider
    @superwaterrider 17 часов назад

    显存要求多少? 手里只有 rtx4090,能两三张卡拼起来用么?

  • @billjoe1769
    @billjoe1769 7 дней назад +6

    网上能搜到的书法作品估计专门训练过,要拿一个素人写的,网上没有的,识别一下。

  • @AA-ze5oj
    @AA-ze5oj 7 дней назад +4

    AI发展远超摩尔定律。迭代很快。
    革命!!!!!!

  • @sshorse
    @sshorse 6 дней назад +1

    請問目前的視覺大模型中,除了PaliGemma之外, 有哪些是可以支持object detection 和 segmentation ?

  • @-kkkirito5658
    @-kkkirito5658 5 дней назад

    求问,M1 Mac要怎么跑?

  • @kunmike
    @kunmike 6 дней назад

    可以用让它看直播预测比赛吗

  • @gwendolynmccullough1287
    @gwendolynmccullough1287 6 дней назад

    大佬,显存占用可以监测一下嘛?不同模型在不同的部署情况下,分别会占用多少显存啊?🧎

  • @Josh-oo4vd
    @Josh-oo4vd 6 дней назад

    想問一下博主的電腦配備, 我的電腦要出現在那些畫面才能知道我的電腦能不能跑得動呢?

  • @sshorse
    @sshorse 6 дней назад +1

    可以做一下Qwen2.5-VL-7B-Instruct 和 deepseek Janus-Pro-7B 的比較嗎? 謝謝

    • @AIsuperdomain
      @AIsuperdomain  6 дней назад +1

      好的 没问题 我尽快安排一期影片

  • @learnfromdata3660
    @learnfromdata3660 7 дней назад +3

    建议博主适当的加点自己的判断,不要全盘拿过来全盘吸收。
    毕竟现在大模型优劣还是能感受到的,使用体验也会有差别,如果实际体验和视频内容出入比较大,这种感觉也不会太好。
    反之,一个好的高质量评测视频也能吸引更多观众。

    • @AIsuperdomain
      @AIsuperdomain  7 дней назад +1

      好的,我会持续改进 谢谢🤝🤝🤝

  • @vincentn1371
    @vincentn1371 7 дней назад

    👍👍👍

  • @yuyao-ib8um
    @yuyao-ib8um 7 дней назад +2

    完整书法作品容易识别,建议将不同书法作品拼接,看看会不会出错。

  • @comusleong
    @comusleong 7 дней назад +2

    請問你的電腦硬件配置是什麼 。才能夠讓本地跑72B的模型 。謝謝

    • @AIsuperdomain
      @AIsuperdomain  7 дней назад +1

      我是从官网用的72B的,我没有那么厉害的硬件能跑这么大的模型

  • @fevonytang
    @fevonytang 6 дней назад

    我都不明白,为什么要本地部署。是担心有一天不开源,收费?如果说担心访问量太大,这是有点用,但这个使用场合太少了,而且现在模型很多,哪个不卡就用哪个。部署下来又不是对本地增加了智能计划的功能,根本上是跟本地隔离的,完全不过是避免网络卡而已。

    • @AIsuperdomain
      @AIsuperdomain  6 дней назад +3

      企业项目99%都要求本地部署,因为怕数据泄露。观看我频道的粉丝大部分也是为企业做开发的

    • @csunltd
      @csunltd 5 дней назад +1

      有这个疑问只能说明你不是干企业业务的

  • @hzc54188
    @hzc54188 7 дней назад

    提交图片的时候,是否可以缺省图片的名称😃

    • @AIsuperdomain
      @AIsuperdomain  7 дней назад +1

      下次我就彻底不将名字命名图片

  • @zdhpeter
    @zdhpeter 7 дней назад +1

    书法可以识别确实有点狠

  • @fevonytang
    @fevonytang 6 дней назад +1

    不行。我给个公务员考试图形推理题,它也做不出来。

  • @hzc54188
    @hzc54188 7 дней назад +2

    哥,提交图片的时候,是否可以将图片文件的名称和图片文件的实际内容错开测试。

    • @AIsuperdomain
      @AIsuperdomain  7 дней назад

      可以,主要是有些图我原本也不知道叫什么,所以将名字作为图片名。但是AI是无法通过图片名识别的

    • @hzc54188
      @hzc54188 7 дней назад

      @ 期待

    • @hzc54188
      @hzc54188 4 дня назад

      @ 好的

    • @lly0571
      @lly0571 4 дня назад

      按照官方的示例接口,LLM看到的只有图片的base64编码,理论上不会产生大的偏差

  • @AA-ze5oj
    @AA-ze5oj 7 дней назад

    特别是在各科学科技专业领域,促进科学技术突破!
    几年内就会发生重大突破!!!

  • @zdhpeter
    @zdhpeter 7 дней назад

    菊石也知道我服气 但我比较好奇 他agent能力到底强不强 毕竟大家还是得干活