AI开发者-就爱瞎鼓捣
AI开发者-就爱瞎鼓捣
  • Видео 32
  • Просмотров 38 618

Видео

GraphRAG与普通RAG比较,效果,速度,费用
Просмотров 3,2 тыс.7 часов назад
GraphRAG与普通RAG比较,效果,速度,费用
Gemma2和Qwen2谁才是开源一哥?
Просмотров 423День назад
比较一下Gemma2与Qwen2看看谁才是开源大模型的一哥?
来围观下网友分享的OpenAI API的梦幻式预算控制
Просмотров 908День назад
来围观下网友分享的OpenAI API的梦幻式预算控制
如何将ollama升级来试用Gemma2?
Просмотров 294День назад
如何将ollama升级来试用Gemma2?
爱鼓捣AI排行榜3:OpenAI限制国内访问会带火Qwen2-72B吗?
Просмотров 16714 дней назад
爱鼓捣AI排行榜第三期发布,一起来看看本周大模型的人气指数有哪些变化。
从0.5B到340B的LLM都需要多少显存?
Просмотров 43114 дней назад
本期视频介绍了LLM推理时所需显存与推理速度,以及Batch-Size,上下文长度,不同量化如何影响显存与推理速度。
AI排行榜2024.06.16:Qwen2, GLM-4谁更能打?
Просмотров 21321 день назад
爱鼓捣AI排行榜第二期,已经正式发布了。一起来看看谁是国产模型的老大?
爱鼓捣AI排行榜 1:谁是Ollama,Huggingface上大模型人气王?
Просмотров 209Месяц назад
爱鼓捣AI排行榜 1:谁是Ollama,Huggingface上大模型人气王?
晒账单:1400亿参数大模型运行一次要多少钱?
Просмотров 267Месяц назад
晒账单:1400亿参数大模型运行一次要多少钱?
实测2360亿参数的最大开源大模型DeepSeek V2,学生党一样可以玩儿
Просмотров 465Месяц назад
实测一下最大的开源大模型DeepSeek-v2,来看看这个2360亿参数的大模型运行需要多少显存。
一次搞懂RAG评估,三个角度LangChain,LlamaIndex,RAGAS看RAG评估
Просмотров 467Месяц назад
本视频为你介绍三个权威的RAG评估教程以及两个理解RAG评估指标的视角。 #rag #langchain #llamaindex #ragas #RAG评估
99%的人都没有意识到的OpenAI代差
Просмотров 411Месяц назад
来体会下正在由OpenAI引领和推动,由LLM所引起的产品代差,OpenAI代差。
如何使用LangSmith创建测试数据以及对RAG评估
Просмотров 697Месяц назад
本视频为您讲解如何通过使用LangSmith创建评价RAG的数据集以及对RAG评估。
如何在OneThingAI的云服务器上学习RAG?
Просмотров 446Месяц назад
本期视频为你介绍一下如何在OneThingAI的云服务器上从零开始运行一个RAG程序。
GPT-4o是如何做到低延迟实时对话的?
Просмотров 1,1 тыс.Месяц назад
GPT-4o是如何做到低延迟实时对话的?
RAG共学二:RAG中如何进行查询转换?
Просмотров 5812 месяца назад
RAG共学二:RAG中如何进行查询转换?
RAG共学一:16个问题帮你快速入门RAG
Просмотров 1,3 тыс.2 месяца назад
RAG共学一:16个问题帮你快速入门RAG
ReRank与Embedding模型的区别? 如何选择ReRank模型?
Просмотров 1,4 тыс.2 месяца назад
ReRank与Embedding模型的区别? 如何选择ReRank模型?
如何选择RAG的Embedding模型?
Просмотров 1,7 тыс.2 месяца назад
如何选择RAG的Embedding模型?
什么是LangChain,RAG?AI开发者如何学习RAG?
Просмотров 3,3 тыс.3 месяца назад
什么是LangChain,RAG?AI开发者如何学习RAG?
揭秘Ollama: 20个问题带你从零到精通
Просмотров 9213 месяца назад
揭秘Ollama: 20个问题带你从零到精通
ChatGPT高仿版WebUI:Ollama + Open WebUI本地环境搭建
Просмотров 3,7 тыс.3 месяца назад
ChatGPT高仿版WebUI:Ollama Open WebUI本地环境搭建
两分钟快速入门 ollama windows安装,小白也能在本地运行开源大模型
Просмотров 1,2 тыс.3 месяца назад
两分钟快速入门 ollama windows安装,小白也能在本地运行开源大模型
如何选择LLM本机推理,部署工具?看看LLM的推荐和统计数据吧
Просмотров 9573 месяца назад
如何选择LLM本机推理,部署工具?看看LLM的推荐和统计数据吧
小显卡玩转大模型,模型分层推理法
Просмотров 3,3 тыс.3 месяца назад
小显卡玩转大模型,模型分层推理法
如何知道一个大模型在推理和训练时需要多少显存?
Просмотров 5 тыс.4 месяца назад
如何知道一个大模型在推理和训练时需要多少显存?
开源大模型下载量大比拼,谁是当下最人气的大模型?
Просмотров 1,1 тыс.4 месяца назад
开源大模型下载量大比拼,谁是当下最人气的大模型?
Linux上搭建Jupyter Notebook开发环境,以及使用GPU的方法
Просмотров 3254 месяца назад
Linux上搭建Jupyter Notebook开发环境,以及使用GPU的方法
谷歌最新开源大模型 Gemma 性能如何?如何使用?
Просмотров 3,2 тыс.4 месяца назад
谷歌最新开源大模型 Gemma 性能如何?如何使用?

Комментарии

  • @xichon147
    @xichon147 13 часов назад

    請問下 是否可以提供您使用的本地LLM的硬件設備規格呢? 感謝

  • @yujeong8373
    @yujeong8373 2 дня назад

    Gemini API會降低一點費用,也可以得到還不錯的內容回答

  • @icatzhao6780
    @icatzhao6780 2 дня назад

    太好了,正好有用

  • @rogerroan7583
    @rogerroan7583 2 дня назад

    又貴又慢,贏那一點點,cp值不高,如果要做貫穿全文的回答,在處理文本後再用summary chain做一份摘要,就具有貫穿全文的能力與回答細節的能力,相較下較便宜

    • @techdiylife
      @techdiylife 2 дня назад

      KG并不新,不过GraphRAG是一种新的实现方法。

  • @rogerroan7583
    @rogerroan7583 2 дня назад

    比這要幹嘛?下個禮拜又有其他一哥了

  • @yiqiujia4587
    @yiqiujia4587 2 дня назад

    费钱啊,换成国产deepseek-chat模型最后跑不过,因为json格式不闭合,造成执行失败。

    • @techdiylife
      @techdiylife 2 дня назад

      是不是因为max-token影响的?也可能是生成中断了。目前这个程序还是有很多地方需要优化的。

  • @rogerroan7583
    @rogerroan7583 2 дня назад

    27b還是太肥了

  • @user-xf3ty7cx9b
    @user-xf3ty7cx9b 2 дня назад

    用本地模型跑一个试试

    • @techdiylife
      @techdiylife 2 дня назад

      在试呢,回头会分享。

  • @Yu-qh8fx
    @Yu-qh8fx 2 дня назад

    我很好奇生产的索引是什么样子的。可以用来生产知识图谱,自己看而不是给AI吗?

    • @techdiylife
      @techdiylife 2 дня назад

      是可以查看的,下次录个视频介绍一下。

  • @choychii
    @choychii 2 дня назад

    Anythinllm 跟這graphrag 是不是差不多?

    • @techdiylife
      @techdiylife 2 дня назад

      简单看了一下anytingllm。应该是不一样的。GraphRAG算是一种新的RAG处理方法。

  • @donzhu4996
    @donzhu4996 2 дня назад

    真贵

  • @user-wz3dp5ej5k
    @user-wz3dp5ej5k 6 дней назад

    请问本地安装和网页不同,则选择哪种呢

  • @user-ed6rh4es5m
    @user-ed6rh4es5m 9 дней назад

    你好,请问为什么int8和int4的Training using Adam 给的数据是N/A

    • @techdiylife
      @techdiylife 9 дней назад

      你要使用量化模型进行训练吗?量化模型训练需要一些特殊的处理。可以去网上找找参考代码。

  • @yuc.w.1217
    @yuc.w.1217 10 дней назад

    實際測試起來,計算量頗大,它是一對對計算再排名,如果要即時,這步需要想辦法加速。照博主建議的嘗試了其中一個模型,覺得rerank的效果不明顯,不知道博主認為什麼情況特別適合使用reranker呢?

    • @techdiylife
      @techdiylife 9 дней назад

      reranker主要是带来的检索准确度提升。如果提升不大的话,对最终生成可能影响也不大。如果你希望选择尽量少的检索文本时,比如top1,提升准确度就比较关键了。如果选择top5,top10 rerank的影响就不明显。

  • @tony608
    @tony608 10 дней назад

    开始像卖肉的,后来像卖切糕的,最后像卖白粉的

  • @lileo7493
    @lileo7493 12 дней назад

    27b试了,回复有中英混杂情况。而且回答内容太长,话痨。

    • @techdiylife
      @techdiylife 12 дней назад

      这好像是谷歌模型的特点,爱自言自语。

  • @CreativeEnglishTeaching
    @CreativeEnglishTeaching 12 дней назад

    能不能讲讲低显卡配置的电脑能更好的运行本地化的这些模型

    • @techdiylife
      @techdiylife 12 дней назад

      参考这个文档:techdiylife.github.io/blog/topic.html?category2=t08&blogid=0058

  • @techdiylife
    @techdiylife 12 дней назад

    视频中文档:techdiylife.github.io/blog/blog.html?category1=c01&blogid=0060

  • @skystarzero
    @skystarzero 14 дней назад

    安装windows的docker的时候会出现一堆细节问题要解决,GL

  • @ixqkedp1
    @ixqkedp1 17 дней назад

    老師您好,請問7b的模型,chunk size和 overlap要設多少?

    • @techdiylife
      @techdiylife 15 дней назад

      你说的应该是embedding时的设置吧。这个数值与文本是有关的,chunk-size可以在先设置200到512之间,然后根据表现再调整。

  • @ericshum8796
    @ericshum8796 17 дней назад

    阿里巴巴的qwen2確實太誇張,連好幾位外國的ai大佬們都一至認同阿里的qwen2站在全球開源模型的第一位,今天huggingface的創始人clem都說了已經重新做一次測試,qwen2仍然是第一,大家看清楚啊... 不是自己國內的大佬自吹

  • @minglv
    @minglv 18 дней назад

    来了

  • @vaelephant
    @vaelephant 18 дней назад

    清晰易懂,干货满满

  • @xueyuandu
    @xueyuandu 20 дней назад

    这种总结最实在,最受用!辛苦了!

  • @techdiylife
    @techdiylife 20 дней назад

    视频中资料:techdiylife.github.io/blog/topic.html?category2=t08&blogid=0058

  • @ericshum8796
    @ericshum8796 22 дня назад

    我是外行人不懂,但有留意相關的資訊,Qwen2好像是國內唯一能擠進國外權威榜單裡的,openAI那個始創人看得上的評測網站和meta那個楊立昆攪出來的評測網站都分別地看到Qwen2,就只有Qwen2在截圖裡,其他的中國大模型都不知道是否在榜裡

    • @techdiylife
      @techdiylife 22 дня назад

      背靠阿里有实力啊。开源模型从0.5到110B非常全。 代码也加入到Transformers开发库中了。

  • @oenice33613
    @oenice33613 22 дня назад

    HF上面phi3 vision下载量那么大,但除了onnx runtime,还有其他类似Ollama、GPT4all这样简单的工具可以支持吗?

  • @attaidapolo8739
    @attaidapolo8739 24 дня назад

    感谢分享

  • @techdiylife
    @techdiylife 24 дня назад

    最新排名:techdiylife.github.io/blog/topic.html?category2=t08

  • @leesc311
    @leesc311 29 дней назад

    沒有顯卡根本跑不動

    • @techdiylife
      @techdiylife 24 дня назад

      大模型的前提是要有显卡。

  • @leesc311
    @leesc311 29 дней назад

    可以裝, 但是反應很慢

  • @saibinlin4407
    @saibinlin4407 Месяц назад

    那为何部署一个大模型,在阿里云上一年的费用要100万呢?

  • @vichikaru
    @vichikaru Месяц назад

    Ollama, vllm

  • @fay-sx4ys
    @fay-sx4ys Месяц назад

    員工休假場景感覺不出來rag,一句sql加邏輯層就查得出來,套上template 顯示,頂多輸入llm結果人性化一點,rag處理了哪個部分?

  • @user-zn5tn9br3b
    @user-zn5tn9br3b Месяц назад

    我直接 調用 API 就好了,這樣不是比較簡單? 為何還需要用 langchain 呢 ??

  • @qiyang7234
    @qiyang7234 Месяц назад

    你这个环境 可以分享 下不

  • @user-dq7pt8vx6i
    @user-dq7pt8vx6i Месяц назад

    7张A100,打扰了,我还是老老实实用官方api使用token吧

  • @terisaphipps3628
    @terisaphipps3628 Месяц назад

    只需要3张48g的a600。。。

  • @vaelephant
    @vaelephant Месяц назад

    干货

  • @user-rm8ml7cw7l
    @user-rm8ml7cw7l Месяц назад

    非常感谢

  • @pigeatappgood8884
    @pigeatappgood8884 Месяц назад

  • @techdiylife
    @techdiylife Месяц назад

    对AI感兴趣的小伙伴: 共学交流群:techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032 AI共学基地-新人优惠卷:t.zsxq.com/1GVDy

  • @SaySaySee
    @SaySaySee Месяц назад

    3:30 embedding 成向量,save.然後USER問時,再把USER的問題弄成向量,然後再去找出DB裡相似的向量 (缺:訊息丟失 4:15 rerank

  • @SaySaySee
    @SaySaySee Месяц назад

    1:50 embling 2:13 5:00 RAG架構

  • @techdiylife
    @techdiylife Месяц назад

    文档链接:techdiylife.github.io/blog/topic.html?category2=t07&blogid=0052

  • @vaelephant
    @vaelephant Месяц назад

    这个视频内容太重要了

  • @user-so1qu8wx4x
    @user-so1qu8wx4x Месяц назад

    我的docker没正常运行起来,怎么解决?开机后就是stop状态,手动开启也还是stop的,win11环境

  • @user-bq1ve6iv1i
    @user-bq1ve6iv1i Месяц назад

    你好,我使用過後,發現faster-whisper生產的語音時間間隔都是固定的並且為整數,看了你的demo發現不一樣,請問你知道是甚麼問題嗎?

  • @techdiylife
    @techdiylife Месяц назад

    云服务器注册链接: onethingai.com/invitation?code=WXCP_QX9dTsRE 视频中的技术文档,代码: techdiylife.github.io/blog/topic.html?category2=t07&blogid=0051