Видео 32
Просмотров 38 618

GraphRAG与普通RAG比较，效果，速度，费用

6:25

Gemma2和Qwen2谁才是开源一哥？

4:23

来围观下网友分享的OpenAI API的梦幻式预算控制

2:07

如何将ollama升级来试用Gemma2？

3:51

爱鼓捣AI排行榜3：OpenAI限制国内访问会带火Qwen2-72B吗？

2:32

从0.5B到340B的LLM都需要多少显存？

5:58

GraphRAG制作的《凡人修仙传》知识图谱长什么样？

本视频带你来看一下GraphRAG生成的知识图谱。一起来看看它到底长什么样子。

Видео

6:25

GraphRAG与普通RAG比较，效果，速度，费用

Просмотров 3,2 тыс.7 часов назад

GraphRAG与普通RAG比较，效果，速度，费用

4:23

Gemma2和Qwen2谁才是开源一哥？

Просмотров 423День назад

比较一下Gemma2与Qwen2看看谁才是开源大模型的一哥？

2:07

来围观下网友分享的OpenAI API的梦幻式预算控制

Просмотров 908День назад

来围观下网友分享的OpenAI API的梦幻式预算控制

3:51

如何将ollama升级来试用Gemma2？

Просмотров 294День назад

如何将ollama升级来试用Gemma2？

2:32

爱鼓捣AI排行榜3：OpenAI限制国内访问会带火Qwen2-72B吗？

Просмотров 16714 дней назад

爱鼓捣AI排行榜第三期发布，一起来看看本周大模型的人气指数有哪些变化。

5:58

从0.5B到340B的LLM都需要多少显存？

Просмотров 43114 дней назад

本期视频介绍了LLM推理时所需显存与推理速度，以及Batch-Size，上下文长度，不同量化如何影响显存与推理速度。

3:44

AI排行榜2024.06.16：Qwen2, GLM-4谁更能打？

Просмотров 21321 день назад

爱鼓捣AI排行榜第二期，已经正式发布了。一起来看看谁是国产模型的老大？

4:49

爱鼓捣AI排行榜 1：谁是Ollama，Huggingface上大模型人气王？

Просмотров 209Месяц назад

爱鼓捣AI排行榜 1：谁是Ollama，Huggingface上大模型人气王？

5:09

晒账单：1400亿参数大模型运行一次要多少钱？

Просмотров 267Месяц назад

晒账单：1400亿参数大模型运行一次要多少钱？

3:30

实测2360亿参数的最大开源大模型DeepSeek V2，学生党一样可以玩儿

Просмотров 465Месяц назад

实测一下最大的开源大模型DeepSeek-v2，来看看这个2360亿参数的大模型运行需要多少显存。

一次搞懂RAG评估，三个角度LangChain，LlamaIndex，RAGAS看RAG评估

9:10

一次搞懂RAG评估，三个角度LangChain，LlamaIndex，RAGAS看RAG评估

Просмотров 467Месяц назад

本视频为你介绍三个权威的RAG评估教程以及两个理解RAG评估指标的视角。 #rag #langchain #llamaindex #ragas #RAG评估

3:53

99%的人都没有意识到的OpenAI代差

Просмотров 411Месяц назад

来体会下正在由OpenAI引领和推动，由LLM所引起的产品代差，OpenAI代差。

7:41

如何使用LangSmith创建测试数据以及对RAG评估

Просмотров 697Месяц назад

本视频为您讲解如何通过使用LangSmith创建评价RAG的数据集以及对RAG评估。

7:40

如何在OneThingAI的云服务器上学习RAG？

Просмотров 446Месяц назад

本期视频为你介绍一下如何在OneThingAI的云服务器上从零开始运行一个RAG程序。

7:57

GPT-4o是如何做到低延迟实时对话的？

Просмотров 1,1 тыс.Месяц назад

GPT-4o是如何做到低延迟实时对话的？

7:54

RAG共学二：RAG中如何进行查询转换？

Просмотров 5812 месяца назад

RAG共学二：RAG中如何进行查询转换？

8:21

RAG共学一：16个问题帮你快速入门RAG

Просмотров 1,3 тыс.2 месяца назад

RAG共学一：16个问题帮你快速入门RAG

7:35

ReRank与Embedding模型的区别？如何选择ReRank模型？

Просмотров 1,4 тыс.2 месяца назад

ReRank与Embedding模型的区别？如何选择ReRank模型？

9:31

如何选择RAG的Embedding模型？

Просмотров 1,7 тыс.2 месяца назад

如何选择RAG的Embedding模型？

10:53

什么是LangChain，RAG？AI开发者如何学习RAG？

Просмотров 3,3 тыс.3 месяца назад

什么是LangChain，RAG？AI开发者如何学习RAG？

14:48

揭秘Ollama: 20个问题带你从零到精通

Просмотров 9213 месяца назад

揭秘Ollama: 20个问题带你从零到精通

ChatGPT高仿版WebUI：Ollama + Open WebUI本地环境搭建

6:19

ChatGPT高仿版WebUI：Ollama + Open WebUI本地环境搭建

Просмотров 3,7 тыс.3 месяца назад

ChatGPT高仿版WebUI：Ollama Open WebUI本地环境搭建

2:06

两分钟快速入门 ollama windows安装，小白也能在本地运行开源大模型

Просмотров 1,2 тыс.3 месяца назад

两分钟快速入门 ollama windows安装，小白也能在本地运行开源大模型

7:06

如何选择LLM本机推理，部署工具？看看LLM的推荐和统计数据吧

Просмотров 9573 месяца назад

如何选择LLM本机推理，部署工具？看看LLM的推荐和统计数据吧

6:58

小显卡玩转大模型，模型分层推理法

Просмотров 3,3 тыс.3 месяца назад

小显卡玩转大模型，模型分层推理法

8:48

如何知道一个大模型在推理和训练时需要多少显存？

Просмотров 5 тыс.4 месяца назад

如何知道一个大模型在推理和训练时需要多少显存？

9:06

开源大模型下载量大比拼，谁是当下最人气的大模型？

Просмотров 1,1 тыс.4 месяца назад

开源大模型下载量大比拼，谁是当下最人气的大模型？

5:15

Linux上搭建Jupyter Notebook开发环境，以及使用GPU的方法

Просмотров 3254 месяца назад

Linux上搭建Jupyter Notebook开发环境，以及使用GPU的方法

6:11

谷歌最新开源大模型 Gemma 性能如何？如何使用？

Просмотров 3,2 тыс.4 месяца назад

谷歌最新开源大模型 Gemma 性能如何？如何使用？

@xichon147 13 часов назад
請問下是否可以提供您使用的本地LLM的硬件設備規格呢? 感謝
@yujeong8373 2 дня назад
Gemini API會降低一點費用，也可以得到還不錯的內容回答
@icatzhao6780 2 дня назад
太好了，正好有用
@rogerroan7583 2 дня назад
又貴又慢,贏那一點點,cp值不高,如果要做貫穿全文的回答,在處理文本後再用summary chain做一份摘要,就具有貫穿全文的能力與回答細節的能力,相較下較便宜
@techdiylife 2 дня назад
KG并不新，不过GraphRAG是一种新的实现方法。
@rogerroan7583 2 дня назад
比這要幹嘛？下個禮拜又有其他一哥了
@yiqiujia4587 2 дня назад
费钱啊，换成国产deepseek-chat模型最后跑不过，因为json格式不闭合，造成执行失败。
@techdiylife 2 дня назад
是不是因为max-token影响的？也可能是生成中断了。目前这个程序还是有很多地方需要优化的。
@rogerroan7583 2 дня назад
27b還是太肥了
@user-xf3ty7cx9b 2 дня назад
用本地模型跑一个试试
@techdiylife 2 дня назад
在试呢，回头会分享。
@Yu-qh8fx 2 дня назад
我很好奇生产的索引是什么样子的。可以用来生产知识图谱，自己看而不是给AI吗？
@techdiylife 2 дня назад
是可以查看的，下次录个视频介绍一下。
@choychii 2 дня назад
Anythinllm 跟這graphrag 是不是差不多？
@techdiylife 2 дня назад
简单看了一下anytingllm。应该是不一样的。GraphRAG算是一种新的RAG处理方法。
@donzhu4996 2 дня назад
真贵
@user-wz3dp5ej5k 6 дней назад
请问本地安装和网页不同，则选择哪种呢
@user-ed6rh4es5m 9 дней назад
你好，请问为什么int8和int4的Training using Adam 给的数据是N/A
@techdiylife 9 дней назад
你要使用量化模型进行训练吗？量化模型训练需要一些特殊的处理。可以去网上找找参考代码。
@yuc.w.1217 10 дней назад
實際測試起來，計算量頗大，它是一對對計算再排名，如果要即時，這步需要想辦法加速。照博主建議的嘗試了其中一個模型，覺得rerank的效果不明顯，不知道博主認為什麼情況特別適合使用reranker呢？
@techdiylife 9 дней назад
reranker主要是带来的检索准确度提升。如果提升不大的话，对最终生成可能影响也不大。如果你希望选择尽量少的检索文本时，比如top1，提升准确度就比较关键了。如果选择top5，top10 rerank的影响就不明显。
@tony608 10 дней назад
开始像卖肉的，后来像卖切糕的，最后像卖白粉的
@lileo7493 12 дней назад
27b试了，回复有中英混杂情况。而且回答内容太长，话痨。
@techdiylife 12 дней назад
这好像是谷歌模型的特点，爱自言自语。
@CreativeEnglishTeaching 12 дней назад
能不能讲讲低显卡配置的电脑能更好的运行本地化的这些模型
@techdiylife 12 дней назад
参考这个文档：techdiylife.github.io/blog/topic.html?category2=t08&blogid=0058
@techdiylife 12 дней назад
视频中文档：techdiylife.github.io/blog/blog.html?category1=c01&blogid=0060
@skystarzero 14 дней назад
安装windows的docker的时候会出现一堆细节问题要解决，GL
@ixqkedp1 17 дней назад
老師您好，請問7b的模型，chunk size和 overlap要設多少？
@techdiylife 15 дней назад
你说的应该是embedding时的设置吧。这个数值与文本是有关的，chunk-size可以在先设置200到512之间，然后根据表现再调整。
@ericshum8796 17 дней назад
阿里巴巴的qwen2確實太誇張，連好幾位外國的ai大佬們都一至認同阿里的qwen2站在全球開源模型的第一位，今天huggingface的創始人clem都說了已經重新做一次測試，qwen2仍然是第一，大家看清楚啊... 不是自己國內的大佬自吹
@minglv 18 дней назад
来了
@vaelephant 18 дней назад
清晰易懂，干货满满
@xueyuandu 20 дней назад
这种总结最实在，最受用！辛苦了！
@techdiylife 20 дней назад
视频中资料：techdiylife.github.io/blog/topic.html?category2=t08&blogid=0058
@ericshum8796 22 дня назад
我是外行人不懂，但有留意相關的資訊，Qwen2好像是國內唯一能擠進國外權威榜單裡的，openAI那個始創人看得上的評測網站和meta那個楊立昆攪出來的評測網站都分別地看到Qwen2，就只有Qwen2在截圖裡，其他的中國大模型都不知道是否在榜裡
@techdiylife 22 дня назад
背靠阿里有实力啊。开源模型从0.5到110B非常全。代码也加入到Transformers开发库中了。
@oenice33613 22 дня назад
HF上面phi3 vision下载量那么大，但除了onnx runtime，还有其他类似Ollama、GPT4all这样简单的工具可以支持吗？
@attaidapolo8739 24 дня назад
感谢分享
@techdiylife 24 дня назад
最新排名：techdiylife.github.io/blog/topic.html?category2=t08
@leesc311 29 дней назад
沒有顯卡根本跑不動
@techdiylife 24 дня назад
大模型的前提是要有显卡。
@leesc311 29 дней назад
可以裝, 但是反應很慢
@saibinlin4407 Месяц назад
那为何部署一个大模型，在阿里云上一年的费用要100万呢？
@vichikaru Месяц назад
Ollama, vllm
@fay-sx4ys Месяц назад
員工休假場景感覺不出來rag，一句sql加邏輯層就查得出來，套上template 顯示，頂多輸入llm結果人性化一點，rag處理了哪個部分？
@user-zn5tn9br3b Месяц назад
我直接調用 API 就好了，這樣不是比較簡單？為何還需要用 langchain 呢 ??
@qiyang7234 Месяц назад
你这个环境可以分享下不
@user-dq7pt8vx6i Месяц назад
7张A100，打扰了，我还是老老实实用官方api使用token吧
@terisaphipps3628 Месяц назад
只需要3张48g的a600。。。
@vaelephant Месяц назад
干货
@user-rm8ml7cw7l Месяц назад
非常感谢
@pigeatappgood8884 Месяц назад
❤
@techdiylife Месяц назад
对AI感兴趣的小伙伴：共学交流群：techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032 AI共学基地-新人优惠卷：t.zsxq.com/1GVDy
@SaySaySee Месяц назад
3:30 embedding 成向量,save.然後USER問時,再把USER的問題弄成向量,然後再去找出DB裡相似的向量 (缺:訊息丟失 4:15 rerank
@SaySaySee Месяц назад
1:50 embling 2:13 5:00 RAG架構
@techdiylife Месяц назад
文档链接：techdiylife.github.io/blog/topic.html?category2=t07&blogid=0052
@vaelephant Месяц назад
这个视频内容太重要了
@user-so1qu8wx4x Месяц назад
我的docker没正常运行起来，怎么解决？开机后就是stop状态，手动开启也还是stop的，win11环境
@user-bq1ve6iv1i Месяц назад
你好，我使用過後，發現faster-whisper生產的語音時間間隔都是固定的並且為整數，看了你的demo發現不一樣，請問你知道是甚麼問題嗎?
@techdiylife Месяц назад
云服务器注册链接： onethingai.com/invitation?code=WXCP_QX9dTsRE 视频中的技术文档，代码： techdiylife.github.io/blog/topic.html?category2=t07&blogid=0051

AI开发者-就爱瞎鼓捣

Видео

Комментарии