Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
讲得很好,点赞一下!那比如有办法输入很多个视频整体来做总结和问答不?
是可以的,不过需要对代码做一些调整,如果是多个视频,需要完善你的语义数据库,类似于给数据库里增量放入数据
@@chang-workshop 嗯嗯,您值得完善语义数据库是什么意思?举个不恰当的比方,比如假如我想尝试把您历史上所有做过的视频输入进去,希望生成对您整体的总结,那么我可能怎么搭建这个工程架构比较合适?因为我现在看到的大部分都是对单一视频或者文档的总结,几乎没有看到对多文档/视频整体的总结会是怎么搭建结构,望您指教~
@ 嗯嗯,最简便的方法是把所以视频脚本都解析一次,然后存在一个文档,例如同一个pdf,或者txt里面,可以想像成一本书,每个章节就是一个视频内容的脚本汇总。然后用Langchain的语义分块方案去把这本书分块,接下来转成embedding存入到chromadb,就可以进行语义检索了,利用检索结果作为LLM的context,配合prompt就可以回答你的问题了。 总结来说,就是相比处理单个视频,增加一步把不同视频数据汇总到同一个文档的动作,应该可以满足你的需求。希望可以帮到你😁
@@chang-workshop 确实有道理,感谢感谢!那比如这个时候我要是想再延展下,比如把每个视频的评论和评论的点赞数也放进去的话呢~
@ 哈哈,好问题,我的思考是,在你组织数据时候需要标识这部分内容是评论,同时这些评论关联的视频标题也要明确,这时候同样可以用embedding数据库做语义检索,另外可以尝试knowledge graph驱动的RAG,这样可能更灵活和准确。 还有一个选项,就是汇总这些数据后,用fine tuning,微调模型
这个办法对比直接利用大的上下文(把书直接扔给llm), 哪个办法更好
这个没法比,主要看场景。我个人觉得,rag好一些,主要是灵活度高,数据更新速度快。把书扔给LLM,首先要基于这个llm本身的支持数据量级上限,再大也是有上限的,但是rag灵活很多,数据更精准,可以减少LLM的幻象问题,向量数据库查询出来的数据你还能做mapreduce仔给到llm。但是把书给LLM,易用性好,技术要求低,现在通用大模型都能实现,普通用户随便用。当然RAG相对技术要求高,而且最重要的数据格式化和embedding要求很高
如何總結文章或書本重點? 是否有教學?
Ollam+RAG這一期影片有一些關於pdf的,可以参考
讲得很好,点赞一下!那比如有办法输入很多个视频整体来做总结和问答不?
是可以的,不过需要对代码做一些调整,如果是多个视频,需要完善你的语义数据库,类似于给数据库里增量放入数据
@@chang-workshop 嗯嗯,您值得完善语义数据库是什么意思?举个不恰当的比方,比如假如我想尝试把您历史上所有做过的视频输入进去,希望生成对您整体的总结,那么我可能怎么搭建这个工程架构比较合适?因为我现在看到的大部分都是对单一视频或者文档的总结,几乎没有看到对多文档/视频整体的总结会是怎么搭建结构,望您指教~
@ 嗯嗯,最简便的方法是把所以视频脚本都解析一次,然后存在一个文档,例如同一个pdf,或者txt里面,可以想像成一本书,每个章节就是一个视频内容的脚本汇总。然后用Langchain的语义分块方案去把这本书分块,接下来转成embedding存入到chromadb,就可以进行语义检索了,利用检索结果作为LLM的context,配合prompt就可以回答你的问题了。 总结来说,就是相比处理单个视频,增加一步把不同视频数据汇总到同一个文档的动作,应该可以满足你的需求。希望可以帮到你😁
@@chang-workshop 确实有道理,感谢感谢!那比如这个时候我要是想再延展下,比如把每个视频的评论和评论的点赞数也放进去的话呢~
@ 哈哈,好问题,我的思考是,在你组织数据时候需要标识这部分内容是评论,同时这些评论关联的视频标题也要明确,这时候同样可以用embedding数据库做语义检索,另外可以尝试knowledge graph驱动的RAG,这样可能更灵活和准确。 还有一个选项,就是汇总这些数据后,用fine tuning,微调模型
这个办法对比直接利用大的上下文(把书直接扔给llm), 哪个办法更好
这个没法比,主要看场景。我个人觉得,rag好一些,主要是灵活度高,数据更新速度快。把书扔给LLM,首先要基于这个llm本身的支持数据量级上限,再大也是有上限的,但是rag灵活很多,数据更精准,可以减少LLM的幻象问题,向量数据库查询出来的数据你还能做mapreduce仔给到llm。但是把书给LLM,易用性好,技术要求低,现在通用大模型都能实现,普通用户随便用。当然RAG相对技术要求高,而且最重要的数据格式化和embedding要求很高
如何總結文章或書本重點? 是否有教學?
Ollam+RAG這一期影片有一些關於pdf的,可以参考