跨全平台的密码管理器bitwarden的自部署项目vaultwarden的docker部署教浏览器扩展插件的使用介绍｜lastpass｜1password｜docker容器系列｜

特朗普話要減稅，咁啲錢從何來❓债市會否出現英國前首相「卓慧思時刻」？｜【PQA】 Jul2024

SERV00注册必备的1个关键设置和3个必备工具配置好环境后准备起飞

I Won. (FIGHT HIGHLIGHTS)

Giving Our Broken BMW The Engine It Deserves

What Happened to the 5 Acre Pond (Bad News)

利用Jan客户端在本地部署Llama3-8b-chinese-chat中文微调大模型输出openAI兼容API同时兼容CPU推理GPU加速

米拉一 (Milaone Channel)

Просмотров 314

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 28 апр 2024
利用Jan客户端在本地部署Llama3-8b-chinese-chat中文微调大模型输出openAI兼容API同时兼容CPU推理GPU加速
技术博客：
www.milaone.com/archives/40.html
discord讨论群：
/ discord
twitter：
/ dcpromo924
这是一个关于使用Llama3大模型进行本地推理的教程。视频主要包括以下内容：
模型介绍：介绍了Meta发布的Llama3大模型，以及一些关于该模型的评价和讨论。
模型选择：讨论了如何选择适合自己需求的模型，包括中文微调的Llama3-8B-Chinese-Chart模型。
推理程序选择：介绍了一种傻瓜式的推理程序Jan，该程序可以支持CPU推理和GPU加速，并且可以转化为OpenAI兼容的API输出。
使用教程：详细展示了如何在Jan客户端中导入模型、启动推理服务以及进行对话测试。
性能测试：展示了在CPU和GPU推理模式下的性能表现，并介绍了如何将模型转换为API并使用OpenAI的翻译服务进行测试。
总结与建议：总结了使用Llama3大模型进行本地推理的优缺点，并给出了一些建议，包括对于一些特定需求建议使用CHatgpt 4等。
这段视频内容相当详细，提供了大量的操作演示和建议，对于想要了解和尝试使用Llama3大模型的人来说应该会很有帮助。
Наука

Комментарии • 8

@liron4954 2 месяца назад
这个方便👍
@user-qe4xu7ql3c 2 месяца назад
能转api 好
@anonymouswhacx 2 месяца назад
intel CPU核显可以加速吗？
@milaone 2 месяца назад
应该不能吧你看我客户端里没有核显选项不是
@anonymouswhacx 2 месяца назад
使用CPU模式的时候CPU占用情况如何啊
@milaone 2 месяца назад
@anonymouswhacx 没跑死，不影响桌面操作，但是cpu肯定100了，没有很夸张，什么桌面卡之类的，我这么老的机器纯cpu都不影响体验，10代以后的估计轻松跑
@lzcell9727 2 месяца назад
这里的GPU加速应该是特指英伟达的CUDA加速，别说是CPU核显不能加速，就算是AMD的硬显卡都加不了。
@milaone 2 месяца назад
对对对你这样说很严谨

Следующие

Автовоспроизведение

跨全平台的密码管理器bitwarden的自部署项目vaultwarden的docker部署教浏览器扩展插件的使用介绍｜lastpass｜1password｜docker容器系列｜

跨全平台的密码管理器bitwarden的自部署项目vaultwarden的docker部署教浏览器扩展插件的使用介绍｜lastpass｜1password｜docker容器系列｜

特朗普話要減稅，咁啲錢從何來❓债市會否出現英國前首相「卓慧思時刻」？｜【PQA】 Jul2024

特朗普話要減稅，咁啲錢從何來❓债市會否出現英國前首相「卓慧思時刻」？｜【PQA】 Jul2024

SERV00注册必备的1个关键设置和3个必备工具配置好环境后准备起飞

SERV00注册必备的1个关键设置和3个必备工具配置好环境后准备起飞

I Won. (FIGHT HIGHLIGHTS)

I Won. (FIGHT HIGHLIGHTS)

Giving Our Broken BMW The Engine It Deserves

Giving Our Broken BMW The Engine It Deserves

What Happened to the 5 Acre Pond (Bad News)

What Happened to the 5 Acre Pond (Bad News)

Fortnite Summer Road Trip Trailer

Fortnite Summer Road Trip Trailer

Cloudflare薅羊毛系列之短链接生成器附带统计图表分析功能|Github开源|pages部署|Cloudflare羊毛小组成员|免费部署|免VPS项目

Cloudflare薅羊毛系列之短链接生成器附带统计图表分析功能|Github开源|pages部署|Cloudflare羊毛小组成员|免费部署|免VPS项目

LAS 숙제 취합과정 2024 07 09 15 05 22

LAS 숙제 취합과정 2024 07 09 15 05 22

SERV00补充问题:利用Github Actions工作流定期自动登录保号|SSH拒绝连接|提示邮件已注册|github家表不准|

SERV00补充问题:利用Github Actions工作流定期自动登录保号|SSH拒绝连接|提示邮件已注册|github家表不准|

完美！一键把内网Web服务搬到公网的方案cloudflare tunnel免费服务设置方法教程|摆脱反代服务器Nginx Proxy Manage|docker绝配|一键建站|web安全|内网映射|

完美！一键把内网Web服务搬到公网的方案cloudflare tunnel免费服务设置方法教程|摆脱反代服务器Nginx Proxy Manage|docker绝配|一键建站|web安全|内网映射|

真的靈！風水大師蘇民峰：家門口放這3樣東西，第二天就有橫財進門！你逃都逃不掉！#曾仕強#民間俗語#中國文化#國學#國學智慧#佛學知識#人生感悟#人生哲理#佛教故事

真的靈！風水大師蘇民峰：家門口放這3樣東西，第二天就有橫財進門！你逃都逃不掉！#曾仕強#民間俗語#中國文化#國學#國學智慧#佛學知識#人生感悟#人生哲理#佛教故事

五臺山中國佛教第一山，究竟有什麽特別之處？見過大場面的馬爺都認慫坦言害怕！ #观复嘟嘟#马未都#圆桌派#窦文涛#中国#历史

五臺山中國佛教第一山，究竟有什麽特別之處？見過大場面的馬爺都認慫坦言害怕！ #观复嘟嘟#马未都#圆桌派#窦文涛#中国#历史

只需要一个域名!利用cloudflare workers&pages部署临时邮箱管理系统.|羊毛小组项目|Temp Mail Server|

只需要一个域名!利用cloudflare workers&pages部署临时邮箱管理系统.|羊毛小组项目|Temp Mail Server|

免登录的chatgpt3.5 转免费chatgpt API的docker应用Aurora部署｜免费chatgpt api 代理｜

免登录的chatgpt3.5 转免费chatgpt API的docker应用Aurora部署｜免费chatgpt api 代理｜

解決 Docker Hub 访问受限问题：--自建--CF--镜像服务实战

解決 Docker Hub 访问受限问题：--自建--CF--镜像服务实战

Он придумал гениальную идею, как исправить разбитый экран! 🤯 | Credit : gertieinar (TT)

Он придумал гениальную идею, как исправить разбитый экран! 🤯 | Credit : gertieinar (TT)

iPhone 15 Pro в реальной жизни

iPhone 15 Pro в реальной жизни

Зачем ЭТО электрику? #секрет #прибор #энерголикбез

Зачем ЭТО электрику? #секрет #прибор #энерголикбез

Aura 879dsp новинка и хит

Aura 879dsp новинка и хит

Android или iPhone - Какой Смартфон Лучше Купить в 2024 Году

Android или iPhone — Какой Смартфон Лучше Купить в 2024 Году

Генерация кадров, апскейл и задержка ввода. - Изучаем и тестируем FSR 3.1

Генерация кадров, апскейл и задержка ввода. — Изучаем и тестируем FSR 3.1

New setup part 3: There's still a lot to add #setup #gamer #gameroom #techhouse #gamingtech

New setup part 3: There's still a lot to add #setup #gamer #gameroom #techhouse #gamingtech

Гениальное решение для вашего телевизора

Гениальное решение для вашего телевизора