最强中文文本转语音！ChatTTS安装部署方法本地一键部署chattts、谷歌colab部署 GitHub Codespaces部署普通话文本转语音TTS流畅和自然度的天花板中文解说视频必备工具

氪學家

Просмотров 11 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 13 июл 2024
本期视频您将学到。chat tts 的3种使用方法，包括本地部署、谷歌colab部署，GitHub codespaces部署，部署方法100%成功。好兄弟们，这两天相信玩AI 文本转语音的小伙伴都被一个叫chatTTS的文本转语音工具刷屏了。
因为这个项目刚出不久，而且项目方这边更新的也比较频繁，项目分支呢也比较多，所以如果大家在实际使用中遇到和视频不符的情况，也可以看一下我视频下方的评论，也欢迎各位大佬在视频下方随时分享有关这个项目的动态。然后我也会把chatTTS官方的b站链接和Q群放在视频的描述，大家也可以联系官方获取最新的更新。
我简单说一下我使用chattts的一点心得。那chattts在生成语言的流畅度和拟人度上确实效果惊艳，这个大家有目共睹。但是如果目前作为生产力来说还存在一些问题。那首先就是我们无法训练自己的声音，只能用seed值去控制音色，这可能还暂时满足不了有声音定制化需求的小伙伴。当然在官方的开发计划上对于lora的训练也已经在计划之中。其次就是声音的稳定性和长文本输出上，其实当前官方放出的这个版本，并不适合生成太长的文本。那有些小伙伴可能说，我可以将文本切分之后分段生成，那这个是没有问题的，但是实际操作的时候，可能就会遇到切分之后分段文本的音色不统一。即使控制了seed也可能会出现这种情况。所以分段录制只能在一定程度上去解决统一性的问题，实际操作起来理论和成果还是有一定差距。最后就是在不同的硬件上跑，即使控制了seed值生成声音音色也可能会有变化。比如我相同一套参数，在colab上生成五个音频，然后再本地用同样的seed去跑，有三段的音色是差不多的，两段就完全不同。如果大家有控制音色需求的话，最好还是保持同一台设备去做输出。
𝕏 我的推特： / ytkexue
💎加入频道会员享视频优先观看： / @kexue
相关链接：
官方项目：github.com/2noise/ChatTTS
官方B站：space.bilibili.com/455643159
官方Q群：808364215
注意：以下链接为第三方开发者开发，非官方版本：
colab版：github.com/6drf21e/ChatTTS_colab （作者也刚更新了win一键整合包）
GitHub codespaces版：github.com/yihong0618/ChatTTS
win一键包：github.com/jianchang512/ChatT...
关于GPU不生效解决方法：x.com/YTkexue/status/17972158...
热门AI应用：
💎ChatGPT Plus会员合租平台：bit.ly/hezu888
🔥 输入优惠码kxj 享全场95折
🔥 MJ、Netflix等会员均可使用优惠码
视频语言翻译（含对口型）
💎Heygen：bit.ly/Hey-Gen
💎Rask.AI：bit.ly/xRaskAI
💎Elevenlabs：bit.ly/11elevenlabs
✅相关链接：
Stable Diffusion入门到精通教程系列：
• Stable Diffusion教程从入门到精通
谷歌账号注册教程：
• 🐼100%成功！Google账号2023注册...
Stable Diffusion汉化包：
github.com/VinsonLaro/stable-...
短信接码平台：
bit.ly/3uxXNAJ
Midjourney入门到精通教程系列：
• Midjourney教程入门到精通
00:00 前言
01:16 colab 一键部署
07:12 GitHub 一键部署
10:25 本地部署方法1
13:44 本地部署方法2
14:02 使用技巧和不足
Наука

Комментарии • 80

@jjcm6675 Месяц назад
先赞为敬
@kexue Месяц назад
感谢支持哈哈
@user-vw1pq8bb8p Месяц назад ⁺¹
第一个好,可以a卡跑的快感谢
@shawvi3892 Месяц назад
请问下博主，colab里面生成的声音seed后，如何在关闭后的第二天，再次打开colab训练的时候还可以找到这个seed？
@kexue Месяц назад
colab里生成的seed 编号记下来下次重开的时候填入就好了呀
@weijie_wang Месяц назад ⁺⁴
mac用户骂骂咧咧点开了视频，并留下了一个赞😊
@kexue Месяц назад
哈哈
@tyvanhou7800 Месяц назад
macOS真的没有一点办法吗？想用M1的MacBook部署到本地到底能不能实现啊？请教各位神仙哥哥姐姐，神烦！
@fenqin-td9zf Месяц назад
请问你运营这个油管你是服务器ip还是专门买的住宅了
@kexue Месяц назад
就最普通的✈
@fenqin-td9zf Месяц назад
@@kexue 多谢了
@kexue Месяц назад
@@fenqin-td9zf 加油
@fenqin-td9zf Месяц назад
这执行力还是可以了
@user-ze6ys9kx1g Месяц назад
感觉是比GPT-sovits好，sovits用起来吞字情况特别多。
@kexue Месяц назад
嗯不是一个类型的 sovits主打小样本训练克隆 tts主要是流畅度和拟人化
@statnet-bv2qu Месяц назад
good
@kexue Месяц назад
奈斯
@tyvanhou7800 Месяц назад
请问下win一键整合包要如何使用？Mac用户在ai这件事情上感觉严重落后。谢谢作者，期待回复！
@kexue Месяц назад ⁺¹
mac下可以参考这个 github.com/jianchang512/ChatTTS-ui?tab=readme-ov-file#macos-%E4%B8%8B%E6%BA%90%E7%A0%81%E9%83%A8%E7%BD%B2 （我不是mac所以测试不了抱歉）
@tyvanhou7800 Месяц назад
@@kexue 非常感谢您！
@Mobaiya Месяц назад
期待训练模型
@kexue Месяц назад
哈哈好饭不怕晚
@zoearthmoon Месяц назад
❤❤
@user-fe3bo6ss1m Месяц назад ⁺¹
有api接口版本吗？
@kexue Месяц назад
第三个提到的本地版本是有个API的按钮的但是我没测试过
@user-td9mf8ey6r Месяц назад
如何匹配到视频上用？只是读文字，那只能用于播客
@kexue Месяц назад
？？我这个视频的开头算不算用在了视频上。。。如果说要对口型的话需要配合其他lip-sync项目可以参考ruclips.net/video/qWvCFDMdkuA/видео.html
@user-kl5qv5go5o Месяц назад ⁺²
你显卡太牛，我980表示羡慕
@kexue Месяц назад
前。。。前辈好
@weizhang-en9ks Месяц назад
大佬，我问一下为什么我用谷歌云端训练完成，下载模型的时候同时下载了三个模型，但是只有一个下载到了，其余两个蓝色圈圈转完了浏览器下载那里也看不到另外两个模型，下载文件那里也没有😅。
@kexue Месяц назад
？？？这个模型不支持训练啊？
@weizhang-en9ks Месяц назад
@@kexue 不是，我用的是花儿开发的那个谷歌云，训练完成了，下个那个模型的时候只能下载一个，其余的点了下载蓝色圈圈转完也没有看到文件。。。
@weizhang-en9ks Месяц назад
他们都用本地部署，问他们全都不了解，看你用谷歌云想问问你知不知道什么问题，哈哈还请见谅。
@kexue Месяц назад
@@weizhang-en9ks 大概率是梯子不稳或者浏览器拦截了现在浏览器为了安全只能下载一次下载第二次的时候会在地址栏右边有一个感叹号需要手动确认
@weizhang-en9ks Месяц назад
@@kexue 哈哈，他是一点提示都没有就很离谱，我已经换个Dl云端解决了。
@liujinhui7046 Месяц назад
群满了
@kexue Месяц назад
太火了哈哈
@user-jb7mv7bj6e Месяц назад
玩玩可以，还是等后期完善吧
@kexue Месяц назад
嗯官方在憋大招
@iithades Месяц назад
真是盼什么来什么，想学什么就出什么，氪学家威武霸气屌炸天！
@kexue Месяц назад
哈哈请给我寄点护肝片
@iithades Месяц назад
@@kexue 请教个问题大佬，如果我要增加笑声是在想增加的地方填写[laugh]还是填写[uv_laugh]？还有[laugh_2]的意思是啥，laugh 2s么？
@kexue Месяц назад
@@iithades 额参数我也没来得及研究抱歉可以都试一下。。。我主要就调了一下温度还有top p和top k 这几个值调小之后音频会更稳定吃字和错字更少
@user-de4xv7dk6k Месяц назад
同样的音色（一摸一样的配置）2次配的音都不一样，大家有没有测试到
@kexue Месяц назад
有遇到过这种情况可以多刷几次
@dianzhonglong1123 Месяц назад
怎么训练特定的音色呢
@kexue Месяц назад
现在还没开训练。。。
@stu-work3326 Месяц назад
声音模型咋训练呢？
@kexue Месяц назад
官方未开放训练
@stu-work3326 Месяц назад
@@kexue 那只能抽卡，抽出三上老师了啊😅
@kexue Месяц назад
@@stu-work3326 哈哈哈请交出你的番号。。。额不是。。。SEED。。。哔。。。我们是一个正经的频道
@stu-work3326 Месяц назад
@@kexue 不要种子，现在是磁力时代😜
@kexue Месяц назад
@@stu-work3326 啥呀我说的是声音的seed哈哈哈
@jinxing-xv3py Месяц назад
呀咩爹😂
@kexue Месяц назад
哒咩！
@jiupeak9250 Месяц назад
本期番号多少
@kexue Месяц назад ⁺¹
110120119
@vidyamayi Месяц назад
可以克隆声音吗
@kexue Месяц назад
现在不行
@mantulife Месяц назад
不能
@hujuzhang 26 дней назад
你这个头像出个教程可好？
@kexue 26 дней назад
这不用教程啊就是一个静态的图片然后嘴巴用了几个不同的形状拼了一下循环播放
@allaboutEPL Месяц назад
学习ING
@kexue Месяц назад
加油加油！
@RogelSeavey 13 дней назад
QQ群已经满了，申请加入组织。
@kexue 13 дней назад
额我没组织没记录无业游民抱歉大佬。。。
@user-ix8re6lj6g Месяц назад
为什么我关闭了梯子，也关闭了代理，app.exe打不开，打开闪退
@kexue Месяц назад
试一下我视频中提到的另一个
@wujie3883 Месяц назад
只能生成30秒
@user-rc4up2oy6n Месяц назад
话说，up主，使用的是什么靠谱科学上网😂
@user-jb7mv7bj6e Месяц назад
一般只要主做视频的都是自建的，网上教程多的是，还有，这个应该叫youtuber,UP主是B站的称呼
@NoneCc-dw3pm Месяц назад
@@user-jb7mv7bj6e对的，长期使用还是自己搭建一个好
@TPDR 25 дней назад
将近3G的软件下载了，安装过程中提示没发现GPU显卡，只能用CPU生成声音，结果就是处理速度极慢200多字的英文生成声音需要将近10分钟!
@kexue 25 дней назад ⁺¹
关于用GPU的方式我在视频中提到了而且视频下面描述也有方法可以参考下
@TPDR 25 дней назад
@@kexue 谢谢
@kexue 24 дня назад ⁺¹
@@TPDR 加油
@kunzew7503 Месяц назад ⁺¹
如果不能固定住人声，无限制长度，没鸟用
@kexue Месяц назад
下一版可能会好一些这个版本用官方的话说应该是“学术探讨”，只不过没想到放出来这么火
@user-gw7xd8nx3q Месяц назад
群满了
@kexue Месяц назад
哈哈太火了