请注意!这个文本转语音TTS工具已成精!多数人都大呼上当 最近两周最火的开源工具chattts部署及使用演示教程
HTML-код
- Опубликовано: 1 июн 2024
- 请注意!这个文本转语音TTS工具已成精!多数人都大呼上当 最近两周最火的开源工具chattts部署及使用演示教程
discord讨论群:
/ discord
twitter:
/ dcpromo924
技术博客文章地址
www.milaone.com/archives/77.html
这段视频主要介绍了一个名为ChatTTS的开源文本转语音工具,并详细演示了如何部署和使用它。
介绍ChatTTS:
这是一个近期发布的开源工具,专门设计用于对话场景的文本转语音模型。
支持英文和中文,使用超过十万个小时的数据进行训练,优化了对话任务,实现自然流畅的语言合成,支持多人会话和韵律特征的控制。
模型特点:
ChatTTS在韵律方面超越了大多数开源模型,甚至微软的Azure TTS。
提供了预训练模型,可以进一步研究。
支持手动加入笑声、停顿和插话。
本地推理:
支持CPU和GPU推理。
视频演示了两种部署和使用方法:
命令行方式:
使用Conda安装环境,配置简单,运行快,但参数设置较少。
WebUI方式:
需要克隆仓库和安装多个包,配置复杂,但运行时参数选择更多。
具体操作步骤:
安装Conda并创建Python环境。
演示命令行方式的安装和运行,包括生成语音文件。
介绍WebUI方式的配置和使用,包括手动插入笑声等特殊效果。
性能测试:
CPU推理速度较快,GPU推理速度更快但未达到最佳性能。
展示了CPU和GPU推理的速度对比。
各剪辑信息
00:01:14,563 - 介绍ChatTTS文本转语音工具
00:01:23,840 - ChatTTS的特点和训练数据
00:01:34,800 - 模型的优化和多人会话支持
00:01:46,480 - 韵律特征控制和自然语言合成
00:02:01,520 - 预训练模型和手动加入特殊效果
00:02:22,520 - 支持本地推理和部署方法介绍
00:02:34,280 - 命令行方式的安装和运行示例
00:02:54,600 - WebUI方式的安装和配置
00:03:20,000 - 配置和运行WebUI的步骤
00:03:53,960 - 完整示例和功能总结 Наука
非常及时,很快就出教程 谢谢!
不客气您,这是我们少先队员应该做的
这个真不错,这是目前最好的文本转语音工具了
确实,很难分辨了
微软那个最好
要是能调用api读小说就美了,感觉速度可能不太行,一直用微软的读小说已经很棒了
嗯我回头关注关注,我记得作者给接口格式了,我不用api没关注
微软那个比这个好多了,而且语气也比这个好。
必须装anaconda么,我没有安装貌似也可以,生成的音频会有些问题。
不装可以,明天再调别的项目时,包的版本,pythone的版本有了冲突,这个有可能就运行不了了,用conda等于把每个项目需要的运行环境隔离开了
@@milaone 明白了
chatTTS 有个bug是不能读取 阿拉伯数字,仅能转汉字或英文来读
是的,我也是昨天看到有网友说这个了,期待他能未来跟上吧
视频介绍部分改下ChartTTS
感谢,已改正
能自定义音色吗?比如把自己的音色采样进去,可以的话应该对自媒体行业有很大帮助
官方说后期是有自定义训练的,等等看吧
可以商用嘛
您可以去他仓库看下协议
能读小说吗?
大家都在问能不能读小说,目前这个界面方式没办法读吧,估计要转成api