最强中文文本转语音!ChatTTS安装部署方法 本地一键部署chattts、谷歌colab部署 GitHub Codespaces部署 普通话文本转语音TTS流畅和自然度的天花板 中文解说视频必备工具

Поделиться
HTML-код
  • Опубликовано: 13 июл 2024
  • 本期视频您将学到。chat tts 的3种使用方法,包括本地部署、谷歌colab部署,GitHub codespaces部署,部署方法100%成功。好兄弟们,这两天相信玩AI 文本转语音的小伙伴都被一个叫chatTTS的文本转语音工具刷屏了。
    因为这个项目刚出不久,而且项目方这边更新的也比较频繁,项目分支呢也比较多,所以如果大家在实际使用中遇到和视频不符的情况,也可以看一下我视频下方的评论,也欢迎各位大佬在视频下方随时分享有关这个项目的动态。然后我也会把chatTTS官方的b站链接和Q群放在视频的描述,大家也可以联系官方获取最新的更新。
    我简单说一下我使用chattts的一点心得。那chattts在生成语言的流畅度和拟人度上确实效果惊艳,这个大家有目共睹。但是如果目前作为生产力来说还存在一些问题。那首先就是我们无法训练自己的声音,只能用seed值去控制音色,这可能还暂时满足不了有声音定制化需求的小伙伴。当然在官方的开发计划上对于lora的训练也已经在计划之中。其次就是声音的稳定性和长文本输出上,其实当前官方放出的这个版本,并不适合生成太长的文本。那有些小伙伴可能说,我可以将文本切分之后分段生成,那这个是没有问题的,但是实际操作的时候,可能就会遇到切分之后分段文本的音色不统一。即使控制了seed也可能会出现这种情况。所以分段录制只能在一定程度上去解决统一性的问题,实际操作起来理论和成果还是有一定差距。最后就是在不同的硬件上跑,即使控制了seed值生成声音音色也可能会有变化。比如我相同一套参数,在colab上生成五个音频,然后再本地用同样的seed去跑,有三段的音色是差不多的,两段就完全不同。如果大家有控制音色需求的话,最好还是保持同一台设备去做输出。
    𝕏 我的推特: / ytkexue
    💎加入频道会员 享视频优先观看: / @kexue
    相关链接:
    官方项目:github.com/2noise/ChatTTS
    官方B站:space.bilibili.com/455643159
    官方Q群:808364215
    注意:以下链接为第三方开发者开发,非官方版本:
    colab版:github.com/6drf21e/ChatTTS_colab (作者也刚更新了win一键整合包)
    GitHub codespaces版:github.com/yihong0618/ChatTTS
    win一键包:github.com/jianchang512/ChatT...
    关于GPU不生效解决方法:x.com/YTkexue/status/17972158...
    热门AI应用:
    💎ChatGPT Plus会员合租平台:bit.ly/hezu888
    🔥 输入优惠码kxj 享全场95折
    🔥 MJ、Netflix等会员均可使用优惠码
    视频语言翻译(含对口型)
    💎Heygen:bit.ly/Hey-Gen
    💎Rask.AI:bit.ly/xRaskAI
    💎Elevenlabs:bit.ly/11elevenlabs
    ✅相关链接:
    Stable Diffusion入门到精通教程系列:
    • Stable Diffusion教程 从入门到精通
    谷歌账号注册教程:
    • 🐼100%成功!Google账号2023注册...
    Stable Diffusion汉化包:
    github.com/VinsonLaro/stable-...
    短信接码平台:
    bit.ly/3uxXNAJ
    Midjourney入门到精通教程系列:
    • Midjourney教程 入门到精通
    00:00 前言
    01:16 colab 一键部署
    07:12 GitHub 一键部署
    10:25 本地部署 方法1
    13:44 本地部署 方法2
    14:02 使用技巧和不足
  • НаукаНаука

Комментарии • 80

  • @jjcm6675
    @jjcm6675 Месяц назад

    先赞为敬

    • @kexue
      @kexue  Месяц назад

      感谢支持哈哈

  • @user-vw1pq8bb8p
    @user-vw1pq8bb8p Месяц назад +1

    第一个好,可以a卡跑的快 感谢

  • @shawvi3892
    @shawvi3892 Месяц назад

    请问下博主,colab里面生成的声音seed后,如何在关闭后的第二天,再次打开colab训练的时候还可以找到这个seed?

    • @kexue
      @kexue  Месяц назад

      colab里生成的seed 编号记下来 下次重开的时候填入就好了呀

  • @weijie_wang
    @weijie_wang Месяц назад +4

    mac用户骂骂咧咧点开了视频,并留下了一个赞😊

    • @kexue
      @kexue  Месяц назад

      哈哈

    • @tyvanhou7800
      @tyvanhou7800 Месяц назад

      macOS真的没有一点办法吗?想用M1的MacBook部署到本地到底能不能实现啊?请教各位神仙哥哥姐姐,神烦!

  • @fenqin-td9zf
    @fenqin-td9zf Месяц назад

    请问你运营这个油管你是服务器ip还是专门买的住宅了

    • @kexue
      @kexue  Месяц назад

      就最普通的✈

    • @fenqin-td9zf
      @fenqin-td9zf Месяц назад

      @@kexue 多谢了

    • @kexue
      @kexue  Месяц назад

      @@fenqin-td9zf 加油

  • @fenqin-td9zf
    @fenqin-td9zf Месяц назад

    这执行力还是可以了

  • @user-ze6ys9kx1g
    @user-ze6ys9kx1g Месяц назад

    感觉是比GPT-sovits好,sovits用起来吞字情况特别多。

    • @kexue
      @kexue  Месяц назад

      嗯 不是一个类型的 sovits主打小样本训练克隆 tts主要是流畅度和拟人化

  • @statnet-bv2qu
    @statnet-bv2qu Месяц назад

    good

    • @kexue
      @kexue  Месяц назад

      奈斯

  • @tyvanhou7800
    @tyvanhou7800 Месяц назад

    请问下win一键整合包要如何使用?Mac用户在ai这件事情上感觉严重落后。谢谢作者,期待回复!

    • @kexue
      @kexue  Месяц назад +1

      mac下可以参考这个 github.com/jianchang512/ChatTTS-ui?tab=readme-ov-file#macos-%E4%B8%8B%E6%BA%90%E7%A0%81%E9%83%A8%E7%BD%B2 (我不是mac所以测试不了抱歉)

    • @tyvanhou7800
      @tyvanhou7800 Месяц назад

      @@kexue 非常感谢您!

  • @Mobaiya
    @Mobaiya Месяц назад

    期待训练模型

    • @kexue
      @kexue  Месяц назад

      哈哈 好饭不怕晚

  • @zoearthmoon
    @zoearthmoon Месяц назад

    ❤❤

  • @user-fe3bo6ss1m
    @user-fe3bo6ss1m Месяц назад +1

    有api接口版本吗?

    • @kexue
      @kexue  Месяц назад

      第三个提到的本地版本是有个API的按钮的 但是我没测试过

  • @user-td9mf8ey6r
    @user-td9mf8ey6r Месяц назад

    如何匹配到视频上用?只是读文字,那只能用于播客

    • @kexue
      @kexue  Месяц назад

      ??我这个视频的开头算不算用在了视频上。。。如果说要对口型的话 需要配合其他lip-sync项目 可以参考ruclips.net/video/qWvCFDMdkuA/видео.html

  • @user-kl5qv5go5o
    @user-kl5qv5go5o Месяц назад +2

    你显卡太牛,我980表示羡慕

    • @kexue
      @kexue  Месяц назад

      前。。。前辈好

  • @weizhang-en9ks
    @weizhang-en9ks Месяц назад

    大佬,我问一下 为什么我用谷歌云端训练完成,下载模型的时候同时下载了三个模型,但是只有一个下载到了,其余两个蓝色圈圈转完了 浏览器下载那里也看不到另外两个模型,下载文件那里也没有😅。

    • @kexue
      @kexue  Месяц назад

      ???这个模型不支持训练啊?

    • @weizhang-en9ks
      @weizhang-en9ks Месяц назад

      @@kexue 不是,我用的是花儿开发的那个谷歌云,训练完成了,下个那个模型的时候只能下载一个,其余的点了下载 蓝色圈圈转完也没有看到文件。。。

    • @weizhang-en9ks
      @weizhang-en9ks Месяц назад

      他们都用本地部署,问他们全都不了解,看你用谷歌云 想问问你知不知道什么问题,哈哈 还请见谅。

    • @kexue
      @kexue  Месяц назад

      @@weizhang-en9ks 大概率是梯子不稳 或者浏览器拦截了 现在浏览器为了安全只能下载一次 下载第二次的时候 会在地址栏右边 有一个感叹号 需要手动确认

    • @weizhang-en9ks
      @weizhang-en9ks Месяц назад

      @@kexue 哈哈,他是一点提示都没有 就很离谱,我已经换个Dl云端解决了。

  • @liujinhui7046
    @liujinhui7046 Месяц назад

    群满了

    • @kexue
      @kexue  Месяц назад

      太火了哈哈

  • @user-jb7mv7bj6e
    @user-jb7mv7bj6e Месяц назад

    玩玩可以,还是等后期完善吧

    • @kexue
      @kexue  Месяц назад

      嗯 官方在憋大招

  • @iithades
    @iithades Месяц назад

    真是盼什么来什么,想学什么就出什么,氪学家威武霸气屌炸天!

    • @kexue
      @kexue  Месяц назад

      哈哈 请给我寄点护肝片

    • @iithades
      @iithades Месяц назад

      @@kexue 请教个问题大佬,如果我要增加笑声是在想增加的地方填写[laugh]还是填写[uv_laugh]? 还有[laugh_2]的意思是啥,laugh 2s么?

    • @kexue
      @kexue  Месяц назад

      @@iithades 额 参数我也没来得及研究抱歉 可以都试一下。。。我主要就调了一下温度还有top p和top k 这几个值调小之后音频会更稳定 吃字和错字更少

  • @user-de4xv7dk6k
    @user-de4xv7dk6k Месяц назад

    同样的音色(一摸一样的配置)2次配的音都不一样,大家有没有测试到

    • @kexue
      @kexue  Месяц назад

      有遇到过这种情况 可以多刷几次

  • @dianzhonglong1123
    @dianzhonglong1123 Месяц назад

    怎么训练特定的音色呢

    • @kexue
      @kexue  Месяц назад

      现在还没开训练。。。

  • @stu-work3326
    @stu-work3326 Месяц назад

    声音模型咋训练呢?

    • @kexue
      @kexue  Месяц назад

      官方未开放训练

    • @stu-work3326
      @stu-work3326 Месяц назад

      @@kexue 那只能抽卡,抽出三上老师了啊😅

    • @kexue
      @kexue  Месяц назад

      @@stu-work3326 哈哈哈 请交出你的番号。。。额不是。。。SEED。。。哔。。。我们是一个正经的频道

    • @stu-work3326
      @stu-work3326 Месяц назад

      @@kexue 不要种子,现在是磁力时代😜

    • @kexue
      @kexue  Месяц назад

      @@stu-work3326 啥呀 我说的是声音的seed哈哈哈

  • @jinxing-xv3py
    @jinxing-xv3py Месяц назад

    呀咩爹😂

    • @kexue
      @kexue  Месяц назад

      哒咩!

  • @jiupeak9250
    @jiupeak9250 Месяц назад

    本期番号多少

    • @kexue
      @kexue  Месяц назад +1

      110120119

  • @vidyamayi
    @vidyamayi Месяц назад

    可以克隆声音吗

  • @hujuzhang
    @hujuzhang 26 дней назад

    你这个头像出个教程可好?

    • @kexue
      @kexue  26 дней назад

      这不用教程啊 就是一个静态的图片 然后嘴巴用了几个不同的形状拼了一下循环播放

  • @allaboutEPL
    @allaboutEPL Месяц назад

    学习ING

    • @kexue
      @kexue  Месяц назад

      加油加油!

  • @RogelSeavey
    @RogelSeavey 13 дней назад

    QQ群已经满了,申请加入组织。

    • @kexue
      @kexue  13 дней назад

      额 我没组织没记录无业游民抱歉大佬。。。

  • @user-ix8re6lj6g
    @user-ix8re6lj6g Месяц назад

    为什么我关闭了梯子,也关闭了代理,app.exe打不开,打开闪退

    • @kexue
      @kexue  Месяц назад

      试一下我视频中提到的另一个

  • @wujie3883
    @wujie3883 Месяц назад

    只能生成30秒

  • @user-rc4up2oy6n
    @user-rc4up2oy6n Месяц назад

    话说,up主,使用的是什么靠谱科学上网😂

    • @user-jb7mv7bj6e
      @user-jb7mv7bj6e Месяц назад

      一般只要主做视频的都是自建的,网上教程多的是,还有,这个应该叫youtuber,UP主是B站的称呼

    • @NoneCc-dw3pm
      @NoneCc-dw3pm Месяц назад

      ​@@user-jb7mv7bj6e对的,长期使用还是自己搭建一个好

  • @TPDR
    @TPDR 25 дней назад

    将近3G的软件下载了,安装过程中提示没发现GPU显卡,只能用CPU生成声音,结果就是处理速度极慢200多字的英文生成声音需要将近10分钟!

    • @kexue
      @kexue  25 дней назад +1

      关于用GPU的方式我在视频中提到了 而且视频下面描述也有方法 可以参考下

    • @TPDR
      @TPDR 25 дней назад

      @@kexue 谢谢

    • @kexue
      @kexue  24 дня назад +1

      @@TPDR 加油

  • @kunzew7503
    @kunzew7503 Месяц назад +1

    如果不能固定住人声,无限制长度,没鸟用

    • @kexue
      @kexue  Месяц назад

      下一版可能会好一些 这个版本用官方的话说 应该是“学术探讨”,只不过没想到放出来这么火

  • @user-gw7xd8nx3q
    @user-gw7xd8nx3q Месяц назад

    群满了

    • @kexue
      @kexue  Месяц назад

      哈哈太火了