Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
感謝分享。粗略使用後,有幾點其他感想:1) 推理生成速度稍慢(RTX 3080 生成時只有30~40 it/s),但音韻品質極佳,很貼近真人;2) 中英文皆可,但中文部分需用簡體中文,繁體中文會有問題;3) 語音種子數要自己一個一個嘗試,才能知道哪個是合適或符合需求的聲音;4) 文字長度不能太長,所以如果想要大規模生成(例如文案撰寫完後,要對其生成完整語音),需要先寫段預處理的程式,用固定長度來斷句(切片),再逐一批量合成。
試用同上
核心语音不错,就是需要预处理,用另一个大模型把符号、阿拉伯数字转换成纯中文、纯英文和能识别的控制符
支持! 請問有方法讓它使用GPU嗎? 每次運行時它都No GPU found use CPU instead.
Any good options for realtime tts?
先赞后看
支持!!
测过之后,感觉很好,个人安装使用的感觉是有点慢,继续观察
为什么我部署不了,显示缺少文件
@@薛岳-q4f 是的, 按照requirement 安装下来, 还是缺文件的,我是继续按提示,缺什么,Pip install 什么。 至少缺2个包。
語音一次只能三十秒嗎?
Need webui and training models.
声音克隆有什么推荐的模型吗?
我也想知道有沒有推薦的。我自己用來用去,目前覺得So-VITS-SVC很好用,但還是希望有更好用的。
每次生成的声音都不一样
软件不错,但是在长文中就会乱读或者乱码。
感謝分享。粗略使用後,有幾點其他感想:1) 推理生成速度稍慢(RTX 3080 生成時只有30~40 it/s),但音韻品質極佳,很貼近真人;2) 中英文皆可,但中文部分需用簡體中文,繁體中文會有問題;3) 語音種子數要自己一個一個嘗試,才能知道哪個是合適或符合需求的聲音;4) 文字長度不能太長,所以如果想要大規模生成(例如文案撰寫完後,要對其生成完整語音),需要先寫段預處理的程式,用固定長度來斷句(切片),再逐一批量合成。
試用同上
核心语音不错,就是需要预处理,用另一个大模型把符号、阿拉伯数字转换成纯中文、纯英文和能识别的控制符
支持! 請問有方法讓它使用GPU嗎? 每次運行時它都No GPU found use CPU instead.
Any good options for realtime tts?
先赞后看
支持!!
测过之后,感觉很好,个人安装使用的感觉是有点慢,继续观察
为什么我部署不了,显示缺少文件
@@薛岳-q4f 是的, 按照requirement 安装下来, 还是缺文件的,我是继续按提示,缺什么,Pip install 什么。 至少缺2个包。
語音一次只能三十秒嗎?
Need webui and training models.
声音克隆有什么推荐的模型吗?
我也想知道有沒有推薦的。我自己用來用去,目前覺得So-VITS-SVC很好用,但還是希望有更好用的。
每次生成的声音都不一样
软件不错,但是在长文中就会乱读或者乱码。