Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
13:12ここ神
とても分かりやすい説明の動画でした。VOICEVOX(既存ボイス)とStyle-Bert-VITS2モデルの比較も違いがはっきり分かる内容でした。とても参考になる動画を配信していただき、ありがとうございました。
すごくわかりやすかたです!!ありがとう!!!
よかったです!ありがとうございます!
すごい
12:00ここで主にいじるのはパラメータのとこですか?そしてこれをaituber-kitで使うためににどこに貼ればいいのですか?
コードはパラメータや処理関連など音声生成に関することを書いています。aituberkitで使うに関しては開発者さんがDiscordサーバーを用意しているのでそちらで聞いてみると分かるかもです。discord.com/invite/5rHEue52nZ
素晴らしいですね。stylebert vitz2から出来た声の感情表現が例えばオーバーだなと思ったら、 句読点 、、 。。などでしか改善させる方法はないのでしょうか? アクセントに関しては 0 1があると思うのですが、、
抑揚パラメーターで調整するか、モデル全体的に感情オーバーであれば他モデルとのマージで感情表現を控えめにするとかかなぁと思います!
最新にバージョンアップしてから、音声の文字起こしでエラーが出るようになったんだけど、なんでですかねぇ??UTF-8のエンコードエラーらしいのですが音声ファイルの名前を半角英数字にしてもエラー出るし、以前は音声ファイルが日本語名でも文字起こし出来たんですが。
うーん、私の環境ではそのようなエラーは確認できませんでした...解決しない場合は再インストールやバージョン変更するなどが良いかもしれません。お役に立てず申し訳ないです🙏
最近自分も同じエラー出て、hugging feceのwhisperを使うのチェック外したら文字起こしできるようになった。多分根本的な解決じゃなくて、以前の方式使ってる的な対処だと思うけど…
動画ありがとうございます。私は音声の文字お越しでエラーになるのですがPCのスペック不足でしょうか。PCのスペックを概要欄に書いていただけると助かります。
概要欄に使用したPCのスペック記載しました。明確な原因は断言できませんが、HuggingFaceのWhisperを使うをチェック外して行うと解決した事例もあるようです。VRAM負荷が原因かもしれないです。
音声の文字おこしの時点でこのようなエラーが出てきて、文字おこしができていませんでした。AssertionError: Torch not compiled with CUDA enabled原因がわからず、進めません...CUDA118 と Pytorch はインストールされており、その確認のためPython環境で次のコマンドを実行しました。>>> import torch>>> print(torch.cuda.is_available())TrueこれよりCUDAは認識されているはずです。
CUDAに対応したPyTorchバージョンを使用していますでしょうか?こちら確認頂き、必要に応じてPyTorch再インストールすると解決するかもしれません。
@@yuki_26 解決しました。ありがとうございます
13:12ここ神
とても分かりやすい説明の動画でした。
VOICEVOX(既存ボイス)とStyle-Bert-VITS2モデルの比較も違いがはっきり分かる内容でした。
とても参考になる動画を配信していただき、ありがとうございました。
すごくわかりやすかたです!!ありがとう!!!
よかったです!
ありがとうございます!
すごい
12:00ここで主にいじるのはパラメータのとこですか?そしてこれをaituber-kitで使うためににどこに貼ればいいのですか?
コードはパラメータや処理関連など音声生成に関することを書いています。
aituberkitで使うに関しては開発者さんがDiscordサーバーを用意しているのでそちらで聞いてみると分かるかもです。
discord.com/invite/5rHEue52nZ
素晴らしいですね。
stylebert vitz2から出来た声の感情表現が例えばオーバーだなと思ったら、 句読点 、、 。。などでしか改善させる方法はないのでしょうか? アクセントに関しては 0 1があると思うのですが、、
抑揚パラメーターで調整するか、モデル全体的に感情オーバーであれば他モデルとのマージで感情表現を控えめにするとかかなぁと思います!
最新にバージョンアップしてから、音声の文字起こしでエラーが出るようになったんだけど、なんでですかねぇ??
UTF-8のエンコードエラーらしいのですが音声ファイルの名前を半角英数字にしてもエラー出るし、以前は音声ファイルが日本語名でも文字起こし出来たんですが。
うーん、私の環境ではそのようなエラーは確認できませんでした...
解決しない場合は再インストールやバージョン変更するなどが良いかもしれません。
お役に立てず申し訳ないです🙏
最近自分も同じエラー出て、hugging feceのwhisperを使うのチェック外したら文字起こしできるようになった。
多分根本的な解決じゃなくて、以前の方式使ってる的な対処だと思うけど…
動画ありがとうございます。
私は音声の文字お越しでエラーになるのですがPCのスペック不足でしょうか。
PCのスペックを概要欄に書いていただけると助かります。
概要欄に使用したPCのスペック記載しました。
明確な原因は断言できませんが、HuggingFaceのWhisperを使うをチェック外して行うと解決した事例もあるようです。
VRAM負荷が原因かもしれないです。
音声の文字おこしの時点でこのようなエラーが出てきて、文字おこしができていませんでした。
AssertionError: Torch not compiled with CUDA enabled
原因がわからず、進めません...
CUDA118 と Pytorch はインストールされており、その確認のためPython環境で次のコマンドを実行しました。
>>> import torch
>>> print(torch.cuda.is_available())
True
これよりCUDAは認識されているはずです。
CUDAに対応したPyTorchバージョンを使用していますでしょうか?
こちら確認頂き、必要に応じてPyTorch再インストールすると解決するかもしれません。
@@yuki_26 解決しました。ありがとうございます