【AIボイチェン】VC Clientで女の子になろう!Ver2対応版リメイク【RVC】
HTML-код
- Опубликовано: 28 сен 2024
- ※動画で解説しているバージョンをご利用の場合は【クライアントモード】での運用を推奨
2024年9月現在の最新版で使い方を解説しています。
Ver2になり内容が少し変わっていますので参考にしてください!
つまづいたら参考にしてね!
• Post
2PCで快適に配信したい場合はこちら
• 【AIボイチェン】激安2PC環境で快適にVC...
自分でモデル作りたい!!はこちら
• 【RVC】初心者の方向けにRVCの導入からモ...
どうしても起動できない、わからん!という方に…
Koemakeっていうのもあるよ!
• 【AIボイチェン】KoemakeでAIボイチ...
次→声を作ろう編
• 【RVC】実際に声を作ってみよう!音声データ...
その次→歌わせてみよう
• 【RVC】実際に歌わせてみたを作ってみよう!...
VC Client ダウンロードページ
github.com/w-o...
VB Cable
vb-audio.com/C...
YAMAHA syncroom ダウンロードページ
syncroom.yamah...
Booth
booth.pm/ja
Pythonのインストールが必須です。ない場合はエラーで起動できません。
下記より事前にダウンロード、インストールしてください。
当動画で使用しているバージョンは【3.10.10】です。
www.python.org/
twitterでもご質問などにおこたえしますー!
(答えられるはんいで)
こいつコメント見逃してるな??っていうときはtwitterへお願いします
もものせTwitter
/ yumeno_momonose
イラストレータ
ねいろ様
モデリング
おかだ様
変に凝った動画じゃないから逆に分かりやすい
まってたぜぇ。。
うぇい!
もものせさんだ~!Ver2対応版のリメイク動画お疲れさまです!
いつもとても丁寧で、誰でも使えそうな分かりやすい解説ですね!
ここまで細かく解説ができる=VC Clientのことを本当に良く理解していらっしゃるのだなあと思いました。
ずっと「もものせさんボイス」かと思ったら、今回は中の人パートの方が長めなのですね。
当たり前かも知れませんが、変換前/変換後でも説明が丁寧で上手なのは変わりませんし、
地声も 変換後とはまた違った良いお声で魅力的ですよね。
話し方の細かい癖や笑い方等も含めて「どちらもしっかりもものせさんだなあ~」と感じました。
声をいろいろいじって魅力的にするのも大切ですけれど、それ以上にトークスキル大事!と思ってしまいましたw
またお時間ある時、雑談配信等楽しみにしてます!
ありがとうございます☆
今回は少し地声パート多めにしてみましたw
トーク力…間違いないですね!もものせも頑張らねば…!
初回起動時変換がうまくいかず、一度閉じて再起動したのはいいんですが、スタート ストップ パススルーのボタンが消えてしまったのですが、再インストールした方が賢明ですかね、、?
おそらく解凍のところから再度構築した方が話は早いと思われます…💦
やっぱりこういう時にRadeonはちょっと使いづらかったりするんですかねぇ
モデルをonnxへ変換するという工程が発生しますがUIもCUDA版と同じになりましたし使いづらさは減ったと思います!
@@yumeno_momonose なるほど〜ただモデル作成の学習がRadeonだと出来ないんでしたっけ…
@@rice_cake-i6o そうなんです…windowsでの学習はCUDAを使用するためNvidia系GPU必須で💦Google colabを使用しての学習は可能なのでそういったサービスを利用する手もありますね!
1080p表示でも文字が小さくてみずらい......マージやり方知りたいかも
ごめんなさい撮影を4kそのままでやってました💦
マージですね!近々解説あげますね!
v2用動画キタコリェ
うぇい(*'ω'*)
グラボがないと使えないと思うのですが、
グラボくらいの性能があると言われるRyzen 7 8600Gみたいなのでも無理ですか?
RVC使うと自分の滑舌の悪さを実感するw
キーボードの音とか雑音もボイチェンされてしまうんですがどうにかなりませんか?😊
broadcastなどのノイズ抑制ソフトを入れるとましになしますよ!
抑揚のある声や笑い声を出すと、裏返っちゃったり、「ハァ~、ファ~」みたいな掠れた感じを防ぐ方法はありますか?
なかなか難しかったりします💦
元の話者の笑い方や声の出し方にそれなりに依存するため、その発声の仕方になるべく合わせるか特徴の似ている方から学習したモデルを使うとかなり自然になる印象です…!
ver1と比べて何が変わったんですか?
onnxモデル使用時の負荷が軽くなったこと、CUDA版とDirectML版のUIが統一されわかりやすくなったことが大きな変更点かと思います…!
AIボイチェン界隈でも本当に桁違いの出来…
脳みそが破壊された後に性癖が再誕されたわ…
動画投稿お疲れ様です!いつも参考にさせていただいてます!
そこで、もものせさんのお声について、いくつかお伺いしたいことがあります。
・元の音源として、数時間分の音源が1~2個ある形なのか、それとも1分程度の短い音源が数百個ある形なのでしょうか?
・学習の際に設定されたエポック数と、何エポック毎に保存を行っているのか?
・また、元音源はBGM付きの雑談配信(声抽出)などの形でしょうか?それとも、シチュエーションボイスのような音源でしょうか?
以上3点について、差し支えない範囲で教えていただけると嬉しいです。
ご視聴ありがとうございます!
・学習は5分程度に切り分けたデータを10個ほど用意しています
・エポック数は200程度、保存に関しては品質に影響しないため50エポック毎にしています
・元音声はBGMのない配信(映画やアニメの同時視聴)がおすすめです
こんな感じですね!
@@yumeno_momonose
返信ありがとうございます!
5分×10程度でも、かなり高い精度が出せるんですね…驚きです。
私も元音声として同時視聴の音源を探してみたのですが、メンバー限定のものが多かったり、あまり喋られていない方も多くて…。そのため、シチュエーションボイスやBGM付きの配信から音声を抽出して学習させてみました。ただ、特定の音に少しBGMが残ってしまったり、ボイチェン感が出てしまっていてやはり精度が悪かったです。
次は、良さそうな同時視聴配信をしている方を探してみようと思います!質問に丁寧に答えていただき、ありがとうございました!応援してます、頑張ってください~!
とてもきれいな変換で尊敬です!
もし良かったら教えて下さい。
モデルの作成について使用されている事前学習モデルがなにか教えていただけないでしょうか?
当方、Apllioを用いてKLM4.1を使用していますが喋り言葉の変換でここまでの精度が出ないように感じております。
また今回の動画のような収録にOBSなどをお使いかと思っていますが、
VCClientの変換音声にたいして何かしらのプラグイン処理(ノイズ処理やイコライザー等)を実施されていますでしょうか?
もし実施されている場合はどのプラグインでなんの処理を実施されているのか参考にさせていただけると嬉しいです。
以上、お手漉きのときなどに教えていただけると嬉しいです。
おほめいただき光栄でございます(*'ω'*)
事前モデルはRVC1006Nvidiaに最初から入っている(最初から選択されている)モデルです。
普段はOBSを使用しておりますが、特にエフェクトやプラグインなどは使用せず、VCCからの音声をそのまま配信や録画に出力しております…!
凄くわかりやすかったです、cuda版導入してみたのでいろいろ試してみようと思います
早口、まいてるなー
Serverモードにして開始を押して停止を押すと
422[Unprocessable Entity]:
Recording failed. Please check
audio device setting and start
converting.
とでて変換できません~💦
サーバーモードに何か不具合ある気がする💦
クライアントモードでの運用推奨…!
@@yumeno_momonose それがクライアントに戻せないんですぅ〜💦
いったん削除して環境構築しなおし!
サーバ入出力テストをすると422のエラーがでます。
何故でしょうか?
422 Audio Device errorというエラーでしょうか?
もものせさんの動画を拝見してvcclient導入してモデルも購入しちゃいました
もものせさんが自然すぎて驚いています
これはRVCによるものでしょうか。それとももものせさん本人の喋り方によるものもあるのでしょうか
あと、VCClientの各種設定値も参考に教えていただきたいです。
ご視聴ありがとうございます☆
モデルをご購入なさったんですね!ちょっとしたコツですがマイク入力音量は小さめ(VCCの標準は1ですが0.2~0.3くらい)にすると破綻しづらくなります!しゃべり方は特に工夫はしていないです…!
参考
CHUNK 256 (Ver2 21600)
EXTLA 4096
index 0.3
こんな感じで運用しています(*'ω'*)
お返事ありがとうございます
RVCでの学習方法も拝見したのですが素材が見つからずに購入しました
設定値ありがとうございます。参考にさせていただきます
もものせとかいう余計なことせず要件サクッとまとめるの上手い女(男)
誇らしくないの?
誇ってく(*'ω'*)
ずいぶんほめてくれる🍑
start_httpで子マントプロンプトが開いた状態でずっとダウンロードされないです...対処法とかありますか?
ウイルス対策ソフト(ウイルスバスター、ノートン)などが動いている可能性はありますか?
オフにしたら出来ました!
ありがとうございます!!
地声もキレイですね!普通に女の子の声だせそう
ありがとうございます(*'ω'*)
女の子の声は…むずかしいですよね…w
初めまして
動画通り終わって
設定を変えたくて入ろうとしたら何処から入ればば良いのか分からなくなり
最初からやったのですが詳細から情報をクリックして実行をだして入っても小窓が消えてはいれないのですが
どうすれば良いでしょうか?🥲よろしくお願いします
2度目の起動もstart_httpから起動していますか?
小窓が消えるとのことですがcmd(黒い画面)でしょうか?
@@yumeno_momonose再設定を変えたくて8:55 ここをやり直したのですが出て来なくて設定画面まで入れなくて困ってます。
8:55というと黒い画面が表示されてダウンロードが始まるところかと思うのですが、黒い画面自体が立ち上がらないという認識でよろしいでしょうか?
その場合はVisualStudioをインストール→その中のpython開発環境というものをインストール後再起動を行ってみてください…!
なんで変換後もこんなに滑舌がいいんですか?
モデルの品質によると思いますよ!
こちらのお声はい○はさんですか?
違いますよー!
クライアントモードで使用のマイクと仮想オーディオデバイスを選ぶ事ができないのですが対処法分かりますか?
一度windowsの再起動を行ってみてください。
それでも選択不可能な場合は再解凍(以前に解凍したフォルダを削除したうえで)して環境を構築しなおしてみてください…!
すいません、色々といじっていたらできました。使ってみて以前のバージョンと比べて不安定な感じを受けるのですが自分だけでしょうか?
一度安定してしまえば問題ないのですが、初回起動時に若干の不安定さが残っているように思います💦
ただし、負荷の面ではVer2が少し有利に思いますね…!
お疲れ様です!お久しぶりです!動画ありがとうございます。Ver2が出たとのことですがVer1からの移行をする大きな音質の変化やその他メリットってありますか?Ver1をある程度設定済みなのでさほど変わらないならこのままVer1で行こうかなと思ってます。
お久しぶりです!onnxモデルを使用した際の負荷が軽くなった印象を受けました。
GPU負荷が高い状態でも安定しやすくなったような感じがしますね!
なるほど〜!印象では自分の使用環境ではさほど変化は無さそうです。返信ありがとうございました😊またライブ行きます(^^)
動画ありがとうございます。
この度V2を導入したのですが…
サーバーで入力をNvidiaブロードキャストを通すと上手く変換されません。
Clientモードだといい感じなんですが…
他のPCだと上手く変換されるのですが…
一応…ブロードキャストやVCClientを入れ直してみたりしたのですが上手くいかず…
困っています。
何卒助言よろしくお願いします。
ご視聴ありがとうございます!
サーバーモードとのことですのでwindows側とVCC側でサンプリングレートが一致しているか確認してみるといいかもしれません…!
@@yumeno_momonose
VCC側のサンプリングレートはどう変えるのでしょうか?
V2になってから項目が消えてるようなのですが…
ちなみにクライアントモードは問題ないようです。
失礼しました💦Ver2からサンプリングレートの項目はなくなりましたね…!
皆様から問い合わせをいただくのですがサーバーモードでの変換トラブルが多いようです。安定版が出るまでクライアントモードでの運用を行った方がいいかもしれませんね…!