Hello. I have an OSS called voicevox running on my command prompt, it is made of FastAPI and when I POST it, it returns the synthesized speech result. github is in Japanese, so I recommend you to translate it and look at it 😀. github:github.com/VOICEVOX/voicevox_engine
この動画ものすごく役に立ちます!動画主に感謝🙏
保存しました❗️感謝です🙌
素晴らしい😂
うお…!欲しかったものがまさかこんな簡単に…!?
chatBOTと組み合わせてコールセンターみたいなのもできそうですね
定型文で返すなら事足りそうですねー。クレーマーの対処とかやってくれないかな?
自分がやってみたかった事が動画であって見させていただきました!
いざやってみようとソースコードを拝借して見た所実行しても音声が聞こえないのですが、何かvscodeでの設定があるのでしょうか?
特にvscodeの設定ではないと思います。
音声の合成に時間がかかるので、遅延の可能性もあります。
確実にコレといった回答ができませんが、エラーが出ていないのであれば、音声の出力が遅くなっている可能性はあるかもしれません。
@@snuow
申し訳ありません、開いてるターミナルが別の物でした。
再度動かしてみた所出力にこちらの文が出てきたのですが、分かりますでしょうか?
よろしければでいいのですが教えていただけますでしょうか?
[Running] python -u "c:\Users\master\Desktop\AITU\voicevox.py"
Traceback (most recent call last):
File "c:\Users\master\Desktop\AITU\voicevox.py", line 5, in
import pyaudio
ModuleNotFoundError: No module named 'pyaudio'
[Done] exited with code=1 in 1.043 seconds
なるほど。
pyaudioというモジュールが入っていないようですね。
ターミナルでpip install pyaudio とすれば動きそうな気がします。
@@snuow
出来ました、ご迷惑かけてしまい申し訳ありませんでした。
ありがとうございます。
Thank you very much ♥
OMG that's amazing ❤
いつも勉強させてもらっています。
辞書を使うにはどうしたらいいですか?
自動で書いた文字をちゃんとした固有名詞で喋らしたいのですが。
/user_dict_wordにPOSTすることで、固有名詞の登録ができますよー。
FastAPIを立ち上げて、/docsをブラウザで見てもらえると、マニュアルが表示されますので、マニュアル下部に登録方法も載っているのでぜひ参照してください。
日本語の方がトークン数使ってるっぽいので、日本語で話したものを英語に直してgpt に送るとトークンは節約できそうですが、結局日本語から日本語が良さそうですね。
voice box を裏で立ち上げないとこのアプリは動かないということはデプロイしてから機能させることは難しいんでしょうか。
デプロイや、Docker, fastAPIに疎くてどういう風に検索するのかもわからないのでここで質問させてください…
どこにデプロイするかによりますが、Pythonのソースコード一式をLinux上で動かせばできるかと思います。
AWSなどの場合、EC2などのコンピューティングリソースにPythonのソースコード一式を入れて、Voicevox含めて一気に動作させる感じですね。
FastAPIやDockerはどちらかというとバックエンドの知識なので、そのあたりで調べると良いかもしれません。
@@snuow とても勉強になります。EC2、FastAPI、Docker の勉強をおかげさまで始めました。がんばります。これからも動画応援してます。
VoiceVoxをサーバー上に置ければ
スマホからとかでも出来ると思うんですけどねー😌
そうですねー。クラウド上なんかにあれば、どこでも音声合成できそうな気がします!
こんにちは。いつも手伝ってもらっている韓国の学生です
失礼でなければ質問があります
リアルタイムで話す声をテキストに変換させてから、Voicevoxで入力させてからキャラクターが読んでくれることはできますか?
どの程度リアルタイム性を追求するか次第ですが、おそらく難しいと思います。
リアルタイム音声→テキスト変換→音声合成→出力となるので、どうしてもタイムラグは発生します。
例えば、下記のようなボイスチェンジャーとかであれば、リアルタイム音声→出力となるので良いかもしれません。(韓国語で説明もあった気がします。)
github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
プログラム知識は本当に皆無なのですが、そんな私でも実装可能でしょうか
知識が0でも、やる気があればできると思いますよー。
ただ、順を追ってやる必要があるとは思うので、Pythonの入門レベルの本とか動画を見ながら徐々にやっていくのが良いかなと思います😀
What did you do in command prompt? I am not Japanese😅 so didn't catch what u did in command prompt. Can you please explain that part?
Hello.
I have an OSS called voicevox running on my command prompt, it is made of FastAPI and when I POST it, it returns the synthesized speech result. github is in Japanese, so I recommend you to translate it and look at it 😀.
github:github.com/VOICEVOX/voicevox_engine
What else do I need in my folder besides the python code? Need help with this library, pls.
You need to download voicevox_engine from the following URL (Japanese) 😀github.com/VOICEVOX/voicevox_engine
speakerを47指定していますが、これはどこから参照していますか?
voicevox_engineのサーバーを立てて、GET /speakersで取得できますねー。
下記みたいに、出てくるはず。。。
{
"supported_features": {
"permitted_synthesis_morphing": "ALL"
},
"name": "ナースロボ_タイプT",
"speaker_uuid": "882a636f-3bac-431a-966d-c5e6bba9f949",
"styles": [
{
"name": "ノーマル",
"id": 47
},
{
"name": "楽々",
"id": 48
},
{
"name": "恐怖",
"id": 49
},
{
"name": "内緒話",
"id": 50
}
],
"version": "0.14.1"
}
@@snuow ありがとうございます!