Размер видео: 1280 X 720853 X 480640 X 360
Показать панель управления
Автовоспроизведение
Автоповтор
Azureの公式実装と比べてもシンプルに実装できていて良いですね!pythonのみで構築できている点も良いと思いました。参考にさせていただきます!
コールセンター関連で10年ほど前仕事をしていた頃、この領域は早晩AIに置き換わるから今から準備をしておこう、と言っていた内容が本当にそろそろ、そろそろ現実になりそうですね。いやはやなんとも面白い時代に生きているものだ。
音声会話ももうこのレベルが当たり前になっちゃってるのすげえですね。エンドユーザー相手に使うのはさすがにまだ逐一チェック必要そうであと一歩足りない感じですが、逆にいえばここまで迫ってると言えるのかも
音声会話の裏でツール使用ができるなら、本当にカスタマーセンターの代わりになりそうですね。ここにきて「プロンプトエンジニア、要る・要らない論」が「要る」方に傾いたような気がします🤔
いや、実は書いてない事を推測で言っちゃうのは実は相当問題だと思う。むしろこの程度の内容ならプッシュフォンで番号押させて分岐して、故障内容が保証に妥当かだけをllmで審査させるようにするくらいしかまだ使えない気がする。他者でやってそうなサービスや規則を勝手に類推して言っちゃうのはお客さんの側も間違いだと一番気づきにくいので…。それをうまく制御するプロンプトや手法も開発されるだろうけど、あくまで人間が作った分岐のテンプレートがないと進められないとおもう。しかもここで、子供が商品の蓋を飲んでしまったみたいな話を途中で入れられた場合とかまで考えるとまだまだllmは相当リスキーだなと思いました。
既存のGPTsでもPDFを読みこませるとその内容からしか回答しないという機能があるのでそれで対応できそうに思いますよ。
金融系コールセンタだと本人確認とかに厳しいルールがあったりするので難しそうですが、Slackも買収したSalesforceなどのCRMベンダーではお金がありそうだから、そういったフレーム制御とうまく混ぜ合わせたSaaSとして提供を始めそう
Amazonは地球の裏側の人まで使って24時間体制のテキストサポートやってるっぽいです。AIはまだ料金がネックになるかな...?
geminiで無料音声API使えるのにopenAIに課金して使う人なんているのw
Geminiはたぶん、音声を文字起こししてLLMで処理して出てきた文章を音声合成するってのを高速でやってるだけだから、品質めっちゃ低いじゃん。openAIのアドバンスド音声モードは野球実況風のセリフ喋らせた時に後ろで観客の声っぽい雑音鳴ってたこともある。AIの性能が段違いなんだよ。
英会話の練習相手に使ってるけど、高度な音声機能の正確性とレスポンスの速さは段違いだねー
将来的にはともかく、現状のGeminiは音声対話や画像認識の精度はChatGPTと比較してかなり劣っているあとはGeminiはChatGPTに比べて融通が効かないイメージ
無料しか取り柄のないただただ図体がデカいだけの会社
@@kosetei1 デマ流してて草。openAIも音声合成してるだけだから後ろから観客の声聞こえてくるわけないやんwちゃんと仕様書読んでから返信してくれw
Azureの公式実装と比べてもシンプルに実装できていて良いですね!
pythonのみで構築できている点も良いと思いました。
参考にさせていただきます!
コールセンター関連で10年ほど前仕事をしていた頃、この領域は早晩AIに置き換わるから今から準備をしておこう、と言っていた内容が本当にそろそろ、そろそろ現実になりそうですね。いやはやなんとも面白い時代に生きているものだ。
音声会話ももうこのレベルが当たり前になっちゃってるのすげえですね。エンドユーザー相手に使うのはさすがにまだ逐一チェック必要そうであと一歩足りない感じですが、逆にいえばここまで迫ってると言えるのかも
音声会話の裏でツール使用ができるなら、本当にカスタマーセンターの代わりになりそうですね。ここにきて「プロンプトエンジニア、要る・要らない論」が「要る」方に傾いたような気がします🤔
いや、実は書いてない事を推測で言っちゃうのは実は相当問題だと思う。むしろこの程度の内容ならプッシュフォンで番号押させて分岐して、故障内容が保証に妥当かだけをllmで審査させるようにするくらいしかまだ使えない気がする。他者でやってそうなサービスや規則を勝手に類推して言っちゃうのはお客さんの側も間違いだと一番気づきにくいので…。それをうまく制御するプロンプトや手法も開発されるだろうけど、あくまで人間が作った分岐のテンプレートがないと進められないとおもう。しかもここで、子供が商品の蓋を飲んでしまったみたいな話を途中で入れられた場合とかまで考えるとまだまだllmは相当リスキーだなと思いました。
既存のGPTsでもPDFを読みこませるとその内容からしか回答しないという機能があるのでそれで対応できそうに思いますよ。
金融系コールセンタだと本人確認とかに厳しいルールがあったりするので難しそうですが、Slackも買収したSalesforceなどのCRMベンダーではお金がありそうだから、そういったフレーム制御とうまく混ぜ合わせたSaaSとして提供を始めそう
Amazonは地球の裏側の人まで使って24時間体制のテキストサポートやってるっぽいです。AIはまだ料金がネックになるかな...?
geminiで無料音声API使えるのにopenAIに課金して使う人なんているのw
Geminiはたぶん、音声を文字起こししてLLMで処理して出てきた文章を音声合成するってのを高速でやってるだけだから、品質めっちゃ低いじゃん。
openAIのアドバンスド音声モードは野球実況風のセリフ喋らせた時に後ろで観客の声っぽい雑音鳴ってたこともある。AIの性能が段違いなんだよ。
英会話の練習相手に使ってるけど、高度な音声機能の正確性とレスポンスの速さは段違いだねー
将来的にはともかく、現状のGeminiは音声対話や画像認識の精度はChatGPTと比較してかなり劣っている
あとはGeminiはChatGPTに比べて融通が効かないイメージ
無料しか取り柄のないただただ図体がデカいだけの会社
@@kosetei1 デマ流してて草。openAIも音声合成してるだけだから後ろから観客の声聞こえてくるわけないやんwちゃんと仕様書読んでから返信してくれw