Chuyển văn bản thành giọng nói có cảm xúc bằng OpenAI TTS (ChatGPT) | Yuto Tech
HTML-код
- Опубликовано: 9 мар 2024
- Trong video này, mình sẽ hướng dẫn bạn cách biến văn bản thành giọng nói đầy cảm xúc như người thật sử dụng công nghệ Text-to-Speech (TTS) tiên tiến của OpenAI.
Video này sẽ đi sâu vào cách thức hoạt động của công nghệ này, từ việc tạo API key đến việc sử dụng để tạo ra giọng nói tự nhiên, mượt mà và đầy biểu cảm. Video này phù hợp với những bạn không rành về kỹ thuật cũng có thể dễ dàng thực hiện được.
Cảm ơn bạn đã xem video. Nếu video có ích thì đừng quên like, share và subscribe để ủng hộ kênh và nhận được nhiều video chia sẻ hữu ích khác nhé!
#texttospeech #tts #openai
#OpenAITTS #TextToSpeech #trituenhantao #trítuệnhântạo #AI #TTS #giongnoihay #côngnghệmới #congngheai #huongdancongnghe #Innovation #TechTutorial #giongnoicamxuc
Bài viết chi tiết, các bạn có thể copy những đoạn code mẫu:
yutojp.com/articles/huong-dan...
Cách Nạp Tiền Vào Tài Khoản OpenAI Để Sử Dụng API:
• Cách Nạp Tiền Vào Tài ...
===========
00:33 Cách tạo API key
01:45 Cách xóa Api key
02:20 Cách chuyển văn bản thành giọng nói
06:12 Một vài mẹo nhỏ khi sử dụng
07:42 Một vài câu hỏi thường gặp
=========== - Наука
Đến lúc này thì nó siêu hơn rất nhiều rồi anh. Giọng nói nghe rất tuyệt. Cảm ơn clip của anh
Thật sự rất cảm ơn chia sẻ của bạn.
đang cần. quá hay. quá dễ hiểu. rất cảm ơn ad!
OpenAI TTS là gì?
TTS là viết tắt của Text-to-Speech, ngày nay công nghệ TTS (chuyển văn bản thành giọng nói) đã rất phổ biến và được ứng dụng rộng rãi.
TTS của OpenAI có khả năng chuyển đổi văn bản thành giọng nói tự nhiên và mượt mà, giọng nói được tạo ra có cảm xúc giống như người thật. Ví dụ như clip truyện ma dưới đây mình làm từ API TTS của OpenAI, giọng đọc không hề qua chỉnh sửa, mặc dù đang còn mới nhưng giọng đọc tiếng Việt cũng rất truyền cảm, nghe lần đầu có thể sẽ không nghĩ là giọng đọc của AI.
Đăng nhập vào OpenAI và tạo API key
Cách sử dụng OpenAI TTS
Ở thời điểm hiện tại đầu năm 2024, OpenAI TTS chưa có giao diện web, do đó để sử dụng được thì phải dùng thông qua API. Những bạn không chuyên về kỹ thuật cũng không cần để ý API nghĩa là gì đâu, tí nữa các bạn chỉ cần chạy code thông qua Terminal (macOS) hoặc Command Prompt (Windows)
Sau khi đăng nhập vào OpenAI, ở thanh menu bạn click vào Text-to-speech để chuyển đến trang hướng dẫn sử dụng chức năng này, hoặc có thể vào trực tiếp từ đường link bên dưới:
platform.openai.com/docs/guides/text-to-speech
Các giọng đọc hiện có của OpenAI TTS
OpenAI TTS hiện tại có các giọng đọc sau, model "tts-1" hiện tại còn khá mới mẻ nên phát âm tiếng Việt nhiều chỗ chưa chuẩn lắm, nhưng nói chung là đủ chất lượng để có thể dùng rồi.
Alloy - Giọng nam trung
Echo - Giọng nam truyền cảm, phù hợp cho kể chuyện
Fable - Giọng nam cao
Onyx - Giọng nam trầm
Nova - Giọng nữ cao
Shimmer - Giọng nữ trầm
Chạy đoạn code để chuyển văn bản thành giọng nói
Mở Terminal nếu là macOS, hoặc Command Prompt nếu là Windows, sau đó paste đoạn code theo mẫu sau:
Nếu là Terminal của macOS
curl api.openai.com/v1/audio/speech \
-H "Authorization: Bearer " \
-H "Content-Type: application/json" \
-d '{
"model": "",
"input": "",
"voice": "",
"speed":
}' \
--output .mp3
Nếu là Command Prompt của Windows
curl api.openai.com/v1/audio/speech ^
-H "Authorization: Bearer " ^
-H "Content-Type: application/json" ^
-d "{""model"": """", ""input"": """", ""voice"": """", ""speed"": }" ^
--output .mp3
bạn ơi sao mình dùng cái cmd của window thì k ra đc voice. mong bạn chỉ
Mình đã thử và thật sự hơi sợ cái AI này, đỉnh !!
Giọng đọc có cảm xúc gần như người thật 😅
Bạn ơi cho mình hỏi mình có tải nhạc ở video shorts người khác về gắn vào video short của mình được ko vậy
Chào bạn, mình chưa thử bao giờ nên cũng không rõ phần Shorts nữa bạn
Mình tạo ra được file bằng đoạn code của bạn đã thay thế api nhưng mà khi mở file lên thì không nghe được thì phải làm sao bạn nhỉ?
Bạn làm trên Windows hay MacBook vậy bạn? Nếu là Windows thì bạn dùng Notepad viết sẵn đoạn code sau đó copy và paste vào Command Prompt, tránh viết trực tiếp trong Command Prompt dễ bị lỗi
Dạ anh ơi, những cái phần đặt trong ngoặc vuông ví dụ như [pause], [laugh], [Vietnamese] , những phần đó anh tự thử nghiệm rồi rút ra kết quả ạ, hay anh tìm hiểu ở đâu vậy ạ ?, em đọc các tài liệu trên mạng về model tts của open ai nhưng chưa thấy ạ.
Những phần đó mình tự mò thôi bạn, vì tài liệu chính thức của OpenAI chưa có nêu rõ về những tag đó
@@YutoTech Dạ vâng ạ, em cảm ơn anh ạ. Em thấy Open AI mới có thêm 2 model nữa là tts-1-hd-1106 và tts-1-1106 ạ.
2 model này có khác nhau nhiều so với 2 model anh nêu trong video không ạ
@@SonTranNgoc-pi8nq Về cơ bản thì vẫn giống như là tts-1 và tts-1-hd thôi bạn. Sau này khi ra các model mới hơn ví dụ như tts-2 chẳng hạn thì mới có thay đổi rõ rệt
@@YutoTech em cảm ơn anh đã giải đáp ạ😀
Cái chỗ đoạn chi phí sử dụng TTS API bạn chỉ mình cách mua với ạ. Cảm ơn bạn nhiều.
Chào bạn, về cách nạp tiền vào tải khoản OpenAI để sử dụng API thì bạn xem video này nhé
ruclips.net/video/GXq7cZA4mSc/видео.html
@@YutoTech cảm ơn bạn nhìu 🥰, chúc bạn buổi tối bình an.
Tt nhe b
cho mình xin cách làm trên window với. Mình làm k ra voice
Chào bạn, ở phần thông tin video mình có để bài blog chi tiết, bạn vào đó xem ở phần hướng dẫn Windows mình có ghi chi tiết
4:24 đoạn code để copy đâu shop ui
Chào bạn, mình có cập nhật link bài viết ở phần mô tả, bạn vào đó copy các đoạn code mẫu nhé
Phải nạp tiền mới thử được à bạn?
Đúng rồi bạn, phải nạp tiền vào với dùng được API
Sao mình thử toàn ra được file rồi mà file bị lỗi không mở ra được vậy ạ?
Chào bạn, mình có viết bài hướng dẫn kèm đoạn code mẫu, bạn có thể tham khảo: yutojp.com/articles/huong-dan-su-dung-openai-tts-api-chuyen-van-ban-thanh-giong-noi
Mình vừa đăng kí nhưng phí nó cũng ko phải rẻ
Bạn đăng ký ChatGPT hả bạn? Còn sử dụng API của OpenAI thì nạp tiền vào trước rồi mới sử dụng
Làm được nhưng không phải mã này
ông làm trên window đc k
@@rubybeargaming Được nhé!!!!
@@capvannamcover3218 ông cho tôi xin câu lệnh được không
@@capvannamcover3218cho tôi mã được k
Chuyển văn bản thành giọng nói siêu rẻ liên hệ m nhé
Liên hệ kiểu gì b ơi
mình làm đúng vậy mà nó ko ra hình như do mình chưa trả phí nên terminal nó báo % Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 444 100 337 100 107 637 202 --:--:-- --:--:-- --:--:-- 845
sausau@192 ~ %
Chào bạn, để tuần này mình làm clip hướng dẫn sử dụng trên Windows