Код для преобразования текста в разные голоса на Python | Точность, интонация и разные языки

PythonToday

Просмотров 24 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 28 янв 2025

Комментарии • 120

@andrewa.8484 Год назад ⁺⁵⁴
нифига примеры не слышно, только если в наушниках слушать
@shirosai9576 Год назад
Потому что у него в плеере громкость 42%
@ВиталийВикторович-л8ж Год назад ⁺³
Как всегда супер, прям коллекцию уже собрали, голосовой ассистент, теперь читалка голосом.
Как всегда спасибо и ждем еще чего нить нового. Особенно с нейронками, торговыми ботами/советниками, распознаванием с камеры на лету используя пайторч или иные скоростные сетки. Лайк.
@PythonToday Год назад
Спасибо за поддержку!
@vigauss1889 Год назад ⁺⁷
Отличный гайд, спасибо за код и свежак в телеге 😉 Успехов и развития каналу ❤
@vigauss1889 Год назад ⁺¹
ps, надо было чуть навалить при прослушивании резуальтата, а то прислушиваться приходится и в проигрывателе меньше чем на половину ползунок
@PythonToday Год назад ⁺¹
Да, забыл прибавить при записи :( Большое сапсибо за поддержку друг!
@deus7204 Год назад ⁺¹⁰
Спасибо за полезный, практический контент! Будь здоров друг!)
@PythonToday Год назад ⁺¹
Спасибо за поддержку друг!
@Chinasius 4 месяца назад
Не за что друг
@ASimpleSkier Год назад ⁺²
Вылазит ошибка "The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation." Как быть?
@hxperxon Год назад
У меня та же ситуация
@vladimirpetrov5276 Год назад ⁺²³
Жалко, что со звуком такая лажа ((
@dpoleev Год назад
громкости не хватает в результатах
@uzun777 Год назад ⁺²
Достойный контент, дружище! Однозначный лайк, подписка и ЕЩЕ БОЛЬШЕ ПАЙТОНА!
@PythonToday Год назад
Благодарю за поддержку!
@Serhii_Hrechka Год назад ⁺¹
А ссылку на Bark Speaker Library (v2) переписывать с экрана видео? Просто ни в тексте под видео ни в ТГ канале что-то ее не нашел 🤨
@vasyatribrat2158 Год назад ⁺³
крутое видео!
очень хотелось бы увидеть от Вас обучение по использованию докера. особенно связки django и react
@888kps Год назад ⁺¹
Спасибо за идею и готовые решения
@PythonToday Год назад ⁺¹
Благодарю за фидбэк и поддержку!
@GameStreamJ Год назад
Пытаюсь освоить python, но увы совсем не понимаю, как читать документацию, еще ни с одной не справился, для меня это просто каша какая-то. Как это преодолеть, может кто подскажет ?
@MrGetlike Год назад ⁺¹
только у меня при исполнении начало тянуть pytorch_model которыи занимает 4,5 гб? что это за зверь такои?
заранее спасибо
@hxperxon Год назад
та же история, только после этого ещё предупреждения всякие выдаёт: UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.
warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.")
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation.
@MrGetlike Год назад
@@hxperxon камрад, оно модель выгоузило. Генерить будет твоя видюха/проц
@Zer-st6qv Год назад ⁺⁵
Спасибо за интересные, практические обзоры библиотек! Только не забывай наваливать в следующий раз звука 😅
@PythonToday Год назад ⁺²
Спасибо за фидбэк! Да, не проверил :(
@kalilinux1515 Год назад
@@PythonToday то я слушаю увеличиваю громкость а потом ты начинаешь говорить я блин чуть с кресла не упал :)
@CONGO_SVZ Год назад ⁺¹
Привет друг. Подскажи пож какая ОС у тебя? Линукс или мак?
@PythonToday Год назад
Привет, в данном видео kali. В работе/жизни использую kali, mac, ubuntu, windows
@CONGO_SVZ Год назад
Спасибо@@PythonToday
@KrasFly Год назад ⁺¹
Спасибо, очень интересно!
Но не нашел информацию, можно ли использовать эту библиотеку для файлов с субтитрами. Было бы полезно использовать для озвучки видео
@ДмитрийАртёмов-ы6щ Год назад ⁺³
Пока из всех моделей синтеза речи мне больше всех нравится сберовская. Конечно я аудиокниги не озвучиваю,только небольшие фразы, но результат вполне себе, очень близко к живой речи.
@PythonToday Год назад ⁺⁴
А есть ссылка на гит? Может какие-то проекты уже есть
@ДмитрийАртёмов-ы6щ Год назад
@@PythonToday у меня к сожалению нет примеров на гите. У сбера документация неплохая. Я пользую их сервис только для генерации фраз, а потом в коде уже аудиофайлы юзаю. Мне что нравится у них, что для физических лиц до 200 000 символов кажется бесплатно в месяц.
@rustamakhmullaev5697 Год назад
Спасибо за шикарный контент 👍👍👍 Вы юзаете кайли линукс как основную рабочую ОС?
@PythonToday Год назад
Благодарю за фидбэк! Да, kali основная на данный момент.
@SandraHyper-d5t Год назад
Подскажите, пожалуйста, как сохранить Bark модель не в кэш, а в другую директорию? Какой метод нужно использовать? А то BarkModel говорит, что у него нет метода save_pretrained.
@rvsn82 10 месяцев назад
Очень интересно, и познавательно, Однако непонятно как его можно запустить на компьютере и чтобы это работало как программа?
@jertvaonlines Год назад
В телеге не нашёл поста с голосами.
@VPavell 11 месяцев назад
Блин, почему по памяти все время падает "CUDA out of memory. Tried to allocate 16.00 MiB" ? GTX 1060 6GB кажется должно хватать.
@Зритель_Ютуб Год назад ⁺⁷
ну и где результат?
@agronomy9746 Год назад
Он показал уже
@melsior1 Год назад ⁺²
не плохо было бы уточнить минимально рекомендуемые требования к железу для запуска с CUDA, чтобы такие нищеброды как я не пытались запустить с 4Гб видеопамяти)))
@ml_funny_situation Год назад
Жиза, но можешь попробовать в гугл колаб запустить
@nikolaydd6219 Год назад ⁺²
Автор, проверяй видео до публикации. Примера не слышно.
@polkovnikvasin1831 Год назад ⁺¹
Звука на слышно тот что сгенерирован . А потом я уже давно перешел с железа на гугл колаб . Для меня это не то что вчерашний день, свое железо , это день который был 3 года назад. Тот кто кувыркался с питоном и установкой tensorflow меня поймут. Плюс там есть среда T4 GPU , бесплатно пару часов .... не помню до 7 часов бесплатно но по факту давали 2-4 часа в день и есть TPU бесплатный не ограничен тоже круть я на нем и сижу.
@xazratbekturdaliyev1274 Год назад ⁺¹
Всем привет
Я парсил сайт с помощью Selenium и получил необходимую информацию в возвращаемом от него html, но некоторая информация скрыта, то есть какая-то дополнительная информация появляется после нажатия на выпадающее меню.Как получить эти скрытые данные с помощью Selenium? было бы здорово, если бы вы сделали видео о том, как парсить скрытые данные с сайтов
@pro100ya3 Год назад
На некоторых сайтах защита от selenium приходиться имитировать работу хрома .
@rinatyagafarov5328 Год назад
Благодарю за видео. Так глядишь и свою умную колонку можно сделать на малинке или апельсинке, плюс там из питона легко обращаться к пинам, а от них уже к релюшкам.
@PythonToday Год назад ⁺¹
Идея хорошая, но подсказали ранее про нейросеть сбера, платная конечно, но попробовать думаю стоит. Есть и бесплатный месячный лимит
@L_Creator Год назад
Молодец! Ты мне очень помог!
@Впоискахпармезана Год назад ⁺¹
Это нормально, что либы torch и scipy занимают несколько гигов (Ubuntu)? Не смог воспроизвести код у себя, так как закончилось место на диске)
@negative-example Год назад ⁺¹
Да, все что касается нейросеток - ужасно жирное. Но по нашим временам терпимое. Вчера купил недорогой SSD на 512 - вышло всего 2750. Так это пол-терабайта же. 128гигов - тысячу стоит с чем-то. Или подмонтировать флешку и на ней держать проект (но будет, конечно, медленнее) Но в самом страшном и безвыходном случае - можно покуситься на святое и удалить игры или коллекцию проно. Но я пока до этого не дошел - докупаю диски.
@BorisChuprin Год назад
Сорян за странный Виндаводский вопрос, но куда можно закинуть в проект скачиваемоую им pytorch_model.bin модель, которую он скачивает во временный кэш папки users ? Т.е. хочется иметь эту библиотеку всё в venv проекте, а не непонятно где, какое-то время.
@agronomy9746 Год назад
Неплохо неплохо, очень хорошо сделано
@PythonToday Год назад
Благодарю за поддержку!
@XCLIPS_VIDEO Год назад
а будет гайд как развернуть проект по качеству как у eleven labs? там прям очень крутая озвучка получается
@ruservices 5 месяцев назад
Добрый день. Подскажите таким образом казахский текст озвучить можно?
@maksberegovoi5134 Год назад
Какой темой ты пользуешься ?Как изменять цвета def/if , чтоб они были разного цвета
@PythonToday Год назад
Тема Night Owl
@maksberegovoi5134 Год назад
@@PythonToday Спасибо , не хотите попробовать библиотеку web3py ? Очень хочется увидеть ваши видео с её использованием
@Искатель-э3й 7 месяцев назад ⁺¹
Да нет, звучит ужасно... А вот за проделанную работу, спасибо.
@idstrctmsf Год назад
Я всегда думал что эта библиотека называется "сципай", теперь тоже ее скипи называть буду))
@ilyagrutsyn325 11 месяцев назад
ссайпай*
@Vladimir_Chunin Год назад
Сейчас куча он лайн сервисов,которые качественный дикторский голос делают и быстро
@veanvi Год назад
Acapela Alena TTS + Балаболка умела тоже самое еще 10 лет назад, но без каких либо задержек. Закидываеш книгу в балаболку, через 5 минут на выходе аудио книга. А програма Balcon, от создателя Балаболки, может делать тоже самое, что и балаболка, но из терминала или из вашей программы.
@АлександрБаранов-ф4д Год назад ⁺¹
Прикольный скрипт. К нему бы прогресс бар и было бы вообще норм
@best_motivational_quotes_1 Год назад ⁺¹
Спасибо за видео, получилось полезно!
А не мог бы ты расписать вариант использования Google Colab для данной задачи?
Думаю, что многим это будет интересно, ведь далеко не у всех есть мощная видюха на борту, а без неё генерация даже пары предложений совсем уж долгая получается :(
@abbosmeliyev8078 Год назад
там так же
@davidsuragan Год назад
самый лучший синтез речи это Edge TTS. Бесплатно 👍
@bmlol Год назад
ток включил, у тебя начало видоса - такое чувство что включил какой-то сериал на ТНТ хД А так прикольно делаешь, спасибо тебе за такие видосы, иногда очень полезно. Вот бы еще новых видосиков про OSINT
@PythonToday Год назад
К сожалению osint был не особо интересен судя по отклику :( Большое спасибо за фидбэк!
@niks1302 Год назад
Скинь ссылку на сайт с голосами пжл
@chiefcentury Год назад
Ребят подскажите, я не очень сильно шарю в питоне, но хочу сделать обычный скрипт который циклично нажимает 2 клавиши на клавиатуре сколько я не перепробовал кодов, ничего не происходит, я даже код написал, что скрипт по кнопке запускается и всё равно заданные клавиши в скрипте нигде не нажимаются, в чем может быть проблема?
@chiefcentury Год назад
вот код
import keyboard
import time
# Переменная, обозначающая, запущен ли скрипт
running = False
def start_stop_script():
global running
running = not running
if running:
print("Скрипт начал работу")
else:
print("Скрипт остановился")
keyboard.add_hotkey("home", start_stop_script)
# Главный цикл скрипта
while True:
if running:
keyboard.press("enter")
time.sleep(1)
keyboard.press("up")
time.sleep(1)
keyboard.release("up")
time.sleep(1)
keyboard.press("enter")
time.sleep(1)
keyboard.press("up")
time.sleep(1)
keyboard.release("up")
time.sleep(1)
keyboard.press("enter")
time.sleep(34) # Задержка 34 секунди
else:
time.sleep(0.1) # Задержка 0.1 секунды
@MichailS-e5l 4 месяца назад
а где ссылка на код?
@jdk_h Год назад
Молодец, еще и рекламу вставил, решил монетизировать
@the_huge_knight Год назад
Почему "scipy" автор произносит как "скипи"?
@ar3love474 Год назад
Аааааа срочно как привязать это к голосовому асситенту, gpt говорит это не возможно, я считаю что возможно ахах
@tilektemirhan9925 Год назад
Используй Azure , намного быстрее , шустрее и меньше кода
@ikRestik Год назад
мдаааа..... жаль, что звук в примерах не слышно =( если только выкручивать громкость на максимум
@Alukard-789 Год назад
❤❤❤❤❤❤
@prosto_odinochestvo Год назад ⁺²
звук еле слышно.
@its_prikolist Год назад
Слушай а где ты научился так быстро печатать?
Дак так я просто смотрю pythontoday
@ml_funny_situation Год назад
В игры поиграй и научишся
@ragents 2 месяца назад ⁺¹
игры+коддинг
@vengr3020 Год назад
ха, заработала первая половина))) эт я олень)))
@TheMorpheios Год назад ⁺³
Silero круче озвучивает
@diyorbek553 Год назад
А можно етот код писать в телеграм бот
@ml_funny_situation Год назад ⁺¹
Да, конечно😂
@djvo1979 Год назад
Что за терминал такой симпатичный?
@PythonToday Год назад
Стандартный kali
@reut_live Год назад
def main лишняя публичная, лучше убрать под магическую строчку. Так мне мой ревьюер говорит))
@ko-prometheus Год назад
Ничего не было слышно!!!!
Повтори снова. Давай озвучим какой то фрагмент из книги на английском языке, перевод и озвучка на русском.
@ЕвгенийБорисов-е1ч Год назад ⁺¹
и ни одна дрянь не взяла не дообучила 1 нейросеть чтоб хотябы 1 голосом на руссише норм было и бесплатно
@Seventeen577 Год назад
Почему ты перестал снимать пентест контент?
@PythonToday Год назад ⁺¹
Ютуб не любит эту тематику. Всё касаемо пентеста буду выкладывать на бусти
@zubarer Год назад ⁺¹
привет
@billy1771 Год назад
когда пентест? ))
@PythonToday Год назад
Пентест будет только в приватке, на ютубе больше выпускать не буду
@kks9518 Год назад
И ВЫ КОНЕЧНО СЛУЧАЙНО ЗАБЫЛИ УТОЧНИТЬ ЧТО НУЖНО БУДЕТ СКАЧАТЬ 4.5ГБ ФАЙЛ
@PythonToday Год назад ⁺¹
А что вас удивило? Почти всегда модели весят не менее нескольких гигабайт.
@super_man-ArtOfWar3 Год назад
Скипи....
Нампи....
@Loveisdarknesss Год назад
Получилось только через gTTS через эту парашу не хочет (((
@lolikice8283 Год назад
А я первый бебебе
@Pre282-n3w Год назад
В детдом
@lolikice8283 Год назад
@@Pre282-n3w ушел в ужасе
@kzvideo9967 Год назад
можешь взломать аватарию? есть 2 читера которые я знаю на питоне крутят ресурсы в игре , но не рассказывают как и кидают людей на бабки
@MichailS-e5l 4 месяца назад
Как же глупо и нелепо выкладывать код только в телегу. Автор умеет думать головой?
@MichailS-e5l 4 месяца назад
Отстой, код не работает
@Chel1k7 Год назад
Это параша а не озвучка, силеро лучше выбирать для этого
@Сливыприватныхкурсов Год назад
интересно, кто же написал о bark, в прошлом видео tts. bark это GPT модель, она может добавлять свои артефакты
@Bunkerniy_Gadenish Год назад ⁺¹
нихера не слышно. сделай видос как петь песни! Как такое сделать? Марк Фейгин & Алексей Арестович - Gangsta's Paradise. концерт в Лас-Вегасе (ai voice cover)
@abakar05 Год назад ⁺¹
Интересно, но эти голоса да и сам принцип воспроизведения текста ДНО
@lookbook.ai. Год назад
давай про изменение голоса мужского в женский

Следующие

Автовоспроизведение

Анонимная, временная почта на Python для принятия кодов активации | Фриланс на Python