Код для преобразования текста в разные голоса на Python | Точность, интонация и разные языки

Поделиться
HTML-код
  • Опубликовано: 13 авг 2023
  • Освойте основы работы с Git на бесплатном курсе от Яндекс Практикума - clck.ru/35CnJw
    ⚡️ Практика Python ⚡️
    В данном видео работаем с крутым Python модулем позволяющим переводить текст в речь на разные языки и с разными голосами. Модуль отлично воспроизводит речь, читает с выражением замечая знаки препинания.
    🔥 Доступ в приват | Поддержать проект:
    boosty.to/pythontoday
    / pythontoday
    yoomoney.ru/to/410019570956160
    💰 Стать спонсором канала:
    / @pythontoday
    Код проекта в telegram канале:
    t.me/python2day
    ****Ссылки****
    Дешевый/надежный сервер в Европе:
    zomro.com/?from=246874
    promo_code:
    zomro_246874
    Хороший proxy сервис:
    proxy6.net/a/149995
    Зарабатываем 10 000 за вечер | Лучший модуль для распознавания речи
    • Фриланс на Python | За...
    С нуля до 100 000 за полгода | Что должен знать JUNIOR PYTHON разработчик в 2023
    • С нуля до 100 000 за п...
    КАК ЗАПУСТИТЬ TELEGRAM БОТА ИЛИ ПАРСЕР НА СЕРВЕРЕ
    • КАК ЗАПУСТИТЬ TELEGRAM...
    8000р за вечер на фрилансе | Обучение парсингу на Python
    • 8000р за вечер на фрил...
    Неуловимый русский хакер | Банковские трояны, шифровальщики, хакерский клуб и миллионы долларов
    • Неуловимый русский хак...
    Программы на Python | Авто переводчик с разных языков в чате на Python | Python socket
    • Программы на Python | ...
    OSINT Python | Как найти человека в интернете? | Поиск по социальным сетям
    • OSINT Python | Как най...
    Выполняем тестовое задание на Junior Python разработчика с зарплатой 70000р:
    • Выполняем тестовое зад...
    Зарабатываем на фрилансе | Requests, bs4 и телеграм бот на aiogram:
    • Обучение парсингу на P...
    Вычисляем по IP с помощью Python | Как определить местоположение по IP:
    • Вычисляем по IP с помо...
    Как узнать пароль от Wi-Fi с помощью Python | Достаем пароли от Wi-Fi точек доступа в Windows:
    • Video
    Python с нуля | if _name_ == '__main__' | Зачем? И почему нужно использовать
    • Python с нуля | if __n...
    Асинхронный парсинг на Python | Ускоряем код в 10 раз
    • Асинхронный парсинг на...
    Плейлист по распознаванию лиц на Python:
    • Распознавание лиц | Fa...
    Плейлист по парсингу сайтов на Python:
    • Парсинг/Scraping
    Плейлист по Instagram боту:
    • Instagram Bot на Pytho...
    Плейлист по Linux для новичков:
    • Linux для начинающих
    ****Соц.сети****
    Telegram: t.me/python2day
    t.me/python2day/3452
    #нейросети #chatgpt #python #программирование
    LdtCKPSe2

Комментарии • 114

  • @andrewa.8484
    @andrewa.8484 9 месяцев назад +50

    нифига примеры не слышно, только если в наушниках слушать

    • @shirosai9576
      @shirosai9576 6 месяцев назад

      Потому что у него в плеере громкость 42%

  • @vigauss1889
    @vigauss1889 9 месяцев назад +8

    Отличный гайд, спасибо за код и свежак в телеге 😉 Успехов и развития каналу ❤

    • @vigauss1889
      @vigauss1889 9 месяцев назад +1

      ps, надо было чуть навалить при прослушивании резуальтата, а то прислушиваться приходится и в проигрывателе меньше чем на половину ползунок

    • @PythonToday
      @PythonToday  9 месяцев назад +1

      Да, забыл прибавить при записи :( Большое сапсибо за поддержку друг!

  • @deus7204
    @deus7204 9 месяцев назад +11

    Спасибо за полезный, практический контент! Будь здоров друг!)

    • @PythonToday
      @PythonToday  9 месяцев назад +1

      Спасибо за поддержку друг!

  • @user-xo2yn4cg5s
    @user-xo2yn4cg5s 9 месяцев назад +3

    Как всегда супер, прям коллекцию уже собрали, голосовой ассистент, теперь читалка голосом.
    Как всегда спасибо и ждем еще чего нить нового. Особенно с нейронками, торговыми ботами/советниками, распознаванием с камеры на лету используя пайторч или иные скоростные сетки. Лайк.

    • @PythonToday
      @PythonToday  9 месяцев назад

      Спасибо за поддержку!

  • @vladimirpetrov5276
    @vladimirpetrov5276 9 месяцев назад +22

    Жалко, что со звуком такая лажа ((

    • @dpoleev
      @dpoleev 9 месяцев назад

      громкости не хватает в результатах

  • @888kps
    @888kps 9 месяцев назад +1

    Спасибо за идею и готовые решения

    • @PythonToday
      @PythonToday  9 месяцев назад +1

      Благодарю за фидбэк и поддержку!

  • @Serhii_Hrechka
    @Serhii_Hrechka 9 месяцев назад +1

    А ссылку на Bark Speaker Library (v2) переписывать с экрана видео? Просто ни в тексте под видео ни в ТГ канале что-то ее не нашел 🤨

  • @Arbuzdog
    @Arbuzdog 9 месяцев назад +1

    Классное видео!

  • @uzun777
    @uzun777 9 месяцев назад +2

    Достойный контент, дружище! Однозначный лайк, подписка и ЕЩЕ БОЛЬШЕ ПАЙТОНА!

    • @PythonToday
      @PythonToday  9 месяцев назад

      Благодарю за поддержку!

  • @vasyatribrat2158
    @vasyatribrat2158 9 месяцев назад +3

    крутое видео!
    очень хотелось бы увидеть от Вас обучение по использованию докера. особенно связки django и react

  • @KrasFly
    @KrasFly 9 месяцев назад +1

    Спасибо, очень интересно!
    Но не нашел информацию, можно ли использовать эту библиотеку для файлов с субтитрами. Было бы полезно использовать для озвучки видео

  • @L_Creator
    @L_Creator 9 месяцев назад

    Молодец! Ты мне очень помог!

  • @user-hm6ez4yf8e
    @user-hm6ez4yf8e 8 месяцев назад

    Подскажите, пожалуйста, как сохранить Bark модель не в кэш, а в другую директорию? Какой метод нужно использовать? А то BarkModel говорит, что у него нет метода save_pretrained.

  • @rustamakhmullaev5697
    @rustamakhmullaev5697 9 месяцев назад

    Спасибо за шикарный контент 👍👍👍 Вы юзаете кайли линукс как основную рабочую ОС?

    • @PythonToday
      @PythonToday  9 месяцев назад

      Благодарю за фидбэк! Да, kali основная на данный момент.

  • @BorisChuprin
    @BorisChuprin 9 месяцев назад

    Сорян за странный Виндаводский вопрос, но куда можно закинуть в проект скачиваемоую им pytorch_model.bin модель, которую он скачивает во временный кэш папки users ? Т.е. хочется иметь эту библиотеку всё в venv проекте, а не непонятно где, какое-то время.

  • @agronomy9746
    @agronomy9746 9 месяцев назад

    Неплохо неплохо, очень хорошо сделано

    • @PythonToday
      @PythonToday  9 месяцев назад

      Благодарю за поддержку!

  • @ASimpleSkier
    @ASimpleSkier 9 месяцев назад +2

    Вылазит ошибка "The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
    Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation." Как быть?

    • @hxperxon
      @hxperxon 6 месяцев назад

      У меня та же ситуация

  • @MrGetlike
    @MrGetlike 8 месяцев назад +1

    только у меня при исполнении начало тянуть pytorch_model которыи занимает 4,5 гб? что это за зверь такои?
    заранее спасибо

    • @hxperxon
      @hxperxon 6 месяцев назад

      та же история, только после этого ещё предупреждения всякие выдаёт: UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.
      warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.")
      The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
      Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation.

    • @MrGetlike
      @MrGetlike 6 месяцев назад

      @@hxperxon камрад, оно модель выгоузило. Генерить будет твоя видюха/проц

  • @rvsn82
    @rvsn82 2 месяца назад

    Очень интересно, и познавательно, Однако непонятно как его можно запустить на компьютере и чтобы это работало как программа?

  • @Zer-st6qv
    @Zer-st6qv 9 месяцев назад +5

    Спасибо за интересные, практические обзоры библиотек! Только не забывай наваливать в следующий раз звука 😅

    • @PythonToday
      @PythonToday  9 месяцев назад +2

      Спасибо за фидбэк! Да, не проверил :(

    • @kalilinux1515
      @kalilinux1515 6 месяцев назад

      @@PythonToday то я слушаю увеличиваю громкость а потом ты начинаешь говорить я блин чуть с кресла не упал :)

  • @rinatyagafarov5328
    @rinatyagafarov5328 9 месяцев назад

    Благодарю за видео. Так глядишь и свою умную колонку можно сделать на малинке или апельсинке, плюс там из питона легко обращаться к пинам, а от них уже к релюшкам.

    • @PythonToday
      @PythonToday  9 месяцев назад +1

      Идея хорошая, но подсказали ранее про нейросеть сбера, платная конечно, но попробовать думаю стоит. Есть и бесплатный месячный лимит

  • @godpixels
    @godpixels 8 месяцев назад

    В телеге не нашёл поста с голосами.

  • @niks1302
    @niks1302 8 месяцев назад

    Скинь ссылку на сайт с голосами пжл

  • @CONGO_SVZ
    @CONGO_SVZ 9 месяцев назад +1

    Привет друг. Подскажи пож какая ОС у тебя? Линукс или мак?

    • @PythonToday
      @PythonToday  9 месяцев назад

      Привет, в данном видео kali. В работе/жизни использую kali, mac, ubuntu, windows

    • @CONGO_SVZ
      @CONGO_SVZ 9 месяцев назад

      Спасибо@@PythonToday

  • @chiefcentury
    @chiefcentury 9 месяцев назад

    Ребят подскажите, я не очень сильно шарю в питоне, но хочу сделать обычный скрипт который циклично нажимает 2 клавиши на клавиатуре сколько я не перепробовал кодов, ничего не происходит, я даже код написал, что скрипт по кнопке запускается и всё равно заданные клавиши в скрипте нигде не нажимаются, в чем может быть проблема?

    • @chiefcentury
      @chiefcentury 9 месяцев назад

      вот код
      import keyboard
      import time
      # Переменная, обозначающая, запущен ли скрипт
      running = False
      def start_stop_script():
      global running
      running = not running
      if running:
      print("Скрипт начал работу")
      else:
      print("Скрипт остановился")
      keyboard.add_hotkey("home", start_stop_script)
      # Главный цикл скрипта
      while True:
      if running:
      keyboard.press("enter")
      time.sleep(1)
      keyboard.press("up")
      time.sleep(1)
      keyboard.release("up")
      time.sleep(1)
      keyboard.press("enter")
      time.sleep(1)
      keyboard.press("up")
      time.sleep(1)
      keyboard.release("up")
      time.sleep(1)
      keyboard.press("enter")
      time.sleep(34) # Задержка 34 секунди
      else:
      time.sleep(0.1) # Задержка 0.1 секунды

  • @VPavell
    @VPavell 3 месяца назад

    Блин, почему по памяти все время падает "CUDA out of memory. Tried to allocate 16.00 MiB" ? GTX 1060 6GB кажется должно хватать.

  • @best_motivational_quotes_1
    @best_motivational_quotes_1 9 месяцев назад +1

    Спасибо за видео, получилось полезно!
    А не мог бы ты расписать вариант использования Google Colab для данной задачи?
    Думаю, что многим это будет интересно, ведь далеко не у всех есть мощная видюха на борту, а без неё генерация даже пары предложений совсем уж долгая получается :(

  • @XCLIPS_VIDEO
    @XCLIPS_VIDEO 5 месяцев назад

    а будет гайд как развернуть проект по качеству как у eleven labs? там прям очень крутая озвучка получается

  • @veanvi
    @veanvi 9 месяцев назад

    Acapela Alena TTS + Балаболка умела тоже самое еще 10 лет назад, но без каких либо задержек. Закидываеш книгу в балаболку, через 5 минут на выходе аудио книга. А програма Balcon, от создателя Балаболки, может делать тоже самое, что и балаболка, но из терминала или из вашей программы.

  • @xazratbekturdaliyev1274
    @xazratbekturdaliyev1274 9 месяцев назад +1

    Всем привет
    Я парсил сайт с помощью Selenium и получил необходимую информацию в возвращаемом от него html, но некоторая информация скрыта, то есть какая-то дополнительная информация появляется после нажатия на выпадающее меню.Как получить эти скрытые данные с помощью Selenium? было бы здорово, если бы вы сделали видео о том, как парсить скрытые данные с сайтов

    • @pro100ya3
      @pro100ya3 8 месяцев назад

      На некоторых сайтах защита от selenium приходиться имитировать работу хрома .

  • @user-dp3jq5lr4h
    @user-dp3jq5lr4h 9 месяцев назад +3

    Пока из всех моделей синтеза речи мне больше всех нравится сберовская. Конечно я аудиокниги не озвучиваю,только небольшие фразы, но результат вполне себе, очень близко к живой речи.

    • @PythonToday
      @PythonToday  9 месяцев назад +4

      А есть ссылка на гит? Может какие-то проекты уже есть

    • @user-dp3jq5lr4h
      @user-dp3jq5lr4h 9 месяцев назад

      @@PythonToday у меня к сожалению нет примеров на гите. У сбера документация неплохая. Я пользую их сервис только для генерации фраз, а потом в коде уже аудиофайлы юзаю. Мне что нравится у них, что для физических лиц до 200 000 символов кажется бесплатно в месяц.

  • @user-ux5ql4ci5e
    @user-ux5ql4ci5e 9 месяцев назад +1

    Прикольный скрипт. К нему бы прогресс бар и было бы вообще норм

  • @bmlol
    @bmlol 9 месяцев назад

    ток включил, у тебя начало видоса - такое чувство что включил какой-то сериал на ТНТ хД А так прикольно делаешь, спасибо тебе за такие видосы, иногда очень полезно. Вот бы еще новых видосиков про OSINT

    • @PythonToday
      @PythonToday  9 месяцев назад

      К сожалению osint был не особо интересен судя по отклику :( Большое спасибо за фидбэк!

  • @GameStreamJ
    @GameStreamJ 8 месяцев назад

    Пытаюсь освоить python, но увы совсем не понимаю, как читать документацию, еще ни с одной не справился, для меня это просто каша какая-то. Как это преодолеть, может кто подскажет ?

  • @maksberegovoi5134
    @maksberegovoi5134 9 месяцев назад

    Какой темой ты пользуешься ?Как изменять цвета def/if , чтоб они были разного цвета

    • @PythonToday
      @PythonToday  9 месяцев назад

      Тема Night Owl

    • @maksberegovoi5134
      @maksberegovoi5134 9 месяцев назад

      @@PythonToday Спасибо , не хотите попробовать библиотеку web3py ? Очень хочется увидеть ваши видео с её использованием

  • @dautmantis
    @dautmantis 9 месяцев назад

    самый лучший синтез речи это Edge TTS. Бесплатно 👍

  • @melsior1
    @melsior1 9 месяцев назад +2

    не плохо было бы уточнить минимально рекомендуемые требования к железу для запуска с CUDA, чтобы такие нищеброды как я не пытались запустить с 4Гб видеопамяти)))

    • @ml_funny_situation
      @ml_funny_situation 9 месяцев назад

      Жиза, но можешь попробовать в гугл колаб запустить

  • @_yt_v
    @_yt_v 9 месяцев назад +5

    ну и где результат?

    • @agronomy9746
      @agronomy9746 9 месяцев назад

      Он показал уже

  • @user-ve7oe5zf8w
    @user-ve7oe5zf8w 9 месяцев назад +1

    Это нормально, что либы torch и scipy занимают несколько гигов (Ubuntu)? Не смог воспроизвести код у себя, так как закончилось место на диске)

    • @negative-example
      @negative-example 9 месяцев назад +1

      Да, все что касается нейросеток - ужасно жирное. Но по нашим временам терпимое. Вчера купил недорогой SSD на 512 - вышло всего 2750. Так это пол-терабайта же. 128гигов - тысячу стоит с чем-то. Или подмонтировать флешку и на ней держать проект (но будет, конечно, медленнее) Но в самом страшном и безвыходном случае - можно покуситься на святое и удалить игры или коллекцию проно. Но я пока до этого не дошел - докупаю диски.

  • @polkovnikvasin1831
    @polkovnikvasin1831 5 месяцев назад +1

    Звука на слышно тот что сгенерирован . А потом я уже давно перешел с железа на гугл колаб . Для меня это не то что вчерашний день, свое железо , это день который был 3 года назад. Тот кто кувыркался с питоном и установкой tensorflow меня поймут. Плюс там есть среда T4 GPU , бесплатно пару часов .... не помню до 7 часов бесплатно но по факту давали 2-4 часа в день и есть TPU бесплатный не ограничен тоже круть я на нем и сижу.

  • @the_huge_knight
    @the_huge_knight 9 месяцев назад

    Почему "scipy" автор произносит как "скипи"?

  • @idstrctmsf
    @idstrctmsf 6 месяцев назад

    Я всегда думал что эта библиотека называется "сципай", теперь тоже ее скипи называть буду))

  • @Vladimir_Chunin
    @Vladimir_Chunin 9 месяцев назад

    Сейчас куча он лайн сервисов,которые качественный дикторский голос делают и быстро

  • @Anonim-im6ln
    @Anonim-im6ln 7 месяцев назад

    ❤❤❤❤❤❤

  • @tilektemirhan9925
    @tilektemirhan9925 9 месяцев назад

    Используй Azure , намного быстрее , шустрее и меньше кода

  • @jdk_h
    @jdk_h 7 месяцев назад

    Молодец, еще и рекламу вставил, решил монетизировать

  • @ikRestik
    @ikRestik 9 месяцев назад

    мдаааа..... жаль, что звук в примерах не слышно =( если только выкручивать громкость на максимум

  • @ar3love474
    @ar3love474 6 месяцев назад

    Аааааа срочно как привязать это к голосовому асситенту, gpt говорит это не возможно, я считаю что возможно ахах

  • @djvo1979
    @djvo1979 9 месяцев назад

    Что за терминал такой симпатичный?

    • @PythonToday
      @PythonToday  9 месяцев назад

      Стандартный kali

  • @pt_vip
    @pt_vip 9 месяцев назад

    Слушай а где ты научился так быстро печатать?
    Дак так я просто смотрю pythontoday

    • @ml_funny_situation
      @ml_funny_situation 9 месяцев назад

      В игры поиграй и научишся

  • @zubarer
    @zubarer 9 месяцев назад +1

    привет

  • @vengr3020
    @vengr3020 9 месяцев назад

    ха, заработала первая половина))) эт я олень)))

  • @reut_live
    @reut_live 9 месяцев назад

    def main лишняя публичная, лучше убрать под магическую строчку. Так мне мой ревьюер говорит))

  • @nikolaydd6219
    @nikolaydd6219 7 месяцев назад

    Автор, проверяй видео до публикации. Примера не слышно.

  • @diyorbek553
    @diyorbek553 9 месяцев назад

    А можно етот код писать в телеграм бот

  • @prosto_odinochestvo
    @prosto_odinochestvo 9 месяцев назад +2

    звук еле слышно.

  • @user-bo2wo6lb2h
    @user-bo2wo6lb2h 9 месяцев назад

    интересно, кто же написал о bark, в прошлом видео tts. bark это GPT модель, она может добавлять свои артефакты

  • @TheMorpheios
    @TheMorpheios 9 месяцев назад +2

    Silero круче озвучивает

  • @billy1771
    @billy1771 9 месяцев назад

    когда пентест? ))

    • @PythonToday
      @PythonToday  9 месяцев назад

      Пентест будет только в приватке, на ютубе больше выпускать не буду

  • @ko-prometheus
    @ko-prometheus 9 месяцев назад

    Ничего не было слышно!!!!
    Повтори снова. Давай озвучим какой то фрагмент из книги на английском языке, перевод и озвучка на русском.

  • @Seventeen577
    @Seventeen577 9 месяцев назад

    Почему ты перестал снимать пентест контент?

    • @PythonToday
      @PythonToday  9 месяцев назад +1

      Ютуб не любит эту тематику. Всё касаемо пентеста буду выкладывать на бусти

  • @super_man-ArtOfWar3
    @super_man-ArtOfWar3 8 месяцев назад

    Скипи....
    Нампи....

  • @user-pi3em2ke2l
    @user-pi3em2ke2l 8 месяцев назад +1

    и ни одна дрянь не взяла не дообучила 1 нейросеть чтоб хотябы 1 голосом на руссише норм было и бесплатно

  • @kks9518
    @kks9518 9 месяцев назад

    И ВЫ КОНЕЧНО СЛУЧАЙНО ЗАБЫЛИ УТОЧНИТЬ ЧТО НУЖНО БУДЕТ СКАЧАТЬ 4.5ГБ ФАЙЛ

    • @PythonToday
      @PythonToday  9 месяцев назад +1

      А что вас удивило? Почти всегда модели весят не менее нескольких гигабайт.

  • @Loveisdarknesss
    @Loveisdarknesss 7 месяцев назад

    Получилось только через gTTS через эту парашу не хочет (((

  • @kzvideo9967
    @kzvideo9967 9 месяцев назад

    можешь взломать аватарию? есть 2 читера которые я знаю на питоне крутят ресурсы в игре , но не рассказывают как и кидают людей на бабки

  • @lolikice8283
    @lolikice8283 9 месяцев назад

    А я первый бебебе

    • @Amongmine2
      @Amongmine2 9 месяцев назад

      В детдом

    • @lolikice8283
      @lolikice8283 9 месяцев назад

      @@Amongmine2 ушел в ужасе

  • @Chel1k7
    @Chel1k7 9 месяцев назад

    Это параша а не озвучка, силеро лучше выбирать для этого

  • @Bunkerniy_Gadenish
    @Bunkerniy_Gadenish 9 месяцев назад +1

    нихера не слышно. сделай видос как петь песни! Как такое сделать? Марк Фейгин & Алексей Арестович - Gangsta's Paradise. концерт в Лас-Вегасе (ai voice cover)

  • @abakar05
    @abakar05 7 месяцев назад +1

    Интересно, но эти голоса да и сам принцип воспроизведения текста ДНО

  • @lookbook.ai.
    @lookbook.ai. 9 месяцев назад

    давай про изменение голоса мужского в женский