Код для преобразования текста в разные голоса на Python | Точность, интонация и разные языки

Поделиться
HTML-код
  • Опубликовано: 28 янв 2025

Комментарии • 120

  • @andrewa.8484
    @andrewa.8484 Год назад +54

    нифига примеры не слышно, только если в наушниках слушать

    • @shirosai9576
      @shirosai9576 Год назад

      Потому что у него в плеере громкость 42%

  • @ВиталийВикторович-л8ж

    Как всегда супер, прям коллекцию уже собрали, голосовой ассистент, теперь читалка голосом.
    Как всегда спасибо и ждем еще чего нить нового. Особенно с нейронками, торговыми ботами/советниками, распознаванием с камеры на лету используя пайторч или иные скоростные сетки. Лайк.

    • @PythonToday
      @PythonToday  Год назад

      Спасибо за поддержку!

  • @vigauss1889
    @vigauss1889 Год назад +7

    Отличный гайд, спасибо за код и свежак в телеге 😉 Успехов и развития каналу ❤

    • @vigauss1889
      @vigauss1889 Год назад +1

      ps, надо было чуть навалить при прослушивании резуальтата, а то прислушиваться приходится и в проигрывателе меньше чем на половину ползунок

    • @PythonToday
      @PythonToday  Год назад +1

      Да, забыл прибавить при записи :( Большое сапсибо за поддержку друг!

  • @deus7204
    @deus7204 Год назад +10

    Спасибо за полезный, практический контент! Будь здоров друг!)

    • @PythonToday
      @PythonToday  Год назад +1

      Спасибо за поддержку друг!

    • @Chinasius
      @Chinasius 4 месяца назад

      Не за что друг

  • @ASimpleSkier
    @ASimpleSkier Год назад +2

    Вылазит ошибка "The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
    Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation." Как быть?

    • @hxperxon
      @hxperxon Год назад

      У меня та же ситуация

  • @vladimirpetrov5276
    @vladimirpetrov5276 Год назад +23

    Жалко, что со звуком такая лажа ((

    • @dpoleev
      @dpoleev Год назад

      громкости не хватает в результатах

  • @uzun777
    @uzun777 Год назад +2

    Достойный контент, дружище! Однозначный лайк, подписка и ЕЩЕ БОЛЬШЕ ПАЙТОНА!

    • @PythonToday
      @PythonToday  Год назад

      Благодарю за поддержку!

  • @Serhii_Hrechka
    @Serhii_Hrechka Год назад +1

    А ссылку на Bark Speaker Library (v2) переписывать с экрана видео? Просто ни в тексте под видео ни в ТГ канале что-то ее не нашел 🤨

  • @vasyatribrat2158
    @vasyatribrat2158 Год назад +3

    крутое видео!
    очень хотелось бы увидеть от Вас обучение по использованию докера. особенно связки django и react

  • @888kps
    @888kps Год назад +1

    Спасибо за идею и готовые решения

    • @PythonToday
      @PythonToday  Год назад +1

      Благодарю за фидбэк и поддержку!

  • @GameStreamJ
    @GameStreamJ Год назад

    Пытаюсь освоить python, но увы совсем не понимаю, как читать документацию, еще ни с одной не справился, для меня это просто каша какая-то. Как это преодолеть, может кто подскажет ?

  • @MrGetlike
    @MrGetlike Год назад +1

    только у меня при исполнении начало тянуть pytorch_model которыи занимает 4,5 гб? что это за зверь такои?
    заранее спасибо

    • @hxperxon
      @hxperxon Год назад

      та же история, только после этого ещё предупреждения всякие выдаёт: UserWarning: torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.
      warnings.warn("torch.nn.utils.weight_norm is deprecated in favor of torch.nn.utils.parametrizations.weight_norm.")
      The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
      Setting `pad_token_id` to `eos_token_id`:10000 for open-end generation.

    • @MrGetlike
      @MrGetlike Год назад

      @@hxperxon камрад, оно модель выгоузило. Генерить будет твоя видюха/проц

  • @Zer-st6qv
    @Zer-st6qv Год назад +5

    Спасибо за интересные, практические обзоры библиотек! Только не забывай наваливать в следующий раз звука 😅

    • @PythonToday
      @PythonToday  Год назад +2

      Спасибо за фидбэк! Да, не проверил :(

    • @kalilinux1515
      @kalilinux1515 Год назад

      @@PythonToday то я слушаю увеличиваю громкость а потом ты начинаешь говорить я блин чуть с кресла не упал :)

  • @CONGO_SVZ
    @CONGO_SVZ Год назад +1

    Привет друг. Подскажи пож какая ОС у тебя? Линукс или мак?

    • @PythonToday
      @PythonToday  Год назад

      Привет, в данном видео kali. В работе/жизни использую kali, mac, ubuntu, windows

    • @CONGO_SVZ
      @CONGO_SVZ Год назад

      Спасибо@@PythonToday

  • @KrasFly
    @KrasFly Год назад +1

    Спасибо, очень интересно!
    Но не нашел информацию, можно ли использовать эту библиотеку для файлов с субтитрами. Было бы полезно использовать для озвучки видео

  • @ДмитрийАртёмов-ы6щ

    Пока из всех моделей синтеза речи мне больше всех нравится сберовская. Конечно я аудиокниги не озвучиваю,только небольшие фразы, но результат вполне себе, очень близко к живой речи.

    • @PythonToday
      @PythonToday  Год назад +4

      А есть ссылка на гит? Может какие-то проекты уже есть

    • @ДмитрийАртёмов-ы6щ
      @ДмитрийАртёмов-ы6щ Год назад

      @@PythonToday у меня к сожалению нет примеров на гите. У сбера документация неплохая. Я пользую их сервис только для генерации фраз, а потом в коде уже аудиофайлы юзаю. Мне что нравится у них, что для физических лиц до 200 000 символов кажется бесплатно в месяц.

  • @rustamakhmullaev5697
    @rustamakhmullaev5697 Год назад

    Спасибо за шикарный контент 👍👍👍 Вы юзаете кайли линукс как основную рабочую ОС?

    • @PythonToday
      @PythonToday  Год назад

      Благодарю за фидбэк! Да, kali основная на данный момент.

  • @SandraHyper-d5t
    @SandraHyper-d5t Год назад

    Подскажите, пожалуйста, как сохранить Bark модель не в кэш, а в другую директорию? Какой метод нужно использовать? А то BarkModel говорит, что у него нет метода save_pretrained.

  • @rvsn82
    @rvsn82 10 месяцев назад

    Очень интересно, и познавательно, Однако непонятно как его можно запустить на компьютере и чтобы это работало как программа?

  • @jertvaonlines
    @jertvaonlines Год назад

    В телеге не нашёл поста с голосами.

  • @VPavell
    @VPavell 11 месяцев назад

    Блин, почему по памяти все время падает "CUDA out of memory. Tried to allocate 16.00 MiB" ? GTX 1060 6GB кажется должно хватать.

  • @Зритель_Ютуб
    @Зритель_Ютуб Год назад +7

    ну и где результат?

  • @melsior1
    @melsior1 Год назад +2

    не плохо было бы уточнить минимально рекомендуемые требования к железу для запуска с CUDA, чтобы такие нищеброды как я не пытались запустить с 4Гб видеопамяти)))

    • @ml_funny_situation
      @ml_funny_situation Год назад

      Жиза, но можешь попробовать в гугл колаб запустить

  • @nikolaydd6219
    @nikolaydd6219 Год назад +2

    Автор, проверяй видео до публикации. Примера не слышно.

  • @polkovnikvasin1831
    @polkovnikvasin1831 Год назад +1

    Звука на слышно тот что сгенерирован . А потом я уже давно перешел с железа на гугл колаб . Для меня это не то что вчерашний день, свое железо , это день который был 3 года назад. Тот кто кувыркался с питоном и установкой tensorflow меня поймут. Плюс там есть среда T4 GPU , бесплатно пару часов .... не помню до 7 часов бесплатно но по факту давали 2-4 часа в день и есть TPU бесплатный не ограничен тоже круть я на нем и сижу.

  • @xazratbekturdaliyev1274
    @xazratbekturdaliyev1274 Год назад +1

    Всем привет
    Я парсил сайт с помощью Selenium и получил необходимую информацию в возвращаемом от него html, но некоторая информация скрыта, то есть какая-то дополнительная информация появляется после нажатия на выпадающее меню.Как получить эти скрытые данные с помощью Selenium? было бы здорово, если бы вы сделали видео о том, как парсить скрытые данные с сайтов

    • @pro100ya3
      @pro100ya3 Год назад

      На некоторых сайтах защита от selenium приходиться имитировать работу хрома .

  • @rinatyagafarov5328
    @rinatyagafarov5328 Год назад

    Благодарю за видео. Так глядишь и свою умную колонку можно сделать на малинке или апельсинке, плюс там из питона легко обращаться к пинам, а от них уже к релюшкам.

    • @PythonToday
      @PythonToday  Год назад +1

      Идея хорошая, но подсказали ранее про нейросеть сбера, платная конечно, но попробовать думаю стоит. Есть и бесплатный месячный лимит

  • @L_Creator
    @L_Creator Год назад

    Молодец! Ты мне очень помог!

  • @Впоискахпармезана

    Это нормально, что либы torch и scipy занимают несколько гигов (Ubuntu)? Не смог воспроизвести код у себя, так как закончилось место на диске)

    • @negative-example
      @negative-example Год назад +1

      Да, все что касается нейросеток - ужасно жирное. Но по нашим временам терпимое. Вчера купил недорогой SSD на 512 - вышло всего 2750. Так это пол-терабайта же. 128гигов - тысячу стоит с чем-то. Или подмонтировать флешку и на ней держать проект (но будет, конечно, медленнее) Но в самом страшном и безвыходном случае - можно покуситься на святое и удалить игры или коллекцию проно. Но я пока до этого не дошел - докупаю диски.

  • @BorisChuprin
    @BorisChuprin Год назад

    Сорян за странный Виндаводский вопрос, но куда можно закинуть в проект скачиваемоую им pytorch_model.bin модель, которую он скачивает во временный кэш папки users ? Т.е. хочется иметь эту библиотеку всё в venv проекте, а не непонятно где, какое-то время.

  • @agronomy9746
    @agronomy9746 Год назад

    Неплохо неплохо, очень хорошо сделано

    • @PythonToday
      @PythonToday  Год назад

      Благодарю за поддержку!

  • @XCLIPS_VIDEO
    @XCLIPS_VIDEO Год назад

    а будет гайд как развернуть проект по качеству как у eleven labs? там прям очень крутая озвучка получается

  • @ruservices
    @ruservices 5 месяцев назад

    Добрый день. Подскажите таким образом казахский текст озвучить можно?

  • @maksberegovoi5134
    @maksberegovoi5134 Год назад

    Какой темой ты пользуешься ?Как изменять цвета def/if , чтоб они были разного цвета

    • @PythonToday
      @PythonToday  Год назад

      Тема Night Owl

    • @maksberegovoi5134
      @maksberegovoi5134 Год назад

      @@PythonToday Спасибо , не хотите попробовать библиотеку web3py ? Очень хочется увидеть ваши видео с её использованием

  • @Искатель-э3й
    @Искатель-э3й 7 месяцев назад +1

    Да нет, звучит ужасно... А вот за проделанную работу, спасибо.

  • @idstrctmsf
    @idstrctmsf Год назад

    Я всегда думал что эта библиотека называется "сципай", теперь тоже ее скипи называть буду))

  • @Vladimir_Chunin
    @Vladimir_Chunin Год назад

    Сейчас куча он лайн сервисов,которые качественный дикторский голос делают и быстро

  • @veanvi
    @veanvi Год назад

    Acapela Alena TTS + Балаболка умела тоже самое еще 10 лет назад, но без каких либо задержек. Закидываеш книгу в балаболку, через 5 минут на выходе аудио книга. А програма Balcon, от создателя Балаболки, может делать тоже самое, что и балаболка, но из терминала или из вашей программы.

  • @АлександрБаранов-ф4д

    Прикольный скрипт. К нему бы прогресс бар и было бы вообще норм

  • @best_motivational_quotes_1
    @best_motivational_quotes_1 Год назад +1

    Спасибо за видео, получилось полезно!
    А не мог бы ты расписать вариант использования Google Colab для данной задачи?
    Думаю, что многим это будет интересно, ведь далеко не у всех есть мощная видюха на борту, а без неё генерация даже пары предложений совсем уж долгая получается :(

  • @davidsuragan
    @davidsuragan Год назад

    самый лучший синтез речи это Edge TTS. Бесплатно 👍

  • @bmlol
    @bmlol Год назад

    ток включил, у тебя начало видоса - такое чувство что включил какой-то сериал на ТНТ хД А так прикольно делаешь, спасибо тебе за такие видосы, иногда очень полезно. Вот бы еще новых видосиков про OSINT

    • @PythonToday
      @PythonToday  Год назад

      К сожалению osint был не особо интересен судя по отклику :( Большое спасибо за фидбэк!

  • @niks1302
    @niks1302 Год назад

    Скинь ссылку на сайт с голосами пжл

  • @chiefcentury
    @chiefcentury Год назад

    Ребят подскажите, я не очень сильно шарю в питоне, но хочу сделать обычный скрипт который циклично нажимает 2 клавиши на клавиатуре сколько я не перепробовал кодов, ничего не происходит, я даже код написал, что скрипт по кнопке запускается и всё равно заданные клавиши в скрипте нигде не нажимаются, в чем может быть проблема?

    • @chiefcentury
      @chiefcentury Год назад

      вот код
      import keyboard
      import time
      # Переменная, обозначающая, запущен ли скрипт
      running = False
      def start_stop_script():
      global running
      running = not running
      if running:
      print("Скрипт начал работу")
      else:
      print("Скрипт остановился")
      keyboard.add_hotkey("home", start_stop_script)
      # Главный цикл скрипта
      while True:
      if running:
      keyboard.press("enter")
      time.sleep(1)
      keyboard.press("up")
      time.sleep(1)
      keyboard.release("up")
      time.sleep(1)
      keyboard.press("enter")
      time.sleep(1)
      keyboard.press("up")
      time.sleep(1)
      keyboard.release("up")
      time.sleep(1)
      keyboard.press("enter")
      time.sleep(34) # Задержка 34 секунди
      else:
      time.sleep(0.1) # Задержка 0.1 секунды

  • @MichailS-e5l
    @MichailS-e5l 4 месяца назад

    а где ссылка на код?

  • @jdk_h
    @jdk_h Год назад

    Молодец, еще и рекламу вставил, решил монетизировать

  • @the_huge_knight
    @the_huge_knight Год назад

    Почему "scipy" автор произносит как "скипи"?

  • @ar3love474
    @ar3love474 Год назад

    Аааааа срочно как привязать это к голосовому асситенту, gpt говорит это не возможно, я считаю что возможно ахах

  • @tilektemirhan9925
    @tilektemirhan9925 Год назад

    Используй Azure , намного быстрее , шустрее и меньше кода

  • @ikRestik
    @ikRestik Год назад

    мдаааа..... жаль, что звук в примерах не слышно =( если только выкручивать громкость на максимум

  • @Alukard-789
    @Alukard-789 Год назад

    ❤❤❤❤❤❤

  • @prosto_odinochestvo
    @prosto_odinochestvo Год назад +2

    звук еле слышно.

  • @its_prikolist
    @its_prikolist Год назад

    Слушай а где ты научился так быстро печатать?
    Дак так я просто смотрю pythontoday

    • @ml_funny_situation
      @ml_funny_situation Год назад

      В игры поиграй и научишся

    • @ragents
      @ragents 2 месяца назад +1

      игры+коддинг

  • @vengr3020
    @vengr3020 Год назад

    ха, заработала первая половина))) эт я олень)))

  • @TheMorpheios
    @TheMorpheios Год назад +3

    Silero круче озвучивает

  • @diyorbek553
    @diyorbek553 Год назад

    А можно етот код писать в телеграм бот

  • @djvo1979
    @djvo1979 Год назад

    Что за терминал такой симпатичный?

  • @reut_live
    @reut_live Год назад

    def main лишняя публичная, лучше убрать под магическую строчку. Так мне мой ревьюер говорит))

  • @ko-prometheus
    @ko-prometheus Год назад

    Ничего не было слышно!!!!
    Повтори снова. Давай озвучим какой то фрагмент из книги на английском языке, перевод и озвучка на русском.

  • @ЕвгенийБорисов-е1ч

    и ни одна дрянь не взяла не дообучила 1 нейросеть чтоб хотябы 1 голосом на руссише норм было и бесплатно

  • @Seventeen577
    @Seventeen577 Год назад

    Почему ты перестал снимать пентест контент?

    • @PythonToday
      @PythonToday  Год назад +1

      Ютуб не любит эту тематику. Всё касаемо пентеста буду выкладывать на бусти

  • @zubarer
    @zubarer Год назад +1

    привет

  • @billy1771
    @billy1771 Год назад

    когда пентест? ))

    • @PythonToday
      @PythonToday  Год назад

      Пентест будет только в приватке, на ютубе больше выпускать не буду

  • @kks9518
    @kks9518 Год назад

    И ВЫ КОНЕЧНО СЛУЧАЙНО ЗАБЫЛИ УТОЧНИТЬ ЧТО НУЖНО БУДЕТ СКАЧАТЬ 4.5ГБ ФАЙЛ

    • @PythonToday
      @PythonToday  Год назад +1

      А что вас удивило? Почти всегда модели весят не менее нескольких гигабайт.

  • @super_man-ArtOfWar3
    @super_man-ArtOfWar3 Год назад

    Скипи....
    Нампи....

  • @Loveisdarknesss
    @Loveisdarknesss Год назад

    Получилось только через gTTS через эту парашу не хочет (((

  • @lolikice8283
    @lolikice8283 Год назад

    А я первый бебебе

  • @kzvideo9967
    @kzvideo9967 Год назад

    можешь взломать аватарию? есть 2 читера которые я знаю на питоне крутят ресурсы в игре , но не рассказывают как и кидают людей на бабки

  • @MichailS-e5l
    @MichailS-e5l 4 месяца назад

    Как же глупо и нелепо выкладывать код только в телегу. Автор умеет думать головой?

  • @MichailS-e5l
    @MichailS-e5l 4 месяца назад

    Отстой, код не работает

  • @Chel1k7
    @Chel1k7 Год назад

    Это параша а не озвучка, силеро лучше выбирать для этого

  • @Сливыприватныхкурсов

    интересно, кто же написал о bark, в прошлом видео tts. bark это GPT модель, она может добавлять свои артефакты

  • @Bunkerniy_Gadenish
    @Bunkerniy_Gadenish Год назад +1

    нихера не слышно. сделай видос как петь песни! Как такое сделать? Марк Фейгин & Алексей Арестович - Gangsta's Paradise. концерт в Лас-Вегасе (ai voice cover)

  • @abakar05
    @abakar05 Год назад +1

    Интересно, но эти голоса да и сам принцип воспроизведения текста ДНО

  • @lookbook.ai.
    @lookbook.ai. Год назад

    давай про изменение голоса мужского в женский