НЕЙРОСЕТИ + PYTHON | Преобразование текста в речь на Python, Точность 100%
HTML-код
- Опубликовано: 10 июн 2023
- clck.ru/34aR2w - развивайте навыки в работе с данными на курсах от Яндекс Практикума
⚡️ Практика Python ⚡️
В данном видео работаем с лучшим сервисом для преобразования текста в речь с помощью Python. Разные голоса, как мужские, так и женские, интонация, знаки препинания, точность 100%!
🔥 Доступ в приват | Поддержать проект:
boosty.to/pythontoday
/ pythontoday
yoomoney.ru/to/410019570956160
💰 Стать спонсором канала:
/ @pythontoday
Код проекта в telegram канале:
t.me/python2day
****Ссылки****
Дешевый/надежный сервер в Европе:
zomro.com/?from=246874
promo_code:
zomro_246874
Хороший proxy сервис:
proxy6.net/a/149995
Зарабатываем 10 000 за вечер | Лучший модуль для распознавания речи
• Фриланс на Python | За...
С нуля до 100 000 за полгода | Что должен знать JUNIOR PYTHON разработчик в 2023
• С нуля до 100 000 за п...
КАК ЗАПУСТИТЬ TELEGRAM БОТА ИЛИ ПАРСЕР НА СЕРВЕРЕ
• КАК ЗАПУСТИТЬ TELEGRAM...
8000р за вечер на фрилансе | Обучение парсингу на Python
• 8000р за вечер на фрил...
Неуловимый русский хакер | Банковские трояны, шифровальщики, хакерский клуб и миллионы долларов
• Неуловимый русский хак...
Программы на Python | Авто переводчик с разных языков в чате на Python | Python socket
• Программы на Python | ...
OSINT Python | Как найти человека в интернете? | Поиск по социальным сетям
• OSINT Python | Как най...
Выполняем тестовое задание на Junior Python разработчика с зарплатой 70000р:
• Выполняем тестовое зад...
Зарабатываем на фрилансе | Requests, bs4 и телеграм бот на aiogram:
• Обучение парсингу на P...
Вычисляем по IP с помощью Python | Как определить местоположение по IP:
• Вычисляем по IP с помо...
Как узнать пароль от Wi-Fi с помощью Python | Достаем пароли от Wi-Fi точек доступа в Windows:
• Video
Python с нуля | if _name_ == '__main__' | Зачем? И почему нужно использовать
• Python с нуля | if __n...
Асинхронный парсинг на Python | Ускоряем код в 10 раз
• Асинхронный парсинг на...
Плейлист по распознаванию лиц на Python:
• Распознавание лиц | Fa...
Плейлист по парсингу сайтов на Python:
• Парсинг/Scraping
Плейлист по Instagram боту:
• Instagram Bot на Pytho...
Плейлист по Linux для новичков:
• Linux для начинающих
****Соц.сети****
Telegram: t.me/python2day
t.me/python2day/3176
#нейросети #chatgpt #python #программирование
LdtCKRMfc
Спасибо! за код и за разъяснения очень классно все рассказал. Начал интересоваться нейросетями и хотел автоматизировать перевод, чтобы не заниматься копировать вставить. По данному методу код выполняется один раз исходя из того, что данные мы самостоятельно проставляем именно методом копировать вставить. Познакомился с виртуальным окружением, тут у кого-то была ошибка из за того что он плохо слушал про переменную окружения и собственно его api был не в переменной, а в самом коде. Начал искать как можно работать с фалом excel и выводить значения колонок, на принт с этим разобрался тоже. Пока не разобрался как зациклить переменную main, чтобы можно было брать значения текст из колонки 2 и вместо значения {unx_time} подставлять id колонки текста и после прохождения всех колонок остановить код.
Это очень круто. Спасибо тебе!
Спасибо, единственный канал где я нашел нужную мне инфу, респект афтору.
Мясо 🔥 Благодарю за Ваш труд!
Спасибо за поддержку!
Кстати, было интересно увидеть практический кейс по работе с pandas и numpy. В ютубе конечно есть видео, но решения, которые там есть вообще непонятно зачем нужны, т.к. большинство авторов совсем не умеют объяснять "для чего это нужно" ((
Супер можно использовать для детей с аутизмом, которые не умеют готовить.
Согласен, благодарю за фидбэк!
Спасибо огромное )))) уже делаю задания на фрилансе:) просто пушка
Спасибо за труд, здоровья и успехов братишка!
Спасибо за фидбэк! Взаимно!
Здравствуйте, я недавно начел изучать aiogram и создавать ботов, я столкнулся с такой проблемой что бот который находится в группе с правами администратора и может читать сообщение от других пользователей группы но не может читать (ловит) сообщении от других ботов. Как можно решить эту проблему? Подскажите пожалуйста
Это видео не про синтез речи (создание своей модели, написания алгоритма на pytorch), это гайд про запросы к платным сервисам.
Как всегда огонь, продолжай по мере возможности! Спасибо за практику!
Спасибо за поддержку друг!
молодец автору респект за развитие ПУ общины и ИТ в общеем !!!
да голоса шикарные, следуют по тексту норм, а можно ли заменить голос на другой (хорошо обучений в какой-нибудь RVC ? ) или нужно полностью создавать свою библиотеку и совать туда голос ????
Видео в рекомендациях через минут,вот это да
Круто!
Круто💯🚀👍
Благодарю! Видео было полезным и очень интересным! Все получилось запустить ))
Благодарю за фидбэк!
Можно будет книгу про алгоритмы на python озвучить) Ну или на другом сайте сделать. В любом случае вы просто must have для начинающих, теперь научился работать с api этого сайта, но free 10$ не хватает на фулл озвучку. Буду теперь с гугл пилить программу) Спасибо за идейку) 4:08
а замазывание лиц в датасете уже было/можно?
Отличное видео, спасибо
Благодарю за фидбэк!
Это все конечно интересно, все пишут ролики какие нейросети крутые и как получить по апи результат с сервиса. Но нет ни одного видео как подключить все эти питонячьи скрипты в работу хотя бы в ту же Calibre. Поразительно, но факт. А без этой возможности эти сервисы не очень то обычным пользователям и нужны. Тот кто владеет кодом и сам может себе сервис сделать под свои хотелки.
Не понял, зачем скачивать аудио если можно просто сохранить сохранить содержимое 'audio' из json в файл?
как?
Какой смысл подключаться к прокладке которая перепродает? Вы делаете запрос к ним, они к Google, потом сохраняют к себе и дают вам ссылку. Что мешает делать запрос без них???
Там же в ответе в json само аудио есть, можно было не делать запрос на скачивание) Или я ошибаюсь?
@@molod1 нет, там есть байты самого аудио
Крутой ролик получился!
Спасибо за поддержку!
дайте ссылку на саундтрек пожалуйста
У них оказывается целая тьма всевозможных молелек. И распознавание лица и чат, спасибо что показал. Залип на пару дней
Рад что полезно! Спасибо за фидбэк!
Интересный проекте еще реализовывал, озвучку рукописного ввода на keras + yandex speechkit
Приветствую, А есть возможно сть написать сеть дял преобразование речи в тест?
есть проект под названием Vosk. не плохое офлайн распознавание речи.
Привет! Прекрасный и интересный контент, как всегда! Но у меня (чайника) появился вопрос насчет вида терминала. Как можно сделать такой лаконичный терминал как у тебя? Имею ввиду чтобы он выводил не как в PowerShell стремно, а как у тебя ?
Здравствуйте, для начала уйти с windows 😀 А вообще думаю есть различные моды, just google.
Есть какой то аналог oh my zsh для windows.
А вообще, установи WSL2 и на неге накати zsh/oh my zsh.
Круто! А что-нибудь опенсорсного и офлайнового в таком духе еще не появилось?
Самому интересно, дай знать, пожалуйста, если найдешь
Лучший канал с практикой по Python! Вот бы по программированию под apple такой найти, да вообще по всем. Большое спасибо за труд!)
Большое спасибо за поддержку! Буквально сегодня часы смотрел и задумался над софтом, захотелось что-то своё написать, даже обычный виджет погоды, задумался стоит ли лезть в Swift))
@@PythonToday интересная идея, я б глянул
@@PythonToday я боюсь вообще в сторону айоса смотреть, мне и на линуксе хорошо)
Так ios это же про смартфоны/планшеты. За качественный продукт пользователи готовы платить) Так что на самом деле есть резон изучить, а если ещё и есть идеи...
@@PythonToday у меня знакомый на свифте стругает, говорит что не плохо, но я пока лучша на ботах посижу)
блин круто. скажите а в пайчарм можно ткое замутить? Я аудиокнигу хотел бы озвучить через прогу такое потянет?
Не совсем понял причем здесь ide, не важно в каком редакторе вы будете набирать код, это скорее дело вкуса.
Есть готовые программы говорилки для озвучивания книг. Я такими 15 лет назад пользовался.
спасибо
Привет! Очень круто! Как раз то, что я искал!!! А может кто-нибудь в курсе, как поставить ударение, чтобы говорилка читала "начАла", а не "началА"? В документации по API такого не нашел... Но как-то же это реализовано на других сайтах с онлайн говорилками...
ну вот и все, я почти закончил писать своего ассистента, спасибо за идеи, правда скорее всего мой ассистент теперь больше пентестер гпт, потому что в нем столько скриптов понапихано это ужас. Начиная с обычного времени и гпт , заканчивая кейлогеррами и скринлоггерами которые отправляются сразу на почте, удивлен как увеличилась скорость выполнения запроса у GPT, изначально думал что буду общаться с задержкой в секунд 10-20, а теперь все пару тройку секунд, хочется научить его обучать модельки для того же stable diffusion ахах, но это случится явно не сегодня... я устал... это проблема для завтрашнего меня 😹
День добрый, можно пожалуйста инфу о том как пользоваться переменным окружением, чтобы выгружать из него скрытый ключ, или ссылку на то где об этом можно почитать?)
Я так понял,, что получаешь какой то ключ (некая строка) и в винде(если она у вас) прописываешь в переменных среды (Мой компььютер-свойства-доп пар системы... в свойствах системы - кнопка "Переменные среды"). Даешь ей свое имя MY_KEY, а значением прописываешь строку-ключ... Это значение у тебя бедет постоянно висеть в памяти и из питона будешь доставать ее функцией os.environ["MY_KEY"]
@@user-vc5sn3ob6c Ну это как по мне не особо удобно, вроде можно все это прописать в vscode, tasks.json или типо того. Так например можно сделать в пайчарм.
Нельзя привязываться к ide типа пайчарм, vsCode.... Питоновый скрипт может быть написан в ноутпаде. Что мне в голову приходит, то надо создать отдельный питон файл и в нем установить имеющиеся переменные окружения (пароли на подключения к сайтам каким). Уже в другом питон файле, что покажешь в ролике, ты импортируешь ранее указанный файл . При импорте он выполнится и установит нужные ключи в переменные окружения. Ну а затем в открытом файле, в котором ваяешь урок, ты извлекаешь эти ключи в переменные, не засвечивая их зрителям.
Добрый день! Отличное видео
А как сделать так, чтобы нейросеть могла определять, есть ли на странице сайта та или иная информация? Например - вводим url страницы. Нейросеть "смотрит" (изучает) всю страницу сайта. Разбивает ее на области: шапка, 1-ый экран, левый сайдбар, правый сайдбар, область контента (со статьей), подвал сайта.
Далее, определяет, например, на странице сайта, в шапке сайта есть логотип, график работы, форма поиска, кнопка заказа звонка и т.д. В области контента есть схема работы, портфолио, таблицы с ценами, вопрос-ответ.
По итогу, создает таблицу какие блоки нашла, какие не нашла.
Такое реально сделать?
да
Хотелось бы видеоурок с практикой по таким моментам:
Кнопки в телеграмм бота которыми управляются переменные в твоем коде, например изменение мужской озвучки на женскую
Как вариант, использовать бд.
А что сложного?
Пусть действие кнопки в боте, относительно юид пользователя, меняют в бд значение переменной, какой голос хочет использовать пользователь.
Странно как-то, делал тест-запрос с самого сайта, результат:
{
"lovoai": {
"error": {
"message": "Lovoai has returned an error: Internal server error."
},
"status": "fail"
}
}
как прочитать wav формат или надо чтото установить?
С такой-же проблемой столкнулся
Спасибо, подскажите, а есть ли бесплатная говорилка на русском языке ? Хотелось бы чтоб говорил комп более человечно, а-ля алиса.
А такие обученные нейронки для озвучки нигде не сливали? Мне даже не топ качество пойдёт, главное бесплатно.
Я так понимаю, этот чудо прибор работает ровно до тех пор пока не закончатся купленные токены на сайте? А зачем тогда городить сложности и просто не озвучить на самом сайте все что нужно?
Привет а можешь сделать видео для перевода аудио или видео в текст?
Здравствуйте я уже посмотрел все ваше видео , и очень уважаю вас , если вам не лень можете написать телеграмм бот по скачиванию видео с Ютуба Инстаграмма или вообще с интернета
Здравствуйте, данные видео есть в приватке на бусти
👍👍👍👍👍👍
Спасибо за ответ, у меня есть идея по видео , сделай видео где подробно объясняет как установить Kali-linux на компютер всем будет интересно, и в Ютубе я не нашел ни одного видео где объясняют как устранить кали , спасибо за ранее
Что сложного?)
Просто следуешь инструкции с оф сайта, а потом по время установки, читаешь буквы на экране. И готово.
Ничего личного, но с такими навыками, кали тебе ещё не нужен)))
Там фейсбук же выпустил бесплатную библиотеку? Или я путаю
Thank you ❤
Подскажите, в чем может быть проблема в файле json приходит просто словарь с одной строкой
'detail':'Method \'GET\' not allowed.'
Все прописано правильно, но почему то get запрос не разрешен
А причем здесь get запрос? Смотрите/слушайте/сверяйте код(всё в открытом доступе) внимательней 🙃
ЕЕЕ
вижу видос один из первых, спасибо тебе PythonToday)
самый крутой канал СНГ по практике!
раздели ж ты код по ФУНКЦИЯМ БЛИН
от заставки трусы слетают
Большое спасибо за поддержку! А чего разбить то, сохранение в отдельную что-ли выносить? Это ведь простенький с крипт, даже без основных параметров в функции. p.s держи трусы крепче))
@@PythonToday как минимум)
Я всегда придерживаюсь правила что функция должна быть полностью видна в редакторе, и должна быть чистой(выполнять одну задачу). С таким подходом ты мог просто всё забабахать в мейне и не париться, сечешь?
P.S: не поможет, заставка просто бомбастик) как доучу fast api, выполню пару заказов на фрилансе и куплю доступ в твой чат)
(Хотелось бы видеть бесплатный!)))
@@PythonToday а если расширять? А если кто то захочет твой скрипт дописать? Так скачал и опааа, уже всё сделано и разбивать ничего не надо
@@PythonToday как связаться то с тобой? У меня есть куча крутых идей по практике)
Так пускай и дописывают) Я знаю что у меня говнокод, но учусь по фану и делюсь практикой)
Есть же Text-to-Speech AI от гугла там тональность можно подкручивать даже
Нейросеть Silero TTS можно скачать прямо на комп и работать без интернета. Видеокарта тоже не нужна.
Ссылку на скачивание оставь. А то на сайте только через телеграм я нашел и всё (
@@user-zv9gi2ui2m всё доступно на гитхабе.
Это худший синтез речи, тогда уж лучше TeraTTS
@@user-wk7wc9oh9h пока только один нормальный голос к сожалению, а так да достойно
А как добавить английские голоса?
Т.е. тебя не смущает размер json ответа и нужно пойти и скачать заново почти тожесамое? Вот из-за таких кодеров все работает медленнее в разы чем могло-бы быть, я бы постыдился такое выкладывать
Зачем писать аудио файл в бинарном режиме?
Ссылку оставь на готовый продукт, чтоб пользоваться можно было)
Код из всех видео доступен в телеграме, ссылка в описании
Я пересмотрел с пару десятков различных генераторов голоса и именно Русский язык лучше всего генерирует именно нейронка Яндекса.
Я первый!
а есть бесплатные такого же качества?
Silero в некоммерческих целях бесплатно. + автономно. не надо никакого интернета для работы. нейронная сеть достаточна маленькая, работает на устаревших компах.
@@prosto_odinochestvo на совсем устаревших не работает, нужно процессор интел хотя бы 5 поколения. Используется специфичные инструкции. А так Silero огонь.
@@TheMorpheios а на сколько голос близкий к реалистичному получается?
@@MrKim-pt2vm там 6 голосов плюс рандомные. Девчачьи голоса Бая и Ксения прямо вообще не отличить, можно скамить, единственное надо ударение иногда проставлять, не всегда правильно ставит но можно принудительно. Можно без установки послушать на Habr выкладывали статью с примерами, гуглить по запросу Habr Silero Tts
@@TheMorpheios а бесплатно там какие ограничения
Ля, как актуально. Экзамены сдаю, хочу озвучить текст и включить на фоне игры:))
четверть ролика реклама?
((
без функции main() ничего не получится да?
Чувак ты меня реально выручил, синтез речи реально лучше чем в обычном gtts 👍
Я использовал pyttsx3, но хотелось бы что-нибудь получше... А этот вариант не катит, так как надо вечно менять АПИ ключ... Нет, можно конечно как-то автоматизировать это дело, через перерегистрацию и пересоздание левых почт, но это громоздко и не хочется всем этим заниматься...
@@EmptyUserНе совсем понятно, зачем вам постоянно менять ключ???
@@user-ue7wu2qc6fчтобы не платить
Да, интересно.
Не нужно искать и исследовать эти сервисы.
Самое долгое и не приятное - это заниматься исследованием этих сервисов и их возможностей.
Писатели скриптов мне напоминают агрофоманов. Кучу полезных скриптов написали но Где результат? Где же Готовое решение. Уже лет 10 как минимум Пользуюсь корявым Преобразованием текстов Речь. И всё это время нахожу вот такие вот видео. Так а где собственно хотя бы одна программа скомпилированная в экзешник? Чтобы нормально работало и могла Преобразовывать Текст в речь Неотличи мою от настоящей. Я этот вопрос поднимал ещё в 2017 если не ошибаюсь. В книге 3.0 слушайте. Так до сих пор и слушаю этими синтезаторами...
Кота увидел = лайк поставил :)
Спасибо за поддержку)
Кому нужны какие-то сторонние платные api, когда уже давно есть куча локальных модулей для этого? Лучше бы про них рассказал.
Приведи пару примеров, хотя бы
@@missingsata bark, silero, например. Первый даже голос клонировать может.
Suno bark @@missingsata
Загуглил «озвучить PDF мужским голосом». Понадобилось по тому, что там 48 листов А4 мелким шрифтом, и мне влом всё читать, но надо. И решил прослушать в наушниках. Ничего особенного. Я не собираюсь ничего программировать! Что за кодинг ты мне втираешь сразу? Пипец.
Помоему api silero не хуже и пока абсолютно бесплатно))))
Сколько много математических терминов 😵💫
Блеск
А как у него обстоят дела со смешанной озвучкой? Что будет, если в одном предложении попадутся одновременно русские и английские слова?
Не пробовал, но вопрос интересный. Даже не задумался об этом
Можно на "Механическом апельсине" поверить - там в нормальном (близком к авторскому) варианте есть русско-английские фразы у персонажей 😊
Красава, почему крупные компании до сих пор не могут сделать такие преобразователи(
Благодарю за фидбэк! Так делают же
Зачем эти кликбейты в названии? Схрена ли ты на пайтоне преобразовываешь речь? Хттп запросик готовому сервису и хттп ответ. Пипец магия, блин.
если ты считаешь это идеальным произношением, то ты не знаешь о bark
Зачем весь этот гЕмор, когда есть готовые онлайн сервисы бесплатные с качественной речью
Во первых, это не гемор.
Во вторых, для собственных проектов, где нужна автоматическая функция озвучивания текста. Чтобы всё делал код, компьютер, а не человек.
Отвечу сразу на возможный вопрос, где это может пригодиться. Да много где! Какая-то реклама в реальной жизни, которая бы озвучивала последние новости компаний. Может быть чат бот ассистент. Или ещё что-то другое, вариантов много.
Мда... код понятный, но... результат самого сервиса - голосовой файл - это нечто. Такой может вполне книги озвучивать ... Блин, скока людей потеряет работу из-за этих компутеров .... Если бы был социализм, то куда ни шло... А при капитализме, да без пособия, люди будут мрачные и голодные бродить по улицам. Только войнами их занять и можно будет...
Прогресс неизбежен, так было всегда. Думаю в ближайшие несколько десятилетий нас ждёт - "упадок человеческой культуры на фоне технологического прогресса в компьютерную эпоху" ака киберпанк. Если планету не загубим конечно раньше.
Согласен, давайте дальше жить в пещерах и охотиться на мамонтов, это же по культуре! Прогресс есть прогресс, эволюция есть эволюция, естественный отбор есть естественный отбор. Не нравится - выбывай)
Очень плохо озвучивает 😢 проблемы с ц з х п и так далее не во всёх словах но есть
Яндекс Практикум - ужасен
гугловские TTS тупо
😎😎😎😎😎UZBEKISTAN
Че с тобой?
@@muso566 Как вы думаете, что должно было произойти?
Вот это дичь
самоя худшая обучалка для новичков
Хочу более подробно
Очень интересно! Но я не понимаю!