Привет как отключить антивирус? Для того , чтобы он не блокировал мои коды, ведь когда я скачиваю с библиотеки bs4 он меня блокирует , так как отключить?
Товарищ, подскажите сайт хороший для фриланса в вебе. Бекенд/фронтенд неважно. Стек Django, Vue. Работаю фронтендером, но времени очень много остаётся, а денег хотелось бы больше.
судя по всему автор - представитель определенного типа людей,которые способствуют развитию нашего общества: человек разобрался,потратил время - объяснил всем,кому интересно.На какой бы выпуск я не попал - он всегда интересный,заставляет срочно попробовать самому и получить массу удовольствия,как будто сам разобрался😄.Спасибо тебе за твой вклад,ты проделываешь великую и крайне ценную работу!!!!
Спасибо тебе большое! Ты не только образовываешь но ещё и годные библиотеки и скрипты подкидываешь. Я лично считаю что таким и должен быть образовательный контент.
Для меня это оказался самородок, который всего за день работы помог заработать 10 тысяч рублей. Заказ для меня оказался бы необычным и даже не находился в разделе IT. Это к слову, что нужно мониторить все подряд. Мне нужно было получить текст из примерно 100 звуковых дорожек, общей продолжительностью более 15 часов. Объем весьма большой, все что я пробовал до этого работало с переменным успехом, особенно с кириллицей. Ну а перепечатывать вручную совсем не гоже, мы же программисты, хоть и в процессе обучения. Каждый кто сталкивался с самообучением, знает, самое сложное это получить практические навыки. С теорией все понятно, в нее нужно погрузиться, читая документацию или смотря ролики в ютубе. Но практиковаться начинающему программисту практически негде, стажировку найти сложно, а выполнять проекты в стол неразумно. При этом на фрилансе можно зарабатывать хорошие деньги. В онлайн школе SkillFactory эту проблему не только осознают, но и решают. На курсе Fullstack разработчик на Python 80% занимает практика на кейсах от бизнес-партнеров школы. Например, дипломный проект студентов - это сайт для складской техники. На протяжении курса вас поддерживают опытные менторы, а потом передают в руки центры карьеры, где вы увеличиваете свои шансы на трудоустройство или переход на фриланс. Помните, работодателям нужны люди с практическими навыками, получите их по ссылке в описании. А по промокоду PythonToday заберите скидку 50% на обучение. Окей, установим необходимую нам сегодня библиотеку. Модуль включает в себя тяжелые зависимости, так что придется немного подождать. Кстати, из коробки скриптор работает через видеокарту, что опять же является огромным плюсом. Импортируем модуль, создадим функцию Speech Recognition, в которой будет происходить вся магия. Функцию Main и условия if name равно Main, в котором вызываем функцию Main. Если вы пока не знаете, для чего нужно использовать данные условия, посмотрите видео по всплывающей подсказке. Первым делом нам нужно подгрузить модель. Создадим переменную и передадим модель функцию LoadModule, вызванную у модуля Whisper. Приступаем к транскрибации. Обращаемся к созданному ранее объекту. Используем состояние Transcribe, в котором нам нужно передать звуковой объект. Это может быть любое голосовое сообщение, или в моем случае я взял песню на русском языке, сохраненную в директории дейта. Я не смог, даже будучи зная оригинал. Далее нам нужно сохранить результат файл. Используем контекстно ManagerWis. Open, первым аргументом указываем название файла. И пускай в названии присутствуют имя модели, чтобы они как-то различались. FlagW и сохраняем результат. В result нам придет огромный словарь с данными, нас в нем интересует ключ текст, в котором собственно и содержится распознанный модулем текст. В функции main первым делом создадим словарь. Ключами у нас будут цифры, а значениями названия моделей. Весь код из видео, а также описание модуля с примерами работы вы сможете скачать в нашем телеграм-канале. Пробежимся циклом по словарю и выведем данные в терминал. Далее запросим у пользователя цифру, чтобы понимать какую модель он хочет использовать. Не забываем привести значение к целому числу. Сделаем небольшую защиту от дурака и напишем условия проверки, что если выбранного значения нет в ключах словаря, то завершим работу скрипта исключением. Наш скрипт готов, давайте тестировать. Запустим скрипт и для начала выберем несуществующую модель, чтобы проверить, что скрипт завершит свою работу. Пробуем. Отлично, вылетело исключение. Запускаем еще раз и выбираем самую первую модель. Кулера на видеокарте даже не запустились, а модуль справился буквально за пару секунд. В директоре у нас создался текстовый файл. И, друзья, попробуйте узнать, что это за песня. Обязательно напишите комментарий, получилось ли у вас. По мне так торопорщено и ничего не разберешь. Запустим скрипт еще раз и на этот раз выберем модель под номером 4, медиум. Пятерка с ларч у меня не запускается, видю хостаровато. На этот раз загудели кулера и тепло подуло в ноги, но и работа занимает чуть больше времени. Посмотрим, что получилось. Вот, другое дело. Думаю, многие узнали этот трек. Библиотека само собой отлично справляется с английским языком даже на базовых моделях. Да, местами подлагивает, но на мой взгляд это лучше на сегодня модуль. Ведь так я понимаю, что не зря выкладываю ролики. Друзья, огромное вам спасибо за просмотр, подписывайтесь на канал, будьте здоровы, всем пока!. . .
@@_test_test Зачем руками? Сначала скачиваешь аудио дорожку видео через yt-dlp, затем обрабатываешь аудио скриптом из видео и получаешь текст. Этот текст обрабатываешь ещё одним скриптом и получается текст, разбитый на абзацы.
Работал с данной либой. Очень достойные результаты. Только самые лучшие модели требуют достаточно много видеопамяти. Тем не менее, с моделью "small" почти всегда верно распознавал голосовые сообщения.
Ставьте лайки ему и по больше чтобы стата была нормальная иначе ютуб не будет приносить доход и мы потерям очень крутой канал. Сам плавал, знаю на сколько каждый лайк важен...
Отличное видео. Есть вопрос - сборка компа на Amd и проц и видяха. Вычисления производит по умолчанию на проце, как сделать так, чтобы вычислял на видеокарте?
Привет, часто смотрю твои видосы и тоже хочу научится классно пасить и автоматизировать браузер, но времени учится самому не так много, может у тебя есть курсы или ты берёшь учиников ?
Изначально не работает код даже который в документации. ошибка UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead") Traceback (most recent call last) затем большое количество ошибок в командах
все работает если на винде запускать - проблемы из-за "слешей" (надо "/" вместо "\" в пути ставить) и (возможно) кирилических имен пользователя еще файл "ffmpeg.exe" надо поместить в папку со скрипром
Здравствуйте,как решается эта проблема? UserWarning: FP16 is not supported on CPU; using FP32 instead (проц ryzen5 5600 видюха rx 470 oc windows 11 на pycharm)
Спасибо за такой годный урок! Получаю такую ошибку : UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead" Да, в результате все равно получаю текст. Но как понял, то у меня используется мощность процессора или встроенной видео карты. У меня так же есть дискретная в ноуте. Собственно как мне заставить работать дискретную при вычислении а не CPU?
Мне так же пришлось указать кодировку with open(f'transcription_{model}.txt', 'w', encoding='utf-8'), из-за ошибки UnicodeEncodeError: 'charmap' codec can't encode characters in position 1-8: character maps to , я так понял это из-за того что я выполняю код на Windows ( не ругайтесь, я начал свое знакомство с питоном ток пару недель назад)
@@ivanmigulin1452 можно взять "torch" в связке с проверкой поддержки CUDA - что-то вроде такого: --------_ # pip install openai-whisper import whisper import torch import os def speech_recognition(model='base'): if torch.cuda.is_available(): device = torch.device('cuda') else: device = torch.device('cpu') ______ PS: у меня (для других целей) стоят не только "дрова" NVIDIA, но и доп. ПО для работы с CUDA может потому "из коробки" код из видео сразу на GPU работал - есть подозрение что даже при наличии нужных "дров" исходный вариант кода все равно "по умолчанию" на CPU запускается
@@TheXai4yef В чем разница работы на GPU или CPU? это влияет на точность разпозгования? или только влияет на вычислительную мощность (типа быстрее обрабатывает)? За ранее спасибо
В этом месяце запустил скрипт на python виспера на отдельном сервере, который обрабатывает аудио файлы звонков колл-центра нашей организации. Оптимальной моделью скорость:качество для нас оказалась medium. Пока все устраивает.
@@PythonToday текст быстрее и легче анализировать. Для контроля работы сотрудников колл-центра, анализ отказов и успешных звонков. Sentiment анализ пока не прикручен. Сильно не углублялся в эту тему.
На канале уже есть видео по биржам, с детальным разбором. В принципе для меня в топе ничего не поменялось, это upwork. Для рф есть проблемы, но есть и методы как их решить. Больше года не сижу на биржах, редко беру заказы, сейчас это либо от старых клиентов, либо сарафанного радио + есть большое количество работы в телеграм чатах. В этом плюс фриланса, он сам тебя продвигает со временем.
Спасибо за видео-урок! Для меня очень актуальная тема. Но я нигде в описании не нашла названия модуля, в видео услышала один раз «whisper» - это и есть название модуля?
Спасибо, полезное видео) А какие модули можете подсказать наоборот для преобразования текста (английский) в речь? Кроме унылого gTTS. Хотелось бы что-то более качественное
Спасибо, за любой шпаргалкой по python всегда к Вам. У меня этот пакет отказался напроч работать. Во-первых, почему-то не видит видеокарту, форсит запуск с CPU,у меня RTX2060, драйверы свежие. Во-вторых, не может найти указанный файл. Пробовал, наверное, все варианты, влоть до того, что кидал в корень диска и название состояло из одной буквы. Кароч, не задалось.
@@Doctor_Pass_CUDO на винде проблемы из-за "слешей" (надо "/" в пути ставить) и кирилических имен пользователя. Файл "ffmpeg.exe" надо поместить в папку со скрипром. Для использования GPU можно задействовать "либу" TensorFlow или PyTorch, только придется скрипт изменить соответствующим образом
@@TheXai4yef можно, пожалуйста, поподробнее. Убил два часа и ничего не решилось. Так же, как и у людей жалуется на этот ffmpeg. Подробно что вы делали, может я упустил какой-то момент. Заранее спасибо!
@@ivanmigulin1452 повторюсь: на винде проблемы из-за "слешей" (вместо "\" надо "/" ставить) и кирилицы в пути к файлам файл "ffmpeg.exe" надо поместить в папку с кодом ну и про имя аудиофайла не забываем - если уж в коде написал "track_1.mp3", то и сам файл в папке "data" так же называться должен (а то бывали "прецеденты" 😉)
@@05Sheik у меня такая же ошибка, что с этим путём не перепробовал.. FileNotFoundError: [WinError 2] Не удается найти указанный файл. У Вас получилось решить?
Как передать заказчику выполненную работу, когда нужно написать подобный скрипт? Отослать файл архивом или выполнить работу у себя на пк (или где-то ещё) и просто прислать результат?(в данном случае, текст) Я ещё не выполнил не одного заказа и поэтому мне интересно, как это устроено.
Скорее всего заказчику нужен текст. Те это заказ на фрилансе не по программированию. Но автор ролика просто написал скрипт и теперь может брать простые подработки на распознавание текста. Заказчику естественно скрипт не надо в данном случае передавать, а только текст
Всегда по разному, кто-то хочет лишь результат, кто-то показать как на компе запускать скрипт, кому-то нужен веб интерфейс за доп.плату, некоторые просят разместить и поддерживатьработу скрипта на сервере. Так что...
а потом C:\Users\Администратор\Desktop\ворки ecogn_project\lib\site-packages\whisper\transcribe.py:114: UserWarning: FP16 is not supported on CPU; using FP32 instead warnings.warn("FP16 is not supported on CPU; using FP32 instead") Traceback (most recent call last): File "C:\Users\Администратор\Desktop\ворки ecogn_project\lib\site-packages\whisper\audio.py", line 46, in load_audio ffmpeg.input(file, threads=0) AttributeError: module 'ffmpeg' has no attribute 'input' During handling of the above exception, another exception occurred: Traceback (most recent call last): File "C:\Users\Администратор\Desktop\ворки ecogn_project\Lib un.py", line 24, in main() File "C:\Users\Администратор\Desktop\ворки ecogn_project\Lib un.py", line 20, in main speech_recognition(model=model) File "C:\Users\Администратор\Desktop\ворки ecogn_project\Lib un.py", line 6, in speech_recognition result = speech_model.transcribe('eva.mp3') File "C:\Users\Администратор\Desktop\ворки ecogn_project\lib\site-packages\whisper\transcribe.py", line 121, in transcribe mel = log_mel_spectrogram(audio, padding=N_SAMPLES) File "C:\Users\Администратор\Desktop\ворки ecogn_project\lib\site-packages\whisper\audio.py", line 130, in log_mel_spectrogram audio = load_audio(audio) File "C:\Users\Администратор\Desktop\ворки ecogn_project\lib\site-packages\whisper\audio.py", line 50, in load_audio except ffmpeg.Error as e: AttributeError: module 'ffmpeg' has no attribute 'Error' Process finished with exit code 1
@@trcamazing кажется у тебя как и меня, вместо GPU используются мощности CPU (я думаю это из-за наличия встроенной карты в проце), собственно FP16 не поддерживается CPU, поэтому в ход идет FP32.
@@Sweet-db1ip я так и не смог решить, приходится использовать CPU. Из-за этого результатом не доволен. Текст получается весьма неточный и плюс ко всему очень короткий. Т.е. беру для примера песню минуты на 3 и получаю только пол куплета
@@qwertycat938 для использования GPU (NVIDIA и ядра CUDA) можно задействовать "либу" TensorFlow или PyTorch, только придется скрипт изменить соответствующим образом еще заметил (ХЗ почему так) - "старая" версия "ffmpeg.exe" (февраль-март 2019) русский лучше распознает чем более новые (декабрь 2022 или апрель 2023)
Приветствую, всё зависит от того, чем ты хочешь заниматься, веб, геймдев, десктопные приложения и тд. Думаю в зависимости от этого и нужно выбирать язык
@@YYYtygames python, но лучше с него не начинать. Плохо поймешь принципы программирования. Попробуй уделить некоторое время плюсам, они очень хорошо научат кодить "правильно", а потом уже иди на пайтон. Работы много для всего, главное чтобы тебе нравилось заниматься этим
@@ivanmigulin1452 ну вот, можешь быть собой доволен) чел сейчас посмотрит на плюсы и забросит. останется работать на заводе, вместо того, чтобы за пару вечеров научиться писать тг ботов и брать какие нибудь заказы. чтобы найти работу плюсовиком, нужно его пару лет изучать
Привет, видео огонь. Но подскажи пожалуйста. У меня на выходе такую ошибку выдает и ниче я не могу с ней сделать - FileNotFoundError: [WinError 2] Не удается найти указанный файл. P.S Решил проблему, но коммент оставлю для продвига)
AttributeError: module 'whisper' has no attribute 'load_model'. здравствуйте, пишет что данного атрибута не существует и даже если заменить на какой-нибудь другой, дальше атрибут .transcribe. тоже не существует. ( пишу в пайчарме )
У кого ошибка: Решение: Нужно вставить этот код в начало программы import ssl try: _create_unverified_https_context = ssl._create_unverified_context except AttributeError: # Legacy Python that doesn't verify HTTPS certificates by default pass else: # Handle target environment that doesn't support HTTPS verification ssl._create_default_https_context = _create_unverified_https_context
Игрался с GPT, он мне накидал скрипт для транскрипции потом я еще транскрибацию допилил с использованием Wav2Vec2 нужно только модель подобрать обученную
Вам интерпретатор прямо говорит, что файл не найден. Проверяйте путь к файлу. Раз пользователь windows не забывайте про обратный слэш либо сырые строки при указании пути
@@kostgame2518 все работает если на винде запускать - проблемы из-за "слешей" (надо "/" вместо "\" в пути ставить) и (возможно) кирилических имен пользователя и еще файл "ffmpeg.exe" надо поместить в папку со скрипром
Читаю комменты и вижу что многие на винде сталкиваются с проблемой: FileNotFoundError: [WinError 2] Не удается найти указанный файл. Все советы не помогают, кроме магического ffmpeg.exe, люди пишут что надо данный файл просто поместить в папку с исполняемым файлом, казалось бы вот он ответ! Но те кто задают вопрос не понимают откуда брать этот заветный файл который решит проблему и когда вопрос задан: "А откуда взять этот файл?", то нет ни одного ответа. Как будто это рофл или локальный мем... Я сам столкнулся с подобной проблемой: 1. \ на / менял 2. кириллица в пути отсутствует 3. но так и не могу положить этот заветный файл ffmpeg.exe. Если кто-то в курсе откуда все таки брать данный файл напишите в комменты под данным постом, уверен что многие так и не нашли ответа. Заранее спасибо!
@@russianbear1322 данный файл скачивается просто по поиску в интернете и кладется в корень проекта. Он нужен для конвертации, записи и передачи разных файлов. Уже и забыл что писал тут этот коммент)
Плейлист создан в первую очередь, чтоб дать новичкам практику, которой мне не хватало. Большое спасибо за поддержку 🤝
Привет как отключить антивирус? Для того , чтобы он не блокировал мои коды, ведь когда я скачиваю с библиотеки bs4 он меня блокирует , так как отключить?
Спасибо!) То что нужно)
Товарищ, подскажите сайт хороший для фриланса в вебе.
Бекенд/фронтенд неважно.
Стек Django, Vue.
Работаю фронтендером, но времени очень много остаётся, а денег хотелось бы больше.
Почему у меня не находит файл хоть и правильно все сделал
Привет✋👋 Подскажи пожалуйста, какой дистр Linux юзаешь? Кроме kali
судя по всему автор - представитель определенного типа людей,которые способствуют развитию нашего общества: человек разобрался,потратил время - объяснил всем,кому интересно.На какой бы выпуск я не попал - он всегда интересный,заставляет срочно попробовать самому и получить массу удовольствия,как будто сам разобрался😄.Спасибо тебе за твой вклад,ты проделываешь великую и крайне ценную работу!!!!
Ля, большое спасибо за такой фидбэк! Очень приятно!
@@PythonTodayдлллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллллл л зол зол дж был ллт
Полностью согласен
Лучший канал с наглядной практикой по языку. Спасибо, что тратишь время и часто зажигаешь мотивацией)
Большое спасибо за фидбэк и поддержку друг!
@@PythonTodayзанимаетесь с менторством?
И тепло подуло в ноги). Крутой канал Спасибо, что помогаешь понять нам python!
Большое спасибо за поддержку!
Спасибо тебе большое! Ты не только образовываешь но ещё и годные библиотеки и скрипты подкидываешь. Я лично считаю что таким и должен быть образовательный контент.
Огромное спасибо за фидбэк!
Спасибо за интересные идеи и практический контент! Здоровья!
Спасибо за поддержку! Взаимно!
Это крутой канал, крутой чувак!!!!!
Спасибо за мотивацию !!!!
Большое спасибо за интерес и поддержку!
Спасибо за интересный и познавательный, практический контент!
Храни тебя Великие Силы)
Ты как Прометей, который дает людям огонь 🔥
Как Аполлон принёс людям огонь, так и я несу лютую дичь!
Большое спасибо за поддержку!)
Ценный урок, автор хорошо подаёт мотивацию, с меня лайк)
Спасибо за поддержку!
Супер, вы как всегда на высоте, благодарю, уверен когда-то пригодится 👍
Большое спасибо за фидбэк!
вау, круто! Продолжай в том же духе)
Спасибо за поддержку!
Отличный модуль, покапался, оч понравился
Благодарю за фидбэк и поддержку!
каждое видео смотрю, Вы топ!
Большое спасибо за поддержку!
Как раз искал, как реализовать данную задачу. Спасибо!
Надеюсь будет полезно! Спасибо за фидбэк!
Без спорно лучший канал с практикой, подачей информации, и без воды 🤗😎лойс
Большое спасибо за поддержку!
Спасибо за видео!
Как всегда супер👍👍👍
Для меня это оказался самородок, который всего за день работы помог заработать 10 тысяч рублей. Заказ для меня оказался бы необычным и даже не находился в разделе IT.
Это к слову, что нужно мониторить все подряд. Мне нужно было получить текст из примерно 100 звуковых дорожек, общей продолжительностью более 15 часов. Объем весьма большой, все что я пробовал до этого работало с переменным успехом, особенно с кириллицей. Ну а перепечатывать вручную совсем не гоже, мы же программисты, хоть и в процессе обучения. Каждый кто сталкивался с самообучением, знает, самое сложное это получить практические навыки. С теорией все понятно, в нее нужно погрузиться, читая документацию или смотря ролики в ютубе. Но практиковаться начинающему программисту практически негде, стажировку найти сложно, а выполнять проекты в стол неразумно. При этом на фрилансе можно зарабатывать хорошие деньги. В онлайн школе SkillFactory эту проблему не только осознают, но и решают.
На курсе Fullstack разработчик на Python 80% занимает практика на кейсах от бизнес-партнеров школы. Например, дипломный проект студентов - это сайт для складской техники. На протяжении курса вас поддерживают опытные менторы, а потом передают в руки центры карьеры, где вы увеличиваете свои шансы на трудоустройство или переход на фриланс. Помните, работодателям нужны люди с практическими навыками, получите их по ссылке в описании.
А по промокоду PythonToday заберите скидку 50% на обучение. Окей, установим необходимую нам сегодня библиотеку. Модуль включает в себя тяжелые зависимости, так что придется немного подождать. Кстати, из коробки скриптор работает через видеокарту, что опять же является огромным плюсом.
Импортируем модуль, создадим функцию Speech Recognition, в которой будет происходить вся магия. Функцию Main и условия if name равно Main, в котором вызываем функцию Main. Если вы пока не знаете, для чего нужно использовать данные условия, посмотрите видео по всплывающей подсказке. Первым делом нам нужно подгрузить модель.
Создадим переменную и передадим модель функцию LoadModule, вызванную у модуля Whisper. Приступаем к транскрибации. Обращаемся к созданному ранее объекту.
Используем состояние Transcribe, в котором нам нужно передать звуковой объект. Это может быть любое голосовое сообщение, или в моем случае я взял песню на русском языке, сохраненную в директории дейта. Я не смог, даже будучи зная оригинал. Далее нам нужно сохранить результат файл.
Используем контекстно ManagerWis. Open, первым аргументом указываем название файла. И пускай в названии присутствуют имя модели, чтобы они как-то различались.
FlagW и сохраняем результат. В result нам придет огромный словарь с данными, нас в нем интересует ключ текст, в котором собственно и содержится распознанный модулем текст. В функции main первым делом создадим словарь. Ключами у нас будут цифры, а значениями названия моделей.
Весь код из видео, а также описание модуля с примерами работы вы сможете скачать в нашем телеграм-канале. Пробежимся циклом по словарю и выведем данные в терминал. Далее запросим у пользователя цифру, чтобы понимать какую модель он хочет использовать. Не забываем привести значение к целому числу. Сделаем небольшую защиту от дурака и напишем условия проверки, что если выбранного значения нет в ключах словаря, то завершим работу скрипта исключением. Наш скрипт готов, давайте тестировать. Запустим скрипт и для начала выберем несуществующую модель, чтобы проверить, что скрипт завершит свою работу.
Пробуем. Отлично, вылетело исключение. Запускаем еще раз и выбираем самую первую модель. Кулера на видеокарте даже не запустились, а модуль справился буквально за пару секунд.
В директоре у нас создался текстовый файл. И, друзья, попробуйте узнать, что это за песня. Обязательно напишите комментарий, получилось ли у вас. По мне так торопорщено и ничего не разберешь. Запустим скрипт еще раз и на этот раз выберем модель под номером 4, медиум. Пятерка с ларч у меня не запускается, видю хостаровато. На этот раз загудели кулера и тепло подуло в ноги, но и работа занимает чуть больше времени. Посмотрим, что получилось. Вот, другое дело. Думаю, многие узнали этот трек. Библиотека само собой отлично справляется с английским языком даже на базовых моделях. Да, местами подлагивает, но на мой взгляд это лучше на сегодня модуль. Ведь так я понимаю, что не зря выкладываю ролики. Друзья, огромное вам спасибо за просмотр, подписывайтесь на канал, будьте здоровы, всем пока!. . .
недурственно. руками писал?:D
@@_test_test Зачем руками? Сначала скачиваешь аудио дорожку видео через yt-dlp, затем обрабатываешь аудио скриптом из видео и получаешь текст. Этот текст обрабатываешь ещё одним скриптом и получается текст, разбитый на абзацы.
@@fugass007 а не мог бы ты подсказать, как разбить на абзацы скриптом?
Интересно получилось и довольно просто!
круто как раз искал такое, правда на ютуб загрузил видео он сделал субтитри
😲😱🤯 Гений просто... челюсть отвисла у меня
Гио Пика! Спасибо большое за видео)
Отдельный лайк за Гио Пика !👍
"Тарабарщина..." Ахахаха, какая песня, такой и результат))
Народ , не идите на этот скилл фектори, это канал гораздо круче платных курсов
Работал с данной либой. Очень достойные результаты. Только самые лучшие модели требуют достаточно много видеопамяти. Тем не менее, с моделью "small" почти всегда верно распознавал голосовые сообщения.
Мне тоже понравилась либа, ещё и с openai и поддержкой комьюнити
Я правильно понимаю что потом этот текст надо вручную на предложения разбивать?
Спасибо))
За гиопику респект)
Ставьте лайки ему и по больше чтобы стата была нормальная иначе ютуб не будет приносить доход и мы потерям очень крутой канал. Сам плавал, знаю на сколько каждый лайк важен...
Огромное спасибо за поддержку!
Whisper был создан компанией OpenAI. Неудивительно что он так хорош.
Надо погуглить библиотеку. Спасибо.
Благодарю за фидбэк!
Харош
спасибо
Твои видио очень хороши, но мог бы ты добавить что-то типа постановки задачи, чтобы человек сначала сам пробовал, а затем смотрел код
Здравствуйте. А можно использовать этот модуль так, что обработка шла не через видеокарту, а через процессор?
Спасибо.
Отличное видео. Есть вопрос - сборка компа на Amd и проц и видяха. Вычисления производит по умолчанию на проце, как сделать так, чтобы вычислял на видеокарте?
Привет, часто смотрю твои видосы и тоже хочу научится классно пасить и автоматизировать браузер, но времени учится самому не так много, может у тебя есть курсы или ты берёшь учиников ?
Сделай обзор на лучшие фриланс площадки.
На канале есть видео на эту тему
Подскажите пожалуйста, WAV файлы через openai-wisper можно будет распознать таким образом, чтобы номер телефона сохранился как цифры в тексте?
Может и не уместно, но. Я рассматриваю фриланс не в качестве основной работы или подработки, а скорее способ поднять свои знания
Изначально не работает код даже который в документации. ошибка UserWarning: FP16 is not supported on CPU; using FP32 instead
warnings.warn("FP16 is not supported on CPU; using FP32 instead")
Traceback (most recent call last) затем большое количество ошибок в командах
а в конце "FileNotFoundError: [WinError 2] Не удается найти указанный файл" ?
@@makshae9029 да все так же
все работает
если на винде запускать - проблемы из-за "слешей" (надо "/" вместо "\" в пути ставить) и (возможно) кирилических имен пользователя
еще файл "ffmpeg.exe" надо поместить в папку со скрипром
@@TheXai4yef слеши я изменил сразу, кириллицы в имени пользователя нет, а что за файл ffmpeg.exe где искать ?
спасибо, запустился@@TheXai4yef
Крутой модуль, даже уже есть мысли как использовать) Какая у тебя видюха? Ты просто упомянул что старая. У меня просто в ноуте 1650ti))
Видео было записано на 1060 6gb
Будто бы 1650 тиайка что-то недостижимое
@@Franchise_vi будто бы не надо лезть, где не тебе вопрос) Конечно может тебя задело)) Я написал название чтобы понятно было, что карта слабая у меня)
Я в шоке, 4 человека посмотрели видео за 1 минуту после выхода)
В чём ваш шок?
@@PythonToday видео длится 6 минут, а люди смотрят его за 1
Топовый скрипт кстати, можно будет для написания статей или распознавания речи использовать)
Вы ведь видите какие первые комментарии :/ И много кто пишет сначала коммент с благой целью, потом просмотр. Но ютуб это ненавидит
Есть идея для бота в телеграме, точнее усовершенствовать. перевод голосовых
А не могли бы Вы подсказать на каких площадках вы ищите задания пожалуйста?
Здравствуйте,как решается эта проблема?
UserWarning: FP16 is not supported on CPU; using FP32 instead
(проц ryzen5 5600 видюха rx 470 oc windows 11 на pycharm)
подскажите как обойти запрет установки премиум модулей на Pydroid3 (в т. ч Torch, tensorflow и openCV). через терминал не получается(((
Спасибо за такой годный урок! Получаю такую ошибку : UserWarning: FP16 is not supported on CPU; using FP32 instead
warnings.warn("FP16 is not supported on CPU; using FP32 instead"
Да, в результате все равно получаю текст. Но как понял, то у меня используется мощность процессора или встроенной видео карты. У меня так же есть дискретная в ноуте. Собственно как мне заставить работать дискретную при вычислении а не CPU?
Мне так же пришлось указать кодировку with open(f'transcription_{model}.txt', 'w', encoding='utf-8'), из-за ошибки UnicodeEncodeError: 'charmap' codec can't encode characters in position 1-8: character maps to , я так понял это из-за того что я выполняю код на Windows ( не ругайтесь, я начал свое знакомство с питоном ток пару недель назад)
Для использования GPU от NVIDIA (ядра CUDA) можно задействовать "либу" TensorFlow или PyTorch, только придется скрипт изменить соответствующим образом
@@TheXai4yef какую из них посоветуете больше?
@@ivanmigulin1452 можно взять "torch" в связке с проверкой поддержки CUDA - что-то вроде такого:
--------_
# pip install openai-whisper
import whisper
import torch
import os
def speech_recognition(model='base'):
if torch.cuda.is_available():
device = torch.device('cuda')
else:
device = torch.device('cpu')
______
PS: у меня (для других целей) стоят не только "дрова" NVIDIA, но и доп. ПО для работы с CUDA
может потому "из коробки" код из видео сразу на GPU работал - есть подозрение что даже при наличии нужных "дров" исходный вариант кода все равно "по умолчанию" на CPU запускается
@@TheXai4yef В чем разница работы на GPU или CPU? это влияет на точность разпозгования? или только влияет на вычислительную мощность (типа быстрее обрабатывает)? За ранее спасибо
Вопрос не в тему , но будут ли видосы парсера scrapy ? хотелось бы узнать в чем различия между bs4, заранее благодарю )
Обязательно, как только проект и время появится :(
@@PythonToday Время и стараний , спасибо за контент! )
кто нибудь знает как в папку data импортировать .мр3 файл? У меня на нем возникает знак вопроса,и после компиляции возникает ашипка😔
У меня код запустился
Выберите модель передав цифру от 1 до 5: 4
Запущен процесс транскрибации, пожалуйста ожидайте...
2%|▋ | 28.7M/1.42G [02:03
В этом месяце запустил скрипт на python виспера на отдельном сервере, который обрабатывает аудио файлы звонков колл-центра нашей организации. Оптимальной моделью скорость:качество для нас оказалась medium. Пока все устраивает.
Если не секрет, для чего аудио в текст переводили, какие-то исследования на этом?
@@PythonToday текст быстрее и легче анализировать. Для контроля работы сотрудников колл-центра, анализ отказов и успешных звонков. Sentiment анализ пока не прикручен. Сильно не углублялся в эту тему.
расскажи на какой бирже сидишь как вообще заказы берешь и вот эта внутренняя кухня интересна
Не расскажет, только за $$$ и то кострат))
На канале уже есть видео по биржам, с детальным разбором. В принципе для меня в топе ничего не поменялось, это upwork. Для рф есть проблемы, но есть и методы как их решить. Больше года не сижу на биржах, редко беру заказы, сейчас это либо от старых клиентов, либо сарафанного радио + есть большое количество работы в телеграм чатах. В этом плюс фриланса, он сам тебя продвигает со временем.
@@PythonToday этот заказ с upwork?
freelancer
@@PythonToday работает с рф? Или максироватся надо?
Гио Пика))
Спасибо за видео-урок! Для меня очень актуальная тема. Но я нигде в описании не нашла названия модуля, в видео услышала один раз «whisper» - это и есть название модуля?
Благодарю за фидбэк! Установка на 1:51, ссылка на модуль и код в телеграм канале
@@PythonToday Спасибо за ответ!
@@PythonToday Нашла, посмотрела, и вправду whisper )). Благодарю еще раз!
На VPS этот скрипт не запустить я так понимаю?
Спасибо, полезное видео) А какие модули можете подсказать наоборот для преобразования текста (английский) в речь? Кроме унылого gTTS. Хотелось бы что-то более качественное
Silero
Уважаемые программисты подскажите почему у меня так ? AttributeError: module 'whisper' has no attribute 'load_model'
Спасибо, за любой шпаргалкой по python всегда к Вам. У меня этот пакет отказался напроч работать. Во-первых, почему-то не видит видеокарту, форсит запуск с CPU,у меня RTX2060, драйверы свежие. Во-вторых, не может найти указанный файл. Пробовал, наверное, все варианты, влоть до того, что кидал в корень диска и название состояло из одной буквы. Кароч, не задалось.
Благодарю за фидбэк! Винда? 10 из 10 проблем у пользователей на винде оказались
та же история пытаюсь втрой день развернуть на виндоуз 8.1 (лицензия), то файл не найден, то FP16 on CPU. Но я пробую дальше...
@@Doctor_Pass_CUDO на винде проблемы из-за "слешей" (надо "/" в пути ставить) и кирилических имен пользователя. Файл "ffmpeg.exe" надо поместить в папку со скрипром. Для использования GPU можно задействовать "либу" TensorFlow или PyTorch, только придется скрипт изменить соответствующим образом
@@TheXai4yef можно, пожалуйста, поподробнее. Убил два часа и ничего не решилось. Так же, как и у людей жалуется на этот ffmpeg. Подробно что вы делали, может я упустил какой-то момент. Заранее спасибо!
@@ivanmigulin1452 повторюсь:
на винде проблемы из-за "слешей" (вместо "\" надо "/" ставить) и кирилицы в пути к файлам
файл "ffmpeg.exe" надо поместить в папку с кодом
ну и про имя аудиофайла не забываем - если уж в коде написал "track_1.mp3", то и сам файл в папке "data" так же называться должен (а то бывали "прецеденты" 😉)
@PythonToday, где ищешь задания по фрилансу? Ищу себе подработку на лето (я студент)
Нигде не ищу, сами предлагают. Видео по первым шагам и биржам есть на канале ruclips.net/video/1pLlX9x60rM/видео.html
На каких фриланс площадках ты делаешь заказы?
На канале есть отдельное видео ruclips.net/video/1pLlX9x60rM/видео.html
Спасибо
Привет крутой виде но круто было бы если ты научил бы как делать ии для игр по типу cs:go
Приветствую. А что там автоматизировать? Это прекрасная игра, и скилл прокачивается набивая руку
Не просто делать ии для игр
Это же интересно
Приведите пример. Вы написали cs:go, ии для чего, для читерства? Стрельбы? Крайне не одобряю
Не я не обязательно в cs:go а просто для знание например есть ии для доту 2 в cs:go мне просто интересно делать ии но я не умею
На каких биржах вы ищете заказы?
Выдает ошибку FileNotFoundError: [WinError 2] Не удается найти указанный файл. Путь указан верно, файл не битый. Есть у кого-то похожая проблема?
Проверяйте путь к файлу. Если пользователь windows не забывайте про обратный слэш либо сырые строки при указании пути
@@05Sheik у меня такая же ошибка, что с этим путём не перепробовал.. FileNotFoundError: [WinError 2] Не удается найти указанный файл. У Вас получилось решить?
@@iPox_klmk Решил проблему установкой библиотек ffmpeg и добавлением их в переменную среды Path
@@iPox_klmk можно по подробней? что добавлял в среду Path?
Мне помогло следующее: установил ffmpeg, добавил в PATH (это не помогло), в папку со скриптом положил ffmpeg.exe - и всё заработало как надо
Можно ли с помощью этой библиотеки сделать прогу для управления компьютером своим голосом ?
Воск лучше, работает без интернета, хорошо распознает голос с микра
@@Chel1k7 Поясните пожалуйста, что такое "Воск" ?
@@Technomax2007 'vosk' библиотека, которая преобразовывает голос в текст
У меня модель large не запускается на 2070 с 8Гб видеопамяти. Скрипт вылетает с ошибкой: CUDA out of memory. 😢
Как передать заказчику выполненную работу, когда нужно написать подобный скрипт? Отослать файл архивом или выполнить работу у себя на пк (или где-то ещё) и просто прислать результат?(в данном случае, текст) Я ещё не выполнил не одного заказа и поэтому мне интересно, как это устроено.
Скорее всего заказчику нужен текст. Те это заказ на фрилансе не по программированию. Но автор ролика просто написал скрипт и теперь может брать простые подработки на распознавание текста. Заказчику естественно скрипт не надо в данном случае передавать, а только текст
Расскажите пожалуйста как вы упаковываете и передаете файл заказчику
Всегда по разному, кто-то хочет лишь результат, кто-то показать как на компе запускать скрипт, кому-то нужен веб интерфейс за доп.плату, некоторые просят разместить и поддерживатьработу скрипта на сервере. Так что...
@@PythonToday спасибо , ох все так сложно, я думал можно просто файл скинуть и все😁
👏👍
почему при запуске кода в консоли показывает что загружается дополнительные 1.5 гб хотя я установил библиотеку с зависимостями
а потом C:\Users\Администратор\Desktop\ворки
ecogn_project\lib\site-packages\whisper\transcribe.py:114: UserWarning: FP16 is not supported on CPU; using FP32 instead
warnings.warn("FP16 is not supported on CPU; using FP32 instead")
Traceback (most recent call last):
File "C:\Users\Администратор\Desktop\ворки
ecogn_project\lib\site-packages\whisper\audio.py", line 46, in load_audio
ffmpeg.input(file, threads=0)
AttributeError: module 'ffmpeg' has no attribute 'input'
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "C:\Users\Администратор\Desktop\ворки
ecogn_project\Lib
un.py", line 24, in
main()
File "C:\Users\Администратор\Desktop\ворки
ecogn_project\Lib
un.py", line 20, in main
speech_recognition(model=model)
File "C:\Users\Администратор\Desktop\ворки
ecogn_project\Lib
un.py", line 6, in speech_recognition
result = speech_model.transcribe('eva.mp3')
File "C:\Users\Администратор\Desktop\ворки
ecogn_project\lib\site-packages\whisper\transcribe.py", line 121, in transcribe
mel = log_mel_spectrogram(audio, padding=N_SAMPLES)
File "C:\Users\Администратор\Desktop\ворки
ecogn_project\lib\site-packages\whisper\audio.py", line 130, in log_mel_spectrogram
audio = load_audio(audio)
File "C:\Users\Администратор\Desktop\ворки
ecogn_project\lib\site-packages\whisper\audio.py", line 50, in load_audio
except ffmpeg.Error as e:
AttributeError: module 'ffmpeg' has no attribute 'Error'
Process finished with exit code 1
@@trcamazing кажется у тебя как и меня, вместо GPU используются мощности CPU (я думаю это из-за наличия встроенной карты в проце), собственно FP16 не поддерживается CPU, поэтому в ход идет FP32.
@@qwertycat938 И как решить данную проблему ?
@@Sweet-db1ip я так и не смог решить, приходится использовать CPU. Из-за этого результатом не доволен. Текст получается весьма неточный и плюс ко всему очень короткий. Т.е. беру для примера песню минуты на 3 и получаю только пол куплета
@@qwertycat938 для использования GPU (NVIDIA и ядра CUDA) можно задействовать "либу" TensorFlow или PyTorch, только придется скрипт изменить соответствующим образом
еще заметил (ХЗ почему так) - "старая" версия "ffmpeg.exe" (февраль-март 2019) русский лучше распознает чем более новые (декабрь 2022 или апрель 2023)
Здравствуйте, подскажите пожалуйста какой язык начать учить первым, выбираю между c++ и python
Приветствую, всё зависит от того, чем ты хочешь заниматься, веб, геймдев, десктопные приложения и тд. Думаю в зависимости от этого и нужно выбирать язык
@@PythonToday А что будет легче в освоении, и в дальнейшем проще будет найти работу?
@@YYYtygames python, но лучше с него не начинать. Плохо поймешь принципы программирования. Попробуй уделить некоторое время плюсам, они очень хорошо научат кодить "правильно", а потом уже иди на пайтон. Работы много для всего, главное чтобы тебе нравилось заниматься этим
@@ivanmigulin1452 Понял, спасибо большое
@@ivanmigulin1452 ну вот, можешь быть собой доволен) чел сейчас посмотрит на плюсы и забросит. останется работать на заводе, вместо того, чтобы за пару вечеров научиться писать тг ботов и брать какие нибудь заказы. чтобы найти работу плюсовиком, нужно его пару лет изучать
А можно как-то сделать так чтобы библиотека работала через процессор?
Где берёшь заказы?
Носил с собою ствол, носил патрон в стволе, через окно ОМОН, вещдоки на столе. Автор заметь
Модуль работает офлайн?
Привет, видео огонь. Но подскажи пожалуйста. У меня на выходе такую ошибку выдает и ниче я не могу с ней сделать - FileNotFoundError: [WinError 2] Не удается найти указанный файл. P.S Решил проблему, но коммент оставлю для продвига)
Попробуй указать абсолютный путь к файлу
Как получилось решить эту проблему? Уже час бьюсь, все равно выплевывает эту ошибку
как вы решили проблему, расскажите пж. я просто уже 2 дня не могу ее решить
Удалось решить проблему? Сейчас натыкаюсь на те же грабли
@ScalperCrypto Друг ты коли проблему решил, так поделись с людьми, а то уже не один человек тебе об этом пишет
AttributeError: module 'whisper' has no attribute 'load_model'.
здравствуйте, пишет что данного атрибута не существует и даже если заменить на какой-нибудь другой, дальше атрибут .transcribe. тоже не существует. ( пишу в пайчарме )
убедись, что правильно установил библиотеку. удали venv с проекта и собери заново, чтобы наверняка
это не аттрибут, а функция/метод класса. если ее/его нет, значит криво установлена библиотека
pip install -U openai-whisper
А где vibe cat?
Хоть кто-то по нему скучает :(
Это Гио Пика буйно голова 5)
У кого ошибка:
Решение:
Нужно вставить этот код в начало программы
import ssl
try:
_create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
# Legacy Python that doesn't verify HTTPS certificates by default
pass
else:
# Handle target environment that doesn't support HTTPS verification
ssl._create_default_https_context = _create_unverified_https_context
Игрался с GPT, он мне накидал скрипт для транскрипции потом я еще транскрибацию допилил с использованием Wav2Vec2 нужно только модель подобрать обученную
Я подписан на канал лайк однозначно
Благодарю за поддержку!
у тебя где нибудь лежит модели?
Как заработать 10 тыщ за день - реклама курсов
Так, а оно только на gpu работает?
как раз "по-умолчанию" хз почему на CPU запускается - для GPU надо еще отдельную "либу" подключать и код переделывать
песня Гио Пика Буйно голова 5
Что за трек?
На виндовсе выдает такую ошибку:FileNotFoundError: [WinError 2] The system cannot find the file specified :(
Как решать?
Вам интерпретатор прямо говорит, что файл не найден. Проверяйте путь к файлу. Раз пользователь windows не забывайте про обратный слэш либо сырые строки при указании пути
@@PythonToday через другие модули все открывается, заметил что у многих такая проблема, даже в комментариях, в любом случае спасибо за видео
ffmpeg.exe положи в папку со скриптом
@@fugass007 или оно не решает проблему, или я не тот файл взял
@@kostgame2518 все работает
если на винде запускать - проблемы из-за "слешей" (надо "/" вместо "\" в пути ставить) и (возможно) кирилических имен пользователя
и еще файл "ffmpeg.exe" надо поместить в папку со скрипром
сейчас реально фрилансить пайтоном?
Если есть скилл, фрилансить можно хоть чем
А как сделать чтобы текст был по нормальному, а не в 1 строку
пробежаться по результату и через определенное кол-во символов(или после точек) добавлять знак переноса строки
не работает
Linux?
?
😅👍
Large, tiny и т. д. Что это?
Модели по распознаванию речи
@@FalseHuman спасибо
Глазов???
Это 10к? Не верю
1
Читаю комменты и вижу что многие на винде сталкиваются с проблемой: FileNotFoundError: [WinError 2] Не удается найти указанный файл.
Все советы не помогают, кроме магического ffmpeg.exe, люди пишут что надо данный файл просто поместить в папку с исполняемым файлом, казалось бы вот он ответ!
Но те кто задают вопрос не понимают откуда брать этот заветный файл который решит проблему и когда вопрос задан: "А откуда взять этот файл?", то нет ни одного ответа.
Как будто это рофл или локальный мем...
Я сам столкнулся с подобной проблемой: 1. \ на / менял 2. кириллица в пути отсутствует 3. но так и не могу положить этот заветный файл ffmpeg.exe.
Если кто-то в курсе откуда все таки брать данный файл напишите в комменты под данным постом, уверен что многие так и не нашли ответа.
Заранее спасибо!
я загуглил ffmpeg portable, скачал какой-то архивчик, и там был этот exe-шник
Да, друг, такая же проблема....
@@russianbear1322 данный файл скачивается просто по поиску в интернете и кладется в корень проекта. Он нужен для конвертации, записи и передачи разных файлов. Уже и забыл что писал тут этот коммент)
☢☢☢☢☢☢☢
Буйно голова