00:04 Whisper - это нейросеть OpenAI для перевода аудиофайлов в текст. 01:06 Установите PyTorch на Windows или Mac 02:00 Установите Cuda, FFmpeg и укажите пути для Windows. 02:54 Укажите путь к папке, содержащей FFMpeg, или добавьте FFMpeg в существующую зарегистрированную папку. 03:41 Скачайте и установите Git для Windows 04:43 Зарегистрируйте пути для папки Bin и папки CMD 05:36 Транскрибировать аудиофайлы в текст с помощью Python -m 06:29 Total Commander - удобный файловый менеджер с командной строкой внизу для более быстрой и простой работы с файлами.
Спасибо! Пришлось повозиться с разными ошибками, хоть и делал всё по инструкции. Ошибки гуглил, переустанавливал и обновлял версии программ, в итоге всё работает!
А у меня вот только одна ошибка появилась когда по инструкции всё делал. Но чат гпт смог мне всё разжевать и решил за 2 минуты проблему. А загуглив ушло бы минут 10. Так что используй чат гпт с кастомной инструкцией под себя
Спасибо автору за такой серезный контент. Пробовал несколько разных файлов, одни работали ,а другие почемуто не хотели запускаться. ВНИМАНИЕ если название файла имеет пробел(тогда не работает данная программа), то необходимо исправить , переименовать так, чтобы заполнить эти пробелы или их сократить. Ещё раз спасибо автору.
Камраду большущий респект за данный нужный и подробный ролик. Вот только камрад пренебрёг некоторыми, весьма важными, техническими подробностями. А именно: про PyTorch 1) под Windows требует только и исключительно х64 версию. 2) CUDA = Nvidia видеокарта. (Один из главных недостатков CUDA состоит в том, что она является эксклюзивной платформой для работы на GPU компании NVIDIA. Это означает, что программа, написанная на CUDA, не будет работать на машинах с графическими процессорами других производителей, например - AMD или Intel). А в последней стабильной версии PyTorch в наличии только CUDA, а CPU - отсутствует, как класс. И найти версию под Intel, тот ещё квест. С уважением, Панки - ХОЙ!
Для тех кого сильно пугает Использование питона и консольной команды, то... есть программа для субтитров - Subtitle Edit. В ней есть возможность через неё же скачать эту Whisper и использовать. Так же доступна другая Ai для субтитров - VOSK/Kaldi. Как конкретно включается: Запуск программы -> Видео -> Audio to text (Whisper) -> Выберите язык -> выберите модель -> "..." -> скачать нужную модель ( Tiny ... Large ) Может кому помогло упростить себе деятельность.
@@GodOffOlympus tiny - маленькая модель для обыденных слов и оборотов речи. А Large модель обучена на большем количестве слов, значит сумеет транскрибировать более специфичные термины/названия компаний, научные термины и прочее. Ну и промежуточные по силу обучения модели. Как-то так.
В последней бета версии Subtitle Edit есть возможность разделения спикеров в окне выбора модели с помощью вкладки "Дополнительно". - команда "diarize". Почему может не срабатывать эта команда при вводе в поле?
@@Вячеслав-й9с7у я не знаю, честно. Можно предположить проблемы от беты. На то она и бета, что б находить и исправлять проблемы, в будущих обновлениях, при описании ошибки в тех-помощи у разрабов. Ну или проблема в самой модели нейросети. или Subtitle Edit этой бета версии, может некорректно скачивать модель. И получаются огрехи.
Добрый вечер, у меня почему-то всё работало хорошо, а вот сейчас пытаюсь транскрибировать и он будто зависает на фразах и по несколько раз одно и то же пишет. У кого-то было такое?
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C: ecsub>whisper r1.mp3 "whisper" не является внутренней или внешней командой, исполняемой программой или пакетным файлом. Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
что делать ? при установке PyTorch выскочили ошибки: ERROR: Could not find a version that satisfies the requirement torch (from versions: none) ERROR: No matching distribution found for torch
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C: ecsub>whisper r1.mp3 "whisper" не является внутренней или внешней командой, исполняемой программой или пакетным файлом. Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
Никак. Пишите стерео, разделяйте на каналы и транскрибируйте каждый канал по очереди, потом по временным меткам соединяйте в диалог. Либо просите ChatGPT по смыслу разделить, но ошибки будут.
Добрый день, подскажите выскакивает ошибка : C:\Users\Фвьшт>whisper Traceback (most recent call last): File "", line 198, in _run_module_as_main File "", line 88, in _run_code File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Scripts\whisper.exe\__main__.py", line 4, in File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\whisper\__init__.py", line 8, in import torch File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\__init__.py", line 148, in raise err OSError: [WinError 126] Не найден указанный модуль. Error loading "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\lib\fbgemm.dll" or one of its dependencies.
1. Установка Python 3.8.10. При установке в первом окне установщика не забудь поставить галочку напротив “Add python.exe to PATH. Для того, чтобы проверить, установился ли Python, необходимо в командной строке ввести “python -V” 2. Установить CUDA Toolkit 12.4. Если видеокарта NVidia. 3. Установка PyTorch. Скопировать текст напротив “Run this Command” в командную строку. Установка Chocolatey. На сайте нажать кнопку “Install”. Потом ниже выбрать кнопку “Individual”. Еще ниже скопировать текст для установки в Windows PowerShell (открыть от имени администратора). После установки, не закрывая окно Windows PowerShell, ввести “choco install ffmpeg” Открываем командную строку от имени администратора и вводим “pip install -U openai-whisper”. Готово! Открываем командную строку в папке с аудиофайлом. Вводим: whisper аудио.mp3. Если в имени файла есть несколько слов (с пробелами), то пишем так: whisper “аудио файл.mp3”. Обрамляем в кавычки. Инструкцией по установке руководствовался вот с этого видео: ruclips.net/video/ABFqbY_rmEk/видео.html&ab_channel=KevinStratvert РЕКОМЕНДУЮ перед началом установки поудалять старые версии Python и PyTorch. Инструкция по удалению по ссылке вверху.
Большое спасибо! по инструкции всё получилось установить))) Подскажите пожалуйста, как записать команду, чтобы при расшифровке использовалась large модель для лучшего качества, когда звук не очень записан? И еще вопрос, просто чтобы понимать) Расшифровка происходит через интернет или полностью на самом компьютере?
расшифровка ведется на пк мощностями установленной видеокарты (в случае CUDA), языковая модель точно в самом начале скачивается с интернета(которую указали в комментарии выше)
ек марек , один файл на ура распознал и перевёл, со вторым ничего не вышло , то есть манипуляция прходит в CMD отображает распознаный текст , но результатирующий файл не образует и не сохраняет ....решил переставить ... то удалить могла себя то теперь никак непоставит, как удалить и поставить заново?
Откуда это взялось. На сайте установки pytorch, внизу есть раздел пререквизиты (то что нужно поставить перед установкой pytorch) со 2 шага написано установить CUDA Toolkit
Спасибо тебе, чувак. Круто все и понятно. Даже даун разберется. Молоток! Не первое твое смотрю, еще c kelopatra видел. Тоже годнота! Однозначно лайк и тебе респект за работу.👍
Спасибо! Всё заработало на ноутбуке, которому 12 лет. У меня два вопроса: 1: Как удалить PyTorch с настройками для CUDA и поставить PyTorch с настройками для CPU? А то видео карта слабее чем процессор. Необходимо весь алгоритм повторить? НО тогда второй вопрос 2: Как почистить комп от всех файлов wisper? (git и puthon видно среди установленных программ, а вот как удалить то, что ставилось из под командной строки?) Буду признателен за помощь.
Вышла ошибка при попытке транскрибации, не найден модуль "C\:users\user\appdata\local\programs\python\python312\lib\site-packeges\torch\lib\fbgemm.dll" or one of its dependencies.
Все делал по инструкции, поймал такую же ошибку. Решение нагуглил, проверил, работает. Дело в том, что мы качаем последнюю версию pytorch, а в ней есть вот этот баг, можно качать версию ниже, типо 2.3.0, и будет ок, но я починил последнюю. Проблема в отсутствии библиотеки, и ее нужно докачать, одно из простых решений как - установить visual studio c/c++, с ней докачивается и библиотека в нужные директории, видеоинструкция в видосе ruclips.net/video/-ky896Qp1k8/видео.html . Но будьте готовы к тому, что загоните себе на диск С дополнительные 5ГБ. У меня после всех этих установк диск С совсем без свободного места оставался и это очень плохо, так не надо. Я поэтому это всё вообще на другой ненужный ноут установил.
Здравствуйте, я пытаюсь установить python по вашему видео, мне выдаёт такой текст, могли бы вы его прокомментировать - что это? На все команды пишет: "не является внутренней или внешней командой, исполняемой программой или пакеты файлом" Означает ли это, что не происходит загрузка? Версия python 3.12.0 на андроид
есть ли модель или нейронка, которая разделяет спикеров по голосам? Шрифтом, к примеру. Можете подсказать сторонние модели или нейронки, которые лучше модели large на русском? Спасибо
А что делать если у меня ошибка "не удается продолжить выполнение кода поскольку система не обнаружила avdevice-60.ddl" когда нажимаю "ок" мне еще раза выдает эту ошибку. Ошибка случилась на этапе ffmpeg в командной строке
в январе 2024 столкнулся с проблемой...при попытке установки PyTorch посыпались ошибки...выяснилось что ПОСЛЕДНЮЮ версию Python они не поддерживают...только 3.11.х...друзья, имейте ввиду
подскажите пожалуйста..может кто-то столкнулся... что я не так сделала... у меня вместо того чтобы создавать файлы транскрипции, создается транскрипция прямо в командной строке...
@@TestRuteplitsast написала вопрос сразу после того как повторила все действия за Вами. файл большой и эти файлы создались через продолжительное время. не удалила комментарий, чтобы разобраться должен ли генерироваться текст в командной строке. Так шо дуже дякую що відповіли 👍
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C: ecsub>whisper r1.mp3 "whisper" не является внутренней или внешней командой, исполняемой программой или пакетным файлом. Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.@@TestRuteplitsast
не работает, выдаёт такую ошибку raise err OSError: [WinError 126] Не найден указанный модуль. Error loading "C:\Users\user\AppData\Local\Programs\Python\Python311\Lib\site-packages\torch\lib\cudnn_cnn_infer64_8.dll" or one of its dependencies.
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C: ecsub>whisper r1.mp3 "whisper" не является внутренней или внешней командой, исполняемой программой или пакетным файлом. Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.@@АндрейКосицин-и2д
Все делал по инструкции, поймал такую же ошибку. Решение нагуглил, проверил, работает. Дело в том, что мы качаем последнюю версию pytorch, а в ней есть вот этот баг, можно качать версию ниже, типо 2.3.0, и будет ок, но я починил последнюю. Проблема в отсутствии библиотеки, и ее нужно докачать, одно из простых решений как - установить visual studio c/c++, с ней докачивается и библиотека в нужные директории, видеоинструкция в видосе ruclips.net/video/-ky896Qp1k8/видео.html . Но будьте готовы к тому, что загоните себе на диск С дополнительные 5ГБ. У меня после всех этих установк диск С совсем без свободного места оставался и это очень плохо, так не надо. Я поэтому это всё вообще на другой ненужный ноут установил.
Установил, все по мануалу. Теперь расскажу свой опыт: Поставил на транскрибацию аудио файл, протяженность аудио - около 1,5 часов. За 5 часов работы программы ничего с места не сдвинулось. Тогда я с редакторе порезал свой файл на 10 чвстей, по 8 - 10 минут. Включил транскрибацию. О чудо, зервый фрагмент перевел в текст. Затем я поставил остальные файлы. Из 10 штук 3 он перевел, остальные намертво зависали. Повторные попытки приводили к одинаковому результату. Прога работает крайне не стабильно, зависнуть может в любой момент и никогда не знаешь, повисла они или работает. Бесплатность проги компенсируется ее очень сильной нестабильностью и повисаловом. Не знаю, может у вас лучше. Благо, что сейчас уже есть нейронки, где все это можно сделать на лету и бесплатно...
Не помню. Где-то было вот прямо совсем просто. Прямо под рукой, помню, что было 4 голоса, но не могу вспомнить где. В принципе вот эти ребята заявляют поддержку голосов silero.ai но я их не тестил. Может сделаю, покопаюсь
В яндекс браузере читалка текста есть. Голос приятный. Чтобы скачивать нужно купить аудиокабель. Просто вставляешь в его в разъём входи и одновременно в разъём выхода и ставишь на запись аудио в любой программе по записи голоса с микрофона.
Ещё бы видео, как перенести whisper на другой комп сделать. Понятное дело, что Pytorch надо будет переустанавливать. Но как перенести? И как обучать whisper правильно распознавать слова. Иначе косячит безжалостно.
@@theurs2 вы не поняли. Large модель тоже ошибается. Не у всех идеальная дикция и не всегда качественная запись. Поэтому необходимо обучать whisper правильно распознавать слова. Как это делать?
Боже как прост и удобно. Проще и удобнее только сам машинный код. Зачем же в Total Commander Открываешь машинный код и строчишь Нолики и единички Прямо с перфокарты. Просто главное не ошибиться. Видно что технологии не стоят на месте. Раньше нажал на экзешник и всё установилось. А теперь вон оно как... Консоль терминал 10 раз перепроверить сто раз нажать. Чему удивляться что до сих пор мы в наемном рабстве и идёт Война. Наверное в своё время поувольняли не только инженеров электроников таких как я в школах, но и программистов которые могли бы доработать программу. Скомпилировать все библиотеки в один пакет.
Да ладно, вы серьезно?) Люди собрали датасет на 680 тысяч часов транскрибированного аудио, потом другие люди создали нейросеть, натренировали её на своих мощностях на этом датасете, а теперь результат отдают вам бесплатно. На huggingface сейчас лежит large v3. Дотренированная дополнительно на 5 миллионах часов аудио, со слабыми лейблами. А на гитхабе уже лежит GUI. И чтобы бесплатно получить одну из лучших моделей для распознавания речи, вам нужен час на повторение за бесплатным видео и, в крайнем случае, пару часов погуглить решение ошибок, если они возникли. Ей богу, не понимаю, откуда такое недовольство. Может вам просто не нужно распознавание речи?
есть такая штука - scoop для виндоса. это такой аналог apt-get для виндоус, самый интересный из них всех. ffmpeg оттуда ставиться командой scoop install ffmpeg
ну да, есть. Ну уж простите, действительно корявенько получилось. Но может для рядового пользователя с менеджерами пакетов связываться... ради одной установки. Сам как-то не пользуюсь и не подумал, что можно оптимизировать процесс. Вы считаете, что Scoop?
раз уж работа идет через консоль, то можно вообще все сделать из консоли. на винде скачивание идет через winger/scoop/chocolatey install python ffmpeg ... по идее даже не надо в переменную среды ничего вставлять, если надо - set PATH=%=%PATH%;CL\your\path\here
@@TestRuteplitsast от задач зависит. winget уже встроен, но если надо показать список установленного, он покажет вообще все проги. scoop я сам больше использую, он проще, хотя там не все есть. draw io например нет. choco имеет больше прог. не помню почему им перестал пользоваться, админ права требовал, или еще что неудобного. и ни в одной проге я не смог назначить свою папку для прог
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C: ecsub>whisper r1.mp3 "whisper" не является внутренней или внешней командой, исполняемой программой или пакетным файлом. Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
00:04 Whisper - это нейросеть OpenAI для перевода аудиофайлов в текст.
01:06 Установите PyTorch на Windows или Mac
02:00 Установите Cuda, FFmpeg и укажите пути для Windows.
02:54 Укажите путь к папке, содержащей FFMpeg, или добавьте FFMpeg в существующую зарегистрированную папку.
03:41 Скачайте и установите Git для Windows
04:43 Зарегистрируйте пути для папки Bin и папки CMD
05:36 Транскрибировать аудиофайлы в текст с помощью Python -m
06:29 Total Commander - удобный файловый менеджер с командной строкой внизу для более быстрой и простой работы с файлами.
Спасибо!
Пришлось повозиться с разными ошибками, хоть и делал всё по инструкции.
Ошибки гуглил, переустанавливал и обновлял версии программ, в итоге всё работает!
А у меня вот только одна ошибка появилась когда по инструкции всё делал. Но чат гпт смог мне всё разжевать и решил за 2 минуты проблему. А загуглив ушло бы минут 10. Так что используй чат гпт с кастомной инструкцией под себя
Спасибо! Хорошо, что так подробно показал! Работает!!!
Потрясающий гайд! Не забывайте обновлять и прописывать пути, тогда всё сработает как по маслу!
Желаю вам миллион подписчиков и миллион просмотров под каждым видео! Благодарю!
Четко и лаконично! Очень помогла ваша инструкция! Спасибо!!!
Спасибо автору за такой серезный контент. Пробовал несколько разных файлов, одни работали ,а другие почемуто не хотели запускаться. ВНИМАНИЕ если название файла имеет пробел(тогда не работает данная программа), то необходимо исправить , переименовать так, чтобы заполнить эти пробелы или их сократить. Ещё раз спасибо автору.
Жесть как здорово! ....и всё получилось , и даже с учётом того что пути у меня совсем другие, наши вам благодарности!
Камраду большущий респект за данный нужный и подробный ролик.
Вот только камрад пренебрёг некоторыми, весьма важными, техническими подробностями.
А именно:
про PyTorch
1) под Windows требует только и исключительно х64 версию.
2) CUDA = Nvidia видеокарта.
(Один из главных недостатков CUDA состоит в том, что она является эксклюзивной платформой для работы на GPU компании NVIDIA. Это означает, что программа, написанная на CUDA, не будет работать на машинах с графическими процессорами других производителей, например - AMD или Intel).
А в последней стабильной версии PyTorch в наличии только CUDA, а CPU - отсутствует, как класс. И найти версию под Intel, тот ещё квест.
С уважением, Панки - ХОЙ!
Большое спасибо! Установила Whisper - это какое-то волшебство!
Да ты просто гений, бро! Огромная благодарность!!!
быстро понятно и без воды, пол дня обыскался такое видео, спасибо😹
Спасибо, всё работает!
Для тех кого сильно пугает Использование питона и консольной команды, то... есть программа для субтитров -
Subtitle Edit.
В ней есть возможность через неё же скачать эту Whisper и использовать. Так же доступна другая Ai для субтитров - VOSK/Kaldi.
Как конкретно включается:
Запуск программы -> Видео -> Audio to text (Whisper) -> Выберите язык -> выберите модель -> "..." -> скачать нужную модель ( Tiny ... Large )
Может кому помогло упростить себе деятельность.
@@GodOffOlympus tiny - маленькая модель для обыденных слов и оборотов речи. А Large модель обучена на большем количестве слов, значит сумеет транскрибировать более специфичные термины/названия компаний, научные термины и прочее. Ну и промежуточные по силу обучения модели.
Как-то так.
В последней бета версии Subtitle Edit есть возможность разделения спикеров в окне выбора модели с помощью вкладки "Дополнительно". - команда "diarize".
Почему может не срабатывать эта команда при вводе в поле?
@@Вячеслав-й9с7у я не знаю, честно. Можно предположить проблемы от беты. На то она и бета, что б находить и исправлять проблемы, в будущих обновлениях, при описании ошибки в тех-помощи у разрабов.
Ну или проблема в самой модели нейросети. или Subtitle Edit этой бета версии, может некорректно скачивать модель. И получаются огрехи.
Для apple продукции подскажите софт для транскрибации? Благодарю
Спасибо огромное! сделала все по инструкции, заработало с первого раза.
Спасибо за работу и удачи!
Здоровья и процветания Вам! Все получилось даже у чайника) От всей души благодарю!
Очень полезно, будем осваивать
02:47 путь к папке для ffmpeg
04:01 разархивируем эти файлы в этот путь
04:21 скачиваем гит
05:20 проверяем
5:40 адрес папки для трнаскрибации
Добрый вечер, у меня почему-то всё работало хорошо, а вот сейчас пытаюсь транскрибировать и он будто зависает на фразах и по несколько раз одно и то же пишет. У кого-то было такое?
Кратко и понятно😀!!!
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
Спасибо! Это очень круто. У меня заработало
Спасибо, боярин! Сильно время сэкономил.
Все получилось! Большое спасибо!!!
Ура! Спасибо за супер обзор;) 👍
Отлично все работает! Спасибо!
что делать ?
при установке PyTorch выскочили ошибки:
ERROR: Could not find a version that satisfies the requirement torch (from versions: none)
ERROR: No matching distribution found for torch
Мне помогла установка другой версии Пайтона (11.4)
спасибо за отлично проделанную работу
Мужик хорош! спасибо
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
скачай версию Питона 3.11.4 все заработает
@@nohchogums не заработает)
Какой же ты прекрасный мужчина! Чёткая дикция, отличный голос, ясная подача без воды, что разберётся даже домохозяйка
Спасибо за видео!
Как можно добавить автоматическое разделение спикеров?
Никак. Пишите стерео, разделяйте на каналы и транскрибируйте каждый канал по очереди, потом по временным меткам соединяйте в диалог. Либо просите ChatGPT по смыслу разделить, но ошибки будут.
Добрый день, подскажите выскакивает ошибка : C:\Users\Фвьшт>whisper
Traceback (most recent call last):
File "", line 198, in _run_module_as_main
File "", line 88, in _run_code
File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Scripts\whisper.exe\__main__.py", line 4, in
File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\whisper\__init__.py", line 8, in
import torch
File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\__init__.py", line 148, in
raise err
OSError: [WinError 126] Не найден указанный модуль. Error loading "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\lib\fbgemm.dll" or one of its dependencies.
Подскажите, нашли как решить проблему?
У меня такая же проблема, пока не знаю, как решить, если кто знает, подскажите пожалуйста.
1. Установка Python 3.8.10. При установке в первом окне установщика не забудь поставить галочку напротив “Add python.exe to PATH. Для того, чтобы проверить, установился ли Python, необходимо в командной строке ввести “python -V”
2. Установить CUDA Toolkit 12.4. Если видеокарта NVidia.
3. Установка PyTorch. Скопировать текст напротив “Run this Command” в командную строку.
Установка Chocolatey. На сайте нажать кнопку “Install”. Потом ниже выбрать кнопку “Individual”. Еще ниже скопировать текст для установки в Windows PowerShell (открыть от имени администратора). После установки, не закрывая окно Windows PowerShell, ввести “choco install ffmpeg”
Открываем командную строку от имени администратора и вводим “pip install -U openai-whisper”.
Готово!
Открываем командную строку в папке с аудиофайлом. Вводим: whisper аудио.mp3. Если в имени файла есть несколько слов (с пробелами), то пишем так: whisper “аудио файл.mp3”. Обрамляем в кавычки.
Инструкцией по установке руководствовался вот с этого видео: ruclips.net/video/ABFqbY_rmEk/видео.html&ab_channel=KevinStratvert
РЕКОМЕНДУЮ перед началом установки поудалять старые версии Python и PyTorch. Инструкция по удалению по ссылке вверху.
Вау! Круто! Супер спасибо!
спасибо, все получилось
Спасибо) помогло
Бро! Ты крут! Лайк, подписка, колокольчик! Быть добру! Желаю тебе платиновую кнопку!
Тода Раба! Спасибо большое!
Спасибо большое
Большое спасибо! по инструкции всё получилось установить))) Подскажите пожалуйста, как записать команду, чтобы при расшифровке использовалась large модель для лучшего качества, когда звук не очень записан?
И еще вопрос, просто чтобы понимать) Расшифровка происходит через интернет или полностью на самом компьютере?
whisper "lecture.mp3" --model large-v2
расшифровка ведется на пк мощностями установленной видеокарты (в случае CUDA), языковая модель точно в самом начале скачивается с интернета(которую указали в комментарии выше)
ек марек , один файл на ура распознал и перевёл, со вторым ничего не вышло , то есть манипуляция прходит в CMD отображает распознаный текст , но результатирующий файл не образует и не сохраняет ....решил переставить ... то удалить могла себя то теперь никак непоставит, как удалить и поставить заново?
А на AMD картах у кого-нибудь получилось PyTorch с CUDO установить? Или на AMD картах только через CPU будет работать?
Скажи, пожалуйста, как удалить Compute Platform "CPU" в PyTorch, которую инсталлируешь в 02:25 ?
у меня при транскрибации выдает одну фразу на все тайм коды "Корректор А.Егорова" в чем прикол?
Сделал по видео все работает. Подскажите, пожалуйста, а как через pycharm настроить? И через Anaconda jupyter notebook?
добрый день! установил, все работает, но работает через CPU, как сделать так, что бы whisper работал на GPU? видеокарта от nvidia.
Откуда это взялось. На сайте установки pytorch, внизу есть раздел пререквизиты (то что нужно поставить перед установкой pytorch) со 2 шага написано установить CUDA Toolkit
Класс, спасибо. Можно также передавать ему несколько файлов так: whisper name1.mp4 name2.mp4 name3.mp4
Добрый день! Подскажите решение, всё получилось но субтитры съехали, как исправить?
Спасибо тебе, чувак. Круто все и понятно. Даже даун разберется. Молоток! Не первое твое смотрю, еще c kelopatra видел. Тоже годнота! Однозначно лайк и тебе респект за работу.👍
Здравствуйте, я дообучал модель whisper и получил файл. И тепер хочу получить финальный файл ggml формата. Пожалуйста подскажите как это сделать
Спасибо! Всё заработало на ноутбуке, которому 12 лет. У меня два вопроса:
1: Как удалить PyTorch с настройками для CUDA и поставить PyTorch с настройками для CPU? А то видео карта слабее чем процессор. Необходимо весь алгоритм повторить? НО тогда второй вопрос
2: Как почистить комп от всех файлов wisper? (git и puthon видно среди установленных программ, а вот как удалить то, что ставилось из под командной строки?)
Буду признателен за помощь.
Расскажи пожалуйста, какие модели и куда скачать на ПК чтобы при каждом запросе не подгружала модель
Большое спасибо все изи!
У меня не получилось установить по этой инструкции. Но я сделал всё заново по инструкции с канала Kevin Stratvert, и всё запустилось.
Вышла ошибка при попытке транскрибации, не найден модуль "C\:users\user\appdata\local\programs\python\python312\lib\site-packeges\torch\lib\fbgemm.dll" or one of its dependencies.
Все делал по инструкции, поймал такую же ошибку. Решение нагуглил, проверил, работает. Дело в том, что мы качаем последнюю версию pytorch, а в ней есть вот этот баг, можно качать версию ниже, типо 2.3.0, и будет ок, но я починил последнюю. Проблема в отсутствии библиотеки, и ее нужно докачать, одно из простых решений как - установить visual studio c/c++, с ней докачивается и библиотека в нужные директории, видеоинструкция в видосе ruclips.net/video/-ky896Qp1k8/видео.html . Но будьте готовы к тому, что загоните себе на диск С дополнительные 5ГБ. У меня после всех этих установк диск С совсем без свободного места оставался и это очень плохо, так не надо. Я поэтому это всё вообще на другой ненужный ноут установил.
Здравствуйте, я пытаюсь установить python по вашему видео, мне выдаёт такой текст, могли бы вы его прокомментировать - что это?
На все команды пишет: "не является внутренней или внешней командой, исполняемой программой или пакеты файлом"
Означает ли это, что не происходит загрузка?
Версия python 3.12.0 на андроид
Подскажите, а можно озвучивать сообщения из телеграм, наоборот, в аудио?
Добрый день! Подскажите,можно ли Whisper засунуть в UE5,а потом все упаковать в Vr шлем под андройдом 10 и чтоб еще работало и распознавал?)
Пестня!!! Спасибо!
в браузере, с приложением колабораторий, 5-минутный ролик расшифровывает 2.5 часа😬так и должно быть?
-== 5-минутный ролик расшифровывает 2.5 часа==-
разово можно и через микрофоны прогнать ...
есть ли модель или нейронка, которая разделяет спикеров по голосам? Шрифтом, к примеру. Можете подсказать сторонние модели или нейронки, которые лучше модели large на русском? Спасибо
сделайте пожалуйста инструкцию по установке для mac
А что делать если у меня ошибка "не удается продолжить выполнение кода поскольку система не обнаружила avdevice-60.ddl" когда нажимаю "ок" мне еще раза выдает эту ошибку.
Ошибка случилась на этапе ffmpeg в командной строке
пропиши путь в переменных средах правильный на питон
FFmpeg для макбука как скачать???
в январе 2024 столкнулся с проблемой...при попытке установки PyTorch посыпались ошибки...выяснилось что ПОСЛЕДНЮЮ версию Python они не поддерживают...только 3.11.х...друзья, имейте ввиду
Охренеть!
Не запускается Wisper
а как перевести с английского на русский видео или аудио ?
подскажите пожалуйста..может кто-то столкнулся... что я не так сделала...
у меня вместо того чтобы создавать файлы транскрипции, создается транскрипция прямо в командной строке...
В командной строке она тоже создается. Но и в папке, в которой лежит файл, должны появиться txt и так далее
@@TestRuteplitsast написала вопрос сразу после того как повторила все действия за Вами. файл большой и эти файлы создались через продолжительное время. не удалила комментарий, чтобы разобраться должен ли генерироваться текст в командной строке. Так шо дуже дякую що відповіли 👍
кому-то как-либо удалось решить проблему с зависаниями во время работы этой нейронки?
Ломаломов, верибест.
а как обратно? хочу слушать написатое
все браузеры сейчас с функцией *прочитать голосом*
Спасибо, а если FFmpeg через Chocolatey установить, то сработает?
Сработает. Должно сработать
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.@@TestRuteplitsast
не работает, выдаёт такую ошибку
raise err
OSError: [WinError 126] Не найден указанный модуль. Error loading "C:\Users\user\AppData\Local\Programs\Python\Python311\Lib\site-packages\torch\lib\cudnn_cnn_infer64_8.dll" or one of its dependencies.
я нашел решение заменой основной папки lib, скачанной с сайта PyTorch. Отладочная как раз не сработала((
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.@@АндрейКосицин-и2д
Все делал по инструкции, поймал такую же ошибку. Решение нагуглил, проверил, работает. Дело в том, что мы качаем последнюю версию pytorch, а в ней есть вот этот баг, можно качать версию ниже, типо 2.3.0, и будет ок, но я починил последнюю. Проблема в отсутствии библиотеки, и ее нужно докачать, одно из простых решений как - установить visual studio c/c++, с ней докачивается и библиотека в нужные директории, видеоинструкция в видосе ruclips.net/video/-ky896Qp1k8/видео.html . Но будьте готовы к тому, что загоните себе на диск С дополнительные 5ГБ. У меня после всех этих установк диск С совсем без свободного места оставался и это очень плохо, так не надо. Я поэтому это всё вообще на другой ненужный ноут установил.
Упс. Error loading "C:\Users\user\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\lib\fbgemm.dll"
Все делал как говорили
спасибо
видео не актуально, сайты были обновлены и теперь не понятно что откуда скачивать
и гугл поиск у ВАС не оплачен?
на линуксе (Ubuntu) выполнил всего 3 команды и работает.
установил все с репозитория
дайте линк на полную инструкцию (в w11 убунта на борту)
Большое спасибо! Но, он вместо русского языка установил английский и всё перевёл с русского на английский. Как указать нужный мне язык?
--language ru
Установил, все по мануалу. Теперь расскажу свой опыт: Поставил на транскрибацию аудио файл, протяженность аудио - около 1,5 часов. За 5 часов работы программы ничего с места не сдвинулось. Тогда я с редакторе порезал свой файл на 10 чвстей, по 8 - 10 минут. Включил транскрибацию. О чудо, зервый фрагмент перевел в текст. Затем я поставил остальные файлы. Из 10 штук 3 он перевел, остальные намертво зависали. Повторные попытки приводили к одинаковому результату. Прога работает крайне не стабильно, зависнуть может в любой момент и никогда не знаешь, повисла они или работает. Бесплатность проги компенсируется ее очень сильной нестабильностью и повисаловом. Не знаю, может у вас лучше. Благо, что сейчас уже есть нейронки, где все это можно сделать на лету и бесплатно...
Дай примеры хоть, где есть такие нейронки
@@valentinlicov3076согласен
Вот теперь тоже самое, только для Mac OS, а то с момента FFmpeg у меня начинается инсульт.
да у меня, дело в том, что инсульт начинается всякий раз, когда я Mac включаю. Но посмотрим. Может сделаю, но это надо разбираться.
Очень нужно
Спасибо огромное!!! Но мой лайк испортил вам "красивую" цифру 666))))
А что за браузер?
Vivaldi
Like
А есть нейросеть наоборот текст в аудио, чтобы более человечно говорила, а то edge браузере есть функция чтения но она как робот читает
Не помню. Где-то было вот прямо совсем просто. Прямо под рукой, помню, что было 4 голоса, но не могу вспомнить где. В принципе вот эти ребята заявляют поддержку голосов silero.ai но я их не тестил. Может сделаю, покопаюсь
В яндекс браузере читалка текста есть. Голос приятный. Чтобы скачивать нужно купить аудиокабель. Просто вставляешь в его в разъём входи и одновременно в разъём выхода и ставишь на запись аудио в любой программе по записи голоса с микрофона.
Ещё бы видео, как перенести whisper на другой комп сделать. Понятное дело, что Pytorch надо будет переустанавливать. Но как перенести?
И как обучать whisper правильно распознавать слова. Иначе косячит безжалостно.
у whisper есть ключ для указания модели, по умолчанию используется маленькая слабенькая, чем больше чем лучше распознаёт --model large
@@theurs2 вы не поняли. Large модель тоже ошибается. Не у всех идеальная дикция и не всегда качественная запись. Поэтому необходимо обучать whisper правильно распознавать слова. Как это делать?
@@theurs2 не подскажете, как изменить модель на получше?
@@EtoBaza-zt1lm --model large
@@theurs2 куда это писать?
Боже как прост и удобно. Проще и удобнее только сам машинный код. Зачем же в Total Commander Открываешь машинный код и строчишь Нолики и единички Прямо с перфокарты. Просто главное не ошибиться. Видно что технологии не стоят на месте. Раньше нажал на экзешник и всё установилось. А теперь вон оно как... Консоль терминал 10 раз перепроверить сто раз нажать. Чему удивляться что до сих пор мы в наемном рабстве и идёт Война. Наверное в своё время поувольняли не только инженеров электроников таких как я в школах, но и программистов которые могли бы доработать программу. Скомпилировать все библиотеки в один пакет.
-==Скомпилировать все библиотеки в один пакет.==-
займитесь и порадуйте дедушек созданным пакетом !
Да ладно, вы серьезно?)
Люди собрали датасет на 680 тысяч часов транскрибированного аудио, потом другие люди создали нейросеть, натренировали её на своих мощностях на этом датасете, а теперь результат отдают вам бесплатно. На huggingface сейчас лежит large v3. Дотренированная дополнительно на 5 миллионах часов аудио, со слабыми лейблами. А на гитхабе уже лежит GUI.
И чтобы бесплатно получить одну из лучших моделей для распознавания речи, вам нужен час на повторение за бесплатным видео и, в крайнем случае, пару часов погуглить решение ошибок, если они возникли.
Ей богу, не понимаю, откуда такое недовольство. Может вам просто не нужно распознавание речи?
есть такая штука - scoop для виндоса. это такой аналог apt-get для виндоус, самый интересный из них всех. ffmpeg оттуда ставиться командой scoop install ffmpeg
ну да, есть. Ну уж простите, действительно корявенько получилось. Но может для рядового пользователя с менеджерами пакетов связываться... ради одной установки. Сам как-то не пользуюсь и не подумал, что можно оптимизировать процесс. Вы считаете, что Scoop?
-==такая штука - scoop для виндоса. это такой аналог apt-get для виндоус==-
поделитесь линком на такие уроки?
спасибо.
@@My_Nickname_No_alias в поиске ютуба пиши
Как установить пакетный менеджер Scoop
раз уж работа идет через консоль, то можно вообще все сделать из консоли. на винде скачивание идет через winger/scoop/chocolatey install python ffmpeg ... по идее даже не надо в переменную среды ничего вставлять, если надо - set PATH=%=%PATH%;CL\your\path\here
ну да. Да я сам-то особо не пользуюсь консолью и как-то не пришло в голову. А что лучше, winger scoop или chocolatey? Тут вот человек пишет, что scoop
@@TestRuteplitsast от задач зависит. winget уже встроен, но если надо показать список установленного, он покажет вообще все проги. scoop я сам больше использую, он проще, хотя там не все есть. draw io например нет. choco имеет больше прог. не помню почему им перестал пользоваться, админ права требовал, или еще что неудобного. и ни в одной проге я не смог назначить свою папку для прог
@@TestRuteplitsast а еще в scoop надо прописывать cleanup * чтобы стереть старые версии программ, т.к он при обновлении ставит новую папку
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
Только на GPU получается?
Нет, вроде CPU тоже работает, просто я не пробовал. Ну и понятно, что медленнее в разы
У меня на ноутбуке Huawei с Core-i7 на борту всё нормально работает.
Спасибо👍