Нейросеть для перевода аудио в текст. Транскрибация от OpenAI: Whisper

Теплица социальных технологий

Просмотров 36 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 7 янв 2025

Комментарии • 157

@POTYOMKIN_ 5 месяцев назад ⁺¹
00:04 Whisper - это нейросеть OpenAI для перевода аудиофайлов в текст.
01:06 Установите PyTorch на Windows или Mac
02:00 Установите Cuda, FFmpeg и укажите пути для Windows.
02:54 Укажите путь к папке, содержащей FFMpeg, или добавьте FFMpeg в существующую зарегистрированную папку.
03:41 Скачайте и установите Git для Windows
04:43 Зарегистрируйте пути для папки Bin и папки CMD
05:36 Транскрибировать аудиофайлы в текст с помощью Python -m
06:29 Total Commander - удобный файловый менеджер с командной строкой внизу для более быстрой и простой работы с файлами.
@Pashe4ka_ Год назад ⁺⁴
Спасибо!
Пришлось повозиться с разными ошибками, хоть и делал всё по инструкции.
Ошибки гуглил, переустанавливал и обновлял версии программ, в итоге всё работает!
@OnSlon 10 месяцев назад ⁺²
А у меня вот только одна ошибка появилась когда по инструкции всё делал. Но чат гпт смог мне всё разжевать и решил за 2 минуты проблему. А загуглив ушло бы минут 10. Так что используй чат гпт с кастомной инструкцией под себя
@drzelenin День назад
Спасибо! Хорошо, что так подробно показал! Работает!!!
@iuliiailina5953 9 месяцев назад
Потрясающий гайд! Не забывайте обновлять и прописывать пути, тогда всё сработает как по маслу!
@rikkavoin Год назад ⁺⁷
Желаю вам миллион подписчиков и миллион просмотров под каждым видео! Благодарю!
@ПавелАнисов-н3б Год назад ⁺³
Четко и лаконично! Очень помогла ваша инструкция! Спасибо!!!
@oleksandr.regresolog 6 месяцев назад ⁺⁴
Спасибо автору за такой серезный контент. Пробовал несколько разных файлов, одни работали ,а другие почемуто не хотели запускаться. ВНИМАНИЕ если название файла имеет пробел(тогда не работает данная программа), то необходимо исправить , переименовать так, чтобы заполнить эти пробелы или их сократить. Ещё раз спасибо автору.
@xsonek 2 месяца назад
Жесть как здорово! ....и всё получилось , и даже с учётом того что пути у меня совсем другие, наши вам благодарности!
@emulec2h5oh82 11 месяцев назад ⁺²
Камраду большущий респект за данный нужный и подробный ролик.
Вот только камрад пренебрёг некоторыми, весьма важными, техническими подробностями.
А именно:
про PyTorch
1) под Windows требует только и исключительно х64 версию.
2) CUDA = Nvidia видеокарта.
(Один из главных недостатков CUDA состоит в том, что она является эксклюзивной платформой для работы на GPU компании NVIDIA. Это означает, что программа, написанная на CUDA, не будет работать на машинах с графическими процессорами других производителей, например - AMD или Intel).
А в последней стабильной версии PyTorch в наличии только CUDA, а CPU - отсутствует, как класс. И найти версию под Intel, тот ещё квест.
С уважением, Панки - ХОЙ!
@linamikhailova4361 Год назад ⁺¹
Большое спасибо! Установила Whisper - это какое-то волшебство!
@ЕвгенийМладший-и9д Год назад ⁺⁴
Да ты просто гений, бро! Огромная благодарность!!!
@forsietsforsiyskayarepubli2265 7 месяцев назад ⁺¹
быстро понятно и без воды, пол дня обыскался такое видео, спасибо😹
@dvizheniye 4 месяца назад
Спасибо, всё работает!
@koryginagrobova3506 Год назад ⁺²³
Для тех кого сильно пугает Использование питона и консольной команды, то... есть программа для субтитров -
Subtitle Edit.
В ней есть возможность через неё же скачать эту Whisper и использовать. Так же доступна другая Ai для субтитров - VOSK/Kaldi.
Как конкретно включается:
Запуск программы -> Видео -> Audio to text (Whisper) -> Выберите язык -> выберите модель -> "..." -> скачать нужную модель ( Tiny ... Large )
Может кому помогло упростить себе деятельность.
@koryginagrobova3506 Год назад ⁺²
@@GodOffOlympus tiny - маленькая модель для обыденных слов и оборотов речи. А Large модель обучена на большем количестве слов, значит сумеет транскрибировать более специфичные термины/названия компаний, научные термины и прочее. Ну и промежуточные по силу обучения модели.
Как-то так.
@Вячеслав-й9с7у Год назад ⁺²
В последней бета версии Subtitle Edit есть возможность разделения спикеров в окне выбора модели с помощью вкладки "Дополнительно". - команда "diarize".
Почему может не срабатывать эта команда при вводе в поле?
@koryginagrobova3506 Год назад ⁺¹
@@Вячеслав-й9с7у я не знаю, честно. Можно предположить проблемы от беты. На то она и бета, что б находить и исправлять проблемы, в будущих обновлениях, при описании ошибки в тех-помощи у разрабов.
Ну или проблема в самой модели нейросети. или Subtitle Edit этой бета версии, может некорректно скачивать модель. И получаются огрехи.
@2323Alexandr Год назад
Для apple продукции подскажите софт для транскрибации? Благодарю
@МарияАлександровна-е6э 10 месяцев назад
Спасибо огромное! сделала все по инструкции, заработало с первого раза.
@appleevil001 Год назад ⁺³
Спасибо за работу и удачи!
@АленаИсакова-ц9ш 8 месяцев назад
Здоровья и процветания Вам! Все получилось даже у чайника) От всей души благодарю!
@alexk3003 Год назад ⁺²
Очень полезно, будем осваивать
@АндрейЩербаков-з1р Год назад ⁺²
02:47 путь к папке для ffmpeg
04:01 разархивируем эти файлы в этот путь
04:21 скачиваем гит
05:20 проверяем
5:40 адрес папки для трнаскрибации
@gtagta3873 10 месяцев назад ⁺³
Добрый вечер, у меня почему-то всё работало хорошо, а вот сейчас пытаюсь транскрибировать и он будто зависает на фразах и по несколько раз одно и то же пишет. У кого-то было такое?
@ГригорійМельник-г2к Год назад ⁺²
Кратко и понятно😀!!!
@vladislavvasilkov5829 Год назад
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
@AnteyOxy Год назад ⁺¹
Спасибо! Это очень круто. У меня заработало
@user-jy5cm9mx7k Год назад ⁺²
Спасибо, боярин! Сильно время сэкономил.
@ТаняВласова-й5э 10 месяцев назад
Все получилось! Большое спасибо!!!
@nurlantaraz5095 Год назад ⁺²
Ура! Спасибо за супер обзор;) 👍
@СергейМихайлов-т3ы 11 месяцев назад
Отлично все работает! Спасибо!
@Лёша-в8х Год назад ⁺²
что делать ?
при установке PyTorch выскочили ошибки:
ERROR: Could not find a version that satisfies the requirement torch (from versions: none)
ERROR: No matching distribution found for torch
@andreykosilovich Год назад ⁺¹
Мне помогла установка другой версии Пайтона (11.4)
@ALEKSEY_77737 Год назад
спасибо за отлично проделанную работу
@nikitachelovian7470 Год назад ⁺¹
Мужик хорош! спасибо
@vladislavvasilkov5829 Год назад ⁺⁴
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
@nohchogums Год назад ⁺¹
скачай версию Питона 3.11.4 все заработает
@BossOfThisGym666 5 месяцев назад
@@nohchogums не заработает)
@mrhendrix7168 10 месяцев назад
Какой же ты прекрасный мужчина! Чёткая дикция, отличный голос, ясная подача без воды, что разберётся даже домохозяйка
@Вячеслав-й9с7у Год назад ⁺¹¹
Спасибо за видео!
Как можно добавить автоматическое разделение спикеров?
@Mastadanil 17 дней назад
Никак. Пишите стерео, разделяйте на каналы и транскрибируйте каждый канал по очереди, потом по временным меткам соединяйте в диалог. Либо просите ChatGPT по смыслу разделить, но ошибки будут.
@AlexNK 5 месяцев назад ⁺³
Добрый день, подскажите выскакивает ошибка : C:\Users\Фвьшт>whisper
Traceback (most recent call last):
File "", line 198, in _run_module_as_main
File "", line 88, in _run_code
File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Scripts\whisper.exe\__main__.py", line 4, in
File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\whisper\__init__.py", line 8, in
import torch
File "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\__init__.py", line 148, in
raise err
OSError: [WinError 126] Не найден указанный модуль. Error loading "C:\Users\Фвьшт\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\lib\fbgemm.dll" or one of its dependencies.
@anastasisia_1510 4 месяца назад
Подскажите, нашли как решить проблему?
@1991Kolyan 4 месяца назад
У меня такая же проблема, пока не знаю, как решить, если кто знает, подскажите пожалуйста.
@1991Kolyan 3 месяца назад ⁺¹
1. Установка Python 3.8.10. При установке в первом окне установщика не забудь поставить галочку напротив “Add python.exe to PATH. Для того, чтобы проверить, установился ли Python, необходимо в командной строке ввести “python -V”
2. Установить CUDA Toolkit 12.4. Если видеокарта NVidia.
3. Установка PyTorch. Скопировать текст напротив “Run this Command” в командную строку.
Установка Chocolatey. На сайте нажать кнопку “Install”. Потом ниже выбрать кнопку “Individual”. Еще ниже скопировать текст для установки в Windows PowerShell (открыть от имени администратора). После установки, не закрывая окно Windows PowerShell, ввести “choco install ffmpeg”
Открываем командную строку от имени администратора и вводим “pip install -U openai-whisper”.
Готово!
Открываем командную строку в папке с аудиофайлом. Вводим: whisper аудио.mp3. Если в имени файла есть несколько слов (с пробелами), то пишем так: whisper “аудио файл.mp3”. Обрамляем в кавычки.
Инструкцией по установке руководствовался вот с этого видео: ruclips.net/video/ABFqbY_rmEk/видео.html&ab_channel=KevinStratvert
РЕКОМЕНДУЮ перед началом установки поудалять старые версии Python и PyTorch. Инструкция по удалению по ссылке вверху.
@Theodor.G Год назад ⁺¹
Вау! Круто! Супер спасибо!
@AlexanderShamarin 22 дня назад
спасибо, все получилось
@Шиномонтажники Год назад ⁺²
Спасибо) помогло
@ЕвгенийСидоров-ч9и 8 месяцев назад
Бро! Ты крут! Лайк, подписка, колокольчик! Быть добру! Желаю тебе платиновую кнопку!
@РоманПарух-ю3й 8 месяцев назад
Тода Раба! Спасибо большое!
@Пава-й3з Год назад ⁺²
Спасибо большое
@Domino56220 Год назад ⁺⁴
Большое спасибо! по инструкции всё получилось установить))) Подскажите пожалуйста, как записать команду, чтобы при расшифровке использовалась large модель для лучшего качества, когда звук не очень записан?
И еще вопрос, просто чтобы понимать) Расшифровка происходит через интернет или полностью на самом компьютере?
@FideiDefensorEDU Год назад ⁺²
whisper "lecture.mp3" --model large-v2
@СергейПроколкин 9 месяцев назад ⁺²
расшифровка ведется на пк мощностями установленной видеокарты (в случае CUDA), языковая модель точно в самом начале скачивается с интернета(которую указали в комментарии выше)
@xsonek 2 месяца назад
ек марек , один файл на ура распознал и перевёл, со вторым ничего не вышло , то есть манипуляция прходит в CMD отображает распознаный текст , но результатирующий файл не образует и не сохраняет ....решил переставить ... то удалить могла себя то теперь никак непоставит, как удалить и поставить заново?
@АлександрГолунов-у6я 10 месяцев назад
А на AMD картах у кого-нибудь получилось PyTorch с CUDO установить? Или на AMD картах только через CPU будет работать?
@aleksandr_dirdrug5080 10 месяцев назад
Скажи, пожалуйста, как удалить Compute Platform "CPU" в PyTorch, которую инсталлируешь в 02:25 ?
@nastishenko Год назад ⁺¹
у меня при транскрибации выдает одну фразу на все тайм коды "Корректор А.Егорова" в чем прикол?
@semendyakonov7109 Год назад ⁺¹
Сделал по видео все работает. Подскажите, пожалуйста, а как через pycharm настроить? И через Anaconda jupyter notebook?
@alex-ender Год назад ⁺²
добрый день! установил, все работает, но работает через CPU, как сделать так, что бы whisper работал на GPU? видеокарта от nvidia.
@АрайКусаинов 10 месяцев назад ⁺¹
Откуда это взялось. На сайте установки pytorch, внизу есть раздел пререквизиты (то что нужно поставить перед установкой pytorch) со 2 шага написано установить CUDA Toolkit
@ВячеславРошка-ц3у 10 месяцев назад ⁺¹
Класс, спасибо. Можно также передавать ему несколько файлов так: whisper name1.mp4 name2.mp4 name3.mp4
@Head_Pack_Films 11 месяцев назад
Добрый день! Подскажите решение, всё получилось но субтитры съехали, как исправить?
@frantsyzof 11 месяцев назад ⁺¹
Спасибо тебе, чувак. Круто все и понятно. Даже даун разберется. Молоток! Не первое твое смотрю, еще c kelopatra видел. Тоже годнота! Однозначно лайк и тебе респект за работу.👍
@MySomethingInteresting 11 месяцев назад
Здравствуйте, я дообучал модель whisper и получил файл. И тепер хочу получить финальный файл ggml формата. Пожалуйста подскажите как это сделать
@ЕгорКрупко-м7й Месяц назад
Спасибо! Всё заработало на ноутбуке, которому 12 лет. У меня два вопроса:
1: Как удалить PyTorch с настройками для CUDA и поставить PyTorch с настройками для CPU? А то видео карта слабее чем процессор. Необходимо весь алгоритм повторить? НО тогда второй вопрос
2: Как почистить комп от всех файлов wisper? (git и puthon видно среди установленных программ, а вот как удалить то, что ставилось из под командной строки?)
Буду признателен за помощь.
@drzelenin День назад
Расскажи пожалуйста, какие модели и куда скачать на ПК чтобы при каждом запросе не подгружала модель
@ГерманХамитов-ж4ь 8 месяцев назад
Большое спасибо все изи!
@condemime1 3 месяца назад
У меня не получилось установить по этой инструкции. Но я сделал всё заново по инструкции с канала Kevin Stratvert, и всё запустилось.
@АлексейКондаков-щ6з 5 месяцев назад
Вышла ошибка при попытке транскрибации, не найден модуль "C\:users\user\appdata\local\programs\python\python312\lib\site-packeges\torch\lib\fbgemm.dll" or one of its dependencies.
@_Maks13 4 месяца назад
Все делал по инструкции, поймал такую же ошибку. Решение нагуглил, проверил, работает. Дело в том, что мы качаем последнюю версию pytorch, а в ней есть вот этот баг, можно качать версию ниже, типо 2.3.0, и будет ок, но я починил последнюю. Проблема в отсутствии библиотеки, и ее нужно докачать, одно из простых решений как - установить visual studio c/c++, с ней докачивается и библиотека в нужные директории, видеоинструкция в видосе ruclips.net/video/-ky896Qp1k8/видео.html . Но будьте готовы к тому, что загоните себе на диск С дополнительные 5ГБ. У меня после всех этих установк диск С совсем без свободного места оставался и это очень плохо, так не надо. Я поэтому это всё вообще на другой ненужный ноут установил.
@ЛарисаМасякина-в3п 6 месяцев назад
Здравствуйте, я пытаюсь установить python по вашему видео, мне выдаёт такой текст, могли бы вы его прокомментировать - что это?
На все команды пишет: "не является внутренней или внешней командой, исполняемой программой или пакеты файлом"
Означает ли это, что не происходит загрузка?
Версия python 3.12.0 на андроид
@ИринаДьяченко-ь6л 6 месяцев назад
Подскажите, а можно озвучивать сообщения из телеграм, наоборот, в аудио?
@kvakazhabra 9 месяцев назад
Добрый день! Подскажите,можно ли Whisper засунуть в UE5,а потом все упаковать в Vr шлем под андройдом 10 и чтоб еще работало и распознавал?)
@pargelium Год назад ⁺¹
Пестня!!! Спасибо!
@texnolog4476 Год назад ⁺¹
в браузере, с приложением колабораторий, 5-минутный ролик расшифровывает 2.5 часа😬так и должно быть?
@My_Nickname_No_alias Год назад
-== 5-минутный ролик расшифровывает 2.5 часа==-
разово можно и через микрофоны прогнать ...
@abusingAIForArt Год назад
есть ли модель или нейронка, которая разделяет спикеров по голосам? Шрифтом, к примеру. Можете подсказать сторонние модели или нейронки, которые лучше модели large на русском? Спасибо
@iosifsavitskiy8797 7 месяцев назад
сделайте пожалуйста инструкцию по установке для mac
@angelikarykalova5238 Год назад
А что делать если у меня ошибка "не удается продолжить выполнение кода поскольку система не обнаружила avdevice-60.ddl" когда нажимаю "ок" мне еще раза выдает эту ошибку.
Ошибка случилась на этапе ffmpeg в командной строке
@MrSeregaTMB Год назад
пропиши путь в переменных средах правильный на питон
@dr.kozorbekov5255 2 месяца назад
FFmpeg для макбука как скачать???
@kirillu6178 11 месяцев назад
в январе 2024 столкнулся с проблемой...при попытке установки PyTorch посыпались ошибки...выяснилось что ПОСЛЕДНЮЮ версию Python они не поддерживают...только 3.11.х...друзья, имейте ввиду
@BackStab1988 Год назад
Охренеть!
@BossOfThisGym666 5 месяцев назад
Не запускается Wisper
@Geforsan Месяц назад
а как перевести с английского на русский видео или аудио ?
@omairatiru5439 Год назад
подскажите пожалуйста..может кто-то столкнулся... что я не так сделала...
у меня вместо того чтобы создавать файлы транскрипции, создается транскрипция прямо в командной строке...
@TestRuteplitsast Год назад
В командной строке она тоже создается. Но и в папке, в которой лежит файл, должны появиться txt и так далее
@omairatiru5439 Год назад ⁺¹
@@TestRuteplitsast написала вопрос сразу после того как повторила все действия за Вами. файл большой и эти файлы создались через продолжительное время. не удалила комментарий, чтобы разобраться должен ли генерироваться текст в командной строке. Так шо дуже дякую що відповіли 👍
@Geforsan Месяц назад
кому-то как-либо удалось решить проблему с зависаниями во время работы этой нейронки?
@dzyn523 Год назад ⁺¹
Ломаломов, верибест.
а как обратно? хочу слушать написатое
@My_Nickname_No_alias Год назад
все браузеры сейчас с функцией *прочитать голосом*
@ОлегИванов-я2ж5и Год назад ⁺¹
Спасибо, а если FFmpeg через Chocolatey установить, то сработает?
@TestRuteplitsast Год назад ⁺¹
Сработает. Должно сработать
@vladislavvasilkov5829 Год назад
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.@@TestRuteplitsast
@ЮрийТесвенко Год назад
не работает, выдаёт такую ошибку
raise err
OSError: [WinError 126] Не найден указанный модуль. Error loading "C:\Users\user\AppData\Local\Programs\Python\Python311\Lib\site-packages\torch\lib\cudnn_cnn_infer64_8.dll" or one of its dependencies.
@АндрейКосицин-и2д Год назад
я нашел решение заменой основной папки lib, скачанной с сайта PyTorch. Отладочная как раз не сработала((
@vladislavvasilkov5829 Год назад
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.@@АндрейКосицин-и2д
@_Maks13 4 месяца назад
Все делал по инструкции, поймал такую же ошибку. Решение нагуглил, проверил, работает. Дело в том, что мы качаем последнюю версию pytorch, а в ней есть вот этот баг, можно качать версию ниже, типо 2.3.0, и будет ок, но я починил последнюю. Проблема в отсутствии библиотеки, и ее нужно докачать, одно из простых решений как - установить visual studio c/c++, с ней докачивается и библиотека в нужные директории, видеоинструкция в видосе ruclips.net/video/-ky896Qp1k8/видео.html . Но будьте готовы к тому, что загоните себе на диск С дополнительные 5ГБ. У меня после всех этих установк диск С совсем без свободного места оставался и это очень плохо, так не надо. Я поэтому это всё вообще на другой ненужный ноут установил.
@Dariel801 4 месяца назад
Упс. Error loading "C:\Users\user\AppData\Local\Programs\Python\Python312\Lib\site-packages\torch\lib\fbgemm.dll"
Все делал как говорили
@sharksgangs Год назад
спасибо
@Dfhb-hx3et Год назад
видео не актуально, сайты были обновлены и теперь не понятно что откуда скачивать
@My_Nickname_No_alias 10 месяцев назад
и гугл поиск у ВАС не оплачен?
@9keepa Год назад
на линуксе (Ubuntu) выполнил всего 3 команды и работает.
установил все с репозитория
@My_Nickname_No_alias 10 месяцев назад
дайте линк на полную инструкцию (в w11 убунта на борту)
@Nayusn Год назад
Большое спасибо! Но, он вместо русского языка установил английский и всё перевёл с русского на английский. Как указать нужный мне язык?
@denbrewers Год назад
--language ru
@ЕвгенийСидоров-ч9и 8 месяцев назад ⁺⁴
Установил, все по мануалу. Теперь расскажу свой опыт: Поставил на транскрибацию аудио файл, протяженность аудио - около 1,5 часов. За 5 часов работы программы ничего с места не сдвинулось. Тогда я с редакторе порезал свой файл на 10 чвстей, по 8 - 10 минут. Включил транскрибацию. О чудо, зервый фрагмент перевел в текст. Затем я поставил остальные файлы. Из 10 штук 3 он перевел, остальные намертво зависали. Повторные попытки приводили к одинаковому результату. Прога работает крайне не стабильно, зависнуть может в любой момент и никогда не знаешь, повисла они или работает. Бесплатность проги компенсируется ее очень сильной нестабильностью и повисаловом. Не знаю, может у вас лучше. Благо, что сейчас уже есть нейронки, где все это можно сделать на лету и бесплатно...
@valentinlicov3076 7 месяцев назад ⁺¹¹
Дай примеры хоть, где есть такие нейронки
@danrick001 Месяц назад
@@valentinlicov3076согласен
@slysid9446 Год назад
Вот теперь тоже самое, только для Mac OS, а то с момента FFmpeg у меня начинается инсульт.
@TestRuteplitsast Год назад ⁺²
да у меня, дело в том, что инсульт начинается всякий раз, когда я Mac включаю. Но посмотрим. Может сделаю, но это надо разбираться.
@jdneo777 Год назад
Очень нужно
@IGREENFOOD Год назад ⁺²
Спасибо огромное!!! Но мой лайк испортил вам "красивую" цифру 666))))
@sha1bu 10 месяцев назад
А что за браузер?
@serpico2105 9 месяцев назад
Vivaldi
@甲骨漢字 Год назад
Like
@bakkamitay Год назад
А есть нейросеть наоборот текст в аудио, чтобы более человечно говорила, а то edge браузере есть функция чтения но она как робот читает
@TestRuteplitsast Год назад
Не помню. Где-то было вот прямо совсем просто. Прямо под рукой, помню, что было 4 голоса, но не могу вспомнить где. В принципе вот эти ребята заявляют поддержку голосов silero.ai но я их не тестил. Может сделаю, покопаюсь
@ВладимирСк-п9п Год назад ⁺²
В яндекс браузере читалка текста есть. Голос приятный. Чтобы скачивать нужно купить аудиокабель. Просто вставляешь в его в разъём входи и одновременно в разъём выхода и ставишь на запись аудио в любой программе по записи голоса с микрофона.
@goradiog8145 Год назад ⁺¹
Ещё бы видео, как перенести whisper на другой комп сделать. Понятное дело, что Pytorch надо будет переустанавливать. Но как перенести?
И как обучать whisper правильно распознавать слова. Иначе косячит безжалостно.
@theurs2 Год назад
у whisper есть ключ для указания модели, по умолчанию используется маленькая слабенькая, чем больше чем лучше распознаёт --model large
@goradiog8145 Год назад ⁺³
@@theurs2 вы не поняли. Large модель тоже ошибается. Не у всех идеальная дикция и не всегда качественная запись. Поэтому необходимо обучать whisper правильно распознавать слова. Как это делать?
@EtoBaza-zt1lm Год назад ⁺¹
@@theurs2 не подскажете, как изменить модель на получше?
@theurs2 Год назад ⁺¹
@@EtoBaza-zt1lm --model large
@EtoBaza-zt1lm Год назад ⁺²
@@theurs2 куда это писать?
@romanbolgar Год назад ⁺³
Боже как прост и удобно. Проще и удобнее только сам машинный код. Зачем же в Total Commander Открываешь машинный код и строчишь Нолики и единички Прямо с перфокарты. Просто главное не ошибиться. Видно что технологии не стоят на месте. Раньше нажал на экзешник и всё установилось. А теперь вон оно как... Консоль терминал 10 раз перепроверить сто раз нажать. Чему удивляться что до сих пор мы в наемном рабстве и идёт Война. Наверное в своё время поувольняли не только инженеров электроников таких как я в школах, но и программистов которые могли бы доработать программу. Скомпилировать все библиотеки в один пакет.
@My_Nickname_No_alias Год назад ⁺³
-==Скомпилировать все библиотеки в один пакет.==-
займитесь и порадуйте дедушек созданным пакетом !
@IvanBondarev-o4w 11 месяцев назад
Да ладно, вы серьезно?)
Люди собрали датасет на 680 тысяч часов транскрибированного аудио, потом другие люди создали нейросеть, натренировали её на своих мощностях на этом датасете, а теперь результат отдают вам бесплатно. На huggingface сейчас лежит large v3. Дотренированная дополнительно на 5 миллионах часов аудио, со слабыми лейблами. А на гитхабе уже лежит GUI.
И чтобы бесплатно получить одну из лучших моделей для распознавания речи, вам нужен час на повторение за бесплатным видео и, в крайнем случае, пару часов погуглить решение ошибок, если они возникли.
Ей богу, не понимаю, откуда такое недовольство. Может вам просто не нужно распознавание речи?
@theurs2 Год назад
есть такая штука - scoop для виндоса. это такой аналог apt-get для виндоус, самый интересный из них всех. ffmpeg оттуда ставиться командой scoop install ffmpeg
@TestRuteplitsast Год назад
ну да, есть. Ну уж простите, действительно корявенько получилось. Но может для рядового пользователя с менеджерами пакетов связываться... ради одной установки. Сам как-то не пользуюсь и не подумал, что можно оптимизировать процесс. Вы считаете, что Scoop?
@My_Nickname_No_alias Год назад
-==такая штука - scoop для виндоса. это такой аналог apt-get для виндоус==-
поделитесь линком на такие уроки?
спасибо.
@theurs2 Год назад
@@My_Nickname_No_alias в поиске ютуба пиши
Как установить пакетный менеджер Scoop
@comisarrex5961 Год назад
раз уж работа идет через консоль, то можно вообще все сделать из консоли. на винде скачивание идет через winger/scoop/chocolatey install python ffmpeg ... по идее даже не надо в переменную среды ничего вставлять, если надо - set PATH=%=%PATH%;CL\your\path\here
@TestRuteplitsast Год назад
ну да. Да я сам-то особо не пользуюсь консолью и как-то не пришло в голову. А что лучше, winger scoop или chocolatey? Тут вот человек пишет, что scoop
@comisarrex5961 Год назад
@@TestRuteplitsast от задач зависит. winget уже встроен, но если надо показать список установленного, он покажет вообще все проги. scoop я сам больше использую, он проще, хотя там не все есть. draw io например нет. choco имеет больше прог. не помню почему им перестал пользоваться, админ права требовал, или еще что неудобного. и ни в одной проге я не смог назначить свою папку для прог
@comisarrex5961 Год назад
@@TestRuteplitsast а еще в scoop надо прописывать cleanup * чтобы стереть старые версии программ, т.к он при обновлении ставит новую папку
@vladislavvasilkov5829 Год назад
Добрый! Подскажите пожалуйста, в чем может заключаться проблема? Выполнил в точности как в видео, все проверки установок пройдены, но при финальном запросе выдает ошибку C:
ecsub>whisper r1.mp3
"whisper" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом.
Думал, что проблема в криво установленном Whisper, но при поптыке переустановить пишет, что Requirement already satisfied: mpmath>=0.19 in c:\users\user\appdata\local\ и т.д.
@user-jy5cm9mx7k Год назад ⁺¹
Только на GPU получается?
@TestRuteplitsast Год назад
Нет, вроде CPU тоже работает, просто я не пробовал. Ну и понятно, что медленнее в разы
@user-jy5cm9mx7k Год назад ⁺¹
У меня на ноутбуке Huawei с Core-i7 на борту всё нормально работает.
@TIMEFORSPORT9 10 месяцев назад
Спасибо👍

Следующие

Автовоспроизведение