Нейросеть превращает аудио в текст. Бесплатно!
HTML-код
- Опубликовано: 14 мар 2024
- Мой сервис по транскрибации (3 в подарок каждый месяц): t.me/BukvitsaAI_bot
Транскрибатор: colab.research.google.com/dri...
Мой Telegram → t.me/sorokin_vr
Instagram → / sorokin_vr
Просто умница. Всех тебе благ!
Это просто СУПЕР !!! Молодец Владимир . Четко .толково, доходчиво . Спасибо
Огромное вам спасибо! Шикарная программа, всё работает!
Хороший пример
Красавчик, большое спасибо! Твори дальше)
ураааааа, ты моё спасение))))
в чём может быть проблема если у меня видео на английском и я поставил что мне нужен русский(ru), но текст транскрибатора на английском языке?
Поскажите, пожалуйста, есть ли у транскрибаторов возможность перевода диалога?
отличное видео! а как запустить на локальной машине?
спасибо. Я не нашла как загружать уже готовые файлы, можете добавить? спасибо заранее
Спасибо за полезное видос. Вов, можешь сказать какой сервис используешь для презентации?
Спасибо, что посмотрели и написали! Эта презентация сделана через Figma. Но делал человек)
Хорошая подача. Сценарий тоже ChatGPT написал?)
Добрый вечер! Нет, для этого видео делал сам, но отправил ошибки вычитать и в паре мест сделал предложения более читабельными и понятными
Видео супер, все очень понятно. Очень нужна обнова для разделения на роли + работу с m4a из zoom! Не планируете обнову кода?
Добрый день! На неделе обновлю код, чтобы работал с файлами в любом аудио формате, а так же сделаю вариант с разделением на роли!
Но уже сейчас можно загнать аудио файл в конвектор в mp3 и сразу транскрибировать.
@@Sorokin_vr Спасибо большое)
А как указывать языки, если видео двуязычное? Я попробовал сделать транскрипт русско-немецкого обучающего видео, поставив язык просто "ru". Русский текст был взят точно, а немецкие фразы пропущены. Можно, например, поставить два языка через запятую?
Добрый день! К сожалению, нет
Можно ли транскрибировать аудио в текст, если это диалог, т.е. 2 участника. Нужно получить текст обозначив кто что сказал.
Добрый день! Можно добавить приписку в конце: --task diarize и тогда транскрибация будет расписанная по ролям
@@Sorokin_vr здравствуйте. а не могли бы Вы указать более точно, куда добавлять приписку?
а куда именно добавить?
не работает с аудио файлами, загружаешь файл mp3(40 мб 30 минут разговора) в папку audio и выдает zip файл пустой, а с ютьюбом действительно работает.
у меня переводит, но не полностью, примерно 10 минут из 30 минутного видео загруженного с компьютера
А как видео транскрибировать, пробовал закинуть в папку Audio, на выходе пустой файл
Добрый день! Достаточно отделить аудио от видео через любой онлайн сервис или залить видео на ютуб с доступом по ссылке и робот сам отделит аудио
Спасибо! Очень хорошая и нужная программа. А может ли ChatGPT составить такой код, чтобы возможно было транскрибировать, скажем, не все 2,5 часа видео или аудио, а только фрагмент по указанному времени тайм‐кода, скажем от 12:50 и до 56:34?
а обрезать любой прогой религия не позволяет?
Из видео не понятно, что нужно делать, если аудио-файл уже есть на компьютере и его не надо ни откуда скачивать?
Добрый день! Нужно запустить первый шаг и дождаться пока он закончится. После этого загрузить аудио файлы в формате .mp3 в папку Audio и запустить третий шаг.
а почему нужно выбирать gpu а не оставлять cpu?
Добрый день! Потому что для работы нейросети требуется бОльшая вычислительная мощность, чем позволяет выдать CPU.
Решил 9-минутное видео сделать: Сеанс прекращен, так как объем ОЗУ полностью исчерпан.
Ага, вернусь-ка я к домашнему whisper...
Добрый день! Это может быть связано с тем, что: 1. Не сменили среду выполнения. 2. После первой транскрибации начали вторую не завершив сеанс. ОЗУ и ВРАМ легко хватает. Если подробнее распишите в какой ситуации у вас вылезло, что не хватает ОЗУ - смогу подсказать
@@Sorokin_vr да, со второго раза получилось. Не планируете доработать скрипт, чтобы автоматически запускался следующий пункт по окончании предыдущего?
Можно весь код засунуть в один блок и одним запуском будет выполняться сразу весь процесс. Все операции написаны последовательно, соотвественно проблем не должно быть. Разделил на блоки, чтобы была возможность выполнять скачивание отдельно + просто логически разные операции.
Но но вообще можно изначально до запуска вставить ссылки во второй шаг и сразу запустить все три шага. В видео разделил по времени нажатия, чтобы пока вставляем ссылки система установила все из первого шага
@@Sorokin_vr Вот улучшение скрипта:
from google.colab import files
from datetime import datetime
и в конце:
# Генерация уникального имени файла на основе текущей даты и времени
current_datetime = datetime.now().strftime("%Y%m%d_%H%M%S")
unique_filename = f'Transcriptions_{current_datetime}.zip'
# Переименование файла
os.rename('Transcriptions.zip', unique_filename)
# Скачивание архива на локальный компьютер
files.download(unique_filename)
Теперь не нужно вручную из левой колонки скачивать результаты на локальный компьютер. Если на локальном компьютере файл существует, он не будет перезаписан, так как в имя архива добавлена текущая дата и время.
Позже еще одно важное улучшение добавлю.