Нейросеть превращает аудио в текст. Бесплатно!

Владимир Сорокин

Просмотров 3,5 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 14 мар 2024
Мой сервис по транскрибации (3 в подарок каждый месяц): t.me/BukvitsaAI_bot
Транскрибатор: colab.research.google.com/dri...
Мой Telegram → t.me/sorokin_vr
Instagram → / sorokin_vr

Комментарии • 41

@cosmopolit777 14 дней назад ⁺⁴
Просто умница. Всех тебе благ!
@romanbadik8587 5 дней назад ⁺¹
Это просто СУПЕР !!! Молодец Владимир . Четко .толково, доходчиво . Спасибо
@kateandrienko8361 10 дней назад ⁺²
Огромное вам спасибо! Шикарная программа, всё работает!
@pilotmebelitti6682 6 дней назад ⁺¹
Хороший пример
@RUpor100 9 дней назад ⁺¹
Красавчик, большое спасибо! Твори дальше)
@put_k_smislu 20 дней назад ⁺³
ураааааа, ты моё спасение))))
@babyshkaboy 8 дней назад ⁺¹
в чём может быть проблема если у меня видео на английском и я поставил что мне нужен русский(ru), но текст транскрибатора на английском языке?
@maiklbland2435 13 дней назад ⁺¹
Поскажите, пожалуйста, есть ли у транскрибаторов возможность перевода диалога?
@vadymbabaiev5644 День назад
отличное видео! а как запустить на локальной машине?
@user-qw7ib5ve3z 3 дня назад
спасибо. Я не нашла как загружать уже готовые файлы, можете добавить? спасибо заранее
@oleksandrtovmachenko8309 2 месяца назад
Спасибо за полезное видос. Вов, можешь сказать какой сервис используешь для презентации?
@Sorokin_vr 2 месяца назад ⁺¹
Спасибо, что посмотрели и написали! Эта презентация сделана через Figma. Но делал человек)
@DanzoX25 Месяц назад ⁺³
Хорошая подача. Сценарий тоже ChatGPT написал?)
@Sorokin_vr Месяц назад ⁺¹
Добрый вечер! Нет, для этого видео делал сам, но отправил ошибки вычитать и в паре мест сделал предложения более читабельными и понятными
@eugenesamofal3701 26 дней назад ⁺²
Видео супер, все очень понятно. Очень нужна обнова для разделения на роли + работу с m4a из zoom! Не планируете обнову кода?
@Sorokin_vr 25 дней назад ⁺²
Добрый день! На неделе обновлю код, чтобы работал с файлами в любом аудио формате, а так же сделаю вариант с разделением на роли!
@Sorokin_vr 25 дней назад ⁺¹
Но уже сейчас можно загнать аудио файл в конвектор в mp3 и сразу транскрибировать.
@eugenesamofal3701 23 дня назад
@@Sorokin_vr Спасибо большое)
@starrider1683 Месяц назад
А как указывать языки, если видео двуязычное? Я попробовал сделать транскрипт русско-немецкого обучающего видео, поставив язык просто "ru". Русский текст был взят точно, а немецкие фразы пропущены. Можно, например, поставить два языка через запятую?
@Sorokin_vr Месяц назад
Добрый день! К сожалению, нет
@AnatolyGalkin Месяц назад ⁺¹
Можно ли транскрибировать аудио в текст, если это диалог, т.е. 2 участника. Нужно получить текст обозначив кто что сказал.
@Sorokin_vr Месяц назад
Добрый день! Можно добавить приписку в конце: --task diarize и тогда транскрибация будет расписанная по ролям
@projectastronautsnb1299 25 дней назад ⁺¹
@@Sorokin_vr здравствуйте. а не могли бы Вы указать более точно, куда добавлять приписку?
@user-tr6rz6ov9y 20 дней назад
а куда именно добавить?
@user-be4do7py9i Месяц назад ⁺¹
не работает с аудио файлами, загружаешь файл mp3(40 мб 30 минут разговора) в папку audio и выдает zip файл пустой, а с ютьюбом действительно работает.
@Nikolay_Epikhin_meditation Месяц назад
у меня переводит, но не полностью, примерно 10 минут из 30 минутного видео загруженного с компьютера
@user-og4vh5jz8k 25 дней назад
А как видео транскрибировать, пробовал закинуть в папку Audio, на выходе пустой файл
@Sorokin_vr 25 дней назад
Добрый день! Достаточно отделить аудио от видео через любой онлайн сервис или залить видео на ютуб с доступом по ссылке и робот сам отделит аудио
@ArtIsSoulEruption 19 дней назад ⁺¹
Спасибо! Очень хорошая и нужная программа. А может ли ChatGPT составить такой код, чтобы возможно было транскрибировать, скажем, не все 2,5 часа видео или аудио, а только фрагмент по указанному времени тайм‐кода, скажем от 12:50 и до 56:34?
@Hit7Man 4 часа назад
а обрезать любой прогой религия не позволяет?
@volbga7220 Месяц назад ⁺¹
Из видео не понятно, что нужно делать, если аудио-файл уже есть на компьютере и его не надо ни откуда скачивать?
@Sorokin_vr Месяц назад ⁺¹
Добрый день! Нужно запустить первый шаг и дождаться пока он закончится. После этого загрузить аудио файлы в формате .mp3 в папку Audio и запустить третий шаг.
@heresyy53 Месяц назад
а почему нужно выбирать gpu а не оставлять cpu?
@Sorokin_vr Месяц назад
Добрый день! Потому что для работы нейросети требуется бОльшая вычислительная мощность, чем позволяет выдать CPU.
@zigf 2 месяца назад
Решил 9-минутное видео сделать: Сеанс прекращен, так как объем ОЗУ полностью исчерпан.
Ага, вернусь-ка я к домашнему whisper...
@Sorokin_vr 2 месяца назад ⁺²
Добрый день! Это может быть связано с тем, что: 1. Не сменили среду выполнения. 2. После первой транскрибации начали вторую не завершив сеанс. ОЗУ и ВРАМ легко хватает. Если подробнее распишите в какой ситуации у вас вылезло, что не хватает ОЗУ - смогу подсказать
@zigf 2 месяца назад
@@Sorokin_vr да, со второго раза получилось. Не планируете доработать скрипт, чтобы автоматически запускался следующий пункт по окончании предыдущего?
@Sorokin_vr 2 месяца назад ⁺¹
Можно весь код засунуть в один блок и одним запуском будет выполняться сразу весь процесс. Все операции написаны последовательно, соотвественно проблем не должно быть. Разделил на блоки, чтобы была возможность выполнять скачивание отдельно + просто логически разные операции.
@Sorokin_vr 2 месяца назад ⁺¹
Но но вообще можно изначально до запуска вставить ссылки во второй шаг и сразу запустить все три шага. В видео разделил по времени нажатия, чтобы пока вставляем ссылки система установила все из первого шага
@zigf 2 месяца назад
@@Sorokin_vr Вот улучшение скрипта:
from google.colab import files
from datetime import datetime
и в конце:
# Генерация уникального имени файла на основе текущей даты и времени
current_datetime = datetime.now().strftime("%Y%m%d_%H%M%S")
unique_filename = f'Transcriptions_{current_datetime}.zip'
# Переименование файла
os.rename('Transcriptions.zip', unique_filename)
# Скачивание архива на локальный компьютер
files.download(unique_filename)
Теперь не нужно вручную из левой колонки скачивать результаты на локальный компьютер. Если на локальном компьютере файл существует, он не будет перезаписан, так как в имя архива добавлена текущая дата и время.
Позже еще одно важное улучшение добавлю.

Следующие

Автовоспроизведение

synthwave radio 🌌 - beats to chill/game to

Парадокс неожиданной казни - когда ожидать неожиданное // Vital Math