Нейросеть превращает аудио в текст. Бесплатно!

Поделиться
HTML-код
  • Опубликовано: 14 мар 2024
  • Мой сервис по транскрибации (3 в подарок каждый месяц): t.me/BukvitsaAI_bot
    Транскрибатор: colab.research.google.com/dri...
    Мой Telegram → t.me/sorokin_vr
    Instagram → / sorokin_vr

Комментарии • 41

  • @cosmopolit777
    @cosmopolit777 14 дней назад +4

    Просто умница. Всех тебе благ!

  • @romanbadik8587
    @romanbadik8587 5 дней назад +1

    Это просто СУПЕР !!! Молодец Владимир . Четко .толково, доходчиво . Спасибо

  • @kateandrienko8361
    @kateandrienko8361 10 дней назад +2

    Огромное вам спасибо! Шикарная программа, всё работает!

  • @pilotmebelitti6682
    @pilotmebelitti6682 6 дней назад +1

    Хороший пример

  • @RUpor100
    @RUpor100 9 дней назад +1

    Красавчик, большое спасибо! Твори дальше)

  • @put_k_smislu
    @put_k_smislu 20 дней назад +3

    ураааааа, ты моё спасение))))

  • @babyshkaboy
    @babyshkaboy 8 дней назад +1

    в чём может быть проблема если у меня видео на английском и я поставил что мне нужен русский(ru), но текст транскрибатора на английском языке?

  • @maiklbland2435
    @maiklbland2435 13 дней назад +1

    Поскажите, пожалуйста, есть ли у транскрибаторов возможность перевода диалога?

  • @vadymbabaiev5644
    @vadymbabaiev5644 День назад

    отличное видео! а как запустить на локальной машине?

  • @user-qw7ib5ve3z
    @user-qw7ib5ve3z 3 дня назад

    спасибо. Я не нашла как загружать уже готовые файлы, можете добавить? спасибо заранее

  • @oleksandrtovmachenko8309
    @oleksandrtovmachenko8309 2 месяца назад

    Спасибо за полезное видос. Вов, можешь сказать какой сервис используешь для презентации?

    • @Sorokin_vr
      @Sorokin_vr  2 месяца назад +1

      Спасибо, что посмотрели и написали! Эта презентация сделана через Figma. Но делал человек)

  • @DanzoX25
    @DanzoX25 Месяц назад +3

    Хорошая подача. Сценарий тоже ChatGPT написал?)

    • @Sorokin_vr
      @Sorokin_vr  Месяц назад +1

      Добрый вечер! Нет, для этого видео делал сам, но отправил ошибки вычитать и в паре мест сделал предложения более читабельными и понятными

  • @eugenesamofal3701
    @eugenesamofal3701 26 дней назад +2

    Видео супер, все очень понятно. Очень нужна обнова для разделения на роли + работу с m4a из zoom! Не планируете обнову кода?

    • @Sorokin_vr
      @Sorokin_vr  25 дней назад +2

      Добрый день! На неделе обновлю код, чтобы работал с файлами в любом аудио формате, а так же сделаю вариант с разделением на роли!

    • @Sorokin_vr
      @Sorokin_vr  25 дней назад +1

      Но уже сейчас можно загнать аудио файл в конвектор в mp3 и сразу транскрибировать.

    • @eugenesamofal3701
      @eugenesamofal3701 23 дня назад

      @@Sorokin_vr Спасибо большое)

  • @starrider1683
    @starrider1683 Месяц назад

    А как указывать языки, если видео двуязычное? Я попробовал сделать транскрипт русско-немецкого обучающего видео, поставив язык просто "ru". Русский текст был взят точно, а немецкие фразы пропущены. Можно, например, поставить два языка через запятую?

    • @Sorokin_vr
      @Sorokin_vr  Месяц назад

      Добрый день! К сожалению, нет

  • @AnatolyGalkin
    @AnatolyGalkin Месяц назад +1

    Можно ли транскрибировать аудио в текст, если это диалог, т.е. 2 участника. Нужно получить текст обозначив кто что сказал.

    • @Sorokin_vr
      @Sorokin_vr  Месяц назад

      Добрый день! Можно добавить приписку в конце: --task diarize и тогда транскрибация будет расписанная по ролям

    • @projectastronautsnb1299
      @projectastronautsnb1299 25 дней назад +1

      @@Sorokin_vr здравствуйте. а не могли бы Вы указать более точно, куда добавлять приписку?

    • @user-tr6rz6ov9y
      @user-tr6rz6ov9y 20 дней назад

      а куда именно добавить?

  • @user-be4do7py9i
    @user-be4do7py9i Месяц назад +1

    не работает с аудио файлами, загружаешь файл mp3(40 мб 30 минут разговора) в папку audio и выдает zip файл пустой, а с ютьюбом действительно работает.

    • @Nikolay_Epikhin_meditation
      @Nikolay_Epikhin_meditation Месяц назад

      у меня переводит, но не полностью, примерно 10 минут из 30 минутного видео загруженного с компьютера

  • @user-og4vh5jz8k
    @user-og4vh5jz8k 25 дней назад

    А как видео транскрибировать, пробовал закинуть в папку Audio, на выходе пустой файл

    • @Sorokin_vr
      @Sorokin_vr  25 дней назад

      Добрый день! Достаточно отделить аудио от видео через любой онлайн сервис или залить видео на ютуб с доступом по ссылке и робот сам отделит аудио

  • @ArtIsSoulEruption
    @ArtIsSoulEruption 19 дней назад +1

    Спасибо! Очень хорошая и нужная программа. А может ли ChatGPT составить такой код, чтобы возможно было транскрибировать, скажем, не все 2,5 часа видео или аудио, а только фрагмент по указанному времени тайм‐кода, скажем от 12:50 и до 56:34?

    • @Hit7Man
      @Hit7Man 4 часа назад

      а обрезать любой прогой религия не позволяет?

  • @volbga7220
    @volbga7220 Месяц назад +1

    Из видео не понятно, что нужно делать, если аудио-файл уже есть на компьютере и его не надо ни откуда скачивать?

    • @Sorokin_vr
      @Sorokin_vr  Месяц назад +1

      Добрый день! Нужно запустить первый шаг и дождаться пока он закончится. После этого загрузить аудио файлы в формате .mp3 в папку Audio и запустить третий шаг.

  • @heresyy53
    @heresyy53 Месяц назад

    а почему нужно выбирать gpu а не оставлять cpu?

    • @Sorokin_vr
      @Sorokin_vr  Месяц назад

      Добрый день! Потому что для работы нейросети требуется бОльшая вычислительная мощность, чем позволяет выдать CPU.

  • @zigf
    @zigf 2 месяца назад

    Решил 9-минутное видео сделать: Сеанс прекращен, так как объем ОЗУ полностью исчерпан.
    Ага, вернусь-ка я к домашнему whisper...

    • @Sorokin_vr
      @Sorokin_vr  2 месяца назад +2

      Добрый день! Это может быть связано с тем, что: 1. Не сменили среду выполнения. 2. После первой транскрибации начали вторую не завершив сеанс. ОЗУ и ВРАМ легко хватает. Если подробнее распишите в какой ситуации у вас вылезло, что не хватает ОЗУ - смогу подсказать

    • @zigf
      @zigf 2 месяца назад

      @@Sorokin_vr да, со второго раза получилось. Не планируете доработать скрипт, чтобы автоматически запускался следующий пункт по окончании предыдущего?

    • @Sorokin_vr
      @Sorokin_vr  2 месяца назад +1

      Можно весь код засунуть в один блок и одним запуском будет выполняться сразу весь процесс. Все операции написаны последовательно, соотвественно проблем не должно быть. Разделил на блоки, чтобы была возможность выполнять скачивание отдельно + просто логически разные операции.

    • @Sorokin_vr
      @Sorokin_vr  2 месяца назад +1

      Но но вообще можно изначально до запуска вставить ссылки во второй шаг и сразу запустить все три шага. В видео разделил по времени нажатия, чтобы пока вставляем ссылки система установила все из первого шага

    • @zigf
      @zigf 2 месяца назад

      @@Sorokin_vr Вот улучшение скрипта:
      from google.colab import files
      from datetime import datetime
      и в конце:
      # Генерация уникального имени файла на основе текущей даты и времени
      current_datetime = datetime.now().strftime("%Y%m%d_%H%M%S")
      unique_filename = f'Transcriptions_{current_datetime}.zip'
      # Переименование файла
      os.rename('Transcriptions.zip', unique_filename)
      # Скачивание архива на локальный компьютер
      files.download(unique_filename)
      Теперь не нужно вручную из левой колонки скачивать результаты на локальный компьютер. Если на локальном компьютере файл существует, он не будет перезаписан, так как в имя архива добавлена текущая дата и время.
      Позже еще одно важное улучшение добавлю.