음성을 텍스트로 바꾸는 최강 + 무료 A.I. - Open AI의 위스퍼 (Whisper)

Поделиться
HTML-код
  • Опубликовано: 1 дек 2024

Комментарии • 58

  • @손병호-w4s
    @손병호-w4s 3 дня назад

    너무 감사합니다.

  • @sarah_inlove
    @sarah_inlove Месяц назад +1

    너무 좋아요! 알려주셔서 진짜 너무 감사합니다!! 시간을 엄청 세이브 했어요~ 코딩으로 해서 하는거 너무 신기하구요:) 채널 처음 알게되었는데 구독 좋아요 누르고 가요^^

  • @Berunnu-le4dg
    @Berunnu-le4dg Месяц назад

    정말 감사합니다 시간이 지나도 잘 작동하네요^^ 잘 사용하겠습니다.

  • @성현-i1p
    @성현-i1p 5 месяцев назад +2

    좋은 정보 너무너무 감사합니다. 쓰다보니 궁굼한게 하나있는데 혹시 srt 를 만들때
    통으로 시간이 만들어지던데
    이걸 단어별 시간을 뽑는 방법도 있을까요?
    알려주신대로 한글음성을 넣으면 문장단위로 되길래 혹시 방법이 있을까 여쭤봅니다 ㅎㅎ

    • @rreport
      @rreport  5 месяцев назад +1

      아마 거기 꺼지는 안되는 것으로…쿨럭…;;;;

  • @루치아-i9y
    @루치아-i9y 3 месяца назад +1

    이건 파일하나만 가능한가요? 아니면 하루에 한개의 파일만? 저장해놓은 경로에 들어가서 다음날 하려고 하면 "/bin/bash: line 1: whisper: command not found" 뜨거든요. 매번 설치과정부터 거치니 번거러워요. 그래도 덕분에 하루에 하나의 파일이라도 건질수 있는게 얼마나 다행인지 감사드려욧

    • @rreport
      @rreport  3 месяца назад

      먼가 이상한데요. 하루에 몇 번이고 가능하고 할때마다 매번 재설치 안하셔도 됩니다…;; 콜라보에서 나오시면 다시 설치해야 합니다만…;;

  • @J_WasThere
    @J_WasThere 5 месяцев назад +1

    이런 툴이 있다는 게 정말 소름돋았어요...! 그동안 자막 작업은 너무 고되고 힘들었는데! 큰 도움이 되었습니다:)
    그리고, 그래도 한글 음성 인식은 늘 네이버가 최고이겠지... 하고 믿었는데, 글로벌 기업은 역시나네요.
    단순한 자막 작업뿐 아니라, 이러한 툴 활용성이 더 무궁무진해질 거라는 생각이 듭니다!

    • @rreport
      @rreport  5 месяцев назад

      최근 유튜브 자동 자막 생성은 더 대박 입니다. 제가 발음이 안좋은데 그걸 다 잡아내서 제대로 자막을 만들어 내더라고요...;; 후덜덜...

    • @J_WasThere
      @J_WasThere 5 месяцев назад

      @@rreport 사용해봤는데 말한 시간을 표기해주는 타임스탬프는 오차가 점점 커지더라구요, 한글>영문 번역도 Whisper가 지원하는지 궁금하네요

  • @all123aasd
    @all123aasd 4 месяца назад

    대박이네요!!! 캡컷 자동캡션 유료되고 일일히 손으로 다시하려다가, 지금 따라했는데요. 대박입니다. 좋아요 누르고 잘 배워갑니다~

    • @rreport
      @rreport  4 месяца назад

      유용하셨다니 다행입니다, 코멘트 감사드려요~ R-report.com 도 많은 관심 부탁 드립니다🙏

  • @user-re7iy8oy2d
    @user-re7iy8oy2d 6 месяцев назад +2

    감사합니다! 혹시 번역 속도가 답답해서 그러는데 유료모델중에 한국어 인식 성능이 가장좋은 변환 프로그램 추천해주실수 있으실까요?

    • @rreport
      @rreport  6 месяцев назад

      솔직히 말씀드리면 특히 한국어는 유료이던 무료이던 완벽하지 않은 것 같습니다. CapCut 내에서도 음성 언어를 인식해서 transcript를 달아주는 기능이 있는데 Whisper 보다 정확성이 떨어지더라고요. 편리성을 추구하신다면 영상 마지막에 소개된 Aiko 모바일 앱을 사용해 보시는 것도 좋을 것 같아요. 속 시원한 대안이 나오기까지는 몇 년 더 걸리지 않을까 싶습니다.😅

  • @hnjuck
    @hnjuck 2 месяца назад +1

    안녕하세요? 다른 영상들에는 개인정보때문에 쓰기가 꺼려졌는데 여기는 그럴 우려가 없어서 좋습니다.그런데 위스퍼 모델을 Large모델을 쓰려면 어떻게 해야할까요?

    • @rreport
      @rreport  2 месяца назад +1

      죄송합니다. 제 짧은 지식으로는 답변을 드릴 수 없네요 😓

    • @hnjuck
      @hnjuck 2 месяца назад +1

      @@rreport 아닙니다. 이 영상으로도 충분히 도움이 되었습니다. 답변 감사합니다.

  • @dahi1220
    @dahi1220 2 месяца назад +1

    정말 좋은 세상입니다. 감사해요. 근데 처리속도 문제는 어쩔수 없는건가요?

    • @rreport
      @rreport  2 месяца назад

      따뜻한 코맨트 감사드려요. 다른 분들의 코맨트를 들어보니 GPU 사양과 와이파이 속도에 따라 위스퍼의 반응 속도가 많이 달라지더라고요~!

  • @KL-uu7mb
    @KL-uu7mb 3 месяца назад

    AIKO는 혹시 얼느정도 길이가 되는지 아시나요 ?
    For short recordings 라고 메세지가 뜨네요

  • @파뇨-t3o
    @파뇨-t3o 22 дня назад

    코드를 어떻게 하는건지 잘 모르겠습니다
    동영상 공유에서 복사를 누르면 되는건지요
    영상이 길면 안되는것인지도 궁금합니다

  • @헤븐리터치-b5e
    @헤븐리터치-b5e 5 месяцев назад +1

    어제 저녁에 몆개 파일만 텍스트 변환해보고 거의 완벽하게 잔 되서 넘 좋다했는데 아침에 추가로 변환하려고 했더니 GPU 백엔드에 연결할 수 없음으로 현재 Colab의 사용량 제한으로 인해 GPU에 연결할 수 없습니다 뜨면서 최종적으로 변환이 안되요 ㅠ
    이거 시간제한이나 용량제한이 있나요? 그렇다면 사용할 의미가 없어지는데요 몇분 안되는 파일 세개 정도 잘 되길래 야호 하고 있었는데.. 이거 해결할 방법 없나요? 변환해야할 자료들이 꽤 많이 남아 있어서 꼭 필요하거든요 답변 꼭 부탁드릴께요

    • @rreport
      @rreport  5 месяцев назад

      제한이 있습니다. 따라서 구글 계정을 여러개 만들어서 번갈아가면서 쓰시면 됩니다 (아니면 구글 Colab을 유료 결제 하셔도 될 껄요~)

  • @유랑천하
    @유랑천하 7 месяцев назад +1

    영상 정말 감사합니다 그럼 다음에 작업할때는 위스퍼 코드를 치지 말고 바로 !whisper "ENTER FILE NAME HERE" --model medium 이 코드 치고 시작하면 되는건가요?

    • @rreport
      @rreport  7 месяцев назад +1

      따뜻한 코맨트 감사드려요~! 구글 콜라보 환경에서 나가시거나 커넥션이 끊어지면 처음 부터 프로세스 다시 시작하셔야 하고요. 같은 환경(구글 콜라보 + Connected)에 머무신 경우에는 파일만 다시 올려 놓고 위의 코드에 이름만 바꾸시면 됩니다.

    • @유랑천하
      @유랑천하 7 месяцев назад +1

      @@rreport 아하 그렇군요 감사합니다 👍👍👍👍

  • @kng6185
    @kng6185 8 месяцев назад +1

    안녕하세요! 혹시 결과가 영어로 나올때는 어디를 수정하면 될까요?분명 한글음성파일인데요 .. ㅜ

    • @rreport
      @rreport  8 месяцев назад

      안녕하세요! 구글 콜라보에서 원하는 음성 파일을 가지고 오신 다음에 !whisper "파일이름.확장자명" --language ko 를 새로운 코드에 넣어 보시겠어요? (일반적으로는 자동으로 언어를 인식하는데요, 자동 인식을 무시하고 지정한 언어로 transcript를 만들 것 입니다.

    • @kng6185
      @kng6185 8 месяцев назад +1

      @@rreport 답글 너무 감사합니다! 원인은 앞부분에 흘러나오던 팝송때문이었어요 앞부분30초의 언어를 감지하는 것 같더라구요! 편집해서 잘라내고 다시 업로드 하였더니 한글로된 결과물이 생성되었어요 아무튼 위스퍼정보는 정말 신세계네요 감사합니다!

    • @rreport
      @rreport  8 месяцев назад

      유료 어플이 많은데, 높은 성능과 무료라는 점을 생각하면 훌륭한 툴 것 같습니다~!@@kng6185

  • @KL-uu7mb
    @KL-uu7mb 3 месяца назад +1

    저는 생각보다 업로드가 엄청걸리네요. .
    기능은 최고네요. 밑에 안된다는 댓글때문에 걱정했지만,
    다시 정상으로 돌아온건지 잘 됩니다.
    다만, 15분짜리 오디오 업로드하는데도 시간이 좀 오래걸렸어요
    바로 슝슝 될줄알았는데.

    • @rreport
      @rreport  3 месяца назад

      제가 방금 14분짜리 음성 파일로 작업을 해 보았는데 업로드에 30초 정도, 텍스트 파일을 만드는데 3분 정도 걸렸습니다. 오랜만에 작업해 보았는데 역시 잘 돌아가네요!

    • @용용-c7r
      @용용-c7r 3 месяца назад

      Gpu를 사용하기때문에 사양에따라 시간이 오래걸릴수도있어요

  • @leesan1004
    @leesan1004 2 месяца назад +1

    이 프로그램이 이제 유료화 되거나 막혔나요? 음성파일 넣었는데, 텍스트추출이 안되네요 ㅜㅜ

  • @Berunnu-le4dg
    @Berunnu-le4dg Месяц назад

    한글 오디오 인데 텍스트 축출은 영어로 나올경우는 어떻게 해야 할까요?? 바쁘신데 질문드려 죄송합니다.

  • @rreport
    @rreport  2 месяца назад

    ChatGPT 와 Gemini 둘 다 오늘 테스트해 보았는데 아직까지 음성파일을 다이렉트로 Text 로 바꾸어 주지는 않습니다. 각 사가 개발한 어플을 사용하셔야 해요. 혹시 제 코맨트에 정정이 필요하시면 말씀해 주세요. 주기적으로 CapCut 의 기능과도 비교해 보지만, 아직 위스퍼를 따라오지는 못하네요.

  • @천원준-e3f
    @천원준-e3f 8 месяцев назад +2

    구글드라이브 연결할 앱에 이 검색이 안되네요.

    • @rreport
      @rreport  8 месяцев назад

      질문 감사합니다! 혹시.. 'Colaboratory' 로 한번 검색해 보시겠어요?

    • @천원준-e3f
      @천원준-e3f 8 месяцев назад +1

      답글 감사합니다.@@rreport 정상적으로 설치하고 영상에서 설명하신대로 하니 자막파일 생성까지 이상없이 실행했습니다.

  • @호크김
    @호크김 5 месяцев назад +1

    whisper의 한글 생성된 텍스트를 어떻게 내보내고 파일로 저장하나요?

  • @taeyang_korea9964
    @taeyang_korea9964 12 дней назад

    모바일도 가능한가요?

  • @donaldtrump1123
    @donaldtrump1123 5 месяцев назад +1

    구독 좋아요 알림 눌러요. 감사합니다.

    • @rreport
      @rreport  5 месяцев назад

      따뜻한 코맨트 감사드려요~!

  • @user-AGJ-sick-hands
    @user-AGJ-sick-hands 3 месяца назад

    잘 되는데 txt 나 srt말고 xml으로 출력은 안되는 건가요? 파컷 사용하는데 여기서 좀 막히네요..

  • @joshua5267
    @joshua5267 Месяц назад

    음..중국어 음성은 안되는건가요? 자막파일.mp3를 넣어서 런 돌렸는데 무한 로딩뜨네요.

  • @샤이니-y4p
    @샤이니-y4p 5 месяцев назад +1

    저..동영상 아래 설명은 어디에 있는 건 가요?

  • @starbucks1971
    @starbucks1971 6 месяцев назад +1

    항상 느끼는건데 저런거 만드는사람도 대단한거 같음.. ㅋㅋ

    • @rreport
      @rreport  5 месяцев назад

      요즘 웹사이트를 만들면서 IT 스타트업 창업자 분들께 가끔 도움을 받는데요...;; 정말 대단하신 분들이 많더라고요...;;;

  • @63빌딩밑
    @63빌딩밑 7 месяцев назад +1

    혹시 지금은 안되나요? 똑같이 했는데 파일명 적고 실행하면 밑에 타이핑되서 나온 게 아니라 trace back 으로 시작하는 게 나옵니다 ㅠ

    • @rreport
      @rreport  7 месяцев назад

      흠.... 지금 새로운 자막 준비하면서 다시 실험해 봤는데, 잘 됩니다;;; 이상하네요;;;

    • @YONGCINE_LOG
      @YONGCINE_LOG 6 месяцев назад

      지금은 두번째 자막 생성하는 과정에서
      traceback로 시작하면서 좌측에 생성이 안되는 것 같습니다,,

  • @호크김
    @호크김 5 месяцев назад +1

    안녕하세요
    수고 많으시네요.
    잘 따라 했는데 마지막 부분이 막히네요.
    Code에서 ENTER FILE NAMR HERE에서
    파일 확장자명을 어떻게 만들 수 있나요?
    컴퓨터 바탕화면에 있는 동영상은 연결이 안되나요?
    또 URL로 연결된 동영상은 어떻게 하면 되나요?
    알려주시면 고맙겠습니다.

  • @starbucks1971
    @starbucks1971 6 месяцев назад +1

    Ai가 미래다

  • @hansookim6986
    @hansookim6986 6 месяцев назад

    안녕하세요, 혹시 한글음성을 영어자막으로 바꾸는 건 어떻게 하나요?

  • @hopesellerful
    @hopesellerful 6 месяцев назад +1

    리프레쉬 버튼을 눌렀는데 아무런 반응이 없네요. 왜 그럴까요?

    • @rreport
      @rreport  6 месяцев назад

      이상하네요....5월 30일 기준으로 저는 문제 없이 쓰고 있습니다.;;; 혹시 이것저것 신경쓰시는 것이 귀찮으시면 CapCut을 써 보셔도 좋을 것 같습니다. (정확성은 살짝 떨어집니다.)

  • @oreak-1181
    @oreak-1181 6 месяцев назад +1

    베트남은 꽝 입니다. 안됨.. 참고요

    • @rreport
      @rreport  6 месяцев назад

      흠.... 중국 처럼 구글 자체를 막아놓은 건가요;; 커뮤니티에 도움이 되는 코맨트 감사드려요~!