이건 파일하나만 가능한가요? 아니면 하루에 한개의 파일만? 저장해놓은 경로에 들어가서 다음날 하려고 하면 "/bin/bash: line 1: whisper: command not found" 뜨거든요. 매번 설치과정부터 거치니 번거러워요. 그래도 덕분에 하루에 하나의 파일이라도 건질수 있는게 얼마나 다행인지 감사드려욧
이런 툴이 있다는 게 정말 소름돋았어요...! 그동안 자막 작업은 너무 고되고 힘들었는데! 큰 도움이 되었습니다:) 그리고, 그래도 한글 음성 인식은 늘 네이버가 최고이겠지... 하고 믿었는데, 글로벌 기업은 역시나네요. 단순한 자막 작업뿐 아니라, 이러한 툴 활용성이 더 무궁무진해질 거라는 생각이 듭니다!
솔직히 말씀드리면 특히 한국어는 유료이던 무료이던 완벽하지 않은 것 같습니다. CapCut 내에서도 음성 언어를 인식해서 transcript를 달아주는 기능이 있는데 Whisper 보다 정확성이 떨어지더라고요. 편리성을 추구하신다면 영상 마지막에 소개된 Aiko 모바일 앱을 사용해 보시는 것도 좋을 것 같아요. 속 시원한 대안이 나오기까지는 몇 년 더 걸리지 않을까 싶습니다.😅
어제 저녁에 몆개 파일만 텍스트 변환해보고 거의 완벽하게 잔 되서 넘 좋다했는데 아침에 추가로 변환하려고 했더니 GPU 백엔드에 연결할 수 없음으로 현재 Colab의 사용량 제한으로 인해 GPU에 연결할 수 없습니다 뜨면서 최종적으로 변환이 안되요 ㅠ 이거 시간제한이나 용량제한이 있나요? 그렇다면 사용할 의미가 없어지는데요 몇분 안되는 파일 세개 정도 잘 되길래 야호 하고 있었는데.. 이거 해결할 방법 없나요? 변환해야할 자료들이 꽤 많이 남아 있어서 꼭 필요하거든요 답변 꼭 부탁드릴께요
안녕하세요! 구글 콜라보에서 원하는 음성 파일을 가지고 오신 다음에 !whisper "파일이름.확장자명" --language ko 를 새로운 코드에 넣어 보시겠어요? (일반적으로는 자동으로 언어를 인식하는데요, 자동 인식을 무시하고 지정한 언어로 transcript를 만들 것 입니다.
ChatGPT 와 Gemini 둘 다 오늘 테스트해 보았는데 아직까지 음성파일을 다이렉트로 Text 로 바꾸어 주지는 않습니다. 각 사가 개발한 어플을 사용하셔야 해요. 혹시 제 코맨트에 정정이 필요하시면 말씀해 주세요. 주기적으로 CapCut 의 기능과도 비교해 보지만, 아직 위스퍼를 따라오지는 못하네요.
안녕하세요 수고 많으시네요. 잘 따라 했는데 마지막 부분이 막히네요. Code에서 ENTER FILE NAMR HERE에서 파일 확장자명을 어떻게 만들 수 있나요? 컴퓨터 바탕화면에 있는 동영상은 연결이 안되나요? 또 URL로 연결된 동영상은 어떻게 하면 되나요? 알려주시면 고맙겠습니다.
너무 감사합니다.
너무 좋아요! 알려주셔서 진짜 너무 감사합니다!! 시간을 엄청 세이브 했어요~ 코딩으로 해서 하는거 너무 신기하구요:) 채널 처음 알게되었는데 구독 좋아요 누르고 가요^^
정말 감사합니다 시간이 지나도 잘 작동하네요^^ 잘 사용하겠습니다.
좋은 정보 너무너무 감사합니다. 쓰다보니 궁굼한게 하나있는데 혹시 srt 를 만들때
통으로 시간이 만들어지던데
이걸 단어별 시간을 뽑는 방법도 있을까요?
알려주신대로 한글음성을 넣으면 문장단위로 되길래 혹시 방법이 있을까 여쭤봅니다 ㅎㅎ
아마 거기 꺼지는 안되는 것으로…쿨럭…;;;;
이건 파일하나만 가능한가요? 아니면 하루에 한개의 파일만? 저장해놓은 경로에 들어가서 다음날 하려고 하면 "/bin/bash: line 1: whisper: command not found" 뜨거든요. 매번 설치과정부터 거치니 번거러워요. 그래도 덕분에 하루에 하나의 파일이라도 건질수 있는게 얼마나 다행인지 감사드려욧
먼가 이상한데요. 하루에 몇 번이고 가능하고 할때마다 매번 재설치 안하셔도 됩니다…;; 콜라보에서 나오시면 다시 설치해야 합니다만…;;
이런 툴이 있다는 게 정말 소름돋았어요...! 그동안 자막 작업은 너무 고되고 힘들었는데! 큰 도움이 되었습니다:)
그리고, 그래도 한글 음성 인식은 늘 네이버가 최고이겠지... 하고 믿었는데, 글로벌 기업은 역시나네요.
단순한 자막 작업뿐 아니라, 이러한 툴 활용성이 더 무궁무진해질 거라는 생각이 듭니다!
최근 유튜브 자동 자막 생성은 더 대박 입니다. 제가 발음이 안좋은데 그걸 다 잡아내서 제대로 자막을 만들어 내더라고요...;; 후덜덜...
@@rreport 사용해봤는데 말한 시간을 표기해주는 타임스탬프는 오차가 점점 커지더라구요, 한글>영문 번역도 Whisper가 지원하는지 궁금하네요
대박이네요!!! 캡컷 자동캡션 유료되고 일일히 손으로 다시하려다가, 지금 따라했는데요. 대박입니다. 좋아요 누르고 잘 배워갑니다~
유용하셨다니 다행입니다, 코멘트 감사드려요~ R-report.com 도 많은 관심 부탁 드립니다🙏
감사합니다! 혹시 번역 속도가 답답해서 그러는데 유료모델중에 한국어 인식 성능이 가장좋은 변환 프로그램 추천해주실수 있으실까요?
솔직히 말씀드리면 특히 한국어는 유료이던 무료이던 완벽하지 않은 것 같습니다. CapCut 내에서도 음성 언어를 인식해서 transcript를 달아주는 기능이 있는데 Whisper 보다 정확성이 떨어지더라고요. 편리성을 추구하신다면 영상 마지막에 소개된 Aiko 모바일 앱을 사용해 보시는 것도 좋을 것 같아요. 속 시원한 대안이 나오기까지는 몇 년 더 걸리지 않을까 싶습니다.😅
안녕하세요? 다른 영상들에는 개인정보때문에 쓰기가 꺼려졌는데 여기는 그럴 우려가 없어서 좋습니다.그런데 위스퍼 모델을 Large모델을 쓰려면 어떻게 해야할까요?
죄송합니다. 제 짧은 지식으로는 답변을 드릴 수 없네요 😓
@@rreport 아닙니다. 이 영상으로도 충분히 도움이 되었습니다. 답변 감사합니다.
정말 좋은 세상입니다. 감사해요. 근데 처리속도 문제는 어쩔수 없는건가요?
따뜻한 코맨트 감사드려요. 다른 분들의 코맨트를 들어보니 GPU 사양과 와이파이 속도에 따라 위스퍼의 반응 속도가 많이 달라지더라고요~!
AIKO는 혹시 얼느정도 길이가 되는지 아시나요 ?
For short recordings 라고 메세지가 뜨네요
코드를 어떻게 하는건지 잘 모르겠습니다
동영상 공유에서 복사를 누르면 되는건지요
영상이 길면 안되는것인지도 궁금합니다
어제 저녁에 몆개 파일만 텍스트 변환해보고 거의 완벽하게 잔 되서 넘 좋다했는데 아침에 추가로 변환하려고 했더니 GPU 백엔드에 연결할 수 없음으로 현재 Colab의 사용량 제한으로 인해 GPU에 연결할 수 없습니다 뜨면서 최종적으로 변환이 안되요 ㅠ
이거 시간제한이나 용량제한이 있나요? 그렇다면 사용할 의미가 없어지는데요 몇분 안되는 파일 세개 정도 잘 되길래 야호 하고 있었는데.. 이거 해결할 방법 없나요? 변환해야할 자료들이 꽤 많이 남아 있어서 꼭 필요하거든요 답변 꼭 부탁드릴께요
제한이 있습니다. 따라서 구글 계정을 여러개 만들어서 번갈아가면서 쓰시면 됩니다 (아니면 구글 Colab을 유료 결제 하셔도 될 껄요~)
영상 정말 감사합니다 그럼 다음에 작업할때는 위스퍼 코드를 치지 말고 바로 !whisper "ENTER FILE NAME HERE" --model medium 이 코드 치고 시작하면 되는건가요?
따뜻한 코맨트 감사드려요~! 구글 콜라보 환경에서 나가시거나 커넥션이 끊어지면 처음 부터 프로세스 다시 시작하셔야 하고요. 같은 환경(구글 콜라보 + Connected)에 머무신 경우에는 파일만 다시 올려 놓고 위의 코드에 이름만 바꾸시면 됩니다.
@@rreport 아하 그렇군요 감사합니다 👍👍👍👍
안녕하세요! 혹시 결과가 영어로 나올때는 어디를 수정하면 될까요?분명 한글음성파일인데요 .. ㅜ
안녕하세요! 구글 콜라보에서 원하는 음성 파일을 가지고 오신 다음에 !whisper "파일이름.확장자명" --language ko 를 새로운 코드에 넣어 보시겠어요? (일반적으로는 자동으로 언어를 인식하는데요, 자동 인식을 무시하고 지정한 언어로 transcript를 만들 것 입니다.
@@rreport 답글 너무 감사합니다! 원인은 앞부분에 흘러나오던 팝송때문이었어요 앞부분30초의 언어를 감지하는 것 같더라구요! 편집해서 잘라내고 다시 업로드 하였더니 한글로된 결과물이 생성되었어요 아무튼 위스퍼정보는 정말 신세계네요 감사합니다!
유료 어플이 많은데, 높은 성능과 무료라는 점을 생각하면 훌륭한 툴 것 같습니다~!@@kng6185
저는 생각보다 업로드가 엄청걸리네요. .
기능은 최고네요. 밑에 안된다는 댓글때문에 걱정했지만,
다시 정상으로 돌아온건지 잘 됩니다.
다만, 15분짜리 오디오 업로드하는데도 시간이 좀 오래걸렸어요
바로 슝슝 될줄알았는데.
제가 방금 14분짜리 음성 파일로 작업을 해 보았는데 업로드에 30초 정도, 텍스트 파일을 만드는데 3분 정도 걸렸습니다. 오랜만에 작업해 보았는데 역시 잘 돌아가네요!
Gpu를 사용하기때문에 사양에따라 시간이 오래걸릴수도있어요
이 프로그램이 이제 유료화 되거나 막혔나요? 음성파일 넣었는데, 텍스트추출이 안되네요 ㅜㅜ
한글 오디오 인데 텍스트 축출은 영어로 나올경우는 어떻게 해야 할까요?? 바쁘신데 질문드려 죄송합니다.
ChatGPT 와 Gemini 둘 다 오늘 테스트해 보았는데 아직까지 음성파일을 다이렉트로 Text 로 바꾸어 주지는 않습니다. 각 사가 개발한 어플을 사용하셔야 해요. 혹시 제 코맨트에 정정이 필요하시면 말씀해 주세요. 주기적으로 CapCut 의 기능과도 비교해 보지만, 아직 위스퍼를 따라오지는 못하네요.
구글드라이브 연결할 앱에 이 검색이 안되네요.
질문 감사합니다! 혹시.. 'Colaboratory' 로 한번 검색해 보시겠어요?
답글 감사합니다.@@rreport 정상적으로 설치하고 영상에서 설명하신대로 하니 자막파일 생성까지 이상없이 실행했습니다.
whisper의 한글 생성된 텍스트를 어떻게 내보내고 파일로 저장하나요?
모바일도 가능한가요?
구독 좋아요 알림 눌러요. 감사합니다.
따뜻한 코맨트 감사드려요~!
잘 되는데 txt 나 srt말고 xml으로 출력은 안되는 건가요? 파컷 사용하는데 여기서 좀 막히네요..
음..중국어 음성은 안되는건가요? 자막파일.mp3를 넣어서 런 돌렸는데 무한 로딩뜨네요.
저..동영상 아래 설명은 어디에 있는 건 가요?
항상 느끼는건데 저런거 만드는사람도 대단한거 같음.. ㅋㅋ
요즘 웹사이트를 만들면서 IT 스타트업 창업자 분들께 가끔 도움을 받는데요...;; 정말 대단하신 분들이 많더라고요...;;;
혹시 지금은 안되나요? 똑같이 했는데 파일명 적고 실행하면 밑에 타이핑되서 나온 게 아니라 trace back 으로 시작하는 게 나옵니다 ㅠ
흠.... 지금 새로운 자막 준비하면서 다시 실험해 봤는데, 잘 됩니다;;; 이상하네요;;;
지금은 두번째 자막 생성하는 과정에서
traceback로 시작하면서 좌측에 생성이 안되는 것 같습니다,,
안녕하세요
수고 많으시네요.
잘 따라 했는데 마지막 부분이 막히네요.
Code에서 ENTER FILE NAMR HERE에서
파일 확장자명을 어떻게 만들 수 있나요?
컴퓨터 바탕화면에 있는 동영상은 연결이 안되나요?
또 URL로 연결된 동영상은 어떻게 하면 되나요?
알려주시면 고맙겠습니다.
Ai가 미래다
안녕하세요, 혹시 한글음성을 영어자막으로 바꾸는 건 어떻게 하나요?
리프레쉬 버튼을 눌렀는데 아무런 반응이 없네요. 왜 그럴까요?
이상하네요....5월 30일 기준으로 저는 문제 없이 쓰고 있습니다.;;; 혹시 이것저것 신경쓰시는 것이 귀찮으시면 CapCut을 써 보셔도 좋을 것 같습니다. (정확성은 살짝 떨어집니다.)
베트남은 꽝 입니다. 안됨.. 참고요
흠.... 중국 처럼 구글 자체를 막아놓은 건가요;; 커뮤니티에 도움이 되는 코맨트 감사드려요~!