내 목소리로 노래하는 AI 만들기
HTML-код
- Опубликовано: 4 окт 2024
- (쇼미더머니 20 지원영상)
이 사람 강의 codingapple.com
구독자용 10% 할인 쿠폰 FPT10 (맨날바뀜 최신영상 참고)
Diff-SVC 가이드북 docs.google.co...
학습용 Colab colab.research...
결과출력용 Colab colab.research...
디스코드 / discord
주의사항 잘 읽어봅시다 유명인 학습은 하지마쇼
선생님 목소리 AI로 스왑한척하고 노래 열창하신거 다압니다
3:53 선생님 쿠키가 상한 거 같아요..
ㅋㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋ
방사능피폭쿠키
ㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 하 이거만들면서 육성으로 웃었을 코딩애플님 상상하니깐 너무웃김 내가만든쿠키에서 개터졌네
Yeah~~
앜ㅋㅋㅋㅋㅋㅋㅋ진짜 웃겨죽는줄ㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
이야~
ㄹㅇㅋㅋㅋㅋ 쿠키에서 현웃터짐 ㅋㅋㅋㅋ
진짜 잔잔하게 미친 사람 같아 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
너무 적절한 표현 ㅋㅋㅋㅋㅋㅋㅋㅋ
코딩애플형 이거 만들면서 입꼬리 쓰윽 올라갈 생각하니까 군침이싹도네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
아나 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 이 힘없고 쿨한 목소리로 노래부르는거 너무 웃기고 커엽 ㅋㅋㅋㅋㅋㅋㅋㅋ
이거 Ai가 만든게아니고 그냥 코딩애플님이 마이크에대고 녹음한거임. 노래 잘들었습니다
아 ㅋㅋ 속을뻔 했다고
솔직히 뉴진스에서 티났음 ㄹㅇㅋㅋ
ㄹㅇㅋㅋ
AI가 내 목소리 따라하게 만드는데 몇시간을 갈아넣어야 한다고? 내가 지금 여기서 바로 부르면 되는데 왜 기다려야 함 ㅋㅋ
@@teabarley 우리의 목은 AI가 아니기 때문에 그라거든요..
3:53 ㅋㅋㅋ 이거로 웃기려고 4분 동안 빌드업한 느낌ㅋㅋㅋㅋ
3:56 십ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 가만히 영상보다가 진짜 개빵터졌네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
파형을 이미지로 그림처럼 학습시킬 생각을 한게 참 대단하네 ㅋㅋ
이제 그럼 chatGPT로 대사 만들고 TTS로 한번 뽑아서 내목소리 diff-svc하면 대본만 가지고 asmr 완성 개꿀
novel ai로 썸네일까지..
@@성이름-p1z9c 이제 인간이 필요가없엉 ㅋㅋㅋ
인간시대의 끝이 도래했다..
AI가 만든 인물 사진에 AI로 딥페이크를 씌워서 자연스럽게 움직이는 영상을 만들고 거기에 AI가 내 목소리로 AI가 만든 대본을 읽으면
@@무슨반응 이미 몇주전에 작엊 해둔게 있긴해요ㅎㅎ
확실히 2019~2020년 초반 기술(음성 합성 기술 : 트위치나 방송 관련 후원하면 나오는 목소리 합성 기술)은 자료도 적었을 뿐더러 해외자료여서 찾기도 힘들었죠. 거기에 학습을 시키려면 기본 사양의(그래픽카드 3000대) 컴퓨터로 최소 2주 이상 걸렸구요(2주 학습해도 남자 목소리가 여자 목소리 비슷하게 들릴 뿐이지만..). 당시에 시연을 보여야되서 부리나케 준비해서 1주 반 학습한 모델 보여줬는데 남자 목소리가 여자 목소리로 바뀌려는 차이? 정도만 났거든요. 물론 각설하고 한편으로는 보다 확실한 보안 처리도 필요할 것으로 보입니다. 학습용 데이터가 30분 분량으로 오늘 영상처럼 나온다면 앞으로 제로샷 형태의 모델이 나올 수 있고, 음성으로 보안처리를 하는 기업들의 경우, 패러다임을 바꿔야 될 것으로 보이거든요.
여튼 오늘 영상도 감사합니다 :)
신기하면서도 보이스피싱 이런 곳에 악용될 거 생각하면 너무 무섭다 ㅜㅜ
3:56 감명깊게 봤습니다
역시 무얼하던 학습이 중요하군요
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
아 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
진짜 코딩애플님이 직접 부른 것 처럼 만들어주네요.
노래를 잘하게 꾸며주지 않고 평소 말투나 습관을 그대로 만들어주는군요
ㅋㅋㄲ
다신 노래하지마쇼
쇼미 예선까지 많은 응원 부탁드립니다
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
@@codingapple
위화감 없는 수준으로 학습하려면 3시간 이상 분량의 보컬 + 배치 사이즈 40 이상 + 20만 스텝 이상 학습시켜야 해서 A100으로 24시간 정도 학습하면 괜찮다네요
👍정보👍
그럼 젠장 그렇게만 하면 커버곡이 뚝딱 이라고요?
@@envel_ope ㄷㄷ
기술 발전 진짜 미쳤네 ㄷㄷ
진짜 미쳐가네 ㅋㅋㅋㅋㅋㅋㅋㅋ
조만간 성우라는 직업들의 영구성이 보존될 수 있다고 생각하니 좋은 기술이네요
성우들도 특정 게임, 애니 더빙이 오래되면 컨디션과 스타일 문제로 목소리가 바뀌기도 하는데. 그 일관성을 보존하는데 굉장히 좋을것같습니다
다시한번 전성기 수준의 제라툴 선생님을 만나 뵐 수 있겠군요(물론 돌아가신거 아님)
기술이 더 발전된다면 성우가 직접 나오지 않아도 목소리 소스만 가지고 텍스트를 읽게 해서 녹화작업을 할 수도 있겠군요. 성우는 직접 뛰지 않고 그냥 자신의 목소리 소스를 팔아 소득을 얻는 산업 구조로 변할 수도 있겠네요
가수들도 비슷하게 창법이 바뀌어서 아쉬워하는 사람이 많은데 래전드가수들이 등장했으면 하네요
실제로 몇몇 유명 게임의 음성합성모델은 누가 학습시키고 배포하는건지 허깅페이스에서 대놓고 배포가 되고 있더라구요.
좀 더 시간이 지나면(길어도 5년안에) 성우조차도 필요없게 그냥 존재하지 않는 사람의 목소리를 만들어낼 수 있을겁니다
코딩 채널이라 그런지 다들 긍정적이시네요.! 다른 데선 성우랑 가수 뭐먹고 살라는 거냐로 개판 싸움 나있던데 ㅋㅋㅋㅋ
진짜 코진스 나올때 배잡고 뒤집었다 ㅋㅋㅋ
이형 존나웃기넼ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 현기증나니까 강의 더만들어줘요 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
노래가이드같은거 자기목소리로 들을 수 있으니 가수들 입장에서도 엄청 좋겠네요..
1:48 nextjs 강의 암시 ㄷㄷ
ㄹㅇ?!
코딩애플 구독 목록 대충 예상 가면 개추 ㅋㅋㅋ
일단 씹덕인 나부터 ㅋㅋㅋ
일단 나부터ㅋㅋㅋㅋㅋ
계추
개추다에요
개추 ㅋㅋㅋ
계추 ㅋㅋ
3:56 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
맥아리가 없어ㅋㅋㅋㅋㅋㅋ
코딩애플에서 주르르를 볼줄은 상상도 못했네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
ㄹㅇㅋㅋ
이 형은 가끔 확 들어오는게 ㅈㄴ웃김ㅋㅋㅋㅋ
3:56 '히야아아..' ㅋㅋㅋㅋㅋ
진짜 ㅈㄴ웃기네 ㅋㅋㅋㅋ 본인도 영상 만들면서 빵터졌을듯
내가만든 쿠키 듣다가 사무실에서 혼자 뿜었어요ㅠㅜㅠㅠㅠ...
02:16 형 진심이었구나
ai그림 보고 배우기도 하듯이 이걸로 연기나 특별한 더빙 톤같은것에 입혀서 내 목소리로 냈을때 어떤 느낌이 나야하는지 배울수도 있겠네요
3:56 야➡아아아앙.....↘ 내가 만든 쿠키~~
살다보니 이 형 신음소리도 듣는날이 오네
3:53 진짜 개웃기넼ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
코딩래퍼 우승을 기원합니다
3-4년전 딥러닝 관련 개발진행 할 때 당시 사장님이 하자고 했는데, 소규모라 코로나로 각자 도생으로 흩어져서 시도를 못 했는데, 비슷한 생각을 실현한 사람이 이미 있었네요. 지금은 다른 분야를 주로하는데 이렇게 다시 보니 감회가 새로우면서 묘한 기분이 드네요.
코딩에플 버튜버간다 ㄷㄷㄷㄷ
어 0:13 누군지는 모르겠지만 노래를 모시깽이하게 잘부르네요 킹아
형의 목소리를 영구보존하자! 영생 왁컬로이드 ㄷㄷ
아 어쩐지 요즘 왁컬로이드 다 고퀄이더니 이거였구먼
이거였네ㅋㅋㅋㅋㅋㅋ
ㄹㅇ ㅋㅋ
ㄹㅇ
여기까지 왓노;
분명 유용하게 쓰일 수도 있겠지만, 범죄 관련에도 소름끼치게 쓰일 수도 있겠단 생각이 드니까 좀 무서워지네요......
이상한 Ditto 소리가 있다고 해서 왔읍니다.
이거 하면 현타옵니다. 내 원래 목소리 듣는 것도 이상한데 학습시켜서 들어보니 자괴감 듦.
나도 이것저것 딥러닝 학습시키고 모델도 직접 만들어보곤 했는데 절대 본인 데이터 넣는 것 아님.
현타오네.
이런건 잘하면 일인 다역도 가능해진다는 거네요. 와우!
내가 만든 쿠키에서 스피커 꺼버림 ㅎㅎㅎㅎㅎ
3:57 진짜 듣자마자 힘이 쪽빠짐 ㅋㅋㅋㅋㅋ
4:13 코딩래퍼 ㅅㅂㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
[3:58] 빵 터졌어요. 웃음 주셔서 감사합니다
이 기술이 보이스 피싱 범죄자들에게 악용될까 심히 우려스럽습니다.
졸업 연구로 AI 음성 커버를 하고 싶다고 생각하고 있는데 감사합니다 ㅠㅠ!!!!
혹시 어떻게 되셨는지 여쭤봐도 될까요???
@@박지우-r1z 잘 안되는 부분이 많아서 저는 다른 AI음성을 만들고 있습니다😗
3:56 듣고 배쨋습니다 ㅋㅋㅋㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
회사에서 성우분 목소리로 노래부른거 librosa로 분석해서 뭐 교육해서 악보랑 가사 넣으면 노래불러주는 거 만들었는데
다른 부서에서 만든거라 저도 너무 해보고 싶더라고요.....
3:56 순간 그분목소리가 생각나서 깜짝놀랐네요..
DFT,FFT가 있는 그 시점에서 음성이나 영상으로 모델확장이 가능한건 뭐 예상 가능한 일이었으니..
가짜 녹음 파일 같은걸로 악용 될 수도 있겠네요 ㄷㄷ
언제나 모든 건 음양, 양날을 갖고 있음.
그런 일을 방지하고자 인공지능이 합성한 음성인지, 실제 사람의 음성인지를 판가름할 수 있는 프로그램이 생기긴 했습니다. 그래도 완벽히 막을 방법은 없고, 그런 프로그램을 사용하지 않는 이상 일반인이 들었을 때에는 실제 음성으로 오해받을 수도 있죠.
보이스피싱에 악용 되겠네
이거 잡는 소프트 웨어 만들어야 겠네
아이돌이나 가수 지원에서 음성 파일 제출하고 그걸로 노래 불러보게 한 다음 괜찮으면 면접 보는 식으로 활용해도 괜찮을듯 하네요
성장 가능성이나 이 목소리로 노래를 불렀을 때 어울리는 지, 원하는 목소리인지
아니면 노래는 이미 만들어 놓고 목소리만 바꿀 수 있으니까 가장 잘 어울리는 목소리를 가진 사람 뽑는 정도?
데모곡 만들어놓고 그거에 입혀서 발매해버리는 회사도 있지 않을까요? 목소리 뺏길 것 같은데
0:18 그니까 코딩애플이 차은우닮았다는거지?
구독하고 영상 몇 개만 봐도 충분히 알 수 있는 기정사실임 ㅇㅇ
ai로 해도 못부르시네요 구현력이 아주 좋습니다!
AI는 그만 발전했으면 좋겠다.. 이건 과거의 사진기 하나 발명된 거랑은 차원이 다른 문제같다.. 진짜 무섭다
르르땅이 누군진 모르겠지만 AI로 나온줄도 몰랐다 킹아
?
킹아에서 검거
암튼 모시깽하네요
@@jokaarch7473 르르땅에서 검거….ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
엄코딩보고 최근영상 보려고 했는 르르땅 나와서 개당황함 ㅋㅋㅋㅋㅋㅋ
와우...유명인 목소리 따다가 한 적 없는 발언 한 것처럼 날조하기 쌉가능이겠는데;;;
감사합니다 덕분에 보이스피싱에 활용하여 건물주가 될 수 있었어요!
이제 sns 동영상에서 추출한 불특정다수의 음성으로 보이스피싱 하기 쉬운 세상이 오겠네요,,,,,,
진짜 진지하게 지코까지는 어떻게 버텨봤는데....뉴진스에서 무너져버렸습니닼ㅋㅋㅋㅋ큐ㅠㅠㅠㅠㅠ너무웃겨ㅋㅋㅋㅋ큐ㅠㅠㅠㅠ 죄송합니다 센세ㅠㅠㅠㅠㅠ
응용하면 TTS로 대사를 녹음하고 내 목소리로 스왑하면 집에서 영상 만드는 사람들은 특별히 마이크도 방음도 신경 안쓰고 영상 제작이 가능하겠네요. 요즘 진짜 Ai들이 넘쳐나서 무섭네요. 저도 몇 일만에 파이썬에 ㅍ도 모르는데 chatGPT로 간단한 프로그램 만들어 냈을 정도이니.....잼있기도하고 겁나네요.
챗지피티는 딱 간단하게만 만들수있음.. 코드에 오류가 너무많음
알고보니 애플센세가 직접 노래부른거 아니야?
와ㅋㅋㅋ 애매하게 같은게 아니라 진짜 부르는것처럼 똑같네.....
영상 진짜 존나재믹네 이사람 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 코딩래퍼 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
이제 성우라는 직업은 목소리를 다양하게 내는 것만을 중점으로 하는 목소리 렌트와 연기력만을 중요시하는 연기성우 두가지로 나뉠지도 모르겠네요
성우분들이 하면 어덯게 될지랑
초기가 이정도인데 나중가면 대체 가능성도 있겠네요..ㄷㄷ
가수 목소리가 굉장히 중요한걸 깨달았어요
Ai가 영상 대본도 쓰고 목소리도 낸다면... 편집, 업로드해주는 ai가 나오면 ㄷㄷ
버튜버나 노래유튜브나 이상한 부분들도 몇몇 있는거 같고
진짜 문제는 남의 목소리로 얼마든지 녹음본 조작하거나 해서
대중 여론 선동 당할 수 있으니 조심해야겠네요.
잘구분하면 목소리에 이질감이 느껴지긴합니다.
목소리 좋은사람들은 저 목소리 모델 만들어서 tts로 팔면 돈 많이될듯하네요. 물론아직 상용화단계는아닌거같지만 기술수준 조금만 더 발전하면 엄청날듯
당장 따라해보겠습니다..... 애플로이드님감사합니다
미치겟다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ공개처형 아닙니까? ㅋㅋㅋㅋㅋㅋ
개는 터미네이터를 냄새로 구분할 수 있다고 합니다.
내가 하지도 않은 강도행각이 녹화된 CCTV 영상의 진위 여부 판별하려면 현장에 개 데려가야 하는 세상이 곧 오겠네요.
코딩애플?님 노래 몇 번씩 돌려보는 중인데, 너무 중독적이에요......
아 회사에서 개발하면서 라디오 처럼 옆에 띄워놓고 보다가 노래부르는 것 보고 터졌네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
어그로성으로 편집하면 이 채널… 떡상하기 너무 좋을것같아
아...배꼽 빠지는 줄 알았습니다. 약간 건성건성으로 부르는 노래가 너무 웃깁니다. ㅋㅋㅋ
쿠키 도입부 개웃기네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ
음색만 딱 입혀주는거 신기하긴하네 ㅋㅋ AI 이젠좀 무서울지도
구독자 반응보고 나중에 음반내려고 AI 썼다고 뻥치고 코딩애플형이 진짜 부른 거 아녀 ?
보자마자 mcmh이 떠올랐습니다. 제가 한번...
중간에 보다가 혹시 이 영상전체가 작업한 결과물이면 소름이겠다 싶었는데,, 그렇진 않았군요 다행인가 ??
봉풀주는 진짜 팬치 아니면 접하기조차 힘든 채널일텐데..? 형도 팬치였어..?
ㅋㅋㅋㅋㅋㅋㅋㅋ쿠키좌 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
1:54 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
3:56 ?? : 예아~
3:32 1초 더콰
평생 가래를 끼고 살아야해서 말하다가 목소리가 변하기도 하는데 이런게 있음 유용할 것 같네요!
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 오토튠 부분에서 닭가슴살 먹다가 뿜어서 모니터 대참사낫네 ㅁㅊ ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
3:58 독이 든 쿠키~ ㅋㅋㅋ
httpOnly cookie ㅋㅋㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋ 못 부르는 건 아닌데...뭐라 해야 하나...
내가 좋아하는 사람의 목소리를 가져와서 나를위한 노래 생성사업하면 재밌겠네
앞으로 몰카가 아니라 몰래녹음범죄 생기겠다 ㅋㅋ
0:39 지은이 누나가 왜 여기서 나와?
예아 내가 만든 쿠키~ ㅋㅋ 4:01
봉풀주는 전설이다..
와ㅋㅋㅋㅋㅋㅋㅋㅋ선생님 목소리 좋다고 생각했는데 컨텐츠 완전 재밌네요
그래서 쌤이 ai한테 학습시키려고 부른 노래는 채널에 언제 올라오죠?
TTS + ai swap 기술 이용하면 목소리를 낼 필요가 없겠네요