과적합까지는 잘 모르겠으나 그래프?를 통해 더 학습이 가능한지, 무의미하게 epoch만 올라가는지 학습의 적절한 종료시점을 확인할 수 있습니다. 과적합이라고 표현되는 현상은 제 경험상 너무 완벽하게 원본 음원과 일치하기때문에 모델의 느낌이 지나치게 안나는 경우인데 이건 이 AI작업이 어디까지나 '합성' 이기 때문입니다. 질문자님의 사례는 모델의 학습이 잘 안된 경우에 가깝습니다. 학습에 사용된 MR제거 음원을 들어보세요 거기서 음질적으로 발음이 뭉개지거나 하는 저품질 음원이 있을가능성이 높습니다. 고음의 경우도 화음이 섞여있다던지 깨끗하지 못한 파투가 섞여있을 가능성이 있고요. 과적합까지 의심을 할 정도면 최소 2000epoch 이상은 되어야합니다.
라이브도 스튜디오 라이브인지 콘서트홀 라이브인지에 따라 다른데 사람이 듣기 좋아도 라이브 특성상 노이즈가 껴있기때문에 일반 녹음음원보다 정교하게 학습되기가 어렵습니다. 그래도 epoch를 늘려서 학습을 쭈욱 돌리면 학습소스 자료 만큼은 나와줍니다. 워낙 변수가 다양하기때문에 정답을 드리기는 어렵습니다만 추가적인 학습을 해보시는것이 가장 좋은 해법일것 같아요
영상 설명란 더보기에 사건의 지평선 나와있는거 말씀하시는 건가요? 이거는 유튜브에서 저작권 검사할때 원곡인 사건의 지평선이 인식되서 자동으로 올라간거에요. 더보기는 유튜브 라이센스에 등록된 음악만 올라가는걸로 알고있습니다. 개인이 마음대로 올릴수는 없어요. 굳이 하자면 롱폼 올리고 쇼츠로 리믹스하면 리믹스한 쇼츠가 달리기는 할거에요 ㅎㅎ
이홍기 에프티아일랜드 시절 느낌 확난다
시청 감사합니다 ㅎㅎ
에프티아일랜드 앨범 기반으로 제작한 모델이에요!
Ai cover할때 epoch가 너무 높으면 과적합나서 새로운 모델에 학습이 어렵다고 들었는데요 그럼 cover후에 발음이 이상해지고 고음부분에서 소리가 별로 안똑같은것도 과적합나서 그런건가요?
과적합까지는 잘 모르겠으나 그래프?를 통해 더 학습이 가능한지, 무의미하게 epoch만 올라가는지 학습의 적절한 종료시점을 확인할 수 있습니다.
과적합이라고 표현되는 현상은 제 경험상 너무 완벽하게 원본 음원과 일치하기때문에 모델의 느낌이 지나치게 안나는 경우인데 이건 이 AI작업이 어디까지나 '합성' 이기 때문입니다.
질문자님의 사례는 모델의 학습이 잘 안된 경우에 가깝습니다. 학습에 사용된 MR제거 음원을 들어보세요 거기서 음질적으로 발음이 뭉개지거나 하는 저품질 음원이 있을가능성이 높습니다.
고음의 경우도 화음이 섞여있다던지 깨끗하지 못한 파투가 섞여있을 가능성이 있고요.
과적합까지 의심을 할 정도면 최소 2000epoch 이상은 되어야합니다.
@@gafeelmusic 음원이 라이브 버전이고 음질도 괜찮은데 혹시 ai가 라이브버전의 발음을 제대로 인지 못해서 그런거일수도 있나요?
라이브도 스튜디오 라이브인지 콘서트홀 라이브인지에 따라 다른데 사람이 듣기 좋아도 라이브 특성상 노이즈가 껴있기때문에 일반 녹음음원보다 정교하게 학습되기가 어렵습니다.
그래도 epoch를 늘려서 학습을 쭈욱 돌리면 학습소스 자료 만큼은 나와줍니다. 워낙 변수가 다양하기때문에 정답을 드리기는 어렵습니다만 추가적인 학습을 해보시는것이 가장 좋은 해법일것 같아요
@@gafeelmusic 감사합니다
혹시 더보기란에 음악 추가는 어떻게 하나요..? ai 커버곡 만든거 올리고 싶은데 어떻게 하는지 모르겠네요ㅠㅠ
영상 설명란 더보기에 사건의 지평선 나와있는거 말씀하시는 건가요?
이거는 유튜브에서 저작권 검사할때 원곡인 사건의 지평선이 인식되서 자동으로 올라간거에요.
더보기는 유튜브 라이센스에 등록된 음악만 올라가는걸로 알고있습니다.
개인이 마음대로 올릴수는 없어요. 굳이 하자면 롱폼 올리고 쇼츠로 리믹스하면 리믹스한 쇼츠가 달리기는 할거에요 ㅎㅎ