안녕하세요. 선생님 강의와 책을 보다가 궁금한게 있어서 질문드립니다. 1. 훈련 개발 세트는 훈련 세트에서 훈련하고 훈련 - 개발세트에서 평가한다인데, 이러면 훈련 세트, 훈련 - 개발 세트, 검증 세트, 테스트 세트 이렇게 데이터를 4개로 나눈다는 건가요? 질문을 다시 정리하자면 훈련 - 개발 세트는 하이퍼 파라미터를 조정하기 위한 단계고 검증 세트는 실전 데이터와 비교하여 대표성을 확인하는 단계라고 생각하면 될까요? 2. 교차검증에 대해서 질문드립니다, 예를 들어 k-fold 교차 검증은 데이터를 5등분해서 1개를 검증 4개를 훈련하자나요. 최종 테스트 데이터셋은 따로 두는 게 맞나요? 다시말해서, 교차횟수를 다 끝낸뒤 최종 테스트세트로 모델평가를 하는게맞을까요? 3. 검증 데이터에서 질문드리고싶습니다. 검증데이터는 모델의 하이퍼 파라미터를 조정하는걸로 알고 있는데 그 하이퍼 파라미터를 조정하는 방법이 그리드서치 등과 같은 방법이다라고 이해하고있는데 맞을까요? 혼자 공부하는데 선생님 강의가 있어서 얼마나 다행인지 모릅니다! 질문과 별개로 강의 너무 감사드립니다.
안녕하세요. 선생님 강의와 책을 보다가 궁금한게 있어서 질문드립니다.
1. 훈련 개발 세트는 훈련 세트에서 훈련하고 훈련 - 개발세트에서 평가한다인데,
이러면 훈련 세트, 훈련 - 개발 세트, 검증 세트, 테스트 세트 이렇게 데이터를 4개로 나눈다는 건가요?
질문을 다시 정리하자면 훈련 - 개발 세트는 하이퍼 파라미터를 조정하기 위한 단계고
검증 세트는 실전 데이터와 비교하여 대표성을 확인하는 단계라고 생각하면 될까요?
2. 교차검증에 대해서 질문드립니다, 예를 들어 k-fold 교차 검증은 데이터를 5등분해서 1개를 검증 4개를 훈련하자나요.
최종 테스트 데이터셋은 따로 두는 게 맞나요?
다시말해서, 교차횟수를 다 끝낸뒤 최종 테스트세트로 모델평가를 하는게맞을까요?
3. 검증 데이터에서 질문드리고싶습니다. 검증데이터는 모델의 하이퍼 파라미터를 조정하는걸로 알고 있는데
그 하이퍼 파라미터를 조정하는 방법이 그리드서치 등과 같은 방법이다라고 이해하고있는데 맞을까요?
혼자 공부하는데 선생님 강의가 있어서 얼마나 다행인지 모릅니다! 질문과 별개로 강의 너무 감사드립니다.
안녕하세요. 훈련-개발 세트는 데이터 불일치 문제를 위해 사용합니다. 63~64 페이지를 참고하세요. 교차 검증 후에 테스트 세트로 최종 평가하는 것이 좋습니다. 그리드 서치는 하이퍼파라미터 튜닝 방법 중 하나입니다. 감사합니다!
@@haesun_park 좀더 명확하게 이해되는데 도움되었습니다. 감사합니당