1장 한눈에 보는 머신러닝 (5)

Поделиться
HTML-код
  • Опубликовано: 25 дек 2024

Комментарии • 3

  • @한겨링-z1q
    @한겨링-z1q 2 года назад

    안녕하세요. 선생님 강의와 책을 보다가 궁금한게 있어서 질문드립니다.
    1. 훈련 개발 세트는 훈련 세트에서 훈련하고 훈련 - 개발세트에서 평가한다인데,
    이러면 훈련 세트, 훈련 - 개발 세트, 검증 세트, 테스트 세트 이렇게 데이터를 4개로 나눈다는 건가요?
    질문을 다시 정리하자면 훈련 - 개발 세트는 하이퍼 파라미터를 조정하기 위한 단계고
    검증 세트는 실전 데이터와 비교하여 대표성을 확인하는 단계라고 생각하면 될까요?
    2. 교차검증에 대해서 질문드립니다, 예를 들어 k-fold 교차 검증은 데이터를 5등분해서 1개를 검증 4개를 훈련하자나요.
    최종 테스트 데이터셋은 따로 두는 게 맞나요?
    다시말해서, 교차횟수를 다 끝낸뒤 최종 테스트세트로 모델평가를 하는게맞을까요?
    3. 검증 데이터에서 질문드리고싶습니다. 검증데이터는 모델의 하이퍼 파라미터를 조정하는걸로 알고 있는데
    그 하이퍼 파라미터를 조정하는 방법이 그리드서치 등과 같은 방법이다라고 이해하고있는데 맞을까요?
    혼자 공부하는데 선생님 강의가 있어서 얼마나 다행인지 모릅니다! 질문과 별개로 강의 너무 감사드립니다.

    • @haesun_park
      @haesun_park  2 года назад

      안녕하세요. 훈련-개발 세트는 데이터 불일치 문제를 위해 사용합니다. 63~64 페이지를 참고하세요. 교차 검증 후에 테스트 세트로 최종 평가하는 것이 좋습니다. 그리드 서치는 하이퍼파라미터 튜닝 방법 중 하나입니다. 감사합니다!

    • @한겨링-z1q
      @한겨링-z1q 2 года назад +1

      @@haesun_park 좀더 명확하게 이해되는데 도움되었습니다. 감사합니당