안녕하세요! 시나공 책으로 열심히 공부하고 있는 9회 시험응시자 입니다! 작업형 제2유형에 파일 제출 관련해서 강조한 부분이 있는거 같은데, 결국은 pred = lg.predict(test) submit = pd.DataFrame({'pred':pred}) submit.to_csv("result.csv", index=False) 이런식으로 코드 작성하고 제출 버튼 누르면 문제가 없는거 맞을까요??
안녕하세요.. 빅데이터분석기사 체험방에 올라온 파일을 이용하여 원핫인코딩 한 결과 컬럼은 72개입니다.. 그런데 test 파일을 동일하게 인코딩하면 71개입니다. 주구매상품 중 한 종류의 상품을 구매한 이력이 없어 차이가 나는듯 한데 이럴떄 어떻게 해야 할까요?? ㅠ.ㅠ
안녕하세요! 시나공 책으로 열심히 공부하고 있는 9회 시험응시자 입니다!
작업형 제2유형에 파일 제출 관련해서 강조한 부분이 있는거 같은데, 결국은
pred = lg.predict(test)
submit = pd.DataFrame({'pred':pred})
submit.to_csv("result.csv", index=False)
이런식으로 코드 작성하고 제출 버튼 누르면 문제가 없는거 맞을까요??
네, 파일 제출에서 실수가 가장 많아요.
분류 문제에서 roc-auc라면 제출 코드가 조금 달라질 수 있어요!
안녕하세요 퇴근후딴짓 선생님의 시나공 책을 보며 독학 중인 학생입니다. 작업형 2에서 스케일링 작업을 수행할 때, 숫자형 컬럼만 스케일링하는 것과 라벨링 된 상태로 전체 컬럼을 스케일링하는 것에 큰 차이가 있는지, 후자로 하면 안되는 지가 궁금합니다!
에러가 나는 것은 아닌데 일반적으로는 스케일링은 숫자형 컬럼만 진행합니다. 데이터에 따라 다르므로 검증 데이터 성능을 기준으로 판단하면 좋을 것 같습니다. 💪 또한 스케일링이 번거롭다면 생략해도 좋아요! 인코딩은 필수, 스케일링은 선택입니다!
@@ai-study 오 그렇군요 답변 감사드립니다!!
안녕하세요.. 빅데이터분석기사 체험방에 올라온 파일을 이용하여 원핫인코딩 한 결과 컬럼은 72개입니다.. 그런데 test 파일을 동일하게 인코딩하면 71개입니다. 주구매상품 중 한 종류의 상품을 구매한 이력이 없어 차이가 나는듯 한데 이럴떄 어떻게 해야 할까요?? ㅠ.ㅠ
예시 문제는 train 카테고리가 test를 포함하고 있어 레이블 인코딩 하면됩니다.