@@비비빅-j3o 님, 기훈님, 강의 잘 봐주셨는데 감사하면서도 구독방식은 제공하지 못해 죄송하게 되었네요 구매 방식에서 갑작스레 구독과 구매 병행으로 변경되었고, 이에 동의하지 않아(여러가지 문제가 있었어요) 구독 부분은 해지가 이루어졌습니다. 계속 논의된 부분이라 갑작스런 구독 종료는 아니랍니다. 확인해보니 구독 종료는 최소 2주전 부터는 된 것으로 담당자에게 확인했어요! 하지만 유튜브를 통한 강의 및 더 많은 학습자료 www.kaggle.com/datasets/agileteam/bigdatacertificationkr 를 계속 자료를 무료로 공유하고 있어요 :)
@@ai-study 갑자스런 구독 종료가 아니라 계속해서 논의된 부분이라 하셨는데, 저에게는 갑작스러웠습니다. 제가 논의에 참여하거나 미리 공지를 받거나 한게 아니니까요. 클래스 101은 팝업으로 공지를 했는데 제대로 전달이 된것같지가 않다고 합니다. 소비자 입장에서는 갑자기 듣던 강의가 없어져서 황당했습니다. 딴짓님이 말씀하시는걸 보니 크리에이터 문제가 아닌 클래스101의 문제인것 같습니다. 기존 구독자의 입장은 전혀 고려하지 않고 그냥 듣던 내강의에서 없애버렸습니다. 계속 공지를 하던지 계속 알림을 주던지, 아님 구독 전에 미리 종료기간을 고지해야 상식일텐데 말이죠...시험2주 앞두고 아예 다른 사람 강의를 새로 들을까 했는데 그냥 듣던거 들으면서 마무리 해야 할것 같아서 그냥 20만원 또 내고 들어야 될것 같습니다. 구독료는 구독료 대로 내고 구매비용도 또 내야 겠습니다. 합격할 수 있다면 그깟 몇십만원 사실 아깝진 않은데 뭔가 클래스 101의 상술에 기분이 매우 상하네요. 딴짓님 강의 감사하고 유튜브 무료 강의 및 자료도 유익하고 감사합니다. 고생하세요!
안녕하세요. 좋은 강의 감사드립니다. cross_val_score 교차검증은 처음이라.. cross_val_score 교차 검증을 하게 되면 train, test 데이터 나눌 필요 없이 검증할 수 있다는 말인가요? 즉, (데이터 나누지 않음) 모델하나 선정 -> cross_val_score 교차점검으로 손튜닝 하이퍼파라미터 찾기 -> 모델 예측 순으로해도 검증이 충분히 된다는 말로 이해해도 되는지 궁금합니당
네 맞아요 !! 다만 cross_val_score(rf, train, target, scoring='f1_macro', cv=5)에서 어떤 평가 방법인지 scoring를 명확하게 작성해줘야 해요 !!! 그 부분은 scikit-learn.org/stable/modules/model_evaluation.html 를 참고해주세요
빅분기 시험 2일 남았는데 단비같은 영상이네요. 궁금한게 하나 있습니다. 문제에서 데이터를 x_train, x_test, y_train 으로 제공한 경우 train_test_split은 반드시 해야하나요? 어떤 경우에 train_test_split을 해야하는지 잘 모르겠습니다. 그리고 모델적용할때 predict와 predict_proba를 적용하는 기준이 분류나 회귀냐의 문제인가요 아니면 결과값이 정수냐 확률이냐 차이인가요?
1. 반드시 할 필요는 없어요! 다만 검증데이터를 통해 만든 모델의 성능을 확인할 수 있어요 2. 분류 모델에서 예측한 결과는 확률값으로 나옵니다. 그런데 predict의 경우 확률이 높은 쪽으로 카테고리가 선택되고 predict_proba는 확률값 그대로 나와요 3. 회귀는 predict를 활용하면 됩니다.
@@ai-study 분류로 풀었는데 다행히 20점 부분점수 획득해서 합격했습니다!! 올려주신 강의와 캐글 문제 풀으면서 정말 도움 많이 받아서 감사 인사 드리고 싶어 찾아왔습니다. 좋은 소식 전해드려서 너무 기쁘네요. 빅분기 준비하는 친구나 지인에게 꼭 추천하겠습니다 감사합니다....!!!!
감사합니다. 새해 복많이 받으세요!
댓글 감사합니다 새해 복 많이 받으세요 😀
너무나 감사합니다 무료로 이런 강의영상을 볼 수 있다니 대단히 감사드립니다!
응원할게요🎉
영상 감사합니다. 적절하게 라벨링 및 스케일링 하고 모델 다 돌려봐도 48 ~ 53 나와서, 정말 1시간 정도..파라메터 다 만져보고 변수별 개별 튜닝 까지 해봤는데 56점 나와서 내가 뭘 잘못했나 했는데..점수 자체가 낮게 나오는 데이터 였군요..
네 비교군이 없다보니 충분히 오해할만한 점수에요🤔
안녕하세요 클래스101에서 퇴근후딴짓님의 빅분기 실기 강의 감사히 잘 듣고 있었는데요! 갑자기 강의가 사라졌던데 이제 제휴가 끊긴건가요?ㅠㅠ
클래스 101에 문의하니까 크리에이터가 구독서비스를 계약 해지했다고 하네요. 아마 빅분기 실시 시험 다가오니까 돈 더 벌려고 구독말고 강의 구매로 방식을 바꾸신것 같습니다. 자본주의 사회에서 이익 추구하는게 당연하지만 하는 방식이 별로 보기는 안좋네요.
@@비비빅-j3o 님, 기훈님, 강의 잘 봐주셨는데 감사하면서도 구독방식은 제공하지 못해 죄송하게 되었네요
구매 방식에서 갑작스레 구독과 구매 병행으로 변경되었고, 이에 동의하지 않아(여러가지 문제가 있었어요) 구독 부분은 해지가 이루어졌습니다. 계속 논의된 부분이라 갑작스런 구독 종료는 아니랍니다. 확인해보니 구독 종료는 최소 2주전 부터는 된 것으로 담당자에게 확인했어요!
하지만 유튜브를 통한 강의 및 더 많은 학습자료 www.kaggle.com/datasets/agileteam/bigdatacertificationkr 를 계속 자료를 무료로 공유하고 있어요 :)
@@ai-study 갑자스런 구독 종료가 아니라 계속해서 논의된 부분이라 하셨는데, 저에게는 갑작스러웠습니다. 제가 논의에 참여하거나 미리 공지를 받거나 한게 아니니까요. 클래스 101은 팝업으로 공지를 했는데 제대로 전달이 된것같지가 않다고 합니다. 소비자 입장에서는 갑자기 듣던 강의가 없어져서 황당했습니다. 딴짓님이 말씀하시는걸 보니 크리에이터 문제가 아닌 클래스101의 문제인것 같습니다. 기존 구독자의 입장은 전혀 고려하지 않고 그냥 듣던 내강의에서 없애버렸습니다. 계속 공지를 하던지 계속 알림을 주던지, 아님 구독 전에 미리 종료기간을 고지해야 상식일텐데 말이죠...시험2주 앞두고 아예 다른 사람 강의를 새로 들을까 했는데 그냥 듣던거 들으면서 마무리 해야 할것 같아서 그냥 20만원 또 내고 들어야 될것 같습니다. 구독료는 구독료 대로 내고 구매비용도 또 내야 겠습니다. 합격할 수 있다면 그깟 몇십만원 사실 아깝진 않은데 뭔가 클래스 101의 상술에 기분이 매우 상하네요. 딴짓님 강의 감사하고 유튜브 무료 강의 및 자료도 유익하고 감사합니다. 고생하세요!
@@비비빅-j3o 나그네님, 캐글에 제가 올린 자료만으로도 합격 충분합니다!! :) 하나씩 시작해보시죠!!
정말 감사합니다!! 근데 다만 저는 submit 눌렀는데도 왜 제출이 안될까요...ㅠㅠ submission으로 만들었는데도 안되네요....
안녕하세요. 좋은 강의 감사드립니다. cross_val_score 교차검증은 처음이라.. cross_val_score 교차 검증을 하게 되면 train, test 데이터 나눌 필요 없이 검증할 수 있다는 말인가요? 즉, (데이터 나누지 않음) 모델하나 선정 -> cross_val_score 교차점검으로 손튜닝 하이퍼파라미터 찾기 -> 모델 예측 순으로해도 검증이 충분히 된다는 말로 이해해도 되는지 궁금합니당
네 맞아요 !! 다만 cross_val_score(rf, train, target, scoring='f1_macro', cv=5)에서 어떤 평가 방법인지 scoring를 명확하게 작성해줘야 해요 !!! 그 부분은 scikit-learn.org/stable/modules/model_evaluation.html 를 참고해주세요
참고 자료까지 정말 감사합니다!!!!! 복받으실거예요!!!!!!
@@밍취향 응원합니다!!
빅분기 시험 2일 남았는데 단비같은 영상이네요. 궁금한게 하나 있습니다. 문제에서 데이터를 x_train, x_test, y_train 으로 제공한 경우 train_test_split은 반드시 해야하나요? 어떤 경우에 train_test_split을 해야하는지 잘 모르겠습니다.
그리고 모델적용할때 predict와 predict_proba를 적용하는 기준이 분류나 회귀냐의 문제인가요 아니면 결과값이 정수냐 확률이냐 차이인가요?
1. 반드시 할 필요는 없어요! 다만 검증데이터를 통해 만든 모델의 성능을 확인할 수 있어요
2. 분류 모델에서 예측한 결과는 확률값으로 나옵니다. 그런데 predict의 경우 확률이 높은 쪽으로 카테고리가 선택되고 predict_proba는 확률값 그대로 나와요
3. 회귀는 predict를 활용하면 됩니다.
선생님, 좋은 강의 감사드립니다 :)
이 문제는 기존에 하던 대로 train_test_split으로 검증 데이터를 분리할 수는 없는 문제인가요?
train_test_split으로 검증 데이터를 분리하려고 하니 SyntaxError가 떠서 진행이 안 돼요ㅠ
train_test_split은 이전 강의에서 다루고 있어서 생략했습니다 :) 충분히 가능합니다.
지금 쓰시는 게 파이썬인가요 어디서 설치할수있죵
선생님! 작업형2에서 분류나 회귀문제가 나오는데 어느것을 보고 분류인지 회귀인지 알수있나요?
그리고 라벨인코딩과 원핫인코딩은 언제 해야되나요?
항상 감사합니다!
타켓(레이블) 값을 보고 확인해주세요~
예를들면
분류: 대학생이냐? 직장인이냐? (카테고리, 이산 값)
회귀: 판매량 (숫자, 연속적인 값)
인코딩은 문자 데이터가 있을 때 사용하면 됩니다.
@@ai-study 감사합니다
넵 응원합니다 :)
안녕하세요, 오늘 빅분기 5회 실기 보고왔는데, 작업형 2 랜덤포레스트분류로 문제 잘 풀었다고 생각했는데 다들 회귀로 푸는거라고 하시더라구요..ㅠ
라벨인코더로 object형 잘 처리하고 결과도 잘 나온거 같은데 이거 가망 없으려나요...
네 회귀 문제였습니다. 결과는 예측하기 어렵네요
@@ai-study 분류로 풀었는데 다행히 20점 부분점수 획득해서 합격했습니다!! 올려주신 강의와 캐글 문제 풀으면서 정말 도움 많이 받아서 감사 인사 드리고 싶어 찾아왔습니다. 좋은 소식 전해드려서 너무 기쁘네요. 빅분기 준비하는 친구나 지인에게 꼭 추천하겠습니다 감사합니다....!!!!
와 너무 축하드립니다!!!! 고생하셨어요!!! 궁금한 점이 혹시 분류가 어떤 모델이었을까요?
@@ai-study 랜덤포레스트분류 하나만 준비해갔었습니다
네!!! 정말 다행입니다!! 줄거운 연말되세요!
y_test가 없는데 오분류표 중 성능지표(예를들면, roc_auc_score 등...)를 만들수 없지 않나요?
roc_auc_score(y_test, y_pred)-분류지표
mean_squared_error(y_test, y_pred)-회귀지표
등등에 함수 인수로 y_test가 어디서 구해질 수 있나요?
y_test는 주어지지 않는 데이터 입니다.
학습하는 차원에서 요구사항대로 csv파일이 만들어졌는지 성능은 어느정도인지 궁금하다면 영상내 설명처럼 submit을 해보세요
제대로 만들어지지 않았다면 에러가
제출이 정상적으로 되었다면 성능을 확인할 수 있어요!
@@ai-study 아...감사합니다.
넵 응원합니다 👍