[혼자 공부하는 머신러닝+딥러닝] 7강. 사이킷런으로 선형 회귀 모델 만들어 보기

Поделиться
HTML-код
  • Опубликовано: 24 сен 2024
  • ※ 이 동영상은 『혼자 공부하는 머신러닝+딥러닝』 책 내용을 토대로 제작 되었으며 ‘독학하는 입문자’가 머신러닝과 딥러닝을 개념을 스스로 익힐 수 있도록 구성 하였습니다.
    ▶ 도서 자세히 보기 : hanbit.co.kr/s...
    ※ 주요 학습 내용
    ✓ 선형 회귀 ▶️ 사이킷런으로 선형 회귀 모델 만들어 보기
    ____ k-최근접 이웃의 한계
    ____ 선형 회귀
    ____ 다항 회귀
    ※ 누구를 위한 강의인가요?
    - 인공지능, 머신러닝, 딥러닝 학습의 필요성을 인지하고 파이썬 정도의 기초 프로그래밍 언어를 입문한 독자
    - 머신러닝, 딥러닝에 관심은 있지만 너무 어려운 내용으로 시도가 힘들었던 독자
    - 개념만 어렴풋이 아는 데 그쳐버리거나 여전히 각 의미가 헷갈려 제대로 낮은 단계부터 다시 배우려는 독자
    ※ Q&A:groups.google....

Комментарии • 31

  • @음악과함께-c6r
    @음악과함께-c6r 3 года назад +5

    이번강의에선 다항회귀...대박입니다. 선형이란말에 너무 필이 꽂혀 이차회귀선에 대한 아쉬움이 있었는데, 길이^2=왕길이로 하여 선형으로 해석하는데선 정말 인상적이었습니다.
    역시 수학에서 차수가 인공지능에선 달리 해석돼서, 제가 개념정리에 좀 애 먹습니다. 감사합니다.

  • @배배-k2k
    @배배-k2k 2 года назад +2

    재밌당~!

  • @dlrlaud_0128
    @dlrlaud_0128 2 года назад +2

    책만 볼 때는 잘 몰랐던 부분이, 강의를 들으면서 보니 훨씬 좋은 것 같아요! 감사합니다~

    • @haesun_park
      @haesun_park 2 года назад

      도움이 되신다니 다행이네요. 감사합니다! :)

  • @자성구-e7e
    @자성구-e7e Год назад

    아주 잘 들었습니다!

  • @donginparkjinman
    @donginparkjinman 3 года назад +1

    7강 잘 봤습니다.
    고맙습니다.

  • @이나현-l7j
    @이나현-l7j 2 года назад

    귀에 쏙쏙 들어오네요 감사합니다!!

  • @user-pb2xc6lf2b
    @user-pb2xc6lf2b Год назад

    8/16일 (3일차) 6, 7강 완료했습니다 :) 감사합니다!

  • @이진지뉴
    @이진지뉴 Год назад

    수강완료 감사합니다!
    23.06.22

  • @PsychoInformatics
    @PsychoInformatics 2 года назад

    R2 값이 .5도 높다는 것은 인문학에서 많이 나오는 말이구요 공학에서는 대부분 .8 .9 에가야할것 같습니다

  • @졸업생현성빈
    @졸업생현성빈 3 года назад

    질문1)
    LinearRegression에서 학습시킬때도 그렇고 KNneiborsRegression에서 학습시킬때도 그렇고 fit메서드는 인풋데이터를 받을때 열단위로 받는데, 항상그런가요?
    질문2)
    LinearRegression에서 어떠한 원리로써 다항회귀또한 표현할 수 있는 것인지 잘 모르겠습니다...
    항상 강의 잘 듣고있습니다^^

    • @haesun_park
      @haesun_park 3 года назад

      안녕하세요. 박해선입니다. 사이킷런은 입력 배열의 한 행이 하나의 샘플일 것으로 기대합니다. LinearRegression 클래스는 연립방정식의 해를 구하기 위해 행렬 분해 기법을 사용합니다. 이에 대한 내용은 이 책의 범위를 넘어섭니다. 온라인 자료나 의 4장을 참고하세요. 감사합니다.

    • @졸업생현성빈
      @졸업생현성빈 3 года назад

      @@haesun_park 그러면 이 상태로 핸즈온머신러닝에 가도 적응할 수 있을까요? ㅡㅜ

    • @haesun_park
      @haesun_park 3 года назад

      @@졸업생현성빈 서점에 가셔서 여러 머신러닝 책을 직접 살펴 보시고 선택하시면 좋을 것 같습니다. ^^

  • @김영훈-z1e3z
    @김영훈-z1e3z 2 месяца назад

    안녕하세요 교수님, 질문있습니다.
    - p.46에 2개의 '클래스' 중 하나를 고르는 문제, 즉 이진 분류에서는 파이썬의 클래스랑 다르다고 나와있는데, 이게 무슨 말인지 잘 모르겠습니다. 지금 현재 이 강의의 '지난 시간에...' ppt 화면에서 보면 파란색 사각형이 X의 클래스라고 나와있는데, 이때 이 클래스는 파이썬에서 흔히 말하는 클래스랑 다른건가요?
    제가 알고있는 클래스는 객체와 인스턴스를 초기화하기 위해 만드는 캐릭터라고 알고있는데, 다른 클래스가 있는건가요?

    • @haesun_park
      @haesun_park 2 месяца назад +1

      안녕하세요. 여기서 클래스는 파이썬 클래스가 아니라 분류해야할 종류를 의미합니다. 예를 들어 강아지와 고양이 사진들을 분류하는 문제의 경우 강아지와 고양이가 각각 하나의 클래스가 됩니다. 감사합니다!

  • @pppssuu
    @pppssuu 2 года назад

    안녕하세요? 저는 본 도서로 정말 많은 것을 배운 한사람입니다. 현재 외국인 대상으로 본 교재를 강의하려고 하는데, 혹시 혼공머신 영어 교재는 없나요? 아니면 혼공머신과 가장 흡사한 영어 도서를 추천해주실수 있는지 조심스럽게 여쭈어드립니다.

    • @haesun_park
      @haesun_park 2 года назад

      안녕하세요. 박해선입니다.
      도움이 되셨다니 기쁘네요.
      제가 따로 알고 있는 원서는 없습니다.
      아마존이나 국외 머신러닝 커뮤니티에 문의해 보시면 좋을 것 같습니다.
      감사합니다!

    • @pppssuu
      @pppssuu 2 года назад

      @@haesun_park 네 알겠습니다. 감사합니다.

  • @ddddaaaiii-n6o
    @ddddaaaiii-n6o 9 месяцев назад

    선생님, 29분 정도쯤에 구간별 직선을 그리는 이유를 잘 모르겠어서 질문 남깁니다!.. plt.plot(point, …)에서 어차피 구간 별로 정해진 모델 파라미터에 따른 이차함수를 그리는 것 아닌가요? 그렇다면 그냥 15~50에서 이차함수를 그리는 것과 뭐가 다른 건가요?..

    • @haesun_park
      @haesun_park 9 месяцев назад

      안녕하세요. 맷플롯립에서 2차 곡선을 그리려면 짧은 직선을 이어서 그려야하기 때문입니다. 감사합니다.

  • @codinglife1
    @codinglife1 3 года назад

    선형회귀 다항회기 모두 실행할 때마다 값이 조금씩 다릅니다.
    예측값, 계수와 절편, R제곱점수 모두요...
    그래프 모양이나 전체적인 추세는 문제가 없는데 값이 항상 미세하게 다르게 출력되는데 원래 그런걸까요?
    원래 그렇다면 돼 그런건지도 궁금합니다.

    • @haesun_park
      @haesun_park 3 года назад

      사이킷런의 LinearRegression 클래스는 확률적인 방식을 사용하지 않기 때문에 여러 번 훈련해도 같은 결과를 만듭니다. 즉 137 페이지의 coef_와 intercept_ 값이 동일합니다. 감사합니다.

    • @codinglife1
      @codinglife1 3 года назад +1

      @@haesun_park 찬찬히 처음부터 다시해보니 같은값으로 나오네요~좋은강의, 빠른답변 감사합니다~

  • @jaeyongis8267
    @jaeyongis8267 3 года назад

    안녕하세요! 강의 잘 보고있습니다!!
    선형회귀는 특성이 하나면 직선방정식이 된다고 책에 나와있는데, 만약 특성이 2개 이상이면 어떻게되나요..?
    차원이 증가하나요...?
    다항회귀는 어떤경우에 사용하는건가요,,,?
    주어진 원본 데이터를 산점도로 그려봤을 때, 직선형태가 아닌 경우 사용해야하나요?
    그리고 직선형태가 아닌경우, 비선형이다 라고 할 수 있나요??
    책에서 " 이 함수는 비선형일 수 있지만 여전히 선형회귀로 표현할 수 있다. " 이 말 뜻이 헷갈려요...
    앗 그리고 PolynomialFeatures()라는 함수?가 있는데
    이 함수는 책에서 직접 x를 제곱한 값을 구해서 column_stack()으로 x제곱과 x를 나란히 붙이는 작업을 해주는 것 인가요?
    PolynomialFeatures()의 사용이 궁금합니다...!

    • @haesun_park
      @haesun_park 3 года назад

      안녕하세요. PolynomialFeatures는 기존 특성을 사용하여 새로운 특성을 만듭니다. 모델의 복잡도를 높이기 위해서 사용합니다. 책에서는 설명을 위해 산점도를 그렸지만 보통 특성이 여러개이기 때문에 산점도로 판단하기 어렵습니다. 훈련/검증(또는 테스트) 세트의 성능을 비교하여 판단합니다. 사실 선형 회귀에서 회귀는 x와 y 관계를 의미하는 것이 아니라 w와 y의 관계를 의미합니다. 따라서 특성의 제곱항을 사용하는 것과 무관하게 선형 모델이라고 부릅니다. PolynomialFeatures에 대한 자세한 사용법은 3-3절을 참고하세요. 감사합니다.

    • @jaeyongis8267
      @jaeyongis8267 3 года назад +2

      @@haesun_park 감사합니다!! polynmiafeatures()가 모델의 복잡도를 높이기 위해 사용했다는거 아니까 이해가 좀 더 쉬워졌어요!
      좋은 강의 감사합니다 :-)

  • @hyeyunkim8475
    @hyeyunkim8475 Год назад

    안녕하세요? 직접 코딩을해보니 138쪽의 r2점수가 각각0.9398463339976041와 0.8247503123313559으로 소수점 맨 끝 두자리 숫자가 다른데 다른 결과들도 약간씩 다른 숫자가 나오는 경우가 있어서요 ㅠㅠ 미세한 차이이기는 한데 왜 숫자가 다르게 나올까요? 지금 제 컴퓨터에 anaconda와 패키지들을 직접 깔고 버전을 설정한 다음에 주피터 노트북으로 실습하고 있습니다. 동일한 코드를 구글 코랩에 넣어서 돌리면 책과 동일한 결과가 나오네요. 이런 시스템(?) 적인 부분 또는 패키지 버전의 차이가 결과값에 차이를 불러올수 있는지 궁금합니다 ㅠㅠ
    제 노트북에 깔린 패키지의 버전입니다. anaconda 4.12.0 / Python 3.9.12 / numpy 1.22.0 / matplotlib 3.5.1 / tensorflow 2.13.0 / 사이킷런 1.0.2

    • @haesun_park
      @haesun_park Год назад

      안녕하세요. 소프트웨어 구현이나 버전의 차이로 인해 약간의 차이가 발생할 수 있지만 이는 큰 문제가 아니므로 신경쓰지 않으셔도 됩니다. 감사합니다.

    • @hyeyunkim8475
      @hyeyunkim8475 Год назад

      @@haesun_park 그렇군요! 알겠습니다. 감사합니다!