rstat101 week5 - 상관계수 계산과정 시각화

Поделиться
HTML-код
  • Опубликовано: 25 ноя 2024

Комментарии • 25

  • @fghjiopazxf
    @fghjiopazxf 3 года назад +2

    쉽게 잘 설명해 주셔서 감사합니다.
    잘 보고 있습니다.

  • @cutyarwinia
    @cutyarwinia 4 года назад +2

    수식을 보다 이해하기 좋게 만들어준 강의입니다. 감사합니다.

  • @박교사-h3m
    @박교사-h3m 2 года назад +2

    중심에서부터 멀리 떨어진 데이터일수록 상관계수에 더 많은 영향을 줄 수 있도록 수식이 설계되었다는 점을 알게되었네요. 통계의 값을 대표하는 수치가 어떻게 만들어졌는지 알게되니 해당 통계 개념에 대하여 더 잘 알게되는 것 같습니다. 매번 잘 봅니다. 감사합니다.

    • @statisticsplaybook
      @statisticsplaybook  2 года назад +1

      수식을 이해하시는 습관과 안목을 기르치면 점점 재미있으실 거예요~! :) 시청 감사합니다~!

  • @ddol_bing
    @ddol_bing Год назад +1

    상관계수 계산 식과 원리에 대해 알수 있게되어 너무 알찬 강의였습니다. 단계별로 plot을 보면서 이해하니 너무 재밋네요.
    통린이로써 한가지 질문은, coefficient 값이 -1부터 1의 범주로 이루어지는데
    이 말인 즉슨, sum(z_x * z_y)의 값의 범위가 반드시 -(n-1)과 (n-1) 사이가 되는 것인가요?
    수식대로 했을 때 최대 최소가 -1, 1이 되는것이 너무 신기한 것 같습니다.

    • @statisticsplaybook
      @statisticsplaybook  Год назад +1

      이 버벅거리는 저의 강의를 들어주셔서 너무 감사할 따름입니다.ㅎㅎ :) 맞아요! 왜 최대 n-1로 맞춰지는지 이 강의로 돌아가서 보시면 느낌 올 것이라 생각합니다! 표본상관계수 1인 경우, sum(z_x * z_y)의 값이 딱 n-1이 나오는 케이스
      ruclips.net/video/pv24Hoh2BIQ/видео.html

  • @KBH0822
    @KBH0822 Год назад +1

    1일 1슬통 week5마무리입니다!
    중간고사 점수와 기말고사 점수가 양의 상관성이 있다는 것은
    중간고사 점수가 높다면 기말고사 점수가 높을 확률이 크고
    기말고사 점수가 높다면 중간고사 점수가 높았을 확률이 크다는 것을 알 수 있는 건가요?
    다이어트 시작이라 배고픈 허기를 슬통님 영상으로 채우고 있습니다.
    잘 먹고 갑니다.⋐( ⃝● 🐽● )⋑

  • @trthffil
    @trthffil 4 года назад

    감사합니다. 강의 잘들었습니다.^^

  • @박교사-h3m
    @박교사-h3m 2 года назад +1

    추가로 plot의 color argument as.factor을 사용하신 이유가 무엇일까요? as.factor을 빼고 했더니
    only 0's may be mixed with negative subscripts
    라는 오류 메세지가 떠서 없으면 안되는건 알겠는데, 그 이유를 잘 모르겠네요. R린이라서 아직 서투릅니다 ㅎㅎ

    • @statisticsplaybook
      @statisticsplaybook  2 года назад +1

      factor로 변환 해줘야 컬러 정보와 매칭을 할 수 있다고 이해하시고 넘어가시면 될 것같습니다! :)

    • @박교사-h3m
      @박교사-h3m 2 года назад +1

      @@statisticsplaybook factor의 level 변수를 활용한거일까요?

    • @statisticsplaybook
      @statisticsplaybook  2 года назад +1

      @@박교사-h3m 넵! factor의 레벨 "값"을 활용한 것입니다! 변수라는 용어보다 값이 표현이 더 정확합니다!

    • @박교사-h3m
      @박교사-h3m 2 года назад

      @@statisticsplaybook 감사합니다~

  • @aaabbb-cd9by
    @aaabbb-cd9by 3 года назад

    좋은 영상 감사합니다. 도움이 많이 되고 있네요 ^^. 결측치가 있는 데이터의 상관계수를 구할 때 손으로 풀어보고 엑셀 및 R로도 풀어보는데, 엑셀과 R의 상관계수값은 동일합니다. 이때 R의 cor()에서 use="pairwise.complete.obs" 입니다. 엑셀은 특별히 지정을 하지 않아도 pairwise deletion을 쓰는 것 같네요.
    여기서 한 가지 질문이 있는데 결측치가 있는 data를 pairwise deletion으로 산출하는 공식이 있을까요? 기존의 공식으로는 계산값이 맞질 않고, 결측치가 1개 있는 쌍, 그리고 둘 다 결측치라서 쌍 자체가 존재하지 않는 경우 등에 따라 n의 값 및 n-1의 값이 달라져서 말이죠. 어떤 원칙은 있는 것 같은데 검색해도 쉽게 찾아지질 않네요.

    • @statisticsplaybook
      @statisticsplaybook  3 года назад

      제가 정확하게 질문을 이해하지 못하고 있는것 같기도 하지만, 답드려봅니다. 말씀하신 결측치가 1개, 둘다 결측치인 경우 모두 다 지우고 계산을 한 것이 pairwise.complete.obs의 뜻입니다. 따라서 완벽한 observation 만을 사용해서 계산, n의 경우도 완벽한 표본의 갯수가 되겠죠? 그 정보들을 사용해서 상관계수 식에 넣으시면 될 것 같습니다. 확인 후 다시 답글 주세요~! :)

  • @RaphaelSJ
    @RaphaelSJ 4 года назад +1

    순서대로 보면서 따라하고 있습니다. as.factor(sign 부분이 잘 이해되지 않습니다. ㅜㅜ 초보라 나름 검색했는데 설명이 잘 이해가 가지 않는군요. 도움 부탁드립니다! 고맙습니다.

    • @statisticsplaybook
      @statisticsplaybook  4 года назад +1

      감사합니다. 쭉 잘 따라오고 계시네요.ㅎㅎ 부호를 따와서 빨강색과 파란색으로 표시하고 싶은 것인데요, c("blue", "red")을 매칭 시킬때 각기 다른 레벨로 매칭시키고 싶어서 factor로 바꿔준 내용입니다. :)

  • @싸우지맙세효
    @싸우지맙세효 4 года назад +1

    혹시 코드를 따로 모아두신 깃허브 있으신지 여쭤볼 수 있을까요?

  • @곽재석-w7m
    @곽재석-w7m 3 года назад +1

    10:30 특정 코드 구간을 ( )로 묶는 단축키가 무엇인가요?