rstat101 week5 - 상관계수 계산과정 시각화

슬기로운통계생활 Statistics Playbook

Просмотров 1,9 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 25 ноя 2024

Комментарии • 25

@fghjiopazxf 3 года назад ⁺²
쉽게 잘 설명해 주셔서 감사합니다.
잘 보고 있습니다.
@statisticsplaybook 3 года назад
들어주셔서 감사합니다!
@cutyarwinia 4 года назад ⁺²
수식을 보다 이해하기 좋게 만들어준 강의입니다. 감사합니다.
@박교사-h3m 2 года назад ⁺²
중심에서부터 멀리 떨어진 데이터일수록 상관계수에 더 많은 영향을 줄 수 있도록 수식이 설계되었다는 점을 알게되었네요. 통계의 값을 대표하는 수치가 어떻게 만들어졌는지 알게되니 해당 통계 개념에 대하여 더 잘 알게되는 것 같습니다. 매번 잘 봅니다. 감사합니다.
@statisticsplaybook 2 года назад ⁺¹
수식을 이해하시는 습관과 안목을 기르치면 점점 재미있으실 거예요~! :) 시청 감사합니다~!
@ddol_bing Год назад ⁺¹
상관계수 계산 식과 원리에 대해 알수 있게되어 너무 알찬 강의였습니다. 단계별로 plot을 보면서 이해하니 너무 재밋네요.
통린이로써 한가지 질문은, coefficient 값이 -1부터 1의 범주로 이루어지는데
이 말인 즉슨, sum(z_x * z_y)의 값의 범위가 반드시 -(n-1)과 (n-1) 사이가 되는 것인가요?
수식대로 했을 때 최대 최소가 -1, 1이 되는것이 너무 신기한 것 같습니다.
@statisticsplaybook Год назад ⁺¹
이 버벅거리는 저의 강의를 들어주셔서 너무 감사할 따름입니다.ㅎㅎ :) 맞아요! 왜 최대 n-1로 맞춰지는지 이 강의로 돌아가서 보시면 느낌 올 것이라 생각합니다! 표본상관계수 1인 경우, sum(z_x * z_y)의 값이 딱 n-1이 나오는 케이스
ruclips.net/video/pv24Hoh2BIQ/видео.html
@KBH0822 Год назад ⁺¹
1일 1슬통 week5마무리입니다!
중간고사 점수와 기말고사 점수가 양의 상관성이 있다는 것은
중간고사 점수가 높다면 기말고사 점수가 높을 확률이 크고
기말고사 점수가 높다면 중간고사 점수가 높았을 확률이 크다는 것을 알 수 있는 건가요?
다이어트 시작이라 배고픈 허기를 슬통님 영상으로 채우고 있습니다.
잘 먹고 갑니다.⋐( ⃝● 🐽● )⋑
@trthffil 4 года назад
감사합니다. 강의 잘들었습니다.^^
@박교사-h3m 2 года назад ⁺¹
추가로 plot의 color argument as.factor을 사용하신 이유가 무엇일까요? as.factor을 빼고 했더니
only 0's may be mixed with negative subscripts
라는 오류 메세지가 떠서 없으면 안되는건 알겠는데, 그 이유를 잘 모르겠네요. R린이라서 아직 서투릅니다 ㅎㅎ
@statisticsplaybook 2 года назад ⁺¹
factor로 변환 해줘야 컬러 정보와 매칭을 할 수 있다고 이해하시고 넘어가시면 될 것같습니다! :)
@박교사-h3m 2 года назад ⁺¹
@@statisticsplaybook factor의 level 변수를 활용한거일까요?
@statisticsplaybook 2 года назад ⁺¹
@@박교사-h3m 넵! factor의 레벨 "값"을 활용한 것입니다! 변수라는 용어보다 값이 표현이 더 정확합니다!
@박교사-h3m 2 года назад
@@statisticsplaybook 감사합니다~
@aaabbb-cd9by 3 года назад
좋은 영상 감사합니다. 도움이 많이 되고 있네요 ^^. 결측치가 있는 데이터의 상관계수를 구할 때 손으로 풀어보고 엑셀 및 R로도 풀어보는데, 엑셀과 R의 상관계수값은 동일합니다. 이때 R의 cor()에서 use="pairwise.complete.obs" 입니다. 엑셀은 특별히 지정을 하지 않아도 pairwise deletion을 쓰는 것 같네요.
여기서 한 가지 질문이 있는데 결측치가 있는 data를 pairwise deletion으로 산출하는 공식이 있을까요? 기존의 공식으로는 계산값이 맞질 않고, 결측치가 1개 있는 쌍, 그리고 둘 다 결측치라서 쌍 자체가 존재하지 않는 경우 등에 따라 n의 값 및 n-1의 값이 달라져서 말이죠. 어떤 원칙은 있는 것 같은데 검색해도 쉽게 찾아지질 않네요.
@statisticsplaybook 3 года назад
제가 정확하게 질문을 이해하지 못하고 있는것 같기도 하지만, 답드려봅니다. 말씀하신 결측치가 1개, 둘다 결측치인 경우 모두 다 지우고 계산을 한 것이 pairwise.complete.obs의 뜻입니다. 따라서 완벽한 observation 만을 사용해서 계산, n의 경우도 완벽한 표본의 갯수가 되겠죠? 그 정보들을 사용해서 상관계수 식에 넣으시면 될 것 같습니다. 확인 후 다시 답글 주세요~! :)
@RaphaelSJ 4 года назад ⁺¹
순서대로 보면서 따라하고 있습니다. as.factor(sign 부분이 잘 이해되지 않습니다. ㅜㅜ 초보라 나름 검색했는데 설명이 잘 이해가 가지 않는군요. 도움 부탁드립니다! 고맙습니다.
@statisticsplaybook 4 года назад ⁺¹
감사합니다. 쭉 잘 따라오고 계시네요.ㅎㅎ 부호를 따와서 빨강색과 파란색으로 표시하고 싶은 것인데요, c("blue", "red")을 매칭 시킬때 각기 다른 레벨로 매칭시키고 싶어서 factor로 바꿔준 내용입니다. :)
@싸우지맙세효 4 года назад ⁺¹
혹시 코드를 따로 모아두신 깃허브 있으신지 여쭤볼 수 있을까요?
@statisticsplaybook 4 года назад
github.com/issactoast/kindstat/tree/master/R%20code
@statisticsplaybook 4 года назад
있으나 관리가 잘 안되어 있습니다ㅜㅎㅎ
@곽재석-w7m 3 года назад ⁺¹
10:30 특정 코드 구간을 ( )로 묶는 단축키가 무엇인가요?
@statisticsplaybook 3 года назад ⁺¹
그냥 블록 지정 후 ( 입력하시면 됩니다!

Следующие

Автовоспроизведение

rstat101 week6 직선을 결정하는 두가지 요소 - 기울기와 절편