-1에서 1사이의 값이 나오는 것은 직관적으로 영상 14:08 에서 설명하였죠. 수학적으로 증명하는 것은 Cauchy-Schwarz 부등식을 이용하는 방법이 있는데 이해하기 어렵다면 그나마 쉬운 방법이 0≤Var(X/σx±Y/σy)=2±2Corr(X,Y) (여기서 σx, σy는 X, Y의 표준편차)을 이용하는 것이죠.😉
답변이 늦어 죄송합니다. 거의 모든 통계책에 그렇게 적혀있습니다. 그렇다고 종속변수와 독립변수간에 상관계수를 구하면 안된다는 뜻은 아닙니다. 상관계수는 일단 변수 간에 관계정도를 보는 것입니다. 그런데 그 두 변수 간에 관계식을 구하고 싶다면(회귀분석) 그 두 변수간에는 영향관계가 성립되어야 한다는 것이죠. 예를 들어 영어점수와 수학점수 간에 상관관계가 존재한다고해도 수학점수를 영어점수(의 함수)로 예측하려는 시도는 좀 어색하죠.
1. 상관계수는 변수 간의 관계를 보는 것인데, 집단 간의 상관계수를 보려는 것인가요? 집단 간에는 특정 상관계수를 비교하겠죠. 그 의도를 파악하기 어렵지만 상관계수에서 독립집단을 언급할 때는 두 집단간에 상관계수의 일치성 검정입니다. 예를 들어 남자집단에서 급여(B)와 이직율(A)의 상관계수(r_AB)와 여자집단에서 상관계수(r_AB)가 일치하는 가를 검정하는 것이죠. 그건 Fisher의 변환을 이용해 z 검정이 가능합니다. 독립이 아니라고 언급되는 경우는 한 집단에서 구한 다른 상관계수들을 서로 비교할 때죠. 한집단에서 이직율(A)과 급여(B)의 상관계수와 이직율과 근무시간(C)의 상관계수를 비교하는 것이죠. r_AB와 r_AC를 비교하는데 r_BC가 존재하기 때문에 앞에서의 검정통계량처럼 간단하지는 않지만 구할 수는 있습니다. 구글링하면 공식을 찾으실 수 있을거에요. 또 한가지 예상되는 것은 같은 표본을 대상으로 2019년에 얻은 상관계수와 2020년에 얻은 상관계수를 비교하는 것이죠. 즉 같은 집단이고 같은 변수간 상관계수인데 측정시기가 달라지는 것. 이것도 가능은 합니다... 2. 연관성을 병합한다... 이것도 그 의도가 모호한데... 상관계수의 linear combination인지 변수의 선형결합인지... 예를 들어 변수가 X1,X2,X3,X4 가 있을 때 (X1,X2)와 (X3,X4)의 관계를 보고자 한다면 Y1=주성분(X1, X2), Y2=주성분(X3, X4)로 변환하여 Y1과 Y2의 상관계수를 구하면 되구요. 만약 상관계수의 어떤 조합을 가지고 검정을 하려면 그것도 가능하지만 그건 수리통계학 시험볼 때나 필요한 줄 알았어요. 예를 들어 r_12+r_34가 0.5가 넘는가를 검정한다면 가능합니다. 그것이 실용적인 의미가 어떤지는 차치하고요. 어쨌든 이런 복잡한 질문은 아니셨기를 ㅎ
정말 도움이 됩니다. 깔끔한 ppt 자료, 공을 많이 들이셨고, 지식도 풍부하시고 설명도 쉬워서 감사드립니다.^^
찾았다.. 통계의 신! 자막까지 완벽합니다..!
세상에.. 통계를 이렇게 잘 설명하는 선생님은 처음 입니다. 바로 구독 좋아요 갑니다
너무 멋진 강의입니다.
수학을 놓은지 16년이 지났지만 이해가 바로 됐습니다 감사합니다
통계내용이 정말 어렵고 재미가없어서 진입장벽이 있는 과목인데
입문자들 눈에 맞는 예를 잘들어줘서 재미있게 들을수있었습니다
본인이 많이 아는것과 잘 가르키는건 별개인데
설명까지 아주 잘해주시네요~
예제와 같이 컨셉을 완벽 설명해주니 듣는 사람 입장에서 이해가 너무 쉽게 잘 되었습니다. 좋은 영상 정말 감사드립니다!
지금 사조사 공부하는데 통계 모르는거 있으면 항상 여기영상 봐요ㅠㅠ감사합니다😊
설명 너무 깔끔하고 이해하기쉽습니다.감사합니다
너무나 정확하고 직관적인 설명입니다. 박수 치고 갑니다.
파이썬으로 통계 개발에 하는데 큰 도움이 됩니다. 감사합니다
진짜 설명이 깔끔해요
정말로 쉽게 설명하시네요.. 고맙습니다
비전공자인데 쉽게 이해가 갑니다 도움주셔서 감사합미다
큰 도움이되었습니다 감사합니다
너무 완벽한 강의네요!~ 내용이 훌륭하니, 저절로 r의 분포? 까지 궁금해지네요.. 수업 내용 처럼 간단하게 r의 분포가 뭐다~정도만 알려주시면 너무 굉징히 좋을 것 같아요.. 진짜 최고의 수업이에요!
쉽게 이해되었습니다 좋은 강의 감사합니다
도움 많이 되었습니다. 감사합니다.
설명으로 이해되었습니다. 감사합니다.
감사합니다~ 잘배워 갑니다^^
너무 잘 보고 갑니다^^ 이해가 ㅅ쑥쑥!
너무 도움이 되었습니다. 감사합니다!
강의 감사합니다
강의 너무 재밌어요!
깔끔한 설명 감사합니다. 많은 도움이 되었습니다!!
감사합니다. 이해하는데 도움이 되었어요!
잘 들었습니다. 감사합니다.
좋은 강의 감사합니다!
안녕하세요! 좋은 강의 감사드립니다. 덕분에 이해가 잘 되었습니다. 혹시 14:03에서 슬라이드에 모상관계수는 X,Y의 공분산을 각각의 편차로 나눠준다고 되어있는데 표준편차로 나눠주는 것이라고 생각하면 될까요?!
예, 거기서 편차는 표준편차입니다.
@@easy_statistics 답변 주셔서 감사합니다. 강의 통해 큰 도움을 얻었습니다.
와 이해 정말 잘 됐어요 감사합니다!
정말 감사합니다!!!!!
학부생인데 많은 도움 받고 갑니다 ~설명 너무 잘하셔요 감사합니다!!
와 정말... 강의력이 대단하십니다...! 항상 헷갈렸는데 한 번에 이해하고 갑니다ㅠㅠ 혹 제 공부 블로그에 출처와 함께 자료 사용해도 괜찮을지요? 좋은 영상 정말 감사합니다!
사용하셔도 좋습니다~
상관계수가 공분산에서 각각의 편차의 곱으로 나눈 값인데 절댓값이 무조건 1이하로 나오는 수학적 근거나 유도 과정이 있을까요? 감사합니다.
-1에서 1사이의 값이 나오는 것은 직관적으로 영상 14:08 에서 설명하였죠. 수학적으로 증명하는 것은 Cauchy-Schwarz 부등식을 이용하는 방법이 있는데 이해하기 어렵다면 그나마 쉬운 방법이 0≤Var(X/σx±Y/σy)=2±2Corr(X,Y) (여기서 σx, σy는 X, Y의 표준편차)을 이용하는 것이죠.😉
상관계수와 회귀의 차이점은 뭘까요?
상관계수 : 독립변인과 종속변인의 개념이 없고 단지 두 변인간의 관계를 나타낸다.
회귀 : 두 변인 간의 관계가 독립변인과 종속변인의 관계가 될때
라고 저희 전공책에 나와있는데...이게 맞는 얘기 일까요??
답변이 늦어 죄송합니다. 거의 모든 통계책에 그렇게 적혀있습니다. 그렇다고 종속변수와 독립변수간에 상관계수를 구하면 안된다는 뜻은 아닙니다. 상관계수는 일단 변수 간에 관계정도를 보는 것입니다. 그런데 그 두 변수 간에 관계식을 구하고 싶다면(회귀분석) 그 두 변수간에는 영향관계가 성립되어야 한다는 것이죠. 예를 들어 영어점수와 수학점수 간에 상관관계가 존재한다고해도 수학점수를 영어점수(의 함수)로 예측하려는 시도는 좀 어색하죠.
네~답변 감사합니다!^^
공분산은 x,y의 방향성을 나타내는 거면 2개의 변수 간의 관계만 측정할 수 있는건가요? 3개 이상 변수의 관계를 측정하는 방법은 따로 있는건가요?
3개의변수가 있을 때 각 2개 변수씩 짝을 지어 관계를 볼 수있습니다. 엑셀에서도 3개 이상의 변수를 선택하고 상관분석이나 공분산분석을 하시면 됩니다.
통계분석 분산분석과 회귀변수는 업로드 예정에 없으실까요? 기다리고 있습니다
중급통계 분야로 시간날때 마다 계속 올리고 있습니다~
선생님~급내상관계수는 뭔가요? 2명의 관찰자 이상인지, 3명의 관찰자 이상 간의 신뢰도 추정인지?? 책을 봐도 헛갈려서 질문 올립니다.
안녕하세요 너무 깔끔한 설명 감사합니다!! 질문이 있는데요
1. 두 집단이 독립 집단이 아니라면 상관 계수를 사용할 수 없나요?
2. 서로 다른 두 연관성을 하나로 병합하여 분석하는 경우에는 상관 계수를 사용할 수 없나요?
1. 상관계수는 변수 간의 관계를 보는 것인데, 집단 간의 상관계수를 보려는 것인가요? 집단 간에는 특정 상관계수를 비교하겠죠.
그 의도를 파악하기 어렵지만 상관계수에서 독립집단을 언급할 때는 두 집단간에 상관계수의 일치성 검정입니다.
예를 들어 남자집단에서 급여(B)와 이직율(A)의 상관계수(r_AB)와 여자집단에서 상관계수(r_AB)가 일치하는 가를 검정하는 것이죠.
그건 Fisher의 변환을 이용해 z 검정이 가능합니다.
독립이 아니라고 언급되는 경우는 한 집단에서 구한 다른 상관계수들을 서로 비교할 때죠.
한집단에서 이직율(A)과 급여(B)의 상관계수와 이직율과 근무시간(C)의 상관계수를 비교하는 것이죠.
r_AB와 r_AC를 비교하는데 r_BC가 존재하기 때문에 앞에서의 검정통계량처럼 간단하지는 않지만 구할 수는 있습니다.
구글링하면 공식을 찾으실 수 있을거에요.
또 한가지 예상되는 것은 같은 표본을 대상으로 2019년에 얻은 상관계수와 2020년에 얻은 상관계수를 비교하는 것이죠.
즉 같은 집단이고 같은 변수간 상관계수인데 측정시기가 달라지는 것. 이것도 가능은 합니다...
2. 연관성을 병합한다... 이것도 그 의도가 모호한데...
상관계수의 linear combination인지 변수의 선형결합인지...
예를 들어 변수가 X1,X2,X3,X4 가 있을 때 (X1,X2)와 (X3,X4)의 관계를 보고자 한다면
Y1=주성분(X1, X2), Y2=주성분(X3, X4)로 변환하여 Y1과 Y2의 상관계수를 구하면 되구요.
만약 상관계수의 어떤 조합을 가지고 검정을 하려면 그것도 가능하지만
그건 수리통계학 시험볼 때나 필요한 줄 알았어요.
예를 들어 r_12+r_34가 0.5가 넘는가를 검정한다면 가능합니다.
그것이 실용적인 의미가 어떤지는 차치하고요.
어쨌든 이런 복잡한 질문은 아니셨기를 ㅎ
안녕하세요 혹시 여기 사용되는 교재가 어떤건가요?
엑셀을 이용한 통계학 -이기훈 자유아카데미
www.yes24.com/Product/Goods/117860807