1. 그러니까 이영상에서 상관계수는 벡터의 내적이라는 제목에서 말하려고 하는 것은 2. 상관계수 자체가 벡터의 내적과 같은 의미라기 보다는 3. 벡터의 내적에서 내적 = a벡터좌표 x b벡터좌표 =a벡터크기x cosθ x b벡터의 크기 인데 4. 여기서 cosθ 값이 상관계수다 그 얘기를 하고 있는 것 같다. 15:40 5. 왜냐면 벡터의 내적은 엄연하게 상수값인데 내적 이건 비율이 아니기 때문이다. 6. 상관계수는 -1과 1사이의 값만을 갖는 비율인데 벡터의 내적은 거기에 구속되지 않는 실제 물리량 값으로 이해될수 있기 때문이다. 7. 전력값 역률계산처럼 말이다. P= 전류 Ⅰ x 역률cosθ x 전압 V 인 것처럼 말이다. 8. 난 내적이란 걸 전력값을 보고서야 비로소 이해했다. 보통 내적을 W(일)= F(힘) x S(이동거리)를 가지고 설명하는데 이때는 잘이해가 안됐었다. 9. 하지만 이걸 전력P로 설명했을때 비로소 이해했다. 내가 내적을 이해하게 된 계기를 이렇게 남겨놓는다. 23.09.30.(토)
핫... 주성분분석보다 흘러 들어왔는데... 질문이 하나 있습니다. 해당 영상의 블로그 글에 '이 말은 다시 말하자면 dataset이 원점으로부터 얼마나 떨어져있는지는 무시하고 서로 퍼진 정도만 보겠다는 의미이다' 라고 적혀 있는데요. 이 문장이 그러한 까닭이 xi와 yi에서 각각 x_bar 와 y_bar를 빼주었기 때문에 원점 근처로 평행이동한 걸로 보면 되는 거지요??
한 가지 더 질문이 있습니다만.. 그러면 결과적으로 벡터의 내적으로 본 상관계수와 cos(theta)가 동일한 값이면 서로 다른 벡터 a->와 b-> 사이의 각도인 theta 의 크기가 상관성을 직접 나타내는 지표라고 보아야 하는 것이죠? 말이 괜히 어려워 보이는데.. 그러니 상관계수가 -1 에서 +1 사이인 까닭은 그저 cos(theta)의 값을 따랐기 때문인 것이지요?
1. xi와 yi에서 각각 x_bar 와 y_bar를 빼주었기 때문에 원점 근처로 평행이동한 걸로 보면 되는 거지요? --> 네 정확합니다. 2. 상관계수가 -1 에서 +1 사이인 까닭은 그저 cos(theta)의 값을 따랐기 때문인 것이지요? --> 이것도 맞습니다 ^^ 혹은 상관 계수는 공분산을 정규화한 것이기 때문이라고 봐도 괜찮습니다 (혹시나 이 말이 어려우시다면 신경쓰지 않으셔도 큰 문제는 없을 것 같습니다).
Wow,,, 놀랍네요.. 이게 이렇게 연결되는구나.. 영어로 다변량 분석 배우고 있는데, 교재에 영어로 이런내용이 있지만 와닿지 않았는데, 역시 모국어로 배우니 감이 확잡히네요. 감사합니다.
와.. 이거 수리통계 시간에 교수님이 설명하실 때 무슨 말인가 했는데.. 진짜 신기허네요
대학에서도 이렇게 가르쳐 줬으면... 감사합니다!!😀
공감합니다 ㅠㅠ
선생님 덕분에 매번 잘 배우고 있습니다.
감사합니다 :)
아직 많이 부족한데도 댓글 감사합니다. 좋은 하루 되세요!
감사합니다. ^^
상관계수에 이런 의미가 있을줄은 생각도 못해봤네요 ㅎㅎ 유익한 설명감사합니다^^
상관계수를 비슷한 벡터의 방향으로도 해석이 되는군요. 감사합니다
상관계수는 벡터의 내적이기 때문에 스칼라 값 입니다. 비슷한 벡터의 방향이라고 해석하시는 것 자체가 스칼라, 벡터를 구분을 이해하지 못하신게 아닌가요?
@@sang-dankim9562내적에서 방향이 비슷할수록(덜벌어져있을수록, 세타가 작을수록) 값이 커지는거니까 상관계수를 내적으로 이해하면 두 자료의 값이 비슷한 방향일수록, 비슷한 경향일수록 상관계수가 커지는걸로 볼 수 있지 않나요?
와 덕분에 상관계수 수식이 좀 더 직관적으로 다가오는거같아요! ㅎㅎㅎ 항상 감사드립니다.
유튜브 후원은 수수료가 많다고 해서 그냥 계좌로 드렸어요 ㅋㅋㅋ 약소하지만 커피한잔 하시구 앞으로도 좋은 영상 부탁드립니다!!
감사합니다~!!
대학교에서 이렇게 배웠으면 좋았을 텐데... 존경합니다.
와.. 많이 배워갑니다.
상관계수 정리
1. 상관계수는 두 변수의 기울기를 나타내는 것이 아니다.
2. 두 가지 변수 사이의 인과관계를 설명하는 것도 아니다.
3. 서로를 얼마나 설명하는가에 대해서만 알려준다.
1. 그러니까 이영상에서 상관계수는 벡터의 내적이라는 제목에서 말하려고 하는 것은
2. 상관계수 자체가 벡터의 내적과 같은 의미라기 보다는
3. 벡터의 내적에서 내적 = a벡터좌표 x b벡터좌표 =a벡터크기x cosθ x b벡터의 크기 인데
4. 여기서 cosθ 값이 상관계수다 그 얘기를 하고 있는 것 같다. 15:40
5. 왜냐면 벡터의 내적은 엄연하게 상수값인데 내적 이건 비율이 아니기 때문이다.
6. 상관계수는 -1과 1사이의 값만을 갖는 비율인데 벡터의 내적은 거기에 구속되지 않는 실제 물리량 값으로 이해될수 있기 때문이다.
7. 전력값 역률계산처럼 말이다. P= 전류 Ⅰ x 역률cosθ x 전압 V 인 것처럼 말이다.
8. 난 내적이란 걸 전력값을 보고서야 비로소 이해했다. 보통 내적을 W(일)= F(힘) x S(이동거리)를 가지고 설명하는데 이때는 잘이해가 안됐었다.
9. 하지만 이걸 전력P로 설명했을때 비로소 이해했다. 내가 내적을 이해하게 된 계기를 이렇게 남겨놓는다. 23.09.30.(토)
선대가 정말 정말 공학 쪽에서는 완전 필수인 학문 같습니다 :)
푸리에급수보다가 여기까지 넘어왔어요~강의 정말 잘봤습니다. 해당내용을 함수의 범위까지 확장하여, 함수의 상관관계도 구할 수 있을까요? 만약 그렇다면..함수 크기의 곱(분모항)은 어떻게 수식으로 나타낼 수 있는지 궁금하네요.
함수간의 상관성은 합성곱과 비슷하게 한 함수를 슬라이딩해서 곱해가면서 더해가는 방식으로 확인합니다. 다만 정규화를 시키지는 않습니다. 자세한 내용은 랜덤신호의 확률적 처리에 관해 공부하면 더 자세히 아실 수 있습니다.
내가 본 유튭 영상중 가장 학업에 도움되는 영상 ㅋㅋ
핫... 주성분분석보다 흘러 들어왔는데... 질문이 하나 있습니다. 해당 영상의 블로그 글에 '이 말은 다시 말하자면 dataset이 원점으로부터 얼마나 떨어져있는지는 무시하고 서로 퍼진 정도만 보겠다는 의미이다' 라고 적혀 있는데요. 이 문장이 그러한 까닭이 xi와 yi에서 각각 x_bar 와 y_bar를 빼주었기 때문에 원점 근처로 평행이동한 걸로 보면 되는 거지요??
한 가지 더 질문이 있습니다만.. 그러면 결과적으로 벡터의 내적으로 본 상관계수와 cos(theta)가 동일한 값이면 서로 다른 벡터 a->와 b-> 사이의 각도인 theta 의 크기가 상관성을 직접 나타내는 지표라고 보아야 하는 것이죠? 말이 괜히 어려워 보이는데.. 그러니 상관계수가 -1 에서 +1 사이인 까닭은 그저 cos(theta)의 값을 따랐기 때문인 것이지요?
1. xi와 yi에서 각각 x_bar 와 y_bar를 빼주었기 때문에 원점 근처로 평행이동한 걸로 보면 되는 거지요?
--> 네 정확합니다.
2. 상관계수가 -1 에서 +1 사이인 까닭은 그저 cos(theta)의 값을 따랐기 때문인 것이지요?
--> 이것도 맞습니다 ^^ 혹은 상관 계수는 공분산을 정규화한 것이기 때문이라고 봐도 괜찮습니다 (혹시나 이 말이 어려우시다면 신경쓰지 않으셔도 큰 문제는 없을 것 같습니다).
@@AngeloYeo 앗 빠른 답변 감사드립니다. 제가 상관계수가 공분산을 각 변수의 표준편차의 곱으로 나누어주는 것까지는 알고 있는데요. 그런데 '공분산을 정규화'한 것과 제 두 번째 질문이 혹시 어떤 관계가 있을까요??
네 그저 공분산의 크기를 -1에서 1까지로 만들어주기 위해서 말씀하신대로 표준편차로 나눈 것이라고 생각하면 될 것 같습니다~
@@AngeloYeo 아 상관계수가 공분산을 표준화한 것이니까요. 공분산의 범위가 음~양 무한대인 줄 인지하지 못했네요. 감사합니다! 정말 늘 도움 필요할 때 많이 배우고 갑니다!
분산 자체가 통계에서 스칼라값으로 표시되어 있어서 몰랐는데 사실 벡터로 표현할 수 있었죠
네 맞습니다 공분산까지 포함해서 행렬로 분산을 표현하게됩니다
벡터b의 변화를 벡터a가 설명해주는 정도라는 의미를 어떻게 도출하신 건지 알 수 있을까요??
이 부분이 이해가 안됩니다!..
좋은 내용 감사드립니다. 영상 녹화할때, 어떤 타블렛 쓰시는지 궁금합니다.
안녕하세요. 가오몬 타블렛 1060 pro 모델 사용하고 있습니다~
@@AngeloYeo 답변 감사합니다. 수학에 궁금한 내용 있을 때 마다, 챙겨서 보고 있습니다. ^^
벡터a = Xi - Xbar
는 어떻게 생긴 벡터인가요? 이 부분에서 다음으로 안넘어가집니다.
참고할만한 자료가 있는 곳을 알려드리겠습니다. 이 주소로 들어가셔서 식 (3), (4)를 보시면, 말씀하신 열벡터 두 개를 하나의 행렬에서 구하는 것을 볼 수 있습니다.
angeloyeo.github.io/2019/07/27/PCA.html
같은 플레이리스트에 있지만 목소리가 유난히 젊게 들리는건 제 착각입니다.
껄껄... 시기 차이가 많이 나겠네요 🤣🤣🤣 20대였겠습니다 아마도
서로가 서로를 설명해준다는게 무슨 의미일까요?
진승교님 안녕하세요. 제가 표현을 수학적으로 하지 못했네요... 서로 닮았다 정도로 바꿔 생각해볼 수 있지 않을까 생각합니다 ㅎㅎ
공돌이 님을 과기부 장관으로 모셔야 합니다 !!!
소오름
ㄷㄷ
형님 혹시 전공이 어떻게 되나용?
대학다시다니고싶다
저두 이런 수학의 재미를 먼저 알았다면 전공 선택도 달라졌을 수도 있고... 수업들도 더 재밌었을 것 같아요 ㅎㅎ
@@AngeloYeo 수업들도 재미있고, 그 시점에 바라볼수있고 이해할 수 있는 폭이 엄청 넓어졌을 테니까요.. 저도 공돌이지만 얕은 수로 여태까지 살아왔고 반대로 님께서 통찰력을 가지고 설명해주시니 반갑고 고마울 따름입니다
저도 공감합니다 ㅎㅎ 보는 눈이 많이 달라졌을 것 같습니다
수학과인데 공돌이님 유튜브보고 공부합니다
16:00, 16:10, 15:45, 16:37
하 시바.. 대학에서 이렇게 배웠어야 하는데..
공감ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
궁금한게 있는데 두 변수사이의 상관계수를 공분산이라하는데 결국 공분산도 벡터 내적이라는 의미인가요?
상관계수(correlation coefficient)와 공분산(covariance)는 다른 값?입니다.
공분산 Cov(X,Y)= E [(X-E [X])(Y-E [Y])]이고
상관계수 sigma_xy=Cov (X,Y)/sq_root (Var [X]*Var [Y])
그러니간 공분산은 벡터의 내적값이겠네요.
아는 내용을 적어봤어요.
결국 같은 말같습니다. 표준화된 벡터를 사용해줌으로써 공분산의 범위를 -1과 1사이로 스케일링해주는 것 뿐이지 둘이 의미하는 바는 같지 않을까요?
동의합니다. 조금 더 보충하자면 공분산과 상관계수 둘 다 내적과 관련되어 있습니다.
다만 공분산은 내적 후 샘플 수로 나눠줘서 정규화해주고
상관계수는 두 벡터를 내적 후 벡터의.크기로 나눠서 정규화해서 코사인 세타 값을 얻게 되는 차이가 있다고 할 수 있겠습니다.