강의 잘듣고 있습니다. 한가지 궁금한 점이 있습니다.x와 e의 관계가 없어서 covariance이 0이 된다고 설명해주셨는데 covariance이 0이 되려면 SPxe가 0이 되어야 합니다. SPxe가 0이 되려면 Xd*ed의 합이 0이 되는데요 그렇다면 Xd*ed의 합이 0이 X와 e의 관계가 없는것을 뜻하는 것인가요? Xd*ed의 합이 0 인것과 X와 e의 관계가 없는것 이 두개의 인과관계를 모르겠습니다.
영상에 20분 정도에서부터 보시면 아시겠지만 각 케이스들에 대한 잔차변수 e 값들은 독립변수 x의 값에 특정 기울기 값인 b값을 부여하여 y값을 예측하는 값 (y hat)을 구한 뒤 나머지 값으로 자동적으로 구해집니다. y를 x를 이용하여 예측한 후 남은 나머지 값이기 때문에 x 와 e는 아무 관계가 없으며 따라서 SP(x,e)와 Corr(x,e)도 모두 자동적으로 0이됩니다. SP(x,e)는 각 케이스별로 xd와 e를 곱하여 구하고 이 값들을 모두 합한 것인데 이 경우는 0이됩니다. 그리고 SP(x,e)가 0이면 자동적으로 Corr(x,e)도 0이 됩니다.
나중에 자세히 알려드리겠습니다. 제가 위에서 알려드린 방법은 회귀계수만을 일단 구하는 것인데 평균이 0이 아닐 수 있는 원래 값들을 가지고 하는 것이 아니라 먼저 각 변수의 편차값 (Xi - M(x)) 들을 구한뒤 (자동적으로 평균이 0이 됨), 그 편차값들을 이용해서 회귀계수를 쉽게 구하는 것입니다. 위에서 Xd 와 Yd를 새로운 변수값들로 생각하고 공식을 적용하시면 될 것입니다. 이렇게 회귀계수를 구하면 회귀계수 값을 이용한 방정식으로 절편 값을 구할 수 있습니다 (아래 참조)
회귀계수 즉 기울기는 평균이 0인것과 관계없습니다. 쉽게 구하는 것을 보여주식 위해 평균을 0으로 한 것입니다. 평균은 x가 0일 때의 y의 값 즉 절편과 관계가 있습니다. 회귀분석에서 기울기인 회귀계수 b를 구하였다면 y 절편값(a) 는 (y의 평균) - b * (x의 평균)으로 구할 수 있습니다. 즉, a = (y 평균) - b* (x 평균). (Hays, 1994, p. 602)
강의 잘듣고 있습니다. 한가지 궁금한 점이 있습니다.x와 e의 관계가 없어서 covariance이 0이 된다고 설명해주셨는데 covariance이 0이 되려면 SPxe가 0이 되어야 합니다.
SPxe가 0이 되려면 Xd*ed의 합이 0이 되는데요
그렇다면 Xd*ed의 합이 0이 X와 e의 관계가 없는것을 뜻하는 것인가요?
Xd*ed의 합이 0 인것과 X와 e의 관계가 없는것 이 두개의 인과관계를 모르겠습니다.
영상에 20분 정도에서부터 보시면 아시겠지만 각 케이스들에 대한 잔차변수 e 값들은 독립변수 x의 값에 특정 기울기 값인 b값을 부여하여 y값을 예측하는 값 (y hat)을 구한 뒤 나머지 값으로 자동적으로 구해집니다. y를 x를 이용하여 예측한 후 남은 나머지 값이기 때문에 x 와 e는 아무 관계가 없으며 따라서 SP(x,e)와 Corr(x,e)도 모두 자동적으로 0이됩니다. SP(x,e)는 각 케이스별로 xd와 e를 곱하여 구하고 이 값들을 모두 합한 것인데 이 경우는 0이됩니다. 그리고 SP(x,e)가 0이면 자동적으로 Corr(x,e)도 0이 됩니다.
설명을 잘해주셔서 이해가 잘 되네요. e 값은 x 와 상관이 없어서 0으로 된다면, 기울기가 구해진 뒤 y 절편의 값은 어떻게 결정해야 할까요?
도움이 되었다니 기쁩니다. 회귀분석에서 기울기인 회귀계수 b를 구하였다면 y 절편값(a) 는 (y의 평균) - b * (x의 평균)으로 구할 수 있습니다.
즉, a = (y 평균) - b* (x 평균). (Hays, 1994, p. 602)
@@persuasion_seminar 무조건 평균을 지나가는 직선이 만들어 지겠네요? 대학교때 이해 못한 부분을 여기서 이해하네요. 감사합니다.
평균이 0이 아닌 경우에는 X`Y = N*Covariance(X,Y) = SP가 성립되지 않고 있는데, 아래 예제에서 어떤게 잘 못 되었을까요?
*Xd`Y` = N*Covariance(X,Y) = SP
ex) X = [-4, -2, 0, 2, 9], Y = [-1, -2, 0, 2, 6]
Xd = [-5, -3, -1, 1, 8], Yd = [-2, -3, -1, 1, 5]
Variance(X) = 100/5 = 20
Variance(Y) = 40/5 = 8
Std(X) = Root(20)
Std(Y) = Root(8)
Xd*Yd = [10, 9, 1, 1, 40]
SP(X,Y) = 61
Covariance(X,Y) = 61/5
Correlation(X,Y) = Covariance(X,Y) / Std(X)*Std(Y)
X`Y = 66
* Xd`Y` = 61
N*Covariance(X,Y) = 5*61/5
제가 뭘 잘 못 이해하고 있는걸까요?
Y = bX + e
위 식에서 사용되는 X와 Y가
X'과 Y'인가요? 왜 그걸 쓰는걸 까요?
나중에 자세히 알려드리겠습니다. 제가 위에서 알려드린 방법은 회귀계수만을 일단 구하는 것인데 평균이 0이 아닐 수 있는 원래 값들을 가지고 하는 것이 아니라 먼저 각 변수의 편차값 (Xi - M(x)) 들을 구한뒤 (자동적으로 평균이 0이 됨), 그 편차값들을 이용해서 회귀계수를 쉽게 구하는 것입니다. 위에서 Xd 와 Yd를 새로운 변수값들로 생각하고 공식을 적용하시면 될 것입니다. 이렇게 회귀계수를 구하면 회귀계수 값을 이용한 방정식으로 절편 값을 구할 수 있습니다 (아래 참조)
@@persuasion_seminar 항상 빠른 답변 주셔서 감사합니다!
평균이 0이 될 수 있는 벡터를 사용해야 하기 때문에,
X/Y가 아닌 X`/Y`로 사용해야 한다고 이해했습니다.
평균이 0인 편차 벡터를 사용하는 이유에 대해서도 영상 기다리고 있겠습니다!
평균이 0이 아닌 경우에도 적용 가능할까요..?
회귀계수 즉 기울기는 평균이 0인것과 관계없습니다. 쉽게 구하는 것을 보여주식 위해 평균을 0으로 한 것입니다. 평균은 x가 0일 때의 y의 값 즉 절편과 관계가 있습니다. 회귀분석에서 기울기인 회귀계수 b를 구하였다면 y 절편값(a) 는 (y의 평균) - b * (x의 평균)으로 구할 수 있습니다.
즉, a = (y 평균) - b* (x 평균). (Hays, 1994, p. 602)