상황에 따라 다른데 한가지 예시를 통해 이해해 보시기 바랍니다. 자주먹는 A과자가 있다고 합시다. 이 과자의 무게는 60이라고 표기되어 있습니다. 어느날 과자를 먹는게 무게가 줄어든게 느껴졌습니다. 며칠 뒤에 먹었을 때도 같은 느낌을 받았습니다. 표기된 무게는 그대로 60이었습니다. 의구심이 들어서 과자 30봉지를 샀습니다. 뜯어서 무게를 측정했고 평균이 30.5, 표준편차가 3.2가 나왔습니다. 통계 검정을 할 것입니다. 귀무가설과 대립가설을 세워봅시다. 귀무가설 : 과자의 무게는 60이다. 대립가설 : 과자의 무게는 60보다 작다. 대립가설을 위와 같이 설정한 이유는 과자 무게가 60보다 큰 것은 문제가 되지 않기 때문입니다. 우리가 궁금한 것은 60보다 작은지 아닌지가 궁금한 것이죠. 아니면 과자 무게 표기 자체가 틀렸다는 시비를 걸고 싶은 상황이라고 합시다. 이때는 무게가 더 많이 나가건 적게 나가건 표기된 무게랑 다르다는게 불만인 것입니다. 이때는 아래와 같이 대립가절을 설정합니다. 귀무가설 : 과자의 무게는 60이다. 대립가설 : 과자의 무게는 60이 아니다.
한가지 궁금한점이 있습니다. p-value 가 작으면 null hyp를 기각한다 인데 null hyp는 표본평균의 평균만을 가정하고 있습니다. 근데 p-value 유도과정을 보니 분산 +-5 도 관련이 있습니다. 모집단의 분산이 크면 p-value도 커지고 그에따라 null hyp를 기각하지 않을수도 있습니다. 다시말해 분산도 p-value 에 영향을 끼치는데 null hyp 와 alternative hyp는 평균만을 주장하고 있으니 분석적으로 좀 애매하다고 생각합니다. 제 생각에는 p-value가 낮아서 null hyp를 기각하더라도 두가지의 경우가 있다고 봅니다. 1) 실제로 표본평균의 평균이 틀렸다. 2) 표본평균의 평균은 맞으나 분산 (또는 오차범위)가 낮게 책정됬다. 어떻게 생각하시는지요?
단순회귀분석 (Y = beta0 + beta1*X + error) 에서 X가 유의한 변수인가를 보려고 단측검정을 한다고 할때, H0 = coefficient 인 beta1이 '0'이다 (관계가 없다). 여기서 p value가 0.05보다 작으면 기각하면서 X는 유의한 변수라고 회귀분석에서 결론을 내린다고 알고 있습니다. 그런데 그냥 통계와 상관없이 직관적으로 생각해볼때 어떤 변수를 택하던 간에 상관계수, beta1이 0이 되는 경우는 매우 적을 것 같고 항상 어느정도의 기울기가 있을 것 같다는 생각이 문득 들더라구요. 다시말해 어떤 랜덤한 Y와 X의 데이타가 관련이 없도록 상관계수가 0이 되는 확률은 거의 희박할 것 같거든요. 그래서 드는 생각은 대부분의 경우 p value가 0.05보다 작게 나오게 되서 잘못된 X변수를 택하게 되는 그래서 잘못된 linear regression모델을 만들게 되지 않나요? (리서치 했을때 다중회귀분석의 변수를 택할때 그럴것 같다고 생각하고 변수를 택했을때 대부분의 경우 p value가 0.05보다 작게 나왔었던 기억이 나면서......)
답변이 늦었습니다. 회귀분석은 공부중인 상태라 일단 제가 아는 한도에서 말씀드리겠습니다. 회귀분석 결과에는 R^2 값과, 분산분석 p값이 있습니다. R^2값은 회귀식이 데이터를 얼마나 설명하는가를 말합니다. R^2값이 0.8이면 80%를 설명하는 것입니다. 이 값이 유의한지는 p값으로 판단합니다. 여기서 구해지는 p값은 F검정의 결과입니다. SSR과 SSE/(n-2)의 비율에 대한 검정이구요. R^2이 크면 SSR의 비율이 커지므로 유의한 결과를 갖게될 것입니다. 문제는 R^2이 작은 경우인데요. R^2이 작은데도 결과가 유의하게 나올 수도 있습니다. 찾아보니 r(R^2의 루트값)에 대한 기준들이 있습니다. 문헌마다 조금씩 다르긴 합니다. 0
그 확률 안에 포함 안된다는게 어떤 의미인가요? 우리가 뽑은 표본이 가설로 세운 분포에서 극단적인 5%안에 들어간다면 가설을 기각하는 것입니다. 0.05는 꼬리쪽의 확률입니다. 0.05보다 작으면 더 극단적인 꼬리가 되겠죠. 확률이 작아질수록 양 끝으로 이동합니다. 이해가 안되시면 말씀해주세요. 더 쉽게 설명강의를 준비해보겠습니다.
@@blessman98 위 경우에 기각되는 상황은 두가지가 있습니다. 평균이 70보다 유의하게 작아서 기각 될 수도 있구요. 평균이 70보다 유의하게 커서 기각될 수도 있습니다. 먼저 기각여부만을 놓고 본다면, 유의수준과 유의확률의 단순한 크기비교로 결정됩니다. 좌측 꼬리가 0.05보다 작게 나와도 기각이고, 우측꼬리가 0.05보다 작게 나와도 기각입니다. 좌측이던 우측이던 0.5보다 넓이가 작은쪽 꼬리를 유의확률로 출력해줍니다. 우리가 사용하는 소프트웨어 SPSS,EXCEL은 그렇게 코딩되어 있습니다. 물론 귀무가설을 평균이 70보다 "같거나 크다"라고 놓고, 70보다 작을때(좌측 꼬리가 0.05보다 작을 때)만 기각시키도록 정의할 수도 있지만, SPSS나 EXCEL에서 그렇게 셋팅되어 있지 않습니다. 귀무가설은 항상 "같다" 로 놓습니다. 그런데 위 경우에서 우리가 뽑은 표본의 평균이 70보다 클 때는 문제가 되지 않습니다. 과자가 더 많이 들어있으면 좋은거니까요. 우리는 회사에서 일부러 과자를 적게 넣었는지가 궁금합니다. 따라서 기각여부 뿐만 아니라 Z의 부호도 고려해야합니다. 위 경우 Z가 -3이 나왔기 때문에, "70보다 유의하게 작아서 기각됐다"고 판단할 수 있습니다. 기각됐는데 Z가 양수였다면, 우측 꼬리에서 기각된 것이므로, 70보다 과자가 너무 많이 들어있어서 기각된 것입니다. 이때는 기각됐더라도 회사에게 컴플레인을 걸 이유가 없습니다. 기계적으로 유의확률값만 읽어서는 안되고, 분포 상에서 어느 꼬리에서 기각된 것인지. 만약 집단이 두개라면 귀무가설을 A-B=0 으로 세웠는지 B-A=0으로 세웠는지도 알아야합니다. R의 경우는 단측검정을 할 때, left tail 과 right tail을 정해주는 옵션이 있습니다. SPSS는 그런 옵션이 없기 때문에, t값의 부호를 고려하여 판단해주어야 합니다. 위 내용을 몰라도 판단이 가능한데, 이렇게 판단하시면 됩니다. A회사에서 70이라고 주장하는데, 우리가 무게를 측정해보니 68이 나왔습니다. t검정을 하니 기각됐습니다. 평균이 70보다 유의하게 작아서 기각된걸까요. 커서 기각된걸까요?? 당연히 작아서입니다. 68이 70보다 작으니까요. 평균의 크기비교만 해도 알 수 있습니다. 설명이 장황해서 읽으셔도 잘 이해 안되실거 같네요ㅠ많이 헷갈릴 수 있는 주제여서. 영상 강의를 준비해보도록 하겠습니다.
@@eostatistics 아닙니다!!! 이렇게 정성껏 답변해주셔서 너무 감사드려요!! 이것저것 찾으면서 찾다보니 저만의 방식으로 이해했습니다!! 물론 통계의본질 님의 영상이 가장 큰 도움이됐구요!! 이렇게 신경써주셔서 너무 감사드려요 시험 잘쳐야할 이유가 하나 생겼네요~~!
글이 더 편하신 분
hsm-edu.tistory.com/217
사랑합니다.
대학강의보다도 훨씬 쉽고 이해가 잘되게 설명해주시네요 너무 잘봤습니다🐸🐸
감사합니다^^
대체 왜 교수님들은 이렇게 설명하지 못하는걸까..? 진ㅋ자 미스테리;
하 이 사람 영상은 대체 뭐지...
왜 재밌지??
그럼 claim은 항상 null인 거네여?
일단 영상이 하나하나 주제별로 짧아서 너무 좋구요!! 예제까지 해주시니 너무 감사합니다 진심 번창하세요!!!!!
제 통계 교수님이시네요.. 감사합니다ㅠㅠㅠ
내용 이해가 어려웠는데 영상보니 확실하게 이해가 되네요! 정말 감사합니다 영상 잘 보겠습니다
강의 잘 보았습니다. 한가지 질문이 있습니다.
A회사가 허위기재한 것으로 결론이 나왔는데, "B회사가 모평균을 대변하지 못하는 표본평균을 뽑아냈다." 라고 해석해도 되나요?
와 정말 명쾌하게 설명해주셔서 감사합니다! 다른 예제에도 바로 응용할 수 있을 것 같아요
표준편차 0.5가 아니라 0.25 아닌가요..?
저도 4분의 1이 왜 0.5가 되는지 궁금해요
대립가설이 크거나 작거나 같지 않다는 기준이 뭔가요?? 문제 유형이 똑같은데 어떤 대립가설은 크다고하고 다른 대립가설은 같지 않다고 해서 헷갈리네요 ㅜㅜ
상황에 따라 다른데 한가지 예시를 통해 이해해 보시기 바랍니다.
자주먹는 A과자가 있다고 합시다. 이 과자의 무게는 60이라고 표기되어 있습니다.
어느날 과자를 먹는게 무게가 줄어든게 느껴졌습니다. 며칠 뒤에 먹었을 때도 같은 느낌을 받았습니다. 표기된 무게는 그대로 60이었습니다.
의구심이 들어서 과자 30봉지를 샀습니다. 뜯어서 무게를 측정했고 평균이 30.5, 표준편차가 3.2가 나왔습니다.
통계 검정을 할 것입니다. 귀무가설과 대립가설을 세워봅시다.
귀무가설 : 과자의 무게는 60이다.
대립가설 : 과자의 무게는 60보다 작다.
대립가설을 위와 같이 설정한 이유는 과자 무게가 60보다 큰 것은 문제가 되지 않기 때문입니다. 우리가 궁금한 것은 60보다 작은지 아닌지가 궁금한 것이죠.
아니면 과자 무게 표기 자체가 틀렸다는 시비를 걸고 싶은 상황이라고 합시다. 이때는 무게가 더 많이 나가건 적게 나가건 표기된 무게랑 다르다는게 불만인 것입니다. 이때는 아래와 같이 대립가절을 설정합니다.
귀무가설 : 과자의 무게는 60이다.
대립가설 : 과자의 무게는 60이 아니다.
@@eostatistics 바로 이해했습니다.!! 친절한 답변 감사합니다.~~
한가지 궁금한점이 있습니다.
p-value 가 작으면 null hyp를 기각한다 인데 null hyp는 표본평균의 평균만을 가정하고 있습니다. 근데 p-value 유도과정을 보니 분산 +-5 도 관련이 있습니다. 모집단의 분산이 크면 p-value도 커지고 그에따라 null hyp를 기각하지 않을수도 있습니다. 다시말해 분산도 p-value 에 영향을 끼치는데 null hyp 와 alternative hyp는 평균만을 주장하고 있으니 분석적으로 좀 애매하다고 생각합니다.
제 생각에는 p-value가 낮아서 null hyp를 기각하더라도 두가지의 경우가 있다고 봅니다. 1) 실제로 표본평균의 평균이 틀렸다. 2) 표본평균의 평균은 맞으나 분산 (또는 오차범위)가 낮게 책정됬다. 어떻게 생각하시는지요?
그래서 z검정에서는 모분산의 참값을 알고 있다고 가정합니다. 아주 이상적인 가정입니다.
실제로 z검정을 쓰지는 않습니다. 모분산을 알 수 있는 경우는 없기 때문입니다. 표본분산을 사용하는 t검정을 합니다.
아하 생각해보니 그렇네요.
단순회귀분석 (Y = beta0 + beta1*X + error) 에서 X가 유의한 변수인가를 보려고 단측검정을 한다고 할때, H0 = coefficient 인 beta1이 '0'이다 (관계가 없다). 여기서 p value가 0.05보다 작으면 기각하면서 X는 유의한 변수라고 회귀분석에서 결론을 내린다고 알고 있습니다.
그런데 그냥 통계와 상관없이 직관적으로 생각해볼때 어떤 변수를 택하던 간에 상관계수, beta1이 0이 되는 경우는 매우 적을 것 같고 항상 어느정도의 기울기가 있을 것 같다는 생각이 문득 들더라구요. 다시말해 어떤 랜덤한 Y와 X의 데이타가 관련이 없도록 상관계수가 0이 되는 확률은 거의 희박할 것 같거든요. 그래서 드는 생각은 대부분의 경우 p value가 0.05보다 작게 나오게 되서 잘못된 X변수를 택하게 되는 그래서 잘못된 linear regression모델을 만들게 되지 않나요?
(리서치 했을때 다중회귀분석의 변수를 택할때 그럴것 같다고 생각하고 변수를 택했을때 대부분의 경우 p value가 0.05보다 작게 나왔었던 기억이 나면서......)
답변을 생각중입니다~곧 답변드릴게요!
@@eostatistics 아직 생각 중이신가요? 아니면 잊어버리셨는지 해서요.
답변이 늦었습니다. 회귀분석은 공부중인 상태라 일단 제가 아는 한도에서 말씀드리겠습니다.
회귀분석 결과에는 R^2 값과, 분산분석 p값이 있습니다. R^2값은 회귀식이 데이터를 얼마나 설명하는가를 말합니다. R^2값이 0.8이면 80%를 설명하는 것입니다. 이 값이 유의한지는 p값으로 판단합니다. 여기서 구해지는 p값은 F검정의 결과입니다. SSR과 SSE/(n-2)의 비율에 대한 검정이구요. R^2이 크면 SSR의 비율이 커지므로 유의한 결과를 갖게될 것입니다. 문제는 R^2이 작은 경우인데요. R^2이 작은데도 결과가 유의하게 나올 수도 있습니다.
찾아보니 r(R^2의 루트값)에 대한 기준들이 있습니다. 문헌마다 조금씩 다르긴 합니다.
0
양측검증 아니고 단측검증인데 .0025아니고 .005 하는건가요...?! 양측검증일때도 .005로 보는것이 아닌가용?? 궁금합니다ㅠㅜ
제가 계산한 단측검정 방식에서는 0.05와 비교해주시면 됩니다. 만약 양측검정이었다면 0.025와 비교했을 거에요. 이에 대한 설명은 24강에 있습니다.
왜 0.05보다 작으면 기각되는건가요? 그 확률안에 포함안되는거 아닌가요?? 설명부탁드려요 ㅜㅜ
그 확률 안에 포함 안된다는게 어떤 의미인가요?
우리가 뽑은 표본이 가설로 세운 분포에서 극단적인 5%안에 들어간다면 가설을 기각하는 것입니다.
0.05는 꼬리쪽의 확률입니다. 0.05보다 작으면 더 극단적인 꼬리가 되겠죠. 확률이 작아질수록 양 끝으로 이동합니다.
이해가 안되시면 말씀해주세요. 더 쉽게 설명강의를 준비해보겠습니다.
@@eostatistics 그럼만약 대립가설이 Ex>70이라면 꼬리가 왼쪽으로 생기니 0.05보다 크다면 유의수준 5퍼센트안에 들어가니 귀무가설은 기각되나요?
유의수준안에 포함이되면 기각되는건가요? 기각역의 개념은 알겠는데 어떨때는 유의수준보다 크면 기각이고 또 어떨때는 작으면 기각이라서 너무 헷달리네요 ㅜㅜ
이부분 설명좀 해주실수있을까요??
@@blessman98
위 경우에 기각되는 상황은 두가지가 있습니다. 평균이 70보다 유의하게 작아서 기각 될 수도 있구요. 평균이 70보다 유의하게 커서 기각될 수도 있습니다.
먼저 기각여부만을 놓고 본다면, 유의수준과 유의확률의 단순한 크기비교로 결정됩니다. 좌측 꼬리가 0.05보다 작게 나와도 기각이고, 우측꼬리가 0.05보다 작게 나와도 기각입니다. 좌측이던 우측이던 0.5보다 넓이가 작은쪽 꼬리를 유의확률로 출력해줍니다. 우리가 사용하는 소프트웨어 SPSS,EXCEL은 그렇게 코딩되어 있습니다.
물론 귀무가설을 평균이 70보다 "같거나 크다"라고 놓고, 70보다 작을때(좌측 꼬리가 0.05보다 작을 때)만 기각시키도록 정의할 수도 있지만, SPSS나 EXCEL에서 그렇게 셋팅되어 있지 않습니다. 귀무가설은 항상 "같다" 로 놓습니다.
그런데 위 경우에서 우리가 뽑은 표본의 평균이 70보다 클 때는 문제가 되지 않습니다. 과자가 더 많이 들어있으면 좋은거니까요. 우리는 회사에서 일부러 과자를 적게 넣었는지가 궁금합니다. 따라서 기각여부 뿐만 아니라 Z의 부호도 고려해야합니다. 위 경우 Z가 -3이 나왔기 때문에, "70보다 유의하게 작아서 기각됐다"고 판단할 수 있습니다. 기각됐는데 Z가 양수였다면, 우측 꼬리에서 기각된 것이므로, 70보다 과자가 너무 많이 들어있어서 기각된 것입니다. 이때는 기각됐더라도 회사에게 컴플레인을 걸 이유가 없습니다.
기계적으로 유의확률값만 읽어서는 안되고, 분포 상에서 어느 꼬리에서 기각된 것인지. 만약 집단이 두개라면 귀무가설을 A-B=0 으로 세웠는지 B-A=0으로 세웠는지도 알아야합니다. R의 경우는 단측검정을 할 때, left tail 과 right tail을 정해주는 옵션이 있습니다. SPSS는 그런 옵션이 없기 때문에, t값의 부호를 고려하여 판단해주어야 합니다.
위 내용을 몰라도 판단이 가능한데, 이렇게 판단하시면 됩니다. A회사에서 70이라고 주장하는데, 우리가 무게를 측정해보니 68이 나왔습니다. t검정을 하니 기각됐습니다. 평균이 70보다 유의하게 작아서 기각된걸까요. 커서 기각된걸까요?? 당연히 작아서입니다. 68이 70보다 작으니까요. 평균의 크기비교만 해도 알 수 있습니다.
설명이 장황해서 읽으셔도 잘 이해 안되실거 같네요ㅠ많이 헷갈릴 수 있는 주제여서. 영상 강의를 준비해보도록 하겠습니다.
@@eostatistics 아닙니다!!! 이렇게 정성껏 답변해주셔서 너무 감사드려요!! 이것저것 찾으면서 찾다보니 저만의 방식으로 이해했습니다!! 물론 통계의본질 님의 영상이 가장 큰 도움이됐구요!! 이렇게 신경써주셔서 너무 감사드려요 시험 잘쳐야할 이유가 하나 생겼네요~~!
통계 바보 탈출하는 기분이에요 ㅎㅎㅎ 감사합니다 ㅎㅎ
감사합니다^^
대학 기말시험을 준비중인데 교수님 수업으로는 이해하기 힘들었는데 손으로 푸는 통계 영상 덕분에 도움이 많이 되고있습니다! 기말이 이주도 안남았는데 아노바,카이테스트,회귀분석이 그 전에 업데이트 되길 바라는건 제 욕심이겠죠..ㅠㅠ
저도 모르는 상태로 공부하면서 올리는거라. 2주보다는 오래걸릴것 같네요ㅜ 시험 화이팅입니다.
큰그림 교육컨텐츠Big picture EDU 감사합니다!