좋은 강의 감사드립니다. 8:54 부분에서 A대학은 평균178.5cm이고 B대학은 평균 179.9cm로 나왔는데 이미 두 대학의 평균키가 다른데 우연히 ''같은'' 확률이 이해가 잘 되지 않습니다ㅠ 만약 A대학과 B대학의 평균이 178.5cm가 나온상태에서 우연히 ''같은'' 확률은 얼마나 될까 라고 하면 이해가 되는데요ㅠ
제 첫번째 강의를 보시면 왜 통계가 어려운지를 설명합니다. 간단히 말해 두대학의 키차이가 1.4cm가 나면 우리는일상적으로 B대학이 더 크다 라고 결론내리고 끝냅니다. 이게 일상적인 결정론적 사고방식입니다. 반면 통계적 사고방식이란 두 학교의 키 차이가 1.4cm났지만 이 차이가 우연히 발생하지 않았을까? 라는 질문에서 시작해서 이 차이가 우연일 확률일 얼마일까를 물어보는 겁니다. 통계에서 말하는 사건이란 이경우 1.4cm의 키차이 입니다. 이 사건이 발생할 확률이 5%미만이라면 우연이 아니라고 보고 뭔가 의미가 있을것이라고 결론냅니다. 그래서 유의하다라고 하지요. 반면 이 확률이 5%보다 크면 우연이라고 보고 유의하지 않다고 봅니다. 가급적 맨 앞부터 보시면 좋을것 같네요.
모집단이 아나라 표본이라 생각해보시죠. 우리는 모집단을 추정하고자 하는것이고 결국 집단간 차이도 집단 모두가 아니라 표본들인 것입니다. 따라서 우리가 도출한 저 차이가 표본이다 보니 표본상으로 우연히 키 차이가 발생햇을 수잇다는 것이죠. 따라서 이렇게 우연히 발생할 확률이 0.05 즉 5퍼 미만이면 표본이라 그런게 아니라 실제로도 차이가 잇다고 보는것이겟죵
좋은 강의 감사 드립니다. 한 가지 여쭤보고 싶은 질문이 있는데 두 집단 간의 차이가 '우연히' 발생할 수 있다는 것은 두 집단의 표본을 비교하고 있다는 것을 전제로 하고 있는 것인가요? 만약 A 대학 대학생 전원과 B 대학 대학생 전원, 즉, 모집단을 비교했을 때 평균차가 1.5 cm라 한다면 이는 이것 자체로 결론을 낼 수 있고 t-test가 필요 없는 것일까요?
사실 통계적 접근이라는 것이 질문하신 내용에 비추어 본다면 두 가지 다른 질문을 담고 있습니다. 첫번째는 모집단을 현실적으로 모두 조사할 수 없기에 우리는 표본이라는 것을 뽑고 이를 통계적으로 검정하는 것입니다. 이는 통계가 현실 세계에 주는 상당한 이로움 이지요. 예컨데, 실업률을 조사한다고 가정하면, 전국민을 대상으로 전수조사를 해야 한다고 하면 거의 불가능에 가까울 것입니다. 이때 우리는 통계적 접근을 하여 통계적으로 합리적인 표본을 추출하는 것입니다. 두번째는 모집단이든 표본이든 단순히 차이가 있다는 것으로는 정말 다른 것인지 아닌지 알 수 없습니다. 이때 사용되는 것이 통계적 검정입니다. 이 차이가 의미 있는 차이인지 의미 없는 차이인지를 알기위해 우리는 통계적인 방법으로 그 차이를 검정하는 것이고 이때, 사용되는 것이 가장 기본적으로는 t-test와 같은 방법이 되는 것일 뿐입니다. 따라서 질문하신 내용은 저 두가지를 모두 이해해야 합니다.
질문 하나 드리고 싶은데, t-test로 비교하는 대상이 A대학의 sample, B 대학의 sample인 것은 알겠는데, 두 sample들은 하나의 모집단에서 기원했다고 생각해야 되나요? 아니면 A 대학 전체 남학생, B 대학 전체 남학생 이런 식으로 모집단이 두 개라고 생각해야 하나요?
안녕하세요. 우연히 채널을 알게 되어서 정주행으로 공부 시작했습니다. 유익한 내용 정말 감사합니다. 그런데 제가 진심 통알못이라... 설명 중에 '우연히 1.4cm의 차이가 생길 확률은 얼마일까?' 라는 질문에서 '우연히 차이가 생겨나는 이유가 모집단이 아니라 표본집단이어서 우연히 큰 학생들을 뽑았을 경우에 대한 확률'로 이해하면 되는건가요?
박사님 강의 너무 감사히 잘듣고있습니다 궁금한것이 있는데 실험시 사용한 데이터들을 모두 사용하면 모집단이라고 할수있나요? 예를들면 신약효과를 검증하는데 500명의 후보들이 있고 이들의 데이터를 모두사용했다면 모집단이라할수있나요? 이럴경우 표준편차SD로 표에 표기할수있나요? 표본을 쓰면 SEM을 써야하는거로 아는데 500명이 모집단이되는지 아니면 전국에 환자들중 500명을 뽑은거니 이것조차도 표본추출인건지..궁금합니다 만약 500명이 모집단이 아니게된다면 거의 모든 실험실 실험은 SEM으로 표기하는것이 맞는거죠? 미리 감사드립니다
애매한 부분이 있기는 하나 일단 그 500명이 전세계에 존재하는 특정 질병을 가진 전체라면 모집단입니다. 그러나 그게 아니라 특정 질병을 가진 사람들중 500명을 대상으로 실험을 진행한다면 표본입니다. 더불어 SEM이 무엇의 약자인지 알려주시면 감사하겠습니다. ^^ 제가 지식이 짧아서....
@@SapientiaaDei 네 표준오차 standard error of mean을 SEM이라하고 SE는 SD/root n(표본수) 이던데요 혹시 제가아는 SE와 SEM의 개념이 다른것일까요? 논문들에는 SEM이 꽤 많이보이던데요 어떤것을 검증하기위해 임의로 처리구를 만들었고 그 처리구와 동일한 개체가 실제로 존재하는지 알수 없다면 모집단이 될수있나요? 아니면 단지 이 세상에 유사한 상황에 놓여있는 개체들이 존재할 수 있다는 가능성만으로도 그 처리구는 모집단이 될 수없나요?
@@안팔아-i3i 네 단정하기는 좀 어렵지만 대부분의 경우 모집단이 아닌 표본으로 보고 들어가는 것이 맞을것 같습니다. 특수한 경우를 제외하고는 우리가 하는 통계분석은 표본집단을 기본으로 진행됩니다. 제 지식이 짧아서라면 몰라도 어지간하면 표본으로 보고 접근하시는 것이 좋을듯 하네요. ^^
통계라는 사막을 헤메며 유튜브에서 오아시스를 찾아다녔지만 늘 신기루였다. 포기할 때쯤 다다른 이곳에서 진짜 오아시스를 만났다. 감사합니다.
강의 앞에서 부터 다 듣고 있는데 진짜 짱짱입니다~^^
와.... 대학교에서 너무 고생하면서 배우고 있는데 이 동영상 하나로 지금까지 배워 왔던 것들이 왜 t-test 이용하는 지 한방에 이해가 갔습니다. 너무 감사드립니다.!!!!!!!!!!!!!!!!!!!!!!!!!!!
R을 이용한 통계학 강의를 듣다가 이해에 어려움이 있어서 여기까지 찾아왔습니다... 정말 선생님의 강의가 없었다면 너무 힘들었을거 같아요 ㅠㅠ 감사합니다!
도움이 되셨다니 다행이네요 ^^
목소리가 너무 좋아서 지금까지 전자음 성우인줄 알았어요 ㅋㅋㅋㅋㅋ
감사합니다 ^^ ㅋㅋㅋ
전 지금 6개월 넘게 반복해서 듣고 있습니다. 넘넘 감사합니다. 통알못..ㅜㅜ ㅎㅎ
부끄럽습니다 ^^ 제가 더 감사하네요 ^^
명강의 입니다. 구세주네요. 감사합니다.
저같은 문과생들에게 너무나도 필요한 강의입니다. 쉽게 설명도 잘 해주시고 너무 좋아요. bbb
와...t-test에서 t가 뭘의미하는지 몰랐는데 감사합니다!!
미쳐따 강의력 무엇
감사합니다. ^^
사랑합니다~ 감사합니다~
아...제...저...그...사랑까지는....^^ 감사합니다. 하하하.
사랑합니다
천천히 그리고 쉽게 강의 해주셔서 감사합니다 !!!
좋은 강의 감사합니다
감사합니다. ^^
정말 감사합니다 흑흑
좋은 강의 감사드립니다. 8:54 부분에서 A대학은 평균178.5cm이고 B대학은 평균 179.9cm로 나왔는데 이미 두 대학의 평균키가 다른데 우연히 ''같은'' 확률이 이해가 잘 되지 않습니다ㅠ
만약 A대학과 B대학의 평균이 178.5cm가 나온상태에서 우연히 ''같은'' 확률은 얼마나 될까 라고 하면 이해가 되는데요ㅠ
제 첫번째 강의를 보시면 왜 통계가 어려운지를 설명합니다. 간단히 말해 두대학의 키차이가 1.4cm가 나면 우리는일상적으로 B대학이 더 크다 라고 결론내리고 끝냅니다. 이게 일상적인 결정론적 사고방식입니다. 반면 통계적 사고방식이란 두 학교의 키 차이가 1.4cm났지만 이 차이가 우연히 발생하지 않았을까? 라는 질문에서 시작해서 이 차이가 우연일 확률일 얼마일까를 물어보는 겁니다. 통계에서 말하는 사건이란 이경우 1.4cm의 키차이 입니다. 이 사건이 발생할 확률이 5%미만이라면 우연이 아니라고 보고 뭔가 의미가 있을것이라고 결론냅니다. 그래서 유의하다라고 하지요. 반면 이 확률이 5%보다 크면 우연이라고 보고 유의하지 않다고 봅니다. 가급적 맨 앞부터 보시면 좋을것 같네요.
모집단이 아나라 표본이라 생각해보시죠. 우리는 모집단을 추정하고자 하는것이고 결국 집단간 차이도 집단 모두가 아니라 표본들인 것입니다. 따라서 우리가 도출한 저 차이가 표본이다 보니 표본상으로 우연히 키 차이가 발생햇을 수잇다는 것이죠. 따라서 이렇게 우연히 발생할 확률이 0.05 즉 5퍼 미만이면 표본이라 그런게 아니라 실제로도 차이가 잇다고 보는것이겟죵
멀고먼 길의 시작 🥲
무슨 소리인지 한 개도 모르겠음에서 기립박수 쳤습니다
멀고도 먼 길입니다. 통계라는 언어는.
좋은 강의 감사 드립니다. 한 가지 여쭤보고 싶은 질문이 있는데 두 집단 간의 차이가 '우연히' 발생할 수 있다는 것은 두 집단의 표본을 비교하고 있다는 것을 전제로 하고 있는 것인가요?
만약 A 대학 대학생 전원과 B 대학 대학생 전원, 즉, 모집단을 비교했을 때 평균차가 1.5 cm라 한다면 이는 이것 자체로 결론을 낼 수 있고 t-test가 필요 없는 것일까요?
사실 통계적 접근이라는 것이 질문하신 내용에 비추어 본다면 두 가지 다른 질문을 담고 있습니다. 첫번째는 모집단을 현실적으로 모두 조사할 수 없기에 우리는 표본이라는 것을 뽑고 이를 통계적으로 검정하는 것입니다. 이는 통계가 현실 세계에 주는 상당한 이로움 이지요. 예컨데, 실업률을 조사한다고 가정하면, 전국민을 대상으로 전수조사를 해야 한다고 하면 거의 불가능에 가까울 것입니다. 이때 우리는 통계적 접근을 하여 통계적으로 합리적인 표본을 추출하는 것입니다. 두번째는 모집단이든 표본이든 단순히 차이가 있다는 것으로는 정말 다른 것인지 아닌지 알 수 없습니다. 이때 사용되는 것이 통계적 검정입니다. 이 차이가 의미 있는 차이인지 의미 없는 차이인지를 알기위해 우리는 통계적인 방법으로 그 차이를 검정하는 것이고 이때, 사용되는 것이 가장 기본적으로는 t-test와 같은 방법이 되는 것일 뿐입니다. 따라서 질문하신 내용은 저 두가지를 모두 이해해야 합니다.
질문 하나 드리고 싶은데, t-test로 비교하는 대상이 A대학의 sample, B 대학의 sample인 것은 알겠는데, 두 sample들은 하나의 모집단에서 기원했다고 생각해야 되나요? 아니면 A 대학 전체 남학생, B 대학 전체 남학생 이런 식으로 모집단이 두 개라고 생각해야 하나요?
안녕하세요. 우연히 채널을 알게 되어서 정주행으로 공부 시작했습니다. 유익한 내용 정말 감사합니다. 그런데 제가 진심 통알못이라... 설명 중에 '우연히 1.4cm의 차이가 생길 확률은 얼마일까?' 라는 질문에서 '우연히 차이가 생겨나는 이유가 모집단이 아니라 표본집단이어서 우연히 큰 학생들을 뽑았을 경우에 대한 확률'로 이해하면 되는건가요?
저 1.4cm 차이가 두 대학 표본 평균들의 차이인 것이죠? 각각 두 대학 남학생 전부의 평균값이 아니구요..? 단순히 a대학 남학생 평균키, b대학 남학생 평균키라고 하니 표본이 아닌 남학생 전체를 조사한뒤에 나온 평균값처럼 착각이 됩니다..
네 그렇게 이해하셔도 무방합니다.
강의 감사하게 잘듣고 있습니다. 질문하나 드리려 하는데 대학 남학생들의 평균키는 모집단의 평균인가요, 표본집단의 평균인가요?
여기서는 두 대학의 표본의 평균이지요 ^^
Sapientia a Dei 감사해요~
@@SapientiaaDei 저도 그 부분이 헷갈려서 찾아보니 댓글에 답이 잇었네요. 감사합니다.
박사님 강의 너무 감사히 잘듣고있습니다
궁금한것이 있는데 실험시 사용한 데이터들을 모두 사용하면 모집단이라고 할수있나요?
예를들면 신약효과를 검증하는데 500명의 후보들이 있고 이들의 데이터를 모두사용했다면 모집단이라할수있나요?
이럴경우 표준편차SD로 표에 표기할수있나요? 표본을 쓰면 SEM을 써야하는거로 아는데 500명이 모집단이되는지 아니면 전국에 환자들중 500명을 뽑은거니 이것조차도 표본추출인건지..궁금합니다
만약 500명이 모집단이 아니게된다면 거의 모든 실험실 실험은 SEM으로 표기하는것이 맞는거죠?
미리 감사드립니다
애매한 부분이 있기는 하나 일단 그 500명이 전세계에 존재하는 특정 질병을 가진 전체라면 모집단입니다. 그러나 그게 아니라 특정 질병을 가진 사람들중 500명을 대상으로 실험을 진행한다면 표본입니다. 더불어 SEM이 무엇의 약자인지 알려주시면 감사하겠습니다. ^^ 제가 지식이 짧아서....
@@SapientiaaDei
네 표준오차
standard error of mean을 SEM이라하고 SE는 SD/root n(표본수)
이던데요
혹시 제가아는 SE와 SEM의 개념이 다른것일까요?
논문들에는 SEM이 꽤 많이보이던데요
어떤것을 검증하기위해 임의로 처리구를 만들었고 그 처리구와 동일한 개체가 실제로 존재하는지 알수 없다면 모집단이 될수있나요? 아니면 단지 이 세상에 유사한 상황에 놓여있는 개체들이 존재할 수 있다는 가능성만으로도 그 처리구는 모집단이 될 수없나요?
@@안팔아-i3i 네 단정하기는 좀 어렵지만 대부분의 경우 모집단이 아닌 표본으로 보고 들어가는 것이 맞을것 같습니다. 특수한 경우를 제외하고는 우리가 하는 통계분석은 표본집단을 기본으로 진행됩니다. 제 지식이 짧아서라면 몰라도 어지간하면 표본으로 보고 접근하시는 것이 좋을듯 하네요. ^^
수학교육전공인데 너무 잘듣고있습니다
감사합니다. ^^
자 드가자..
대학 남학생들의 키의 평균 듣고서 듣기 싫어졌다....
안녕하세요! 우선 아주 쉽게 내용을 풀어주셔서 감사합니다. 한가지 여쭤볼게 있는데, n (데이터의 갯수)가 커지거나 작아짐에 따라, 표준편차에는 어떤 변화가 일어나고 왜 변하는 건가요?
좀 길어질듯해서 다 말씀드리긴 어렵구요 ^^ 다음 강의를 계속해서 보시다보면 질문에 대한 답을 찾을 수 있을겁니다 ^^ 답해드리기 너무 길어지네요