슬통님. 강의 항상 정주행하는 사회과학(사회복지학) 대학원생입니다. ^^. 강의 너무 잘 듣고 있습니다. 항상 감사드립니다. 질문이 하나 있는데요. n의 크기가 30개 이상이면 그러니까 n의 크기가 30 이상인 하나의 표본을 '여러 번(거의 무한대)' 뽑을 때 모집단의 분포와 상관없이 정규분포를 따른다는 건 알겠습니다. 이건 이론적 분포라고 알고 있고요. 현실에서는 결코 우리가 시행할 수 없는. 근데, 현실 상황에서는 표본을 '딱 한번'만 뽑고 연구를 수행하는데요. 예를 들어 n=130을 한번 표본 추출하고 이 표본의 평균을 매기는 식으로요. 그런데, 이렇게 한 번 표본 추출을 하면 아까 시뮬레이션 상에 파란색 벽돌이 1개만 쌓이는데 파란색 벽돌 1개가 정규분포를 따른다고는 볼 수 없잖아요? 그냥 벽돌이 1개만 쌓였으니 분포를 띄지 않는건 당연하니깐요. 근데, 그냥 n=130인 1개의 표본을 마치 무한대로 뽑은 것으로 '가정하면' 중심극한정리에 의해 정규분포를 따를 것이기 때문에 그냥 현실 연구에서는 1번 표본 추출한 표본이 무한대로 표본 추출한 것이라 그냥 가정만 하는 것인가요?
추가적으로 글쓰신 부분에서 정규분포에 대하여 "이건 이론적 분포라고 알고 있고요. 현실에서는 결코 우리가 시행할 수 없는." 라고 쓰신 부분이 헷갈리시는 부분 같습니다. 정규분포는 정말 현실적인 분포이고, 자주 관찰되는 분포입니다! 표본을 여러번 뽑는 것이 비현실적이지 분포는 비현실적이지 않습니다. :)
@@leegunhee2203 네 질문하신 것이 어떤 부분을 이야기하는지 정확하게 이해하고 답변 드린 것이었습니다.ㅎㅎ 가장 질문을 많이 하시는 부분이기도 하구요. :) 파란색 벽돌을 여러개 뽑았을 때의 분포가 종모양인 정규분포라는 것을 이해하셨는지 질문 드린 것이었습니다. 표본을 하나"만" 뽑아도 그것을 여러 개 뽑았을 때의 분포를 쫒아갑니다. 주사위 던져서 숫자가 하나가 나와도 우리가 주사위에서 나오는 값들이 이산 균일분포를 따른다고 알고 있는 것과 같은 이치 입니다! :)
슬통님! 강의 넘 잘 들었습니다. 이해하기 쉽게 설명해 주셔서 대박 감사합니다. 한가지 질문이 있습니다. 조재환님께서 질문해 주신 부분인데요. 중심극한정리에서는 표본의 수가 30이상(파란상자가 30개 이상)이 되어야 별도의 검정없이 정규분포를 따른다라는 것 아닌지요? 그러나 대부분의 연구에서는 1번의 샘플링을 통해서 130개의 데이터를 표집을 했다면 표본이 한개(즉 파란상자가 1개가 되는 것)가 되죠. 한 번만 하기에 정규성과 등분산성 검정을 해야하고 정규성을 만족시키지 못했을 때는 부트스트랩 방법을 사용하는 것 아닌가요? 궁금해서 여쭤봅니다^^
안녕하세요~! 정규성 등분산성 검정은 하는 이유는 파란 벽돌을 하나만 뽑아서가 아닙니다. 같은 목적을 달성하는 여러 검정들 중에서 조금이라도 높은 검정력을 가지는 검정을 고르기 위한 것이죠! 예를 들어 모평균 관련 검정을 진행할 때 정규성을 만족하지 못한 상태에서 t 테스트를 진행하는 것 보다는 비모수 검정을 통해서 모평균 검정을 하는 것이 검정력이 높습니다!
@@statisticsplaybook 네, 답변 고맙습니다. 한가지만 더 여쭤보겠습니다. 그러면 중심극한정리의 정의 중 어떤 분포의 표본의 수가 극한이 되면 평균이 뮤이고 분산이 시그마인 정규분포를 나타낸다는 것인데 표본의 수가 최소한 어느 정도 되어야하는지요?? 실제 연구에서는 무한대로 표집을 하기에는 비용과 시간 등의 이유로 어려움이 있습니다ㅠㅠ
선생님 안녕하세요! 너무나도 좋은 강의 감사합니다. 혹시 표본의 크기 n이 다른 표본이 10개가 있을 때, 표본평균의 표준편차 식에 들어가는 n은 어떤걸 넣어야 하는지 알려주실 수 있을까요..? 그리고 표본비율의 표준오차(?) 표준편차(?)에 대해서도 다뤄주실 수 있으실까요?!
세상에... 제가 여기다가 사랑고백해도 되나요. 제가 뭘 그동안 헷갈려왔는지를 이제야 깨달았네요 -_-;;;; 너무 감사해요!!!!
이런 댓글 때문에 제가 유튜브를 못 끊어요..ㅠ 갬사합니다ㅋㅋㅋ 슬통갱도 웰컴!!😎👍
사회과학 전공하는 학생인데요. 재미있게 잘 보고 있습니다. 앞으로도 명쾌한 설명 부탁드려요 >
감사합니다! 좋은 피드백이 오니 제가 기분이 좋네요 :) 자주 들러주세요! 😁
감사합니다. 쏙쏙 알아 듣기 쉬운 설명
너무 좋은 설명 감사드립니다! 😀 깔끔하게 이해가 되었습니다.
UC 대학에서 데이터사이언스 공부하는 학생인데, 시험치기전에 볼 걸 그랬어요! 너무 이해가 쉽네요! 파이널 잘 치를 수 있을 것 같습ㄴ디ㅏ ㅎㅎ
슬통님. 강의 항상 정주행하는 사회과학(사회복지학) 대학원생입니다. ^^. 강의 너무 잘 듣고 있습니다. 항상 감사드립니다.
질문이 하나 있는데요.
n의 크기가 30개 이상이면 그러니까 n의 크기가 30 이상인 하나의 표본을 '여러 번(거의 무한대)' 뽑을 때 모집단의 분포와 상관없이 정규분포를 따른다는 건 알겠습니다. 이건 이론적 분포라고 알고 있고요. 현실에서는 결코 우리가 시행할 수 없는.
근데, 현실 상황에서는 표본을 '딱 한번'만 뽑고 연구를 수행하는데요. 예를 들어 n=130을 한번 표본 추출하고 이 표본의 평균을 매기는 식으로요.
그런데, 이렇게 한 번 표본 추출을 하면 아까 시뮬레이션 상에 파란색 벽돌이 1개만 쌓이는데 파란색 벽돌 1개가 정규분포를 따른다고는 볼 수 없잖아요? 그냥 벽돌이 1개만 쌓였으니 분포를 띄지 않는건 당연하니깐요.
근데, 그냥 n=130인 1개의 표본을 마치 무한대로 뽑은 것으로 '가정하면' 중심극한정리에 의해 정규분포를 따를 것이기 때문에
그냥 현실 연구에서는 1번 표본 추출한 표본이 무한대로 표본 추출한 것이라 그냥 가정만 하는 것인가요?
질문 잘해주셨어요! 질문하신게 요지 인데, 그 딱 한개 뽑은 파란벽돌이 정규분포를 따릅니다. 파란색을 여러번 뽑아서 우리는 확인만 한 것이구요. :)
추가적으로 글쓰신 부분에서 정규분포에 대하여 "이건 이론적 분포라고 알고 있고요. 현실에서는 결코 우리가 시행할 수 없는." 라고 쓰신 부분이 헷갈리시는 부분 같습니다. 정규분포는 정말 현실적인 분포이고, 자주 관찰되는 분포입니다! 표본을 여러번 뽑는 것이 비현실적이지 분포는 비현실적이지 않습니다. :)
@@leegunhee2203 파란색 벽돌을 영상에서 여러 개 뽑았을때 분포모양이 어떻게 생겼는지 생각해 보세요! 🙂
@@leegunhee2203 네 질문하신 것이 어떤 부분을 이야기하는지 정확하게 이해하고 답변 드린 것이었습니다.ㅎㅎ 가장 질문을 많이 하시는 부분이기도 하구요. :) 파란색 벽돌을 여러개 뽑았을 때의 분포가 종모양인 정규분포라는 것을 이해하셨는지 질문 드린 것이었습니다.
표본을 하나"만" 뽑아도 그것을 여러 개 뽑았을 때의 분포를 쫒아갑니다. 주사위 던져서 숫자가 하나가 나와도 우리가 주사위에서 나오는 값들이 이산 균일분포를 따른다고 알고 있는 것과 같은 이치 입니다! :)
@@leegunhee2203 네 맞습니다! 표본크기가 1이면 모분포를 따르게 됩니다. 크기가 1인 표본은 추출횟수를 10만개로 늘려도 표본 각각은 원래 분포를 따르는 것이죠! 추출 횟수는 분포의 히스토그램을 그리기 위한 것일 뿐 중심극한정리와는 관련이 없습니다!
재밌게 잘 가르치시네요😊
슬통님! 강의 넘 잘 들었습니다. 이해하기 쉽게 설명해 주셔서 대박 감사합니다.
한가지 질문이 있습니다.
조재환님께서 질문해 주신 부분인데요. 중심극한정리에서는 표본의 수가 30이상(파란상자가 30개 이상)이 되어야 별도의 검정없이 정규분포를 따른다라는 것 아닌지요? 그러나 대부분의 연구에서는 1번의 샘플링을 통해서 130개의 데이터를 표집을 했다면 표본이 한개(즉 파란상자가 1개가 되는 것)가 되죠. 한 번만 하기에 정규성과 등분산성 검정을 해야하고 정규성을 만족시키지 못했을 때는 부트스트랩 방법을 사용하는 것 아닌가요? 궁금해서 여쭤봅니다^^
안녕하세요~! 정규성 등분산성 검정은 하는 이유는 파란 벽돌을 하나만 뽑아서가 아닙니다. 같은 목적을 달성하는 여러 검정들 중에서 조금이라도 높은 검정력을 가지는 검정을 고르기 위한 것이죠!
예를 들어 모평균 관련 검정을 진행할 때 정규성을 만족하지 못한 상태에서 t 테스트를 진행하는 것 보다는 비모수 검정을 통해서 모평균 검정을 하는 것이 검정력이 높습니다!
@@statisticsplaybook 네, 답변 고맙습니다. 한가지만 더 여쭤보겠습니다.
그러면 중심극한정리의 정의 중 어떤 분포의 표본의 수가 극한이 되면 평균이 뮤이고 분산이 시그마인 정규분포를 나타낸다는 것인데 표본의 수가 최소한 어느 정도 되어야하는지요??
실제 연구에서는 무한대로 표집을 하기에는 비용과 시간 등의 이유로 어려움이 있습니다ㅠㅠ
감사합니다.
덕분에 공부합니다~!
언제나 변함없는 서포팅 감사합니다~!ㅎㅎㅎ
와 감사합니다. 이해가 잘 되었어요!
ㅎㅎ굿! 들어주셔서 감사합니다!
It's so clear to understand 😀
does it work? Nice!! Thanks for the feedback! haha I had many students who like this explanation a lot! You are the first one on RUclips. :)
선생님 안녕하세요! 너무나도 좋은 강의 감사합니다. 혹시 표본의 크기 n이 다른 표본이 10개가 있을 때, 표본평균의 표준편차 식에 들어가는 n은 어떤걸 넣어야 하는지 알려주실 수 있을까요..? 그리고 표본비율의 표준오차(?) 표준편차(?)에 대해서도 다뤄주실 수 있으실까요?!
질문이 정확하게 이해가 가지 않습니다. 표본크기가 다른 표본 10개가 있다면, 각각의 표본 평균에 대한 표준편차를 구할 땐 각 표본 크기 n_i 를 사용하면 됩니다. 각 10개 셋트를 발생시킨 모분포의 표준편차를 추정하고 싶으신걸까요?
아 넘 좋다.. 고마워요 이해가 잘 되었습니다! ㅠㅜ
ㅎㅎ시청 감사합니다~! 와 프로필 사진이 저희집 수니 (퍼그) 흰둥이 버젼 같아요! 넘 귀엽네욬ㅋㅋ
@@statisticsplaybook 저희집 강아지는 페키니즈에요! ㅋㅋ 닮은 친구들이죠!! 퍼그도 넘 이쁘겠어욥 :)
내가 왜 이걸 이제 봤을까....
저 식을 말로 풀어보면
"표본평균에서 모평균을 뺀 값은 n이 증가할 수록 평균이 0, 분산이 시그마 제곱인 정규분포로 수렴한다." 라고 하면 될까요?
제일 중요한 식 중에 하나죠ㅎㅎㅎ :)
* 표본평균에서 모평균을 뺀 값 만을 생각하면 대수에 법칙에 의하여 0으로 수렴
* 저 식은 n 을 고정한 상태에 하는 이야기 입니다! :)
와 레전드 레전드