예를 들어 귀무가설로 모집단 평균이 10이다, 대립가설로 모집단 평균이 10이 아니다 라고 했을때 영상의 내용으로 보면 x bar 1으로 11이 나왔는데, 11보다 같거나 큰 값이 나올 확률이 0.02밖에 안되니 모평균이 10이라는 가설은 틀렸다. 라는 말인데.. 이해가 안가네요ㅠㅠ
안녕하세요. 강의 잘 봤습니다. 개인적으로 궁금한 점이 있어서 댓글 남깁니다. 충분히 많은 n개의 표본을 뽑았고 그 표본평균은 정규분포를 따르잖아요. 근데 이 때 이 표본 편균의 평균이 이론적으로 모평균과 같다고 저번 강의에서 증명을 해주셨습니다. 그렇다면, 여기서 제 의문은 우리는 특정 샘플 데이터의 정규분포를 가정하고 있고 (CLT가 적용된 것이고 ) n이 충분히 많다는 것이니 표본평균의 평균 = 모평균 아닌지요. “이미 이론상 표본평균의 평균 = 모평균인데 거기에 또 가설검정을 해야하는 건가...? “ 라는 의문이 들어 질문합니다. 또는 혹시 n이 충분히 많지 않거나, 혹은 모종의 이유로 표본평균의 평균=모평균이 성립하지 않을 수도 있으니까 가설검정으로 이를 보완 설명하는 건가요?
이론상 표본평균의 평균이 모평균이라는 것은. 모평균이 맞게 계산되었고. 그 모집단에서 표본이 뽑힌 것이 확실할 때 성립합니다. 위 사실이 확실한지를 모르기 때문에 검정하는 거구요. 예를 들어보겠습니다. 모평균이 30이라고 알려져있고. 표본을 100개를 뽑았습니다. 평균은 33, 분산은 4 였습니다. 우리가 궁금한 것은 30이라고 알려져있는 모집단 평균이 정말 맞냐는 것입니다. 알려져있는 모집단평균이 맞다면. 우리가 뽑은 표본평균의 평균과 모집단의 평균이 같을 것입니다. 표본평균의 평균 = 모집단 ???? 이게 참인지를 검정하는 것입니다. 이게 참이라고 "가정"했을때. 우리가 뽑은 표본이 뽑힐 확률이 매우 낮다면. 그 낮은 확률을 뚫고 뽑힌거야!!라고 주장하는게 아니라 모집단의 평균이 30이라는 것이 잘못된걸거야. 라고 하는게 기각입니다
강의 내용 중에 의문이 있어서 질문드립니다! 표본의 크기가 커서 표본평균의 분포가 정규분포를 따른다 이부분이 확실하게 이해되지 않습니다ㅠ ‘엑스바’의 분포가 정규분포를 이루려면 엑스원바 엑스투바 ~~등등 ‘표본평균’이 많아져야 하는게 아닌가요? 즉 표본의 크기보다 표본을 추출한 횟수가 중요한거 아닌가요? 왜 표본의 크기가 중요한건지 궁금합니다
중심극한정리 강의 9~14를 보시면 됩니다. 표본추출횟수는 무한으로 가정합니다. 표본의 크기만 중요합니다. 이것이 중심극한정리의 핵심입니다. 같은 질문을 하시는 분들이 많아서 조만간 아래와 같은 제목의 영상을 올릴 예정입니다. "표본의 크기입니다. 횟수가 아닙니다. 이 영상을 보고 더 이상 헷갈리지 맙시다." 기다려주세요~
공부 하다 궁금한 점이 있어서 질문 드립니다. * 10,000명의 모집단에서 500명의 표본을 무작위로 추출한 뒤 광고시안 A B C 중에 가장 누르고 싶은 것을 고르도록 합니다. 여기서 선호도는 A>B>C 순으로 나왔습니다. * 이후 같은 모집단에서 500명의 서로 다른 표본 3개를 더 추출한 뒤 각각 광고시안 A, B, C를 노출합니다. 이 때 각 표본에 노출된 광고시안의 전환률도 A>B>C 순이 될까요? 너무 궁금해서 질문 드립니다 ㅠㅠ
통계의 본질 EOStatistics 광고 효율을 판단하는 서비스를 만들어 보려고 구상 중입니다. 각각 노출시켜 전환률을 구하는 대신 하나의 표본에 3가지 광고를 한꺼번에 보여주고 선호도를 구하는 방식으로 표본의 수를 1/3로 줄이면 더 적은 비용과 시간으로 광고 시안의 우열을 가릴 수 있을 것 같아서요. 그렇다면 수학적으로 신뢰도를 구할 수 있다는 것은 어떻게 하는 것인가요?
우리가 뽑은 표본보다 같거나 큰 표본을 뽑을 확률이 0.02라는 것입니다. "정규분포 상에서 엑스바원보다 같거나 큰 부분의 넓이가 0.02다." 주어 = 엑스바원보다 같거나 큰 부분의 넓이 모평균을 A라고 가정한 정규분포를 그렸고, 표본 엑스바원을 뽑았습니다. 이 엑스바원이 정규분포 어느 위치에 있나 본거구요. 엑스바원보다 같거나 큰 표본을 뽑을 확률은 엑스바원 이상인 부분의 넓이입니다. 이 넓이가 너무 작기 때문에 모평균을 A라고 가정한 것 자체가 틀렸다고 주장하는 것입니다.
글이 더 편하신 분
hsm-edu.tistory.com/132
좋은 댓글들이 너무나 많습니다!! 덕분에 많은 것을 알아가고 있습니다 ㅎㅎ 항상 응원하겠습니다~
2:11 쯤에 '이렇게 낮은 확률로 표본이 뽑힐 리가 없으니까 가설이 틀렸다' 라고 말씀해주시는데요.. 갑자기 왜 가설이 틀린 건가요? 너무 많은 내용이 비약되어 있는 것 같습니다 ㅠㅠ
예를 들어 귀무가설로 모집단 평균이 10이다, 대립가설로 모집단 평균이 10이 아니다 라고 했을때
영상의 내용으로 보면 x bar 1으로 11이 나왔는데, 11보다 같거나 큰 값이 나올 확률이 0.02밖에 안되니 모평균이 10이라는 가설은 틀렸다. 라는 말인데.. 이해가 안가네요ㅠㅠ
맞게 이해하신겁니다. 아래 영상 참고하셔요~
ruclips.net/video/qdieWdYpjt0/видео.html
안녕하세요. 강의 잘 봤습니다. 개인적으로 궁금한 점이 있어서 댓글 남깁니다.
충분히 많은 n개의 표본을 뽑았고 그 표본평균은 정규분포를 따르잖아요. 근데 이 때 이 표본 편균의 평균이 이론적으로 모평균과 같다고 저번 강의에서 증명을 해주셨습니다.
그렇다면, 여기서 제 의문은 우리는 특정 샘플 데이터의 정규분포를 가정하고 있고 (CLT가 적용된 것이고 ) n이 충분히 많다는 것이니 표본평균의 평균 = 모평균 아닌지요.
“이미 이론상 표본평균의 평균 = 모평균인데 거기에 또 가설검정을 해야하는 건가...? “ 라는 의문이 들어 질문합니다.
또는 혹시 n이 충분히 많지 않거나, 혹은 모종의 이유로 표본평균의 평균=모평균이 성립하지 않을 수도 있으니까 가설검정으로 이를 보완 설명하는 건가요?
이론상 표본평균의 평균이 모평균이라는 것은. 모평균이 맞게 계산되었고. 그 모집단에서 표본이 뽑힌 것이 확실할 때 성립합니다. 위 사실이 확실한지를 모르기 때문에 검정하는 거구요.
예를 들어보겠습니다.
모평균이 30이라고 알려져있고.
표본을 100개를 뽑았습니다. 평균은 33, 분산은 4 였습니다.
우리가 궁금한 것은 30이라고 알려져있는 모집단 평균이 정말 맞냐는 것입니다.
알려져있는 모집단평균이 맞다면. 우리가 뽑은 표본평균의 평균과 모집단의 평균이 같을 것입니다.
표본평균의 평균 = 모집단 ????
이게 참인지를 검정하는 것입니다.
이게 참이라고 "가정"했을때. 우리가 뽑은 표본이 뽑힐 확률이 매우 낮다면. 그 낮은 확률을 뚫고 뽑힌거야!!라고 주장하는게 아니라 모집단의 평균이 30이라는 것이 잘못된걸거야. 라고 하는게 기각입니다
영상 유용하게 잘보고 있습니다.
z 분포는 0을 기점으로 변환하는것으로 알고 있습니다.
정규 분포를 사용했다는 표현이 맞는것 같습니다
네 감사합니다^^
강의 내용 중에 의문이 있어서 질문드립니다!
표본의 크기가 커서 표본평균의 분포가 정규분포를 따른다 이부분이 확실하게 이해되지 않습니다ㅠ
‘엑스바’의 분포가 정규분포를 이루려면 엑스원바 엑스투바 ~~등등 ‘표본평균’이 많아져야 하는게 아닌가요? 즉 표본의 크기보다 표본을 추출한 횟수가 중요한거 아닌가요?
왜 표본의 크기가 중요한건지 궁금합니다
중심극한정리 강의 9~14를 보시면 됩니다.
표본추출횟수는 무한으로 가정합니다. 표본의 크기만 중요합니다. 이것이 중심극한정리의 핵심입니다.
같은 질문을 하시는 분들이 많아서 조만간 아래와 같은 제목의 영상을 올릴 예정입니다.
"표본의 크기입니다. 횟수가 아닙니다. 이 영상을 보고 더 이상 헷갈리지 맙시다."
기다려주세요~
통계의 본질 EOStatistics 무한으로 가정하는거였군요 감사합니다!! 표본의 크기가 계속 헷갈렸는데 다음 영상 기대할게요 ㅎㅎ
공부 하다 궁금한 점이 있어서 질문 드립니다.
* 10,000명의 모집단에서 500명의 표본을 무작위로 추출한 뒤 광고시안 A B C 중에 가장 누르고 싶은 것을 고르도록 합니다. 여기서 선호도는 A>B>C 순으로 나왔습니다.
* 이후 같은 모집단에서 500명의 서로 다른 표본 3개를 더 추출한 뒤 각각 광고시안 A, B, C를 노출합니다. 이 때 각 표본에 노출된 광고시안의 전환률도 A>B>C 순이 될까요?
너무 궁금해서 질문 드립니다 ㅠㅠ
확률적으로 계산해서 신뢰도를 제시할 수는 있겠지만. "그렇다" 라는 결론을 내릴 수는 없습니다.
보통 그런 상황에서는 AB테스를 하는 것으로 아는데요. 어떤 공부를 하시다 나온 내용인지 알 수 있을까요?
통계의 본질 EOStatistics 광고 효율을 판단하는 서비스를 만들어 보려고 구상 중입니다. 각각 노출시켜 전환률을 구하는 대신 하나의 표본에 3가지 광고를 한꺼번에 보여주고 선호도를 구하는 방식으로 표본의 수를 1/3로 줄이면 더 적은 비용과 시간으로 광고 시안의 우열을 가릴 수 있을 것 같아서요. 그렇다면 수학적으로 신뢰도를 구할 수 있다는 것은 어떻게 하는 것인가요?
통계의 본질 EOStatistics 더불어 A B C 3가지 시안이 아니라 A B 2가지 시안으로 줄이면 선호순서와 전환율 우열이 같아질 확률이 높아질까요?
한번 계산시도를 해보고 답변드리겠습니다. 이번주 안으로 최대한 드려볼게요
통계의 본질 EOStatistics 너무 감사합니다^^ 기다리고 있겠습니다!!
죄송합니다만 이해를 잘 못한거 같아서요. A가 모평균이냐 아니냐 할 때 표본평균의 정규분포에 B/n을 사용하는데 그럼 B는 일단 모분산이 맞다는 조건이 전제되어 있는 건가요?
네 그렇습니다.
근데 실제로 모분산을 아는 경우는 없습니다.
따라서 표본분산을 대신 사용하거나. t분포를 사용합니다. 더 듣다보시면 나옵니다
@@eostatistics 답글 감사합니다! 복많이 받으세요!
X바의 예로서 원소가 100개인 표본을 평균하고, 또 100개를 뽑아 평균하고하여 여러 평균들의 평균인가요?
표본 원소 100개 이상 개이상 뽑고 그 하나의 표본 평균을 사용하면 안되나요?
x바는 표본평균의 확률변수입니다.
E[x바] 가 표본평균의 평균이고 이 값이 모평균과 같습니다
말씀하신것중에 갑자기 중간설명없이 확넘어간것같은 느낌이 들어서 질문드립니다.
표본평균의 분포는 평균이 A 분산이 B인 정규분포를 따른다고 가정했는데, 갑자기 엑스바원보다 같거나 클확률이 0.02랍니다. 주어가 없어요.
뭐가 엑스바원보다 같거나 클확률이 0.02라는거죠?
확률밀도함수에서 엑스바원보다 같거나 큰 부분의 넓이를 0.02로 놓은 것입니다. 아래 링크에 글로 된 설명이 있습니다. 조금 더 자세한 설명인데 읽어봐주셔요.
hsm-edu.tistory.com/132?category=741767
모평균 A가 엑스바원보다 같거나 클확률, 즉 해당부분에 넓이에 있을 확률이 0.02라는 말씀이신가요?
그런데 통계에서는 그럴가능성은 낮다고 보니까 기각하는 거구요?
우리가 뽑은 표본보다 같거나 큰 표본을 뽑을 확률이 0.02라는 것입니다. "정규분포 상에서 엑스바원보다 같거나 큰 부분의 넓이가 0.02다."
주어 = 엑스바원보다 같거나 큰 부분의 넓이
모평균을 A라고 가정한 정규분포를 그렸고, 표본 엑스바원을 뽑았습니다. 이 엑스바원이 정규분포 어느 위치에 있나 본거구요. 엑스바원보다 같거나 큰 표본을 뽑을 확률은 엑스바원 이상인 부분의 넓이입니다. 이 넓이가 너무 작기 때문에 모평균을 A라고 가정한 것 자체가 틀렸다고 주장하는 것입니다.
답변이 오래걸릴것같았는데 빨리, 그리고 친절하고 자세하게 답변해주셔서 감사합니다. 영상 잘보고있습니다. 앞으로도 꾸준히 올려주세요ㅎ
네 감사합니다 ^^
궁금한 것이 있어서 질문 드리게 되었습니다. 다름이 아니라 s^2=v(x(x bar))인가요??
s2은 표본분산인거 같은데요
우변의 x(xbar)는 뭔가요?
E(xbar) 표본평균를 말씀하시는건가요?
@@eostatistics 아 그냥 xbar라고 쓰면 되는데 잘못 썻습니다. v(x bar)입니다. 표본 분산과 = v(x bar)이 맞는지 궁금합니다.
s2 을 표본분산의 의미로 사용하셨다면
등호가 성립하지 않습니다. 우변은 표본평균의 분산입니다.
@@eostatistics 항상 감사합니다ㅠㅠ
그런데 왜 엑스1바 보다 큰쪽의 확률을 보고 판단하는건가요?ㅠㅠ
답변입니다^^곧 영상도 올라옵니다
hsm-edu.tistory.com/989
왤케 복잡하죠