Wartość p to ilościowe przedstawienie dowodów przeciwko hipotezie zerowej. Ta ilość jest zawsze z przedziału [0,1] a więc jest prawdopodobieństwem. To zdanie ładnie oddaje sens p-value. Przy przykładzie z monetą, jeśli H0 to "jest symetryczna" to prawdopodobieństwo liczymy tak naprawdę dwustronne, bo nie wiadomo, czy Orzeł jest obciążony czy Reszka. Czyli p = 2*(100 \choose 8)/2^{10}.
Cześć, wydaje mi się, że p-value jest trochę czymś innym. To znaczy jest to (prawdopodobieństwo otrzymania naszego wyniku + prawdopodobieństwo otrzymania wyniku tak samo prawdopodobnego + prawdopodobieństwo otrzymania mniej prawdopodobnego wyniku). Jeśli zrobimy jak napisałeś, to pominiemy tę trzecią część. Na przykład można pomyśleć w eksperymencie z monetą, że rzuciliśmy nią baaardzo dużo razy. Wtedy prawdopodobieństwo tego (przy założeniu, że hipoteza zerowa jest prawdziwa), że dokładnie połowa z nich to będą orły też pewnie będzie mniejsze niż 0.05, bo masa prawdopodobieństwa się intuicyjnie bardzo rozpłaszczy. A wiadomo, że przy takim wyniku odrzucenie hipotezy zerowej jest bezsensowne. Czyli możemy o p-value myśleć jako o mierzeniu wyjątkowości naszego zdarzenia. To znaczy sytuacja, że 8 orłów i 92 reszek jest wyjątkowa, ale tak samo wyjątkowe jest 8 reszek i 92 orły, co ujmuje wyjątkowości naszym 8 orłom. A biorąc pod uwagę, że mogliśmy wylosować np. 6 orłów i 94 reszki, co jest jeszcze bardziej wyjątkowe (jeszcze mniej prawdopodobne) to nasze 8 orłów staje się przy tym jeszcze mniej wyjątkowym. Podsumowując wylosowanie dajmy na to 0.5 z rozkładu jednostajnego wcale takie wyjątkowe nie jest. :)
@@krzysztofm4847 to znaczy w przypadku rzutów monetą, rzucamy 100 razy, i jeśli wynik to 8 reszek i 92 orły, to p-value jest prawdopodobieństwem, że otrzymamy taki lub bardziej "ekstremalny" wynik czyli prawdopodobieństwo wyrzucenia 8 reszek i 92 orłów lub 7 reszek i 93 orłów lub 6 reszek i 94 orłów ... lub 0 reszek i 100 orłów ALE - ponieważ H0 brzmi "moneta jest symetryczna" to również plus prawdopodobieństwo 8 orłów i 92 reszek lub 7 orłów i 93 reszek ... lub 0 orłów i 100 reszek. To jakby test obustronny w tym wypadku. Na filmie nie wchodziłem w takie szczegóły.
@@pianoplayer281 Tak, wtedy wydaje mi się, że wtedy zdanie: "Czyli p = 2*(100 \choose 8)/2^{10}" jest nieprawdziwe. Wydaje mi się, że to jest warty doprecyzowania szczegół, bo np. w sytuacji z poprzedniego mojego komentarza w drugim akapicie: Jeśli będziemy liczyć p-value sposobem, jaki jest powiedziany przed 4:18 w filmie otrzymamy, że p-value jest małe (że jest prawdopodobieństwem, że przy 10000 rzutach symetryczną monetą otrzymamy dokładnie połowę reszek i połowę orłów), a wiemy, że prawdziwe p-value wynosi wtedy 1. Ogólnie nie jestem jakimś ekspertem od p-value, nie jestem w 100 procentach pewny, wydaje mi się jedynie, że coś tu się nie zgadza. :)
Czy liczbę 0,05 bądź inną nazywa sie marginesem błędu? Tak mi intuicja podpowiada by to nazwac. Niemniej, niezaleznie od nazwy, czy bierze sie pod uwagę "margines błędu marginesu błędu" np. wychodzi przy wielu próbach 0,0524, więc teoretycznie mamy wynik powyżej a z drugiej strony caly czas wychodzi bardzo maly wiec zdaje sie ze mimo to daje oczekiwany rezultat
@@tysiak6756 ta liczba to poziom ufności. Powinieneś wykonać jedną próbę, to znaczy raz robić eksperyment z lekiem oraz raz rzucać 100 razy. Bo jeśli otrzymamy małe p-value - czyli małe prawdopodobieństwo otrzymania tak skrajnego wyniku - to to oznacza że albo faktycznie H0 jest do odrzucenia albo mieliśmy olbrzymiego pecha i H0 jest prawdziwa - czyli moneta symetryczna - ale mimo wszystko wypadło nam 92 reszek… i jeśli takich serii 100 rzutów symetryczna moneta wykonamy bardzo wiele to kiedyś natrafimy nawet na taki przypadek że otrzymamy te 92 reszki. Dlatego powinno się eksperyment wykonać raz, a nie tyle aż p-value nas zadowoli. Jeśli p-value wyszło blisko poziomu ufności, to zrób 200 rzutów albo 1000 ale w jednym eksperymencie. To znaczy bierz wszystkie otrzymane wyniki a nie wybieraj najlepszych stu spośród tysiaca. A teraz odpowiadając na Twoje pytanie: masz rację, poziom ufności czyli 0,05 ustala się z góry. I przyjęło się że jest to zazwyczaj właśnie 0,05 jeśli chodzi o artykuły naukowe. Czasami można spotkać 0,01 - to jest jeszcze bardziej pewne. Ale tak naprawdę jeśli robisz eksperyment dla siebie w swoim domu i jeśli wyjdzie Ci p-value 0,0534 to i tak Cię to przekonuje ku odrzuceniu H0 mimo że jest to powyżej poziomu ufności. Natomiast jeśli trzeba by było opublikować twój eksperyment w artykule naukowym, to lepiej żeby zrobić jeszcze jedną próbę a później jeszcze jedną aż w końcu wyjdzie poniżej 0,05 żeby móc napisać „odrzucamy H0 na poziomie ufności 0,05” tylko ze względów estetycznych. A z kolei czasami takie powtarzanie eksperymentu dopóki p-value nas zadowoli jest naciąganiem.
Ja zawsze się gubiłem, czy odrzucamy h0 gdy p-value > alfa czy mniejsze to w końcu zapamiętałem prostą mnemotechnike: "Jeżeli p-value jest bardzo małe to nie ma k*rwa matematycznych możliwości na h0" Pozdrawiam
Dobrze powiedziane :) Aczkolwiek, mimo że prawdopodobieństwo wychodzi małe, nie znaczy to że to jest niemożliwe... i to niekiedy jest wykorzystywane przez fake-artykuły. No bo przecież nikt w swojej pracy nie chce mieć napisane na końcu "nie ma podstaw do odrzucenia hipotezy H0" (czyli równoważnie "nic nie udało mi się udowodnić..."). Każdy chce mieć zakończenie "czyli odrzucamy hipotezę H0 na rzecz H1". I powtarzają eksperyment dopóki p-value będzie mała. Biorąc ufność = 0.05 średnio raz na 20 razy p-value wyjdzie mała. I wtedy dopiero publikowany jest artykuł nie wspominając oczywiście o 19 pozostałych próbach... :)
P-value nie tyle mówi że nasz event jest bardzo mało prawdopodobny, a że uzyskanie eventu takiego jak nasz LUB mniej prawdopodobnego (najczęściej bierze się wartości z dwóch stron rozkładu prawdopodobieństwa) od naszego jest bardzo małe, swoją drogą to temat p-value jest bardzo kontrowersyjnym tematem
Tak wszystko się zgadza to co mówisz. Nie wchodziłem w te szczegóły na filmie przekłamując tak naprawdę czym jest p-value. Tłumaczę to w innym komentarzu dokładnie jak znaleźć to prawdopodobieństwo w przypadku 100 rzutów. Wartość z jednej strony rozkładu byłaby na przykład gdyby H0 brzmiała tak: orly wypadają rzadziej niż reszki. To prawda o kontrowersyjności. We wspomnianym komentarzu też tłumaczę, że można powtarzać eksperyment dopóki p-value nas zadowoli.
bardzo się podoba poprosimy więcej
Wartość p to ilościowe przedstawienie dowodów przeciwko hipotezie zerowej. Ta ilość jest zawsze z przedziału [0,1] a więc jest prawdopodobieństwem. To zdanie ładnie oddaje sens p-value.
Przy przykładzie z monetą, jeśli H0 to "jest symetryczna" to prawdopodobieństwo liczymy tak naprawdę dwustronne, bo nie wiadomo, czy Orzeł jest obciążony czy Reszka. Czyli p = 2*(100 \choose 8)/2^{10}.
Cześć, wydaje mi się, że p-value jest trochę czymś innym. To znaczy jest to (prawdopodobieństwo otrzymania naszego wyniku + prawdopodobieństwo otrzymania wyniku tak samo prawdopodobnego + prawdopodobieństwo otrzymania mniej prawdopodobnego wyniku). Jeśli zrobimy jak napisałeś, to pominiemy tę trzecią część.
Na przykład można pomyśleć w eksperymencie z monetą, że rzuciliśmy nią baaardzo dużo razy. Wtedy prawdopodobieństwo tego (przy założeniu, że hipoteza zerowa jest prawdziwa), że dokładnie połowa z nich to będą orły też pewnie będzie mniejsze niż 0.05, bo masa prawdopodobieństwa się intuicyjnie bardzo rozpłaszczy. A wiadomo, że przy takim wyniku odrzucenie hipotezy zerowej jest bezsensowne.
Czyli możemy o p-value myśleć jako o mierzeniu wyjątkowości naszego zdarzenia. To znaczy sytuacja, że 8 orłów i 92 reszek jest wyjątkowa, ale tak samo wyjątkowe jest 8 reszek i 92 orły, co ujmuje wyjątkowości naszym 8 orłom. A biorąc pod uwagę, że mogliśmy wylosować np. 6 orłów i 94 reszki, co jest jeszcze bardziej wyjątkowe (jeszcze mniej prawdopodobne) to nasze 8 orłów staje się przy tym jeszcze mniej wyjątkowym.
Podsumowując wylosowanie dajmy na to 0.5 z rozkładu jednostajnego wcale takie wyjątkowe nie jest. :)
@@krzysztofm4847 to znaczy w przypadku rzutów monetą, rzucamy 100 razy, i jeśli wynik to 8 reszek i 92 orły, to p-value jest prawdopodobieństwem, że otrzymamy taki lub bardziej "ekstremalny" wynik czyli prawdopodobieństwo wyrzucenia 8 reszek i 92 orłów lub 7 reszek i 93 orłów lub 6 reszek i 94 orłów ... lub 0 reszek i 100 orłów ALE - ponieważ H0 brzmi "moneta jest symetryczna" to również plus prawdopodobieństwo 8 orłów i 92 reszek lub 7 orłów i 93 reszek ... lub 0 orłów i 100 reszek. To jakby test obustronny w tym wypadku. Na filmie nie wchodziłem w takie szczegóły.
@@pianoplayer281 Tak, wtedy wydaje mi się, że wtedy zdanie: "Czyli p = 2*(100 \choose 8)/2^{10}" jest nieprawdziwe.
Wydaje mi się, że to jest warty doprecyzowania szczegół, bo np. w sytuacji z poprzedniego mojego komentarza w drugim akapicie: Jeśli będziemy liczyć p-value sposobem, jaki jest powiedziany przed 4:18 w filmie otrzymamy, że p-value jest małe (że jest prawdopodobieństwem, że przy 10000 rzutach symetryczną monetą otrzymamy dokładnie połowę reszek i połowę orłów), a wiemy, że prawdziwe p-value wynosi wtedy 1.
Ogólnie nie jestem jakimś ekspertem od p-value, nie jestem w 100 procentach pewny, wydaje mi się jedynie, że coś tu się nie zgadza. :)
@@krzysztofm4847 zgadzam się z tym co piszesz :) dzięki :)
@@pianoplayer281 Miłego weekendu! :)
Czy liczbę 0,05 bądź inną nazywa sie marginesem błędu? Tak mi intuicja podpowiada by to nazwac. Niemniej, niezaleznie od nazwy, czy bierze sie pod uwagę "margines błędu marginesu błędu" np. wychodzi przy wielu próbach 0,0524, więc teoretycznie mamy wynik powyżej a z drugiej strony caly czas wychodzi bardzo maly wiec zdaje sie ze mimo to daje oczekiwany rezultat
@@tysiak6756 ta liczba to poziom ufności. Powinieneś wykonać jedną próbę, to znaczy raz robić eksperyment z lekiem oraz raz rzucać 100 razy. Bo jeśli otrzymamy małe p-value - czyli małe prawdopodobieństwo otrzymania tak skrajnego wyniku - to to oznacza że albo faktycznie H0 jest do odrzucenia albo mieliśmy olbrzymiego pecha i H0 jest prawdziwa - czyli moneta symetryczna - ale mimo wszystko wypadło nam 92 reszek… i jeśli takich serii 100 rzutów symetryczna moneta wykonamy bardzo wiele to kiedyś natrafimy nawet na taki przypadek że otrzymamy te 92 reszki. Dlatego powinno się eksperyment wykonać raz, a nie tyle aż p-value nas zadowoli. Jeśli p-value wyszło blisko poziomu ufności, to zrób 200 rzutów albo 1000 ale w jednym eksperymencie. To znaczy bierz wszystkie otrzymane wyniki a nie wybieraj najlepszych stu spośród tysiaca.
A teraz odpowiadając na Twoje pytanie: masz rację, poziom ufności czyli 0,05 ustala się z góry. I przyjęło się że jest to zazwyczaj właśnie 0,05 jeśli chodzi o artykuły naukowe. Czasami można spotkać 0,01 - to jest jeszcze bardziej pewne. Ale tak naprawdę jeśli robisz eksperyment dla siebie w swoim domu i jeśli wyjdzie Ci p-value 0,0534 to i tak Cię to przekonuje ku odrzuceniu H0 mimo że jest to powyżej poziomu ufności. Natomiast jeśli trzeba by było opublikować twój eksperyment w artykule naukowym, to lepiej żeby zrobić jeszcze jedną próbę a później jeszcze jedną aż w końcu wyjdzie poniżej 0,05 żeby móc napisać „odrzucamy H0 na poziomie ufności 0,05” tylko ze względów estetycznych. A z kolei czasami takie powtarzanie eksperymentu dopóki p-value nas zadowoli jest naciąganiem.
Ja zawsze się gubiłem, czy odrzucamy h0 gdy p-value > alfa czy mniejsze to w końcu zapamiętałem prostą mnemotechnike:
"Jeżeli p-value jest bardzo małe to nie ma k*rwa matematycznych możliwości na h0"
Pozdrawiam
Dobrze powiedziane :)
Aczkolwiek, mimo że prawdopodobieństwo wychodzi małe, nie znaczy to że to jest niemożliwe... i to niekiedy jest wykorzystywane przez fake-artykuły. No bo przecież nikt w swojej pracy nie chce mieć napisane na końcu "nie ma podstaw do odrzucenia hipotezy H0" (czyli równoważnie "nic nie udało mi się udowodnić..."). Każdy chce mieć zakończenie "czyli odrzucamy hipotezę H0 na rzecz H1". I powtarzają eksperyment dopóki p-value będzie mała. Biorąc ufność = 0.05 średnio raz na 20 razy p-value wyjdzie mała. I wtedy dopiero publikowany jest artykuł nie wspominając oczywiście o 19 pozostałych próbach... :)
P-value nie tyle mówi że nasz event jest bardzo mało prawdopodobny, a że uzyskanie eventu takiego jak nasz LUB mniej prawdopodobnego (najczęściej bierze się wartości z dwóch stron rozkładu prawdopodobieństwa) od naszego jest bardzo małe, swoją drogą to temat p-value jest bardzo kontrowersyjnym tematem
Tak wszystko się zgadza to co mówisz. Nie wchodziłem w te szczegóły na filmie przekłamując tak naprawdę czym jest p-value. Tłumaczę to w innym komentarzu dokładnie jak znaleźć to prawdopodobieństwo w przypadku 100 rzutów. Wartość z jednej strony rozkładu byłaby na przykład gdyby H0 brzmiała tak: orly wypadają rzadziej niż reszki. To prawda o kontrowersyjności. We wspomnianym komentarzu też tłumaczę, że można powtarzać eksperyment dopóki p-value nas zadowoli.