Testowanie normalności rozkładu

Поделиться
HTML-код
  • Опубликовано: 18 окт 2024

Комментарии • 4

  • @quegon6125
    @quegon6125 11 месяцев назад +3

    W teście Kołmogorowa-Smirnowa wyskakuje mi komunikat, że wartości powtórzone nie powinny być obecne w teście Kolmogorowa-Smirnowa. Rozumiem, że muszą to być tylko wartości unikalne?

    • @zArkadiuszem
      @zArkadiuszem  11 месяцев назад

      Tak. Pojawia się takie ostrzeżenie. Błędem byłoby tu usunięcie duplikatów - to by zmieniało nasz testowany rozkład empiryczny. Sensowne wydaje mi się natomiast dodanie do duplikatów bardzo małej liczby losowej (to sprawi, że dla testu będą się one różnić). np. z przedziału -0.0001; +0.0001 (chyba, że sama zmienna przyjmuje bardzo małe wartości - wtedy wartość losowa powinna być jeszcze mniejsza).
      Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test. Test Shapiro Wilka został zmodyfikowany tak, że teraz (wersja z R funkcja shapiro.test()) można go stosować także do dużych prób (3 - 5000). Jeśli ma Pan/Pani próbę większą niż 5000 - to polecam ocenę wzrokową w oparciu o stosowne wykresy. Pozdrawiam

    • @acha10000
      @acha10000 8 месяцев назад

      Mam ten sam problem co @quegon6125
      @@zArkadiuszem rozumiem, że skoro u Pana ten test dziala, to Pan ma zmodyfikowany plik? Może Pan go gdzieś udostępnić? Chętnie bym poćwiczyła.
      Podobny komunikat wyskakiwał mi, gdy próbowałam test Wilcoxona i pojawiały się powtórzone wartości. Czy R nie jest odporny na takie sytuacje (dla przykładu LabVIEW nie ma z tym problemu)? Jeśli tak, to jest to jego bardzo poważne ograniczenie, bo jeśli chcemy zautomatyzować pracę, to ciężko nam zakładać brak powtórzeń, a ocena wzrokowa nie jest oceną obiektywną i nie daje się zautomatyzować. Ręczne wyszukiwanie tych samych próbek i modyfikacji ich wartości w zbiorze bardzo dużych danych nie wchodzi w rachubę.

    • @zArkadiuszem
      @zArkadiuszem  8 месяцев назад +1

      R to w znacznej mierze zbiór pakietów - jeśli coś można poprawić - zasadne jest dodanie (stworzenie) nowego pakietu. R rozwija się właśnie przez taką pracę ludzi zainteresowanych tematem. Tu powtórzę wcześniejszą sugestię: "Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test". @@acha10000