Pruebas de normalidad en R (pruebas estadísticas y gráficos)
HTML-код
- Опубликовано: 2 ноя 2024
- _______________________________________________________
Script del video y bases de datos: github.com/Dam...
_______________________________________________________
Descarga R: cran.r-project...
Descarga R Studio: rstudio.com/pr...
_______________________________________________________
Marcas de tiempo:
2:40 Shapiro-Wilk - shapiro.test()
3:38 ¿Qué es el valor de P?
5:10 Kolmogorov-Smirnov - ks.test()
6:50 Kolmogorov-Smirnov con corrección de Lilliefors - lillie.test() (requiere paquetería 'nortest')
7:33 Anderson-Darling, Cramer-von Mises, Chi cuadrada de Pearson, Shapiro-Francia - (requieren paquetería 'nortest')
8:44 Histograma - hist()
9:10 Gráfico cuantil-cuantil - qqnorm() + qqline()
10:01 Gráfico de Crawley - crawley.plot() (requiere copiar la función del gráfico de las páginas 232-233 del libro de Crawley (2013) - descarga el libro gratuitamente en el vínculo proporcionado en la sección "Referencias")
_______________________________________________________
Referencias
Crawley, M. J. (2013). The R book. 2nd Ed. John Wiley & Sons. Descarga gratuita en: 93.174.95.29/main/E09DB860B99F0710EC5746796C101D59
Crawley, M. (2014). Statistics: an introduction using R. 2 Ed. West Sussex, UK: John Wiley & Sons Ltd. 357 pp. Descarga gratuita en: libgen.lc/ads....
Ghasemi, A., & Zahediasl, S. (2012). Normality tests for statistical analysis: a guide for non-statisticians. International journal of endocrinology and metabolism, 10(2), 486-489. DOI: doi.org/10.581...
Pedrosa, I., Juarros-Basterretxea, J., Robles-Fernández, A., Basteiro, J., & García-Cueto, E. (2015). Pruebas de bondad de ajuste en distribuciones simétricas,¿ qué estadístico utilizar?. Universitas psychologica, 14(1), 245-254.
Razali, N. M., & Wah, Y. B. (2011). Power comparisons of shapiro-wilk, kolmogorov-smirnov, lilliefors and anderson-darling tests. Journal of statistical modeling and analytics, 2(1), 21-33.
Steinskog, D. J., Tjøstheim, D. B., & Kvamstø, N. G. (2007). A cautionary note on the use of the Kolmogorov-Smirnov test for normality. Monthly Weather Review, 135(3), 1151-1157.
Yap B. W. & Sim C. H. (2011) Comparisons of various types of
normality tests, Journal of Statistical Computation and Simulation, 81:12, 2141-2155. DOI:
10.1080/00949655.2010.520163.
_______________________________________________________
Libro Statistics: and introduction using R (Crawley, 2014) y sus bases de datos: github.com/Dam...
Libro The R Book (Crawley, 2013) y sus bases de datos: github.com/Dam...
Michael J. Crawley es profesor investigador del Colegio Imperial de Londres, en el departamento de Biología Evolutiva y Ecología ( • Video ).
___________________________________________________________________
Video editado en ActivePresenter, descarga gratuita en: atomisystems.c...
Mis felicitaciones. Que emoción cuando no se tiene expectativas, pero se encuentra con tremenda clase. Tus fortalezas eson el sustento con las referencias y las distintas formas de interpretación con las herramientas variadas. Excelente.
¡Muchas gracias!
Extraordinario video, muchas gracias
Tremendo video, super claro y bien referenciado. El mejor que he visto
Excelente video y con muy buenas referencias que avalan lo dicho, muchas gracias!!
Muy buen video, super like
Excelente aportación, súper facil de entender, gracias.
Excelente vídeo, muy didáctico, gracias.
Muchas gracias , buena explicación
Qué hermoso explicas.
Excelente vídeo, muy bien explicado.
Excelente video, en verdad sigue así
¡Muchas gracias por compartir tu conocimiento, estimado Damián V! Estoy analizando un "modelo de regresión lineal múltiple", que tiene variables numéricas y dummy (si/no). Si el supuesto de normalidad no se cumple (residuales), al "transformar" el modelo ¿debería verificar, si en esta ocasión, se cumple el supuesto de normalidad?
Si ya comprobaste que los residuales "no son normales", tocaría utilizar una distribución de error diferente a la normal. Por ejemplo, si tu variable de respuesta son conteos (números enteros = numérica discreta), entonces sugeriría que utilizaras una distribución de error tipo Poisson.
Hola Damián, tengo una duda, las pruebas de normalidad las hizo con los datos brutos, deberías haber utilizado los residuos o me equivoco? Ese dilema siempre lo veo, unos calculan con datos brutos y otros con residuales... me aclara por favor. Gracias!
¡Buenas! En el video yo quise corroborar si mi variable de respuesta se ajustaba a una distribución de error normal, por lo tanto utilicé los datos brutos. Si por el contrario, tras correr un modelo (independientemente de la distribución de error que utilices, puede ser normal, poisson, quasipoisson, binomial, negativa binomial, gamma), quieres saber si tu distribución de error utilizada se ajusta a tus datos, entonces puedes correr una prueba de normalidad con los residuales. Si los residuales se ajustan, entonces la distribución de error que utilizaste es estadísticamente adecuada para tus datos, de lo contrario tienes suficiente evidencia para correr tu modelo con otra distribución de error. Más información sobre cómo y cuando utilizar los residuales la puedes encontrar en la página 568 de "The R Book" (Crawley, 2013): github.com/Damian-VA/Tutoriales-R/blob/main/Crawley%20(2013)%20book%20%2B%20databases/The%20R%20Book%202nd%20Ed%20(Crawley%2C2013).pdf
Muchas gracias :)
Que video tan excelente, solo una consulta, cuando realizo las pruebas siempre el P me sale con este valor p-value < 2.2e-16, por cualquier de los métodos, es correcto?, los datos son numéricos y tiene NA´s
Cuando el valor de P es altamente significativo, R te dice que es menor a 2.2e-16, pero eso es por el límite de la sintaxis del programa, la manera en como lo interpretas sería algo así como: "el valor de P es altamente significativo (P
muchas gracias Damian, favor una aclaración mas las pruebas los estoy aplicando a una serie de tiempos (45 estaciones climáticas cada una con 360 observaciones), el p-value me sale de todas ese valor, e interpretando entonces la prueba de la hipótesis nula se rechazan verdad?, los datos no presentan una distribución normal, estoy correcto?
@@juancarlosverabarja4876 Así es, tus datos no presentan una distribución normal. Puede ser que tengan una distribución Poisson (si es que hay muchos valores pequeños, por ejemplo muchos valores cercanos al cero, y muy pocos valores grandes).
MAS VIDEOS ASI..!! GRACIAS..!!!!!
Se ve muy pequeño. Por favor agranda la letra.