- Видео 3
- Просмотров 123 367
Loren Araujo
Добавлен 1 фев 2012
Detección y Reemplazo de Valores Ausentes con RStudio!
En este video muestro cómo detectar y reemplazar valores NA (valores ausentes) en un conjunto de datos, usando el software estadístico Rstudio.
Espero les sea útil!!
No olviden suscribirse y No dejen de comentar!!
Espero les sea útil!!
No olviden suscribirse y No dejen de comentar!!
Просмотров: 17 994
Видео
Series Temporales
Просмотров 22 тыс.8 лет назад
En este video les explico cómo llevar a cabo un análisis de series temporales básico empleando el software estadístico RStudio. ¡Espero les sirva de apoyo!... ¡No olviden suscribirse! Saludos.
Análisis de Componentes Principales con RStudio Paso a Paso!
Просмотров 83 тыс.8 лет назад
En este video muestro detalladamente cómo realizar el correspondiente preprocesamiento de los datos y el empleo de la técnica descriptiva Análisis de Componentes Principales empleando el software estadístico RStudio. La data utilizada está disponible en inglés pero la traduje al español... la pueden descargar dando click en el siguiente link: archive.ics.uci.edu/ml/machine-learning-databases/00...
Me ha gustado mucho su enfoque y estilo de mostrar los detalles..!
👎👎👎 Muy malo.
Súper bueno el vídeo.
¿Me parece que, en alguna parte del procesamiento, se realizó Análisis Factorial o eso es otra cuestión que no está incluido aquí?.
Muchas gracias Loren por tu video, lo he seguido al pie de la letra con una base que trabajaba y ya puedo hacer mejor comparaciones de los datos. Ojalá puedas volver a youtube
Hola. Dentro de mis variables, tengo algunas categóricas, ¿cómo puedo incluir estas variables al análisis de componenetes principales?
hello I congratulate you on your work.
Me necnato esta explicacion super clara!! muchisimas gracias!!! pero Tengo una duda. Habia leido que la funcion PRCOMP solo aplica para conjunto de dados cuantitativos pero entiendo que si bien la region posee una valor numerico, no deja de ser una etiqueta, y su valor en si no reprensenta valor critico o ponderacion por si misma, es por ello que al inclirla dentro del analisis de componentes principales no se estaria incurriendo en en un error? y de ser asi no se deberia llevar otro metodo de analisis para variables cuantitativas y otro para variables cualitativas? desde ya muchas gracias!!
Muy bien explicado. Además me gusta como interpreta los gráficos.
Excelente video muy bien explicado! Gracias
Loren donde conseguiste la base de datos con la que estas trabajando?
Excelente Video. Fijate que estoy haciendo una reducción de dimensionalidad en variables Macroeconomicas, para contar con un indicador sintético de la actividad económica para un Nowcasting del PIB y tengo dudas, si no será necesario estandarizar las variables como tu mencionas y en vez de esos hacer todas los cálculos a parir de las variaciones interanuales de cada una de las variables. Por otra parte, me queda la duda de que utilizar para el cálculo de los valores y vectores propios, si la matriz de varianzas-covarianzas o la de correlaciones y en el caso de las correlaciones, si utilizar, pearson o spearman. Agradezco tus comentarios. Saludos desde Honduras.
Hola cómo puedo hacer con notas de colegio por estudiantes de cada asignatura.
Hola, si yo solo quisiera hacer la correlación de una columna x con otra columna Y, como seria la linea de codigo por favor.
Hola Loren! Muy interesante y clara tu explicación de la técnica. Pero tengo un comentario respecto de la inclusión de las variables Región y Canal, ya que esta técnica sólo admite variables medidas en escalas métricas (intervalos o proporciones). Y estas dos mencionadas, no lo están. Por el contrario, están expresadas en escala categórica. Y sobre este tipo de escalas no es posible aplicar operaciones aritméticas. Mucho menos, escalar o estandarizarlas. Además, desde el punto de vista del tratamiento estadístico, estás intentando calcular media y varianza a una variable categórica. (Es comí intentar calcular el promedio al sexo) Cosa imposible. Independientemente que, en el file hayas representado las categorías con números, no lo son y no pueden ser operados como tales. Por otro lado, el ACP y, en general, los métodos multivariantes, hacen un homomorfismo entre las matrices de datos y las "nubes de puntos" en un espacio multidimensional donde cada dimensión está asociada, desde uno de dos posibles puntos de vista, a cada una de las variables. Y los individuos (o casos) se representan en ese espacio tomando como coordenada el valor que toma cada individuo en cada variable. Así entonces, como, por definición de la escala de medida (de intervalos o proporciones) en las que están medidas las variables, en todas las dimensiones asociadas al hiperespacio asociado a las variables y que el ACP pretende "reducir" no es posible introducir variables categóricas, como Región o Canal, porque en el sentido de esa dimensión la continuidad no existiría. Sólo generaría subespacios de dimensión menor. Sí es posible combinar variables medidas en diferentes escalas mediante Análisis de Correspondencias Simples (ACOBI) o Múltiples (ACOMP), que, en pocas palabras, para el ACOBI, realiza un doble ACP pero sobre una matriz de frecuencias y las asocia mediante las llamadas relaciones cuasi baricéntricas. Lo que implica, para las variables medidas en escalas métricas, categorizarlas y contar las frecuencias de cada categoría. Voy a mirar con sumo interés tus videos sobre ésta y otras técnicas también. Tanto en mi vida como alumno, hace ya muchos años, como profesor especialmente de Análisis Multivariante Continuo y Discreto, como Estadística no Paramétrica, recibí y puse mucho cuidado en el tratamiento adecuado de los datos según cómo fueron recolectados y medidos. Y más aún en mi vida actual como analista de datos (prefiero ser llamado así y no "data scientiest"). Mil disculpas por no presentarme al principio: Soy Néstor Martínez Estadístico, graduado en la Escuela de Estadística de la Universidad Nacional de Rosario Doctorat 3ème Cycle Université Montpéllier II
Muchas gracias por la información, fue muy útil
Las dos primeras variables no son categóricas???
hola loren , en la database de discoveries me sale valores Na`s xq? como se los elimina??
Cuáles son los valores de cp1,2 y 3?
Hola, disculpa soy nuevo, no puedo sacar la varianza, me dice error argumento no numerico para operador binario, ¿alguna idea?
Buen video, sería interesante ver otras técnicas para imputación MCAR, MAR, NMAR
Excelente vídeo como puedo obtener esa base de datos de JohnsonJohnson, co2, y las que mencionas en el vídeo por favor weimar_9@hotmail.com
Para los primeros datos con el comando data(JohnsonJohnson), para los segundos en este enlace se puede descargar www.dropbox.com/s/zugg2443hlq7z6z/co2.csv?dl=0
@Loren Araujo, Con este modelo, será posible predecir la deforestación futura de un área determinada?
Excelente. Muy completo
Excelente Loren, gracias por tu aporte. Acabo de culminar un curso de R, y me toca practicar y practicar para dominar tantas librerías y funcionalidades de la herramienta! Si conoces alguna comunidad spanish que me puedas sugerir te lo agradezco. Saludos!
¿La normalizacion tambien se realiza con scale. = TRUE)?
¿Como se puede conocer la significancia de cada correlacion?
Excelente explicación. Tengo una pregunta. Si yo seleccioné 5 componentes, como puego graficar, por ejemplo el componente 1 con el 5?. o el 2 con el 4?. Como le indico esto a R?. Muchas gracias :)
Dado que las representaciones solo son en dos planos, tienes que ir seleccionando las parejas que quieras graficar, excluyendo con el signo - aquellas dimensiones que no quieras graficar.
Muy buen video, solo que reomendaria la función "ggtsdisplay" del paquete "forecast" para graficar los resagos.
Muchas gracias profesora , tiene un nuevo suscriptor, me ayudo mucho con mi carrera de Analasis de Datos
Hola Adrián! No soy profesora, pero me alegra que te haya sido de ayuda el video. Saludos.
Hola Loren!! Muchas gracias por el vídeo Me gustaría poder hacerle una pregunta : en los diagramas de cajas y bigotes , que interpretación tendría todos juntos, que magnitud y aceleración por ejemplo al tener menos dispersión significa que son los datos más homogéneos que tenemos a diferencia de station y dist? Y si en station por ejemplo la mediana está más cerca de q3 significa significa siempre que los datos presentan asimétria a la derecha (negativa) o puede pasar que tenga asimetría positiva aún teniendo ese esquema ?
Excelente Loren, esta bien explicado para complementar la practica se requiere el archivo de datos con el que se realiza el trabajo, para lo cual le agradezco por anticipado si me enviara dicho archivo angel_mm50@hotmail.com
Hola Angel, si observas con detenimiento, la data que uso en el estudio es una data propia de R, por tanto no necesitas cargar ningún archivo. Sólo carga la data como lo hago en el video. Saludos.
Gracias por la aclaración Loren, sigue adelante
Me gusto tu video, gracias!! por cierto, estas muy linda...
Muchas gracias por tu video, está excelente, tengo dudas con proyección de estructuras latentes, no sé si tengas algún ejemplo que nos puedas suministrar, muchas gracias!!
como podemos saber la significancia de las correlaciones?
Aquí lo explico un poco: ruclips.net/video/uEcvj7C35ho/видео.html
Humildemente te digo que este vídeo esta malo, el procedimiento que usaste es incorrecto, no estas trabajando con ninguna componente principal, erróneamente trabajaste con los vectores propios, CP1, CP2 y CP3 son los ventores propios, si quieres, compruébalo usando la función eigen().
Hola Loren, Gracias, muy buena información. Es posible contactarte para clases particulares pagadas? Saludos!
Me gusto mucho tu video y tu explicación impecable, no sabes cuanto me ayudó en terminar mi tesis 🙏🏻
Humildemente te digo que este vídeo esta malo, el procedimiento que usaste es incorrecto, no estas trabajando con ninguna componente principal, erróneamente trabajaste con los vectores propios, CP1, CP2 y CP3 son los ventores propios, si quieres, compruébalo usando la función eigen().
son geniales tus videos!! gracias
Me gusta, explicas muy bien, claro preciso y conciso. me gustaria tener los otros video del curso.
Estimada Loren agradezco tus videos me han ayudado muchisimo en interpretar las series temporales y si pudieras seguir sería grandioso. muchas gracias
Muchas gracias por el video, excelentemente explicado. Me salvó la vida.
Humildemente te digo que este vídeo esta malo, el procedimiento que usaste es incorrecto, no estas trabajando con ninguna componente principal, erróneamente trabajaste con los vectores propios, CP1, CP2 y CP3 son los ventores propios, si quieres, compruébalo usando la función eigen().
Clarito, gracias!!
você conhece a abordagem GYT biplot?
Excelente vídeo, buena explicación. Saludos!!
tienes algún video de análisis de conglomerados?
Maravilloso contenido, creo que sobra el paso de elevar la desviación tipica al cuadrado, pues un numero menor de uno al cuadrado no podrá dar más de la unidad. saludos y muchas gracias por el video.
Muy bueno. Ya existen Análisis de Componentes de principales espaciales para vincular datos de coordenadas. Saludos
Muy bueno me sirvió
¿Se pueden cambiar los números por los nombres de los individuos/clientes? ¿Cómo se hace?