Loren Araujo
Loren Araujo
  • Видео 3
  • Просмотров 123 367
Detección y Reemplazo de Valores Ausentes con RStudio!
En este video muestro cómo detectar y reemplazar valores NA (valores ausentes) en un conjunto de datos, usando el software estadístico Rstudio.
Espero les sea útil!!
No olviden suscribirse y No dejen de comentar!!
Просмотров: 17 994

Видео

Series TemporalesSeries Temporales
Series Temporales
Просмотров 22 тыс.8 лет назад
En este video les explico cómo llevar a cabo un análisis de series temporales básico empleando el software estadístico RStudio. ¡Espero les sirva de apoyo!... ¡No olviden suscribirse! Saludos.
Análisis de Componentes Principales con RStudio Paso a Paso!Análisis de Componentes Principales con RStudio Paso a Paso!
Análisis de Componentes Principales con RStudio Paso a Paso!
Просмотров 83 тыс.8 лет назад
En este video muestro detalladamente cómo realizar el correspondiente preprocesamiento de los datos y el empleo de la técnica descriptiva Análisis de Componentes Principales empleando el software estadístico RStudio. La data utilizada está disponible en inglés pero la traduje al español... la pueden descargar dando click en el siguiente link: archive.ics.uci.edu/ml/machine-learning-databases/00...

Комментарии

  • @profesorramonbee8482
    @profesorramonbee8482 4 месяца назад

    Me ha gustado mucho su enfoque y estilo de mostrar los detalles..!

  • @fechbrd
    @fechbrd 4 месяца назад

    👎👎👎 Muy malo.

  • @juandavidlopezzea1028
    @juandavidlopezzea1028 7 месяцев назад

    Súper bueno el vídeo.

  • @jimmyjmv
    @jimmyjmv 2 года назад

    ¿Me parece que, en alguna parte del procesamiento, se realizó Análisis Factorial o eso es otra cuestión que no está incluido aquí?.

  • @giacomoolanoraffo8113
    @giacomoolanoraffo8113 2 года назад

    Muchas gracias Loren por tu video, lo he seguido al pie de la letra con una base que trabajaba y ya puedo hacer mejor comparaciones de los datos. Ojalá puedas volver a youtube

  • @jeanpierrerodriguezmirano5317
    @jeanpierrerodriguezmirano5317 3 года назад

    Hola. Dentro de mis variables, tengo algunas categóricas, ¿cómo puedo incluir estas variables al análisis de componenetes principales?

  • @alexanderretajac5942
    @alexanderretajac5942 3 года назад

    hello I congratulate you on your work.

  • @franciscogamarra934
    @franciscogamarra934 3 года назад

    Me necnato esta explicacion super clara!! muchisimas gracias!!! pero Tengo una duda. Habia leido que la funcion PRCOMP solo aplica para conjunto de dados cuantitativos pero entiendo que si bien la region posee una valor numerico, no deja de ser una etiqueta, y su valor en si no reprensenta valor critico o ponderacion por si misma, es por ello que al inclirla dentro del analisis de componentes principales no se estaria incurriendo en en un error? y de ser asi no se deberia llevar otro metodo de analisis para variables cuantitativas y otro para variables cualitativas? desde ya muchas gracias!!

  • @joseluisjimenezmartinez7453
    @joseluisjimenezmartinez7453 3 года назад

    Muy bien explicado. Además me gusta como interpreta los gráficos.

  • @solangefranco3444
    @solangefranco3444 3 года назад

    Excelente video muy bien explicado! Gracias

  • @nathalyrivas6899
    @nathalyrivas6899 3 года назад

    Loren donde conseguiste la base de datos con la que estas trabajando?

  • @celinhernandez4729
    @celinhernandez4729 3 года назад

    Excelente Video. Fijate que estoy haciendo una reducción de dimensionalidad en variables Macroeconomicas, para contar con un indicador sintético de la actividad económica para un Nowcasting del PIB y tengo dudas, si no será necesario estandarizar las variables como tu mencionas y en vez de esos hacer todas los cálculos a parir de las variaciones interanuales de cada una de las variables. Por otra parte, me queda la duda de que utilizar para el cálculo de los valores y vectores propios, si la matriz de varianzas-covarianzas o la de correlaciones y en el caso de las correlaciones, si utilizar, pearson o spearman. Agradezco tus comentarios. Saludos desde Honduras.

  • @LuisSuarez-pt3rw
    @LuisSuarez-pt3rw 3 года назад

    Hola cómo puedo hacer con notas de colegio por estudiantes de cada asignatura.

  • @nommsable
    @nommsable 3 года назад

    Hola, si yo solo quisiera hacer la correlación de una columna x con otra columna Y, como seria la linea de codigo por favor.

  • @nestormartinez3256
    @nestormartinez3256 3 года назад

    Hola Loren! Muy interesante y clara tu explicación de la técnica. Pero tengo un comentario respecto de la inclusión de las variables Región y Canal, ya que esta técnica sólo admite variables medidas en escalas métricas (intervalos o proporciones). Y estas dos mencionadas, no lo están. Por el contrario, están expresadas en escala categórica. Y sobre este tipo de escalas no es posible aplicar operaciones aritméticas. Mucho menos, escalar o estandarizarlas. Además, desde el punto de vista del tratamiento estadístico, estás intentando calcular media y varianza a una variable categórica. (Es comí intentar calcular el promedio al sexo) Cosa imposible. Independientemente que, en el file hayas representado las categorías con números, no lo son y no pueden ser operados como tales. Por otro lado, el ACP y, en general, los métodos multivariantes, hacen un homomorfismo entre las matrices de datos y las "nubes de puntos" en un espacio multidimensional donde cada dimensión está asociada, desde uno de dos posibles puntos de vista, a cada una de las variables. Y los individuos (o casos) se representan en ese espacio tomando como coordenada el valor que toma cada individuo en cada variable. Así entonces, como, por definición de la escala de medida (de intervalos o proporciones) en las que están medidas las variables, en todas las dimensiones asociadas al hiperespacio asociado a las variables y que el ACP pretende "reducir" no es posible introducir variables categóricas, como Región o Canal, porque en el sentido de esa dimensión la continuidad no existiría. Sólo generaría subespacios de dimensión menor. Sí es posible combinar variables medidas en diferentes escalas mediante Análisis de Correspondencias Simples (ACOBI) o Múltiples (ACOMP), que, en pocas palabras, para el ACOBI, realiza un doble ACP pero sobre una matriz de frecuencias y las asocia mediante las llamadas relaciones cuasi baricéntricas. Lo que implica, para las variables medidas en escalas métricas, categorizarlas y contar las frecuencias de cada categoría. Voy a mirar con sumo interés tus videos sobre ésta y otras técnicas también. Tanto en mi vida como alumno, hace ya muchos años, como profesor especialmente de Análisis Multivariante Continuo y Discreto, como Estadística no Paramétrica, recibí y puse mucho cuidado en el tratamiento adecuado de los datos según cómo fueron recolectados y medidos. Y más aún en mi vida actual como analista de datos (prefiero ser llamado así y no "data scientiest"). Mil disculpas por no presentarme al principio: Soy Néstor Martínez Estadístico, graduado en la Escuela de Estadística de la Universidad Nacional de Rosario Doctorat 3ème Cycle Université Montpéllier II

  • @irvingo.velazquez9658
    @irvingo.velazquez9658 3 года назад

    Muchas gracias por la información, fue muy útil

  • @anthonyrb313
    @anthonyrb313 3 года назад

    Las dos primeras variables no son categóricas???

  • @JHEFRIL1
    @JHEFRIL1 4 года назад

    hola loren , en la database de discoveries me sale valores Na`s xq? como se los elimina??

  • @PAMP6010
    @PAMP6010 4 года назад

    Cuáles son los valores de cp1,2 y 3?

  • @valentinolivares8107
    @valentinolivares8107 4 года назад

    Hola, disculpa soy nuevo, no puedo sacar la varianza, me dice error argumento no numerico para operador binario, ¿alguna idea?

  • @elberpardo6002
    @elberpardo6002 4 года назад

    Buen video, sería interesante ver otras técnicas para imputación MCAR, MAR, NMAR

  • @weimarchambi5872
    @weimarchambi5872 4 года назад

    Excelente vídeo como puedo obtener esa base de datos de JohnsonJohnson, co2, y las que mencionas en el vídeo por favor weimar_9@hotmail.com

    • @mrtrebor3004
      @mrtrebor3004 4 года назад

      Para los primeros datos con el comando data(JohnsonJohnson), para los segundos en este enlace se puede descargar www.dropbox.com/s/zugg2443hlq7z6z/co2.csv?dl=0

  • @tonynoriega4952
    @tonynoriega4952 4 года назад

    @Loren Araujo, Con este modelo, será posible predecir la deforestación futura de un área determinada?

  • @pichurri3068
    @pichurri3068 4 года назад

    Excelente. Muy completo

  •  4 года назад

    Excelente Loren, gracias por tu aporte. Acabo de culminar un curso de R, y me toca practicar y practicar para dominar tantas librerías y funcionalidades de la herramienta! Si conoces alguna comunidad spanish que me puedas sugerir te lo agradezco. Saludos!

  • @guadalupepacheco6644
    @guadalupepacheco6644 4 года назад

    ¿La normalizacion tambien se realiza con scale. = TRUE)?

  • @guadalupepacheco6644
    @guadalupepacheco6644 4 года назад

    ¿Como se puede conocer la significancia de cada correlacion?

  • @julianandrescastillovargas3375
    @julianandrescastillovargas3375 4 года назад

    Excelente explicación. Tengo una pregunta. Si yo seleccioné 5 componentes, como puego graficar, por ejemplo el componente 1 con el 5?. o el 2 con el 4?. Como le indico esto a R?. Muchas gracias :)

    • @plersike
      @plersike 3 года назад

      Dado que las representaciones solo son en dos planos, tienes que ir seleccionando las parejas que quieras graficar, excluyendo con el signo - aquellas dimensiones que no quieras graficar.

  • @j.b.polanco1640
    @j.b.polanco1640 4 года назад

    Muy buen video, solo que reomendaria la función "ggtsdisplay" del paquete "forecast" para graficar los resagos.

  • @adrianzamora1426
    @adrianzamora1426 4 года назад

    Muchas gracias profesora , tiene un nuevo suscriptor, me ayudo mucho con mi carrera de Analasis de Datos

    • @lorenaraujo1066
      @lorenaraujo1066 4 года назад

      Hola Adrián! No soy profesora, pero me alegra que te haya sido de ayuda el video. Saludos.

  • @marinalopez7420
    @marinalopez7420 4 года назад

    Hola Loren!! Muchas gracias por el vídeo Me gustaría poder hacerle una pregunta : en los diagramas de cajas y bigotes , que interpretación tendría todos juntos, que magnitud y aceleración por ejemplo al tener menos dispersión significa que son los datos más homogéneos que tenemos a diferencia de station y dist? Y si en station por ejemplo la mediana está más cerca de q3 significa significa siempre que los datos presentan asimétria a la derecha (negativa) o puede pasar que tenga asimetría positiva aún teniendo ese esquema ?

  • @angelmaldonado6913
    @angelmaldonado6913 4 года назад

    Excelente Loren, esta bien explicado para complementar la practica se requiere el archivo de datos con el que se realiza el trabajo, para lo cual le agradezco por anticipado si me enviara dicho archivo angel_mm50@hotmail.com

    • @lorenaraujo1066
      @lorenaraujo1066 4 года назад

      Hola Angel, si observas con detenimiento, la data que uso en el estudio es una data propia de R, por tanto no necesitas cargar ningún archivo. Sólo carga la data como lo hago en el video. Saludos.

    • @angelmaldonado6913
      @angelmaldonado6913 4 года назад

      Gracias por la aclaración Loren, sigue adelante

  • @juandavidlozadacalderon1356
    @juandavidlozadacalderon1356 4 года назад

    Me gusto tu video, gracias!! por cierto, estas muy linda...

  • @NestorAgamez
    @NestorAgamez 4 года назад

    Muchas gracias por tu video, está excelente, tengo dudas con proyección de estructuras latentes, no sé si tengas algún ejemplo que nos puedas suministrar, muchas gracias!!

  • @guadalupepacheco6644
    @guadalupepacheco6644 4 года назад

    como podemos saber la significancia de las correlaciones?

    • @PabloVallejoMedina
      @PabloVallejoMedina 4 года назад

      Aquí lo explico un poco: ruclips.net/video/uEcvj7C35ho/видео.html

  • @luisalbertorodriguez1749
    @luisalbertorodriguez1749 4 года назад

    Humildemente te digo que este vídeo esta malo, el procedimiento que usaste es incorrecto, no estas trabajando con ninguna componente principal, erróneamente trabajaste con los vectores propios, CP1, CP2 y CP3 son los ventores propios, si quieres, compruébalo usando la función eigen().

  • @gonzalorubilar1423
    @gonzalorubilar1423 5 лет назад

    Hola Loren, Gracias, muy buena información. Es posible contactarte para clases particulares pagadas? Saludos!

  • @felipebozzoleon5345
    @felipebozzoleon5345 5 лет назад

    Me gusto mucho tu video y tu explicación impecable, no sabes cuanto me ayudó en terminar mi tesis 🙏🏻

    • @luisalbertorodriguez1749
      @luisalbertorodriguez1749 4 года назад

      Humildemente te digo que este vídeo esta malo, el procedimiento que usaste es incorrecto, no estas trabajando con ninguna componente principal, erróneamente trabajaste con los vectores propios, CP1, CP2 y CP3 son los ventores propios, si quieres, compruébalo usando la función eigen().

  • @accuarius
    @accuarius 5 лет назад

    son geniales tus videos!! gracias

  • @amilkarsierra3464
    @amilkarsierra3464 5 лет назад

    Me gusta, explicas muy bien, claro preciso y conciso. me gustaria tener los otros video del curso.

  • @wpatal
    @wpatal 5 лет назад

    Estimada Loren agradezco tus videos me han ayudado muchisimo en interpretar las series temporales y si pudieras seguir sería grandioso. muchas gracias

  • @royespse
    @royespse 5 лет назад

    Muchas gracias por el video, excelentemente explicado. Me salvó la vida.

    • @luisalbertorodriguez1749
      @luisalbertorodriguez1749 4 года назад

      Humildemente te digo que este vídeo esta malo, el procedimiento que usaste es incorrecto, no estas trabajando con ninguna componente principal, erróneamente trabajaste con los vectores propios, CP1, CP2 y CP3 son los ventores propios, si quieres, compruébalo usando la función eigen().

  • @pazcespedescardenas1302
    @pazcespedescardenas1302 5 лет назад

    Clarito, gracias!!

  • @mauricioaraujo4342
    @mauricioaraujo4342 5 лет назад

    você conhece a abordagem GYT biplot?

  • @luiscc3913
    @luiscc3913 5 лет назад

    Excelente vídeo, buena explicación. Saludos!!

  • @arq.olimpiaesquivelcancino9557
    @arq.olimpiaesquivelcancino9557 5 лет назад

    tienes algún video de análisis de conglomerados?

  • @JUANGOMEZ-qy6gq
    @JUANGOMEZ-qy6gq 5 лет назад

    Maravilloso contenido, creo que sobra el paso de elevar la desviación tipica al cuadrado, pues un numero menor de uno al cuadrado no podrá dar más de la unidad. saludos y muchas gracias por el video.

  • @piandecata
    @piandecata 5 лет назад

    Muy bueno. Ya existen Análisis de Componentes de principales espaciales para vincular datos de coordenadas. Saludos

  • @ranidegiusto8348
    @ranidegiusto8348 5 лет назад

    Muy bueno me sirvió

  • @elizapatino1771
    @elizapatino1771 5 лет назад

    ¿Se pueden cambiar los números por los nombres de los individuos/clientes? ¿Cómo se hace?