Clustering Jerarquico en Python

Поделиться
HTML-код
  • Опубликовано: 8 янв 2025

Комментарии • 61

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  2 года назад +2

    Obtén los scripts, archivos y diapositivas que se muestran en mis videos en: www.patreon.com/rociochavezcienciadedatos

  • @jorge1869
    @jorge1869 2 года назад +3

    Una de las cosas que me enoja de RUclips, es q canales como estos no tengan como mínimo un millón de suscriptores. Saludos, excelente contenido.

  • @tensoescalar1
    @tensoescalar1 Год назад

    No sé cómo no había visto este video, Excelente, muchas Gracias

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  2 года назад

    Si te fue de utilidad este video y deseas ayudarme a seguir creando contenido, puedes hacerlo de varias formas:
    - Compartiendo mi canal en tus redes sociales
    - Dejándome un comentario (aunque sea un "Hola!"... ;) )
    - Dando clic en "Me gusta" para incrementar la probabilidad de que el algoritmo de youtube promueva mi contenido
    - Suscribiéndote a mi canal
    - Presionando el ícono "Gracias" y haciendo una donación
    Si estás interesado en aprender acerca de algún algoritmo en especial, házmelo saber en los comentarios

  • @ricardosebastian9085
    @ricardosebastian9085 8 месяцев назад

    muchas gracias por tu ayuda, me fue de mucho apoyo

  • @calebmedrano3733
    @calebmedrano3733 Год назад

    Eres genial Rocio!!!!!😊😊 ya te ganaste un suscriptor más

  • @cristianlaiho
    @cristianlaiho 3 года назад

    wow muy clara tu explicación!! mil gracias!!

  • @Se-pk8lg
    @Se-pk8lg 4 года назад +1

    Muy bien explicado. Muchas gracias por el video :D

  • @franklinriabanimercadoflor3093
    @franklinriabanimercadoflor3093 3 месяца назад

    Muchas Gracias por tu ayuda

  • @alexisjose7515
    @alexisjose7515 3 года назад

    agregar a que cluster pertenece cada registro es genial!

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  4 года назад +1

    Para llevar a cabo el pre-procesamiento de tus datos y poder obtener
    información confiable en tus análisis, visita mi lista de reproducción
    llamada Pre-procesamiento de Datos en Python
    ruclips.net/p/PLUofJx5RUeFqAIVdzfnJayenwZFEGtCmg

  • @Estampadosconserigrafia
    @Estampadosconserigrafia 3 года назад +1

    Como validar los cluster??

  • @joseluisvillalpandoaguilar2613
    @joseluisvillalpandoaguilar2613 2 года назад

    EXCELENTE VIDEO GRACIAS

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  3 года назад

    Si estás interesado en adquirir alguno de mis cursos en línea, vista mi página web rociochavezml.com/cursos-en-linea/ ;)

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  4 года назад +4

    Hola! Acabo de correr el código y me dí cuenta de que ya hicieron una modificación al paquete mglearn. En caso de que te dé problemas, puedes teclear pip install --upgrade mglearn (con doble guión) en Powershell Prompt de Anaconda. Si tienes dudas acerca de como hacerlo, envíame un correo a rociochavezmx@yahoo.com ;)

  • @jorge1869
    @jorge1869 2 года назад

    Sólido contenido. Yo estoy tratando de hacer este análisis con un millón de rows pero no he encontrado la forma de ver por ejemplo elementos adyacentes en un mismo clúster.

  • @kimberlyjohanarinconvalenc8650
    @kimberlyjohanarinconvalenc8650 3 года назад

    estuvo genial
    me gustaria saber como generar el dendograma con los clusters definidos en el corte. gracias !!!

  • @LuisLopez-sc1qc
    @LuisLopez-sc1qc Год назад

    Se puede hacer un grafico jertarquico como el de power bi en python

  • @jonathanr.amadorarellano1021
    @jonathanr.amadorarellano1021 3 года назад

    Hola, estaba siguiendo tus instrucciones, pero al momento de "Crear el dendrograma del clustering jerárquico" obtube un error que no he logrado corregir, podrías ayudarme?
    Clustering_Jerarquico = linkage(calificaciones, 'ward')
    NameError Traceback (most recent call last)
    in
    ----> 1 Clustering_Jerarquico=linkage(calificaciones, 'ward')
    NameError: name 'linkage' is not defined
    linkage es la impostación que se hizo al inicio de scipy.cluster.hierarchy
    Gracias.

  • @libardochanchy8292
    @libardochanchy8292 3 года назад +1

    Rocio como se puede exportar a JPG o PNG el grafico del dendograma?

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  3 года назад

      Hola Libardo! Puedes utilizar el comando plt.savefig. Aquí te dejo una página en la que mencionan como hacerlo chartio.com/resources/tutorials/how-to-save-a-plot-to-a-file-using-matplotlib/ Espero que te sea de utilidad ;)

    • @libardochanchy8292
      @libardochanchy8292 3 года назад

      @@RocioChavezCienciadeDatos Rocio gracias, desafortunadamente no me a funcionado o no e podido.

  • @alanhernandez7201
    @alanhernandez7201 2 года назад

    Hola! Se puede hacer un Cluster Jerarquico con variables cualitativas o categoricas en Python? Muchas gracias!

  • @javieramontecino1674
    @javieramontecino1674 3 года назад

    ola sabes que hice todo lo que pusiste en el video pero me sale el siguiente error = module 'scipy.cluster.hierarchy' has no attribute 'dendogram' qué hago :(

  • @madsanty8745
    @madsanty8745 4 года назад

    Genial video, como conozco las caracteristicas por las que han sido agrupadas de esa manera a la hora de explicarlo?

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 года назад

      Hola! En estos momentos no podría decirte el código que necesitarías utilizar, pero lo que podrías hacer es: Una vez que tengas la información incluyendo la columna del cluster en el que se ubicó cada individuo en el archivo csv, obtienes el promedio de cada una de las características de los individuos que forman cada uno de los clusters, es decir, obtienes los centroides de cada cluster. Para que sea más claro lo que te quiero decir, te recomiendo que veas el video Clustering Jerárquico Aglomerativo explicación matemática, que está en ruclips.net/video/d_7pU9zqkfM/видео.html. Ahí explico lo que son los centroides. Espero que esta información te sea de utilidad ;)

  • @nicolasvinuesa8276
    @nicolasvinuesa8276 4 года назад

    Excelente!

  • @ghumeresh7621
    @ghumeresh7621 4 года назад

    Hola Rocio. Alguna idea o ayua para realizar el : coeficiente de concordancia de Lin? seri de gran ayuda. muchas gracias

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 года назад +2

      En cuanto tenga una oportunidad, investigo y te aviso. Si gustas puedes enviarme un correo a rociochavezmx@yahoo.com para que no se me olvide... jejeje

  • @samuelceciliochucuyamamani561
    @samuelceciliochucuyamamani561 3 года назад

    Excelente video! , tendrás uno de Análisis Factorial ?
    Saludos

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  3 года назад +1

      Muchas gracias Samuel! Todavía no he creado un video acerca de análisis factorial.
      Te invito a visitar mi página rociochavezml.com, en la pestaña BLOG encontrarás los temas de este canal de forma más organizada ;)

  • @Estampadosconserigrafia
    @Estampadosconserigrafia 3 года назад

    si tengo aprox 200000 registros y 10 variables seria factible ??

  • @rodrigoperalta5778
    @rodrigoperalta5778 4 года назад

    Para poder normalizar o estandarizar los datos (Z), que código debo utilizar y donde. saludos

    • @nesivapama
      @nesivapama 4 года назад +1

      Puedes utilizar parte del preprocessing data del paquete sklearn (SciKit-Learn), tienen algoritmos para normalizar y para estandarizar.

    • @jxccLP
      @jxccLP 3 года назад

      from sklearn.preprocessing import StandardScaler

  • @libardochanchy8292
    @libardochanchy8292 3 года назад

    Como se puede realizar el mismo análisis con variables cualitativas?

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  3 года назад

      Hola Libardo! Podrías utilizar variables dummy y sobre ellas aplicar el clustering. Tengo un video acerca de las variables dummy aquí ruclips.net/video/WBY9yrSznP4/видео.html&ab_channel=RocioChavezCienciadeDatos

    • @libardochanchy8292
      @libardochanchy8292 3 года назад

      @@RocioChavezCienciadeDatos gracias excelente tutoríal.

  • @tomasgerzenstein4051
    @tomasgerzenstein4051 Год назад

    Cuando abro el archivo en Excel me aparecen todos lo datos en distintas filas, pero en la misma columna. Alguien sabe por que?

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  Год назад +1

      Hola Tomas! Es un archivo de tipo csv, lo que significa que sus valores están separados por comas

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  Год назад +1

      En este enlace puedes ver como abrirlo en Excel help.cliengo.com/hc/es/articles/360020203574-C%C3%B3mo-abrir-un-archivo-CSV-en-Excel

    • @tomasgerzenstein4051
      @tomasgerzenstein4051 Год назад

      @@RocioChavezCienciadeDatos Muchas Gracias!

  • @dr.mariogonzalezsilva877
    @dr.mariogonzalezsilva877 4 года назад

    Como puedo graficar los datos con los clusters?? muy buen video gracias!!

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 года назад

      Hola Mario! Me puedes escribir a rociochavezmx@yahoo.com para poder ayudarte más fácilmente, por favor?

    • @dr.mariogonzalezsilva877
      @dr.mariogonzalezsilva877 4 года назад +1

      @@RocioChavezCienciadeDatos Muchas gracias, ya te mande correo

  • @mariaarbelaez1501
    @mariaarbelaez1501 2 года назад

    Hola. ¿Es posible tener una clase contigo?

  • @nicolasvinuesa8276
    @nicolasvinuesa8276 4 года назад

    Rocio, no encuentro el error, quizas puedas aclararme:

    • @nicolasvinuesa8276
      @nicolasvinuesa8276 4 года назад

      File "", line 1
      Estudiantes=pd.read_csv('C:/Users/nvinu/Archivos en Jupiter/Bases de datos a Analizar/ejemplo estudiantes.csv', engine'python', index_col=0)#Con index_col indicamos que las filas tienen un nombre
      ^
      SyntaxError: invalid syntax

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 года назад

      @@nicolasvinuesa8276 a simple vista, le falta un signo= entre engine y python. Otra cosa que puedes hacer es usar comillas dobles en lugar de sencillas. Espero que te sea de utilidad ;)

    • @nicolasvinuesa8276
      @nicolasvinuesa8276 4 года назад +1

      @@RocioChavezCienciadeDatos Muchisimas gracias por tu pronta respuesta.

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 года назад

      @@nicolasvinuesa8276 Un gusto! Si tuvieras más dudas, me puedes enviar un correo a rociochavezmx@yahoo.com ;)

  • @MsBlasster
    @MsBlasster 3 года назад

    Saludos Rocio! nos ayudas mucho con tus videos.
    Estoy haciendo el ejemplo, este es mi codigo
    Estudiantes=pd.read_csv('C:\Users\NANCY\Desktop\Rocio-Chavez-youtube-Files-master\Ejemplo Estudiantes.csv',
    engine='python',index_col=0)
    Me sale este error:
    File "", line 1
    Estudiantes=pd.read_csv('C:\Users\NANCY\Desktop\Rocio-Chavez-youtube-Files-master\Ejemplo Estudiantes.csv', engine='python',index_col=0)
    ^
    SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape
    No entiendo cual es el error. Estaría muy agradecido si me ayudas.

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  3 года назад

      Hola Rafael! Muchas gracias por tus palabras. Habría que cambiar las diagonales invertidas de la ruta en donde se encuentra el archivo por diagonales normales / Espero que esta información te sea de utilidad ;)