Cómo crear Clasificadores de Machine Learning ante Clases Desbalanceadas asignando Pesos con Python

Поделиться
HTML-код
  • Опубликовано: 9 янв 2025

Комментарии • 33

  • @CodigoMaquina
    @CodigoMaquina  2 года назад

    👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com

  • @NewOrden12
    @NewOrden12 Год назад +6

    Probablemente el mejor canal en español para ML, gracias!!!

    • @CodigoMaquina
      @CodigoMaquina  Год назад +3

      @NewOrden12 te agradezco mucho tus palabras.
      Dando like, comentando y/o compartiendo el video, ayudas a que este contenido llegue a más personas ¡¡¡GRACIAS!!!

  • @guillermosilva1527
    @guillermosilva1527 3 года назад +2

    Geniaal! Espectacular contenido.

    • @CodigoMaquina
      @CodigoMaquina  2 года назад

      ¡Muchas gracias por tus comentarios! :)

  • @victordeltoro1495
    @victordeltoro1495 2 года назад +2

    Simplemente espectacular el vídeo, felcitaciones. Me aportó un montón. Pensaba que en los casos de clases desbalanceadas solo se podia usar la métrica Kappa de Cohen.

    • @CodigoMaquina
      @CodigoMaquina  2 года назад +1

      Muchas gracias por tus comentarios. Por cierto, todavía tengo pendiente sacar otro video para crear modelos con clases desbalanceadas. Ahora sí que próximamente :) Gracias por seguir el contenido del canal.

  • @pythonfamily
    @pythonfamily 2 года назад +1

    Bien explicado, muchas gracias

    • @CodigoMaquina
      @CodigoMaquina  2 года назад

      ¡Muchas gracias a los Python Brothers! ¡Feliz Año!

  • @victord8866
    @victord8866 3 года назад +4

    Buen detalle lo de explicar cómo funciona class_weight='balanced'.
    Lo he usado varias veces como una black box, pero nunca me pregunté qué peso exactamente tenían las clases.

    • @CodigoMaquina
      @CodigoMaquina  2 года назад

      Nos da gusto saber que nuestros videos aportan aunque sea un poquito. Muchas gracias por comentar y por ver el canal :)

  • @mejia414
    @mejia414 3 года назад +2

    Gracias excelente material señor

  • @juliojaimesrivera5540
    @juliojaimesrivera5540 10 месяцев назад

    Muy buena la enseñanza Mr. Octavio. Por favor si podrías facilitar la página de dónde se extrae la data original de Wisconsin, gracias.

  • @nancynardelli5466
    @nancynardelli5466 7 месяцев назад +1

    Gracias!

    • @CodigoMaquina
      @CodigoMaquina  Месяц назад

      Muchas gracias por seguir el contenido del canal!!!

  • @VictorHugoAngel
    @VictorHugoAngel 2 года назад +2

    Muy buen video, muchas gracias. Tienes algun video sobre el metodo Smote?

    • @CodigoMaquina
      @CodigoMaquina  2 года назад +1

      Lamentablemente no, pero ya lo anoté en la lista de temas por incluir al canal. Gracias por la sugerencia.

  • @tomasscopelliti9362
    @tomasscopelliti9362 Год назад +1

    Muchas gracias Octavio! Excelente material, como siempre. Una consulta, esto entraría dentro de la limpieza de datos o seria parte de la preparación? Muchas gracias por todo!!! Un abzo grande.

    • @CodigoMaquina
      @CodigoMaquina  Год назад

      Tomas gracias por tus comentarios. Con respecto a tu pregunta, el tema tratado en el video sería posterior a la limpieza de los datos. Comúnmente, primero se limpian los datos y de ahí se crean modelos o se realiza algún tipo de análisis. Gracias por seguir el contenido del canal :)

  • @juanpablocruz6225
    @juanpablocruz6225 3 года назад +2

    La explicación es bastante clara, sin embargo tal vez se podría analizar casos con un mayor desbalance, por decir 2% de los casos en la clase de interés, saludos.

    • @CodigoMaquina
      @CodigoMaquina  2 года назад +1

      Gracias por la sugerencia. Todavía vamos a hacer otro video sobre datos desbalanceados pero ahora utilizando muestreo. Intentaré encontrar un data set interesante con datos reales que presente el desbalance pero de forma más grave. Gracias por comentar y por ver el canal :)

  • @nachokabrera5442
    @nachokabrera5442 2 года назад +1

    Buenas, excelente video, siempre bien explicado, pero me gustaría saber si es aplicable para KNN o árbol de decisión (Para clasificación) y si no lo es, que podría hacer para trabajar el desbalance de clases.

    • @CodigoMaquina
      @CodigoMaquina  2 года назад

      Estimado Nacho muchas gracias por tu comentario y por la pregunta. Este tipo de técnicas se puede utilizar para cualquier tipo de clasificador incluyendo los árboles de decisión.

  • @wolfanrodriguez4928
    @wolfanrodriguez4928 2 года назад +2

    hola, que buenos videos, soy un aprendiz de ciencia de datos, y quisiera aprender todo lo que pueda de esto, siempre veo que la herramienta principal es python, pero en algunas ocasiones veo que usan otras herramientas, por ejemplo hace poco vi la herramienta tableau, y tambien el sas studio, tambien conozco el rapidminer, ; entonces no termina uno de conocer bien una herramienta cuando de pronto nos muestran y aconsejan otra, como debe uno sobrellevar todo esto, depronto es una pregunta como de opinión, pero qué herramientas debería conocer uno como para que a la hora de buscar un trabajo tenga mas opciones.

    • @CodigoMaquina
      @CodigoMaquina  2 года назад

      Muchas gracias por tus comentarios y por la confianza con la pregunta. Ciertamente, en general, en el área de TI, hay muchas herramientas y constantemente las tendencias de uso cambian. Esto en algunas ocasiones podría ser abrumador, aunque también es parte de la belleza del área. Mi recomendación es que te enfoques en los fundamentos, por ejemplo, los fundamentos de estadística. Las herramientas, lenguajes y tendencias van y vienen, pero ese conocimiento permanece. Así tendrás un núcleo sólido sobre el cuál podrás agregar el uso de ciertas herramientas dependiendo del contexto laboral donde te desenvuelvas. Mucha suerte en tu camino.

  • @cristianlikez
    @cristianlikez 2 года назад +2

    De nuevo muchas gracias por tan valiosa información, tengo una duda. Para utilizar Machine learning de manera profesional es recomendable utilizar jupyter o existe algún IDE más recomendable, de antemano muchas gracias..

    • @CodigoMaquina
      @CodigoMaquina  2 года назад +1

      Muchas gracias por tus comentarios. Con respecto a tu pregunta: hay varias herramientas profesionales. Una es efectivamente las libretas de jupyter, también están las Colab Notebooks de Google (estas tienen la ventaja de que puedes entrenar tus modelos en la nube de Google bajo ciertas restricciones). Otras opciones populares son PyCharm y VSCode. Muchas veces se utilizan todas a la par, por ejemplo se utiliza jupyter notebooks para exploración y análisis de datos e inclusive creación preliminar de modelos y posteriormente migras el código a módulos que trabajas en otras IDEs, por ejemplo PyCharm. Yo te recomendaría familiarizarte con Colab Notebooks (muy similares a Jupyter Notebooks) y después con VSCode (por simple cuestión de gustos, prefiero VSCode sobre PyCharm pero ambas son buenas). Posteriormente subiremos un video sobre Colab Notebooks, justo antes de entrar a los videos de redes neuronales. Gracias por ver el canal :)

  • @samuelvicentelisarazu8068
    @samuelvicentelisarazu8068 2 месяца назад

    Cómo.me contacto con Tigo , necesito resolver un problema de aprendizaje para series temporales clasificación, pago lo que pidas

  • @andresbetancur3469
    @andresbetancur3469 Год назад +1

    Hola Código Máquina, tengo una duda aunque no exactamente del video pero sí me surgió a raiz de este. Supongamos que quiero hacer un clasificador y una de mis features son categorías que también presentan un sesgo como el que vimos aquí para la clase. Yo siempre las descarto porque no me aportan información, pero si quisiera usarlas para el modelo se puede hacer algo como un balanceo de este estilo o definitivamente no se toman. Es decir, quiero saber qué hacer cuando hay un desbalance en mis features y no en mi target. Te agradezco mucho¡!

    • @CodigoMaquina
      @CodigoMaquina  Год назад

      @andresbetancur3469 gracias por la pregunta. Ciertamente, en ocasiones se descartan atributos categóricos donde predomina considerablemente un valor dado que ciertamente en ocasiones no aportan información. Sin embargo, antes de eliminarlas, por ejemplo, podría valer la pena explorar su "información mutua" (favor de ver el siguiente video ruclips.net/video/37b9eyl4Q1c/видео.html) o evaluar la utilidad del atributo creando un clasificador con y sin el atributo categórico.

  • @matiashernandez3913
    @matiashernandez3913 Год назад +1

    Hola Octavio! excelente video!!
    Sabes que me esta dando error la parte de:
    # 30 características: radio, textura, area, entre otros
    datos = info[:-1].T
    # 0 : SANO, 1 : CÁNCER
    clase = info[-1]
    Segun parece ya no se llama de esa forma a la ultima columna para asignarselo al dataframe de la clase...
    KeyError: -1
    Saludos!!

    • @CodigoMaquina
      @CodigoMaquina  Год назад +1

      Hola @matiashernandez3913 gracias por seguir el contenido del canal y por la pregunta. Le eche un ojo al código y lo re-ejecuté con la última versión de python y creo que no es cuestión de algún problema derivado de depreciación. Creo que podría ser un problema de "encoding" del archivo que se está utilizando. Esto aún podría pasar si se está utilizando el mismo archivo de nuestro repositorio. De hecho, pasa seguido cuando se abre el archivo en Mac OS que utiliza otros encondings diferentes a Windows. En realidad podría ser eso y/o otras 100 cosas, lamento no poder brindar más ayuda con el contexto provisto.