[Ranking 10 al 1] Machine Learning - Top Algoritmos IMPRESCINDIBLES para Data Science en 2024

Поделиться
HTML-код
  • Опубликовано: 7 сен 2024
  • 👉 Descarga el notebook con el código aquí: datascience4bu...
    En este vídeo te voy a enseñar el ranking de los 10 algoritmos de machine learning más importantes para analizar datos tabulares.
    Además te voy a hacer una breve explicación de cómo funciona cada uno.
    Te voy a decir los casos de uso en los que ese algoritmo concreto es especialmente útil.
    Y por si fuera poco te voy a dar una plantilla de código en Python con el esqueleto para implementar ese algoritmo.
    Machine Learning, Análisis de Datos, Algoritmos, Python, Regresión, KNN, Naive Bayes, K-medias, Árbol de Decisión, ARIMA, Suavizado Exponencial, Random Forest, XGBoost, LightGBM.

Комментарии • 44

  • @sebasnolascop
    @sebasnolascop Год назад +20

    Falta un video sobre métricas para evaluar los modelos, qué métrica conviene para cada modelo y por qué?

    • @JohnLocke-ld6tj
      @JohnLocke-ld6tj 10 месяцев назад +3

      Siiiiiiiii y también los de la hiperparametrización. Gracias, DataScience ForBusiness.

  • @yuniorbatista2416
    @yuniorbatista2416 Год назад +10

    Sería interesante hacer una segunda parte para aprender cómo se evalúan los modelos, y sus principales métricas. por ejemplo, poniendo a competir el Top 3 del modelo y explicar porque escoger uno de ellos segun las métricas analizadas, AUC, Matriz de confusión, etc

  • @alejandrosellesperez1810
    @alejandrosellesperez1810 5 месяцев назад

    Estaria muy top que recomendaras recursos o hicieras videos para informarse mas de lo que hay matemáticamente detras de cada algoritmo que comentas

  • @yvankovkafka8158
    @yvankovkafka8158 2 месяца назад +1

    esta vez ya le sigo la pista y aunque no he tenido la oportunidad de poner en practica todos los modelos, el K-Means me funciona perfecto, ahora estoy viendo las BitNets, esto está volando y yo recién estoy gateando 🤔

  • @ESPjump
    @ESPjump Год назад +2

    Has omitido los Support Vector Machine por algun motivo? En algunos proyectos de clasificacion en medicina, era el algoritmo que obtenia mejores resultados, similares a algunas redes neuronales. El principal problema es que el entrenamiento tardaba muchisimo.

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад +2

      Ningún motivo especial. El objetivo era repasar los algoritmos que más se usan en la empresa en datos tabulares. Y es cierto que SVM se usa más en la academia-investigación que en la empresa. Pero tb podría ser perfectamente válido.

  • @dionisiofernandez5832
    @dionisiofernandez5832 2 месяца назад

    Hola que tal ? me gusto mucho tu video y logre implementar alguno de los algoritmos en mi proyecto y le fue muy bien, tengo un par de preguntas sobre un proyecto nose si tengas un correo donde te la pueda hacer? por otro lado estaba mirando tu pagina web y esta muy interesante hacer el reto de una semana como data science, pero yo hice el curso de certificacion profesional en Data Science EDX de harvard y es todo en R, asi que phyton un no lo manejo (aunque supongo que la curva de aprendizaje debe ser corta) puedo hacer el reto usando R como lenguaje?, muchas gracias y felicitaciones por tus videos

  • @10955356
    @10955356 27 дней назад +1

    Buen video

  • @oscar2h
    @oscar2h 2 месяца назад +1

    Excelente video, gracias!

  • @josemag4617
    @josemag4617 2 месяца назад

    Cuando menciona hiperparametrizacion a qué se refiere puntualmente? Elegir parámetros en vez de los por defecto? Gracias, muy buen material

    • @DataScienceForBusiness
      @DataScienceForBusiness  2 месяца назад +2

      Los hiperparámetros son aquellos parámetros cuyo valor no lo establece el algoritmo en base a su entrenamiento, si no que se los defines tú como analista: tasa de aprendizaje, regularización, niveles de profundidad, etc. Son diferentes en cada algoritmo. El proceso de hiperparametrización es una manera (realmente hay varias técnicas) para encontrar los mejores valores de esos hiperparámetros también de forma programática y basada en datos, sin tener que decidirlos tú "a dedo".

  • @miguelsalas634
    @miguelsalas634 Год назад +1

    Excelete Video Profe gracias

  • @nathaliarecalde4871
    @nathaliarecalde4871 2 месяца назад +1

    Interesante. Lo tienes bien explicado, una buena estructura de datos.

  • @VictorHugoAngel
    @VictorHugoAngel Год назад +1

    Excelente video. Gracias

  • @josevicente632
    @josevicente632 Год назад +2

    Excelente video

  • @jorge1869
    @jorge1869 Год назад

    Estoy en el rublo académico, trabajo mucho con datos tabulares, y me he percatado que para problemas de clasificación en la mayoría de los casos el algoritmo random forest es imbatible. OJO en problemas de regresión también es excelente, pero donde más brilla es en problemas de clasificación con datos tabulares.

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад +2

      ha sido mi algoritmo por defecto muchos años. el principal problema es como digo en el vídeo si ya estás en casos de mucho volumen de datos, por el tiempo de entrenamiento (que se puede resolver muestreando), pero últimamente tiendo más a xgboost o lightgbm

    • @jorge1869
      @jorge1869 Год назад

      @@DataScienceForBusiness xgboost ha sido uno de los algoritmos que más competencia ha ganado en kaggle. Gradient boosting es también muy bueno, lo malo es que es un demonio que te consume muchos recursos del PC con grandes volúmenes de datos.

  • @monicaoc5235
    @monicaoc5235 4 месяца назад +1

    Un genio

  • @Franzzss
    @Franzzss Год назад

    Hola, he visto que han sacado el Técnico Superior en Administración y Finanzas con Especialidad en Big Data para el Sector Financiero, titulacion oficial, ¿que opinas de este nuevo FP? gracias.

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад +1

      puff, pues no he visto el programa, pero si le han puesto ese título no me da buena espina. yo miraría a ver si han sacado algún otro de big data pero con enfoque más técnico

    • @Franzzss
      @Franzzss Год назад

      @@DataScienceForBusiness UNIDAD 1 Programación en entornos de Big Data
      UNIDAD 2. Procesamiento de datos
      UNIDAD 3. Segmentación de clientes mediante análisis de datos
      UNIDAD 4. Evaluación del nivel de riesgo y prevención del riesgo mediante el análisis de datos
      UNIDAD 5. Análisis de Mercados Bursátiles
      Parece que esta enfocado al business analytic, muchas gracias por responder, de los mejores canales dando informacion sobre el sector.

  • @davidrosenblum4079
    @davidrosenblum4079 Год назад +1

    y es necesario aprenderlos todos porque hay que ser una enciclopedia con patas para trabajar en ML, cierto?

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад +2

      es un ámbito que requiere esfuerzo. pero no es tan complicado como parece. si te fijas al final el proceso es siempre muy similar. lo importante es aprender los fundamentos de ML. luego teniendo y entendiendo esa base aprender un nuevo algoritmo es relativamente fácil

  • @mientorno.digital
    @mientorno.digital Год назад

    Hola Isaac. En tu último vídeo enviado por correo no sale el botón para pasar al siguiente vídeo, por lo menos a mi no me aparece habilitado. Saludos.

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад

      Se te debería habilitar automáticamente tras unos 20 min. Si te sigue sin funcionar escríbeme a isaac@datascience4business.com

  • @user-wo3hj1wx5e
    @user-wo3hj1wx5e 4 месяца назад

    En arima dices autocorrelaciones?? No querrás decir varianzas?

  • @JuanSosa-gd8uy
    @JuanSosa-gd8uy Год назад

    Ya no hay Rstudio?

  • @yuniorbatista2416
    @yuniorbatista2416 Год назад

    se puede afirmar que estos algoritmos ya estan obsoletos con las ventajas que a estas alturas tienen el deep learning y las redes neuronales?, sobre todo en contexto empresariales, noto que ultimamente los reclutadores y ofertas de empleos piden DL

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад

      no, DL es lo mejor para video, texto o imágenes. pero para datos tabulares, además de que no suele compensar por eficiencia, tampoco suele conseguir mejores predicciones que el top de los algoritmos de este vídeo. el algoritmo idóneo depende del caso de uso.

  • @gjs3409
    @gjs3409 Год назад +1

    Si usamos R?

  • @samuelorellana9923
    @samuelorellana9923 Год назад

    donde esta la base de datos?

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад +1

      debajo del botón para descargar el notebook hay otro para descargar el csv

  • @EmeritoMontilla
    @EmeritoMontilla Год назад

    pero la plantilla nunca llega

    • @CarolinaAvilaCoral
      @CarolinaAvilaCoral Год назад +1

      Cuando te registras te llega el correo para confirmar tu interés en pertenecer a la lista de noticias, cuando le dices que si, te lleva a una página con información de otros servicios gratuitos y al final está el botón de descargar.

    • @DataScienceForBusiness
      @DataScienceForBusiness  Год назад

      correcto, tienes que darle a ese botón y te lo descarga desde google drive

  • @leonardoleonardo4867
    @leonardoleonardo4867 2 месяца назад

    Muy rapido amigo, como ddocente o capacitador ud. No sirve...

    • @juanhernandez-lq4po
      @juanhernandez-lq4po 2 месяца назад +2

      hay 70.000 personas que creen que si, no llores tanto solo porque a ti no te hace sentido😂

  • @yvankovkafka8158
    @yvankovkafka8158 3 месяца назад

    desgraciadamente entendí una mierda, ES MI PROBLEMA, que debo estudiar para poder entender los modelos? que lenguaje de programación están usando? hay otro video donde muestren las bases para poder seguirles el paso? muchas gracias, llevo unos meses tratando de aprender y estoy en nada comparado al video que para mi está en conceptos avanzados 🥴

    • @DataScienceForBusiness
      @DataScienceForBusiness  3 месяца назад

      python. para empezar puedes ver el vídeo de "la mejor ruta para aprender data science"