Curso de Pandas para Data Science (Análisis de Data de Mundiales de Futbol con Python)

Поделиться
HTML-код
  • Опубликовано: 5 фев 2025

Комментарии • 41

  • @leandro_potrino
    @leandro_potrino Год назад +2

    Genial este video!! Muy buen trabajo!!

  • @legadoleemon
    @legadoleemon Год назад +2

    Impecable, gran trabajo amigo, gracias por compartir.

  • @mitchelnunez753
    @mitchelnunez753 2 года назад +13

    No sabes cuanto estaba esperando este video, muchas gracias. Podrías hacer uno de como se relaciona NUMPY con PANDAS? que aún no tengo muy claro como sacarle el jugo a estas dos librerías.

    • @dfaquino
      @dfaquino 2 года назад +1

      De hecho Pandas está basado en Numpy

    • @thepycoachES
      @thepycoachES  2 года назад +11

      Es cierto Pandas esta basado en Numpy. Podria hacer un video basico de Numpy pero seria muy aburrido. Lo que podria hacer es un video intermedio/avanzado de Numpy donde enseño las buenas practicas al momento de trabajar con data. Lo que sucedes es que Numpy nos permite vectorizar las operaciones haciendo todo más eficiente y rápido.

    • @mitchelnunez753
      @mitchelnunez753 2 года назад

      Sií, por favor!

  • @mauriciorodriguez1278
    @mauriciorodriguez1278 2 года назад +1

    Excelente video como siempre, eres un crack!!!

  • @dfaquino
    @dfaquino 2 года назад +2

    Hola Frank, un video súper bien explicado desde cero, pero sabes, me gustaría que hicieras una predicción del mundial no con resultados históricos, sino con los resultados recientes de las clasificaciones al mundial de las distintas confederaciones y dandole una ponderación a los ranking FIFA también. Considero que de esta manera se puede hacer un pronóstico más acertado...

    • @thepycoachES
      @thepycoachES  2 года назад +6

      Hola. La data seria muy poca y solo basado en esa data lo más probable es que lo gane Dinamarca o Alemania que ganaron 9 partidos y solo perdieron 1 haciendo +27 goles de diferencia.

  • @cesarandrade9285
    @cesarandrade9285 2 года назад

    Muchas gracias por este contenido ayudando a mucha gente aprender

  • @oscar86077
    @oscar86077 Год назад

    Excelente trabajo.

  • @carlosroka1939
    @carlosroka1939 10 месяцев назад

    Gracias. Muy buena explicación.

  • @mikejack9813
    @mikejack9813 8 месяцев назад

    Muchas gracias por compartir conocimientos

  • @ock2403
    @ock2403 Год назад

    dia 1 00:08:50
    dia2 00:13:47
    dia3 00:22:48
    dia4 00:26:28
    dia5 00:33:13

  • @ingluissantana
    @ingluissantana 2 года назад +1

    Genial!! Gracias!!!

  • @milovanmarrder668
    @milovanmarrder668 Год назад

    Excelente ejemplo!

  • @diegodalinger6376
    @diegodalinger6376 2 года назад

    Impecable.. muy buen video

  • @manfredazofeifa5077
    @manfredazofeifa5077 11 месяцев назад

    Muchas gracias por el aporte

  • @leidertorres3364
    @leidertorres3364 2 месяца назад

    Hola, de antemano muchas gracias por el video pero tuve un problema.
    Cuando uso dropna() para mi data, se elimina absolutamente toda la información, pues Dropna tiene en cuenta filas y columnas. Para ello, si queremos eliminar solamente datos en Columnas por ejemplo, usamos

    • @luisorlandoguerragonzalez1114
      @luisorlandoguerragonzalez1114 6 дней назад

      El método dropna() se utiliza para eliminar filas o columnas que contienen valores faltantes (NaN) en un DataFrame. El comportamiento por defecto es eliminar filas que contengan al menos un valor NaN, pero puedes modificarlo usando el parámetro axis.
      Parámetros clave:
      axis:
      axis=0 o axis='index' (por defecto): Elimina filas que contengan valores NaN.
      axis=1 o axis='columns': Elimina columnas que contengan valores NaN.
      how:
      how='any' (por defecto): Elimina filas o columnas si algún valor es NaN.
      how='all': Elimina filas o columnas solo si todos los valores son NaN.
      subset:
      Permite especificar un subconjunto de columnas para verificar valores NaN. Solo se eliminarán filas o columnas basadas en estas columnas.
      inplace:
      Si inplace=True, modifica el DataFrame directamente en lugar de devolver uno nuevo.
      Ejemplos prácticos
      1. Eliminar filas con valores NaN (por defecto):
      python
      Copy
      import pandas as pd
      # Crear un DataFrame de ejemplo
      data = {
      'A': [1, 2, None, 4],
      'B': [None, 2, 3, 4],
      'C': [1, 2, 3, None]
      }
      df = pd.DataFrame(data)
      # Eliminar filas con algún valor NaN
      df_cleaned = df.dropna()
      print(df_cleaned)
      Salida:
      Copy
      A B C
      1 2.0 2.0 2.0
      2. Eliminar columnas con valores NaN:
      python
      Copy
      # Eliminar columnas con algún valor NaN
      df_cleaned = df.dropna(axis=1)
      print(df_cleaned)
      Salida:
      Copy
      Empty DataFrame
      Columns: []
      Index: [0, 1, 2, 3]
      En este caso, todas las columnas tenían al menos un NaN, por lo que se eliminaron todas.
      3. Eliminar filas donde todos los valores son NaN:
      python
      Copy
      # Crear un DataFrame con una fila completamente NaN
      data = {
      'A': [1, None, None],
      'B': [None, None, None],
      'C': [1, None, None]
      }
      df = pd.DataFrame(data)
      # Eliminar filas donde todos los valores son NaN
      df_cleaned = df.dropna(how='all')
      print(df_cleaned)
      Salida:
      Copy
      A B C
      0 1.0 NaN 1.0
      1 NaN NaN NaN
      Aquí solo se eliminaría la fila 2 si existiera una fila completamente vacía.
      4. Especificar un subconjunto de columnas:
      python
      Copy
      # Eliminar filas donde la columna 'A' tiene NaN
      df_cleaned = df.dropna(subset=['A'])
      print(df_cleaned)
      Salida:
      Copy
      A B C
      0 1.0 NaN 1.0
      5. Modificar el DataFrame original (inplace=True):
      python
      Copy
      # Eliminar filas con NaN y modificar el DataFrame original
      df.dropna(inplace=True)
      print(df)
      Salida:
      Copy
      A B C
      0 1.0 NaN 1.0
      Consejos adicionales
      Si solo quieres eliminar columnas que están completamente vacías, usa how='all' junto con axis=1:
      python
      Copy
      df_cleaned = df.dropna(axis=1, how='all')
      Si tu DataFrame tiene muchos valores NaN y no quieres perder demasiados datos, considera usar fillna() para rellenar los valores faltantes en lugar de eliminarlos.

  • @JuniorOnLive
    @JuniorOnLive 2 года назад

    Si hay más datos con w/o debería ser:
    df_historical_data[
    df_historical_data['score'].str.contains('w/o')
    ]
    verdad?

  • @veritas2162
    @veritas2162 Год назад

    Solo hay un problema estas usando jupyter notebook antes del video 2.

  • @2299alexander
    @2299alexander Год назад +1

    Hola amigo, una pregunta, que plataforma en español recomiendas para hacer una carrera de data science e inteligencia artificial ? soy ingeniero mecatrónico pero quiero especializarme en el área , he visto plataformas latinoamericanas como coderhouse y platzi, si pudieras orientarme, muy agradecido .
    Excelentes tus videos,
    saludos desde chile.

  • @nehemiaslindao3661
    @nehemiaslindao3661 Год назад

    saben como añadir datos a un dataframe

  • @JORDAN7514
    @JORDAN7514 2 года назад +1

    Donde encuentro el video donde se extrae la data faltante?

    • @thepycoachES
      @thepycoachES  2 года назад

      Lo acabo de subir hace unos minutos. Es el video "Data Science con Selenium"

  • @alejandroiosefosorio4261
    @alejandroiosefosorio4261 2 года назад

    en que version de python es compatible pandas, con la 3.9 no funciona

  • @veritas2162
    @veritas2162 Год назад

    Lo he intentado todo pero no lee el csv ni en jupyter ni en colab :(

    • @nadie-pr7nl
      @nadie-pr7nl Год назад

      Ubicaste el link correctamente?

    • @nadie-pr7nl
      @nadie-pr7nl Год назад

      Porque cuando se descargan los archivos del video el cvs no esta alineado con la libreta

    • @nadie-pr7nl
      @nadie-pr7nl Год назад

      Se pondría: df_data_historica = pd.read_csv('./data/fifa_worldcup_matches.cvs')

  • @jorgefalappa842
    @jorgefalappa842 2 года назад +1

    Cupon para el curso?

  • @laltuve
    @laltuve 2 года назад +3

    No funciona la expresion regular " df_data_historica[df_data_historica['score'].str.contains('[^\d-]')] "

    • @lalogarcia4568
      @lalogarcia4568 2 года назад +9

      Creo que es por el guión, no funciona con el del teclado, selecciona el que sale en la columna score del dataframe y haz copy-paste en la expresión

    • @laltuve
      @laltuve 2 года назад

      @@lalogarcia4568 Me funciono!... Gracias

    • @ronaldastudillo9694
      @ronaldastudillo9694 Год назад

      @@lalogarcia4568 gracias xD

    • @Mastodonte71
      @Mastodonte71 Год назад

      @@lalogarcia4568 fino, también estaba teniendo el mismo problema

  • @luiangel8242
    @luiangel8242 7 месяцев назад

    Las fechas me tan comiendo vivo

  • @elricho72
    @elricho72 2 года назад

    Falló la prediccion, asi que AGUANTE ARGENTINA !!! 🤣 LTA python