No sabes cuanto estaba esperando este video, muchas gracias. Podrías hacer uno de como se relaciona NUMPY con PANDAS? que aún no tengo muy claro como sacarle el jugo a estas dos librerías.
Es cierto Pandas esta basado en Numpy. Podria hacer un video basico de Numpy pero seria muy aburrido. Lo que podria hacer es un video intermedio/avanzado de Numpy donde enseño las buenas practicas al momento de trabajar con data. Lo que sucedes es que Numpy nos permite vectorizar las operaciones haciendo todo más eficiente y rápido.
Hola Frank, un video súper bien explicado desde cero, pero sabes, me gustaría que hicieras una predicción del mundial no con resultados históricos, sino con los resultados recientes de las clasificaciones al mundial de las distintas confederaciones y dandole una ponderación a los ranking FIFA también. Considero que de esta manera se puede hacer un pronóstico más acertado...
Hola. La data seria muy poca y solo basado en esa data lo más probable es que lo gane Dinamarca o Alemania que ganaron 9 partidos y solo perdieron 1 haciendo +27 goles de diferencia.
Hola, de antemano muchas gracias por el video pero tuve un problema. Cuando uso dropna() para mi data, se elimina absolutamente toda la información, pues Dropna tiene en cuenta filas y columnas. Para ello, si queremos eliminar solamente datos en Columnas por ejemplo, usamos
El método dropna() se utiliza para eliminar filas o columnas que contienen valores faltantes (NaN) en un DataFrame. El comportamiento por defecto es eliminar filas que contengan al menos un valor NaN, pero puedes modificarlo usando el parámetro axis. Parámetros clave: axis: axis=0 o axis='index' (por defecto): Elimina filas que contengan valores NaN. axis=1 o axis='columns': Elimina columnas que contengan valores NaN. how: how='any' (por defecto): Elimina filas o columnas si algún valor es NaN. how='all': Elimina filas o columnas solo si todos los valores son NaN. subset: Permite especificar un subconjunto de columnas para verificar valores NaN. Solo se eliminarán filas o columnas basadas en estas columnas. inplace: Si inplace=True, modifica el DataFrame directamente en lugar de devolver uno nuevo. Ejemplos prácticos 1. Eliminar filas con valores NaN (por defecto): python Copy import pandas as pd # Crear un DataFrame de ejemplo data = { 'A': [1, 2, None, 4], 'B': [None, 2, 3, 4], 'C': [1, 2, 3, None] } df = pd.DataFrame(data) # Eliminar filas con algún valor NaN df_cleaned = df.dropna() print(df_cleaned) Salida: Copy A B C 1 2.0 2.0 2.0 2. Eliminar columnas con valores NaN: python Copy # Eliminar columnas con algún valor NaN df_cleaned = df.dropna(axis=1) print(df_cleaned) Salida: Copy Empty DataFrame Columns: [] Index: [0, 1, 2, 3] En este caso, todas las columnas tenían al menos un NaN, por lo que se eliminaron todas. 3. Eliminar filas donde todos los valores son NaN: python Copy # Crear un DataFrame con una fila completamente NaN data = { 'A': [1, None, None], 'B': [None, None, None], 'C': [1, None, None] } df = pd.DataFrame(data) # Eliminar filas donde todos los valores son NaN df_cleaned = df.dropna(how='all') print(df_cleaned) Salida: Copy A B C 0 1.0 NaN 1.0 1 NaN NaN NaN Aquí solo se eliminaría la fila 2 si existiera una fila completamente vacía. 4. Especificar un subconjunto de columnas: python Copy # Eliminar filas donde la columna 'A' tiene NaN df_cleaned = df.dropna(subset=['A']) print(df_cleaned) Salida: Copy A B C 0 1.0 NaN 1.0 5. Modificar el DataFrame original (inplace=True): python Copy # Eliminar filas con NaN y modificar el DataFrame original df.dropna(inplace=True) print(df) Salida: Copy A B C 0 1.0 NaN 1.0 Consejos adicionales Si solo quieres eliminar columnas que están completamente vacías, usa how='all' junto con axis=1: python Copy df_cleaned = df.dropna(axis=1, how='all') Si tu DataFrame tiene muchos valores NaN y no quieres perder demasiados datos, considera usar fillna() para rellenar los valores faltantes en lugar de eliminarlos.
Hola amigo, una pregunta, que plataforma en español recomiendas para hacer una carrera de data science e inteligencia artificial ? soy ingeniero mecatrónico pero quiero especializarme en el área , he visto plataformas latinoamericanas como coderhouse y platzi, si pudieras orientarme, muy agradecido . Excelentes tus videos, saludos desde chile.
Genial este video!! Muy buen trabajo!!
Impecable, gran trabajo amigo, gracias por compartir.
No sabes cuanto estaba esperando este video, muchas gracias. Podrías hacer uno de como se relaciona NUMPY con PANDAS? que aún no tengo muy claro como sacarle el jugo a estas dos librerías.
De hecho Pandas está basado en Numpy
Es cierto Pandas esta basado en Numpy. Podria hacer un video basico de Numpy pero seria muy aburrido. Lo que podria hacer es un video intermedio/avanzado de Numpy donde enseño las buenas practicas al momento de trabajar con data. Lo que sucedes es que Numpy nos permite vectorizar las operaciones haciendo todo más eficiente y rápido.
Sií, por favor!
Excelente video como siempre, eres un crack!!!
Hola Frank, un video súper bien explicado desde cero, pero sabes, me gustaría que hicieras una predicción del mundial no con resultados históricos, sino con los resultados recientes de las clasificaciones al mundial de las distintas confederaciones y dandole una ponderación a los ranking FIFA también. Considero que de esta manera se puede hacer un pronóstico más acertado...
Hola. La data seria muy poca y solo basado en esa data lo más probable es que lo gane Dinamarca o Alemania que ganaron 9 partidos y solo perdieron 1 haciendo +27 goles de diferencia.
Muchas gracias por este contenido ayudando a mucha gente aprender
Excelente trabajo.
Gracias. Muy buena explicación.
Muchas gracias por compartir conocimientos
dia 1 00:08:50
dia2 00:13:47
dia3 00:22:48
dia4 00:26:28
dia5 00:33:13
Genial!! Gracias!!!
Excelente ejemplo!
Impecable.. muy buen video
Muchas gracias por el aporte
Hola, de antemano muchas gracias por el video pero tuve un problema.
Cuando uso dropna() para mi data, se elimina absolutamente toda la información, pues Dropna tiene en cuenta filas y columnas. Para ello, si queremos eliminar solamente datos en Columnas por ejemplo, usamos
El método dropna() se utiliza para eliminar filas o columnas que contienen valores faltantes (NaN) en un DataFrame. El comportamiento por defecto es eliminar filas que contengan al menos un valor NaN, pero puedes modificarlo usando el parámetro axis.
Parámetros clave:
axis:
axis=0 o axis='index' (por defecto): Elimina filas que contengan valores NaN.
axis=1 o axis='columns': Elimina columnas que contengan valores NaN.
how:
how='any' (por defecto): Elimina filas o columnas si algún valor es NaN.
how='all': Elimina filas o columnas solo si todos los valores son NaN.
subset:
Permite especificar un subconjunto de columnas para verificar valores NaN. Solo se eliminarán filas o columnas basadas en estas columnas.
inplace:
Si inplace=True, modifica el DataFrame directamente en lugar de devolver uno nuevo.
Ejemplos prácticos
1. Eliminar filas con valores NaN (por defecto):
python
Copy
import pandas as pd
# Crear un DataFrame de ejemplo
data = {
'A': [1, 2, None, 4],
'B': [None, 2, 3, 4],
'C': [1, 2, 3, None]
}
df = pd.DataFrame(data)
# Eliminar filas con algún valor NaN
df_cleaned = df.dropna()
print(df_cleaned)
Salida:
Copy
A B C
1 2.0 2.0 2.0
2. Eliminar columnas con valores NaN:
python
Copy
# Eliminar columnas con algún valor NaN
df_cleaned = df.dropna(axis=1)
print(df_cleaned)
Salida:
Copy
Empty DataFrame
Columns: []
Index: [0, 1, 2, 3]
En este caso, todas las columnas tenían al menos un NaN, por lo que se eliminaron todas.
3. Eliminar filas donde todos los valores son NaN:
python
Copy
# Crear un DataFrame con una fila completamente NaN
data = {
'A': [1, None, None],
'B': [None, None, None],
'C': [1, None, None]
}
df = pd.DataFrame(data)
# Eliminar filas donde todos los valores son NaN
df_cleaned = df.dropna(how='all')
print(df_cleaned)
Salida:
Copy
A B C
0 1.0 NaN 1.0
1 NaN NaN NaN
Aquí solo se eliminaría la fila 2 si existiera una fila completamente vacía.
4. Especificar un subconjunto de columnas:
python
Copy
# Eliminar filas donde la columna 'A' tiene NaN
df_cleaned = df.dropna(subset=['A'])
print(df_cleaned)
Salida:
Copy
A B C
0 1.0 NaN 1.0
5. Modificar el DataFrame original (inplace=True):
python
Copy
# Eliminar filas con NaN y modificar el DataFrame original
df.dropna(inplace=True)
print(df)
Salida:
Copy
A B C
0 1.0 NaN 1.0
Consejos adicionales
Si solo quieres eliminar columnas que están completamente vacías, usa how='all' junto con axis=1:
python
Copy
df_cleaned = df.dropna(axis=1, how='all')
Si tu DataFrame tiene muchos valores NaN y no quieres perder demasiados datos, considera usar fillna() para rellenar los valores faltantes en lugar de eliminarlos.
Si hay más datos con w/o debería ser:
df_historical_data[
df_historical_data['score'].str.contains('w/o')
]
verdad?
Solo hay un problema estas usando jupyter notebook antes del video 2.
Hola amigo, una pregunta, que plataforma en español recomiendas para hacer una carrera de data science e inteligencia artificial ? soy ingeniero mecatrónico pero quiero especializarme en el área , he visto plataformas latinoamericanas como coderhouse y platzi, si pudieras orientarme, muy agradecido .
Excelentes tus videos,
saludos desde chile.
coursera
saben como añadir datos a un dataframe
Donde encuentro el video donde se extrae la data faltante?
Lo acabo de subir hace unos minutos. Es el video "Data Science con Selenium"
en que version de python es compatible pandas, con la 3.9 no funciona
Lo he intentado todo pero no lee el csv ni en jupyter ni en colab :(
Ubicaste el link correctamente?
Porque cuando se descargan los archivos del video el cvs no esta alineado con la libreta
Se pondría: df_data_historica = pd.read_csv('./data/fifa_worldcup_matches.cvs')
Cupon para el curso?
Esperate al black friday 😉
No funciona la expresion regular " df_data_historica[df_data_historica['score'].str.contains('[^\d-]')] "
Creo que es por el guión, no funciona con el del teclado, selecciona el que sale en la columna score del dataframe y haz copy-paste en la expresión
@@lalogarcia4568 Me funciono!... Gracias
@@lalogarcia4568 gracias xD
@@lalogarcia4568 fino, también estaba teniendo el mismo problema
Las fechas me tan comiendo vivo
Falló la prediccion, asi que AGUANTE ARGENTINA !!! 🤣 LTA python