me pidieron crear una base de datos bajo unos parametros. Bueno el punto es que tengo filas con valores repetidos y si bien algunas columnas tienen el mismo valor, tambien hay filas con valores en diferentes columnas como tambien hay columnas en blanco que podrian ser complementadas con las filas repetidas. hay alguna forma de combinar las filas para crear y complementar unas a otras para crear otra fila nueva que este completa? actualmente tengo mas de 17k de datos y 83 columnas . por eso busco ayuda gracias. espero puedan ayudarme
3 года назад
Hola Alejandro, El primer paso sería realizar una exploración de datos, y luego una limpieza. Quedo atento. Saludo,
Te lanzo otra pregunta, no sé si la has resuelto en otro video. En este ejemplo los registros duplicados contenían información diferente ¿podríamos hacer la eliminación de duplicados en una sola columna y conservar los datos de las demás? Gracias por tu dedicación y esfuerzo
3 года назад
Hola, Es posible hacer manipulación de datos sobre cualquiera de los ejes de un DataFrame. Para los valores duplicados se puede asignar un valor bandera que indique duplicidad para que sirva como indicación para no ser considerado para otra operación relevante. Saludo,
Y como seria para eliminar teniendo en cuenta toda la fila no una celda de ella ?
2 года назад
Hola 😃 Miguel. Espero te encuentres bien. Usa esta guía: www.geeksforgeeks.org/drop-rows-from-the-dataframe-based-on-certain-condition-applied-on-a-column/ Quedo atento 👨💻. Saludo 👋🏻 desde Colombia 🇨🇴.
Como puedes borrar los repetidos de una dataframe muy grande con muchos repetidos
me pidieron crear una base de datos bajo unos parametros. Bueno el punto es que tengo filas con valores repetidos y si bien algunas columnas tienen el mismo valor, tambien hay filas con valores en diferentes columnas como tambien hay columnas en blanco que podrian ser complementadas con las filas repetidas.
hay alguna forma de combinar las filas para crear y complementar unas a otras para crear otra fila nueva que este completa? actualmente tengo mas de 17k de datos y 83 columnas . por eso busco ayuda gracias. espero puedan ayudarme
Hola Alejandro,
El primer paso sería realizar una exploración de datos, y luego una limpieza.
Quedo atento.
Saludo,
¿cúal es el editor de texto que utilizas ?
Hola 😀 Antonio.
Jupyter Notebook.
Saludo 👋🏻 desde Colombia 🇨🇴.
Te lanzo otra pregunta, no sé si la has resuelto en otro video. En este ejemplo los registros duplicados contenían información diferente ¿podríamos hacer la eliminación de duplicados en una sola columna y conservar los datos de las demás?
Gracias por tu dedicación y esfuerzo
Hola,
Es posible hacer manipulación de datos sobre cualquiera de los ejes de un DataFrame. Para los valores duplicados se puede asignar un valor bandera que indique duplicidad para que sirva como indicación para no ser considerado para otra operación relevante.
Saludo,
Gracias
¡Sigue aprendiendo!
muchas gracias
Hola,
Espero sigas aprendiendo a través de estos contenidos.
Saludo,
@ si, muchas gracias por compartir tus conocimientos
Y como seria para eliminar teniendo en cuenta toda la fila no una celda de ella ?
Hola 😃 Miguel.
Espero te encuentres bien.
Usa esta guía:
www.geeksforgeeks.org/drop-rows-from-the-dataframe-based-on-certain-condition-applied-on-a-column/
Quedo atento 👨💻.
Saludo 👋🏻 desde Colombia 🇨🇴.
Thx bro!
Hola,
Te recomiendo los talleres de Pandas 🐼 en este mismo canal 📺 para aprender más acerca de Python 🐍 y librerías de manipulación de datos.
Saludo,