Pandas desde cero: Estadísticas básicas para un archivo CSV (+4000 registros)

Поделиться
HTML-код
  • Опубликовано: 24 окт 2024

Комментарии • 72

  • @cctmexico
    @cctmexico  7 лет назад +5

    Por si tienen prisa..o quieren ir al grano, aquí les dejamos el resumen del vídeo por minuto, esperamos que les sea de utilidad:
    2:55 Impresión de los primeros registros (head)
    4:20 Datos del CSV al DataFrame
    6:17 Reemplazar datos NaN por ceros
    9:30 Impresión de estadísticas que solamente tengan valores numéricos (np.number)
    10:57 Reemplazar valores “N/A” y “NR” (No ranking)
    14:20 Conversión de los datos de dos columnas a enteros
    15:50 Impresión de las estadísticas básicas, con los valores modificados
    16:27 Eliminar todos los registros (filas) donde haya NaN (dropna)

  • @robertoregaladoarreola5713
    @robertoregaladoarreola5713 3 года назад +2

    Sigo con los tutoriales la verdad me están sirviendo mucho!!! Gracias por el aporte!!!👍👍

  • @luisangelhernandezortiz6830
    @luisangelhernandezortiz6830 7 лет назад +27

    Al principio del tutorial tuve algunos problemas, por los datos me daban muchos errores: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 17: invalid continuation byte
    Por si le sucede lo mismo a alguien mas, solo tienen que agregar esto a la linea:
    datos = pd.read_csv('ATP.csv',encoding = "ISO-8859-1")
    Gracias por tus tutoriales :D

    • @cctmexico
      @cctmexico  7 лет назад +2

      +Luis Angel Hernandez Ortiz ¡Muchas gracias, por tu aportación! Y muchos saludos!!

    • @juanenriquelopezmarcos1774
      @juanenriquelopezmarcos1774 6 лет назад

      Buenas, me gustaría saber por qué si utilizo encoding="utf-8" no funciona cuando no hay aparentemente símbolos "raros" (ä, Ë, ô, etc..)

    • @juansalvador7481
      @juansalvador7481 6 лет назад +1

      A que se debe eso?

    • @andres1guerrero965
      @andres1guerrero965 4 года назад

      Genial.

  • @hildazepeda5040
    @hildazepeda5040 4 года назад

    Me encanta la practicidad de los videos, y la forma en la que organizan la información que brindan sobre los mismos (el resumen de los temas vistos en los comentarios, los links que proporcionan, etc). Son pocos los canales que he visto con esa organización. Muchas gracias!

  • @franciscoalejandrolunarang839
    @franciscoalejandrolunarang839 2 года назад +1

    muy chingon el contenido, me gusto porque lo explicas de una manera muy sencilla, gracias

  • @AngelPerez-pl6sm
    @AngelPerez-pl6sm 2 года назад

    Quiero aprender pandas porque me gusta la programación , pero odio Excel y debo utilizarlo jaja. Así que esta es la única manera que veo de aplicar algo que me gusta que es la programación, sobre algo que no me gusta que es el Excel. Excelente explicación en los videos!

  • @josearmandomejiavelez3106
    @josearmandomejiavelez3106 8 месяцев назад +1

    Muy buen video, la explicación es perfecta

  • @davidsaez1481
    @davidsaez1481 4 года назад +1

    Excelente, comienzo a dar mis primeros pasos en Python y este canal me viene como anillo al dedo!

    • @cctmexico
      @cctmexico  4 года назад

      ¡Muchas gracias por tan amable comentario, nos da mucho gusto saber que estas aprendiendo Python, éxito y saludos desde México!

  • @jhonmoraless5509
    @jhonmoraless5509 6 лет назад +1

    Primero que nada quiero felicitarte por el gran conocimiento que posees para manipular todo esto y decirte que tienes mi respeto, además quiero agradecerte por brindarnoslo gratuitamente, almenos por mi parte te estoy eternamente agradecido por que es un tema que no domino bien pero me encuentro en proceso de aprendizaje. Sigue adelante ya tienes un suscriptor, felíz día.

    • @cctmexico
      @cctmexico  6 лет назад

      ¡Muchas gracias por dejarnos tan amable comentario, nos hizo el día! Nos da mucho gusto saber que estos vídeos son de utilidad, para que más personas puedan conocer de esta increíble (y fácil de usar) herramienta, muchas gracias a tí por vernos y mucho éxito en el aprendizaje y aplicación de Pandas!!

  • @sistemasmatematicos1092
    @sistemasmatematicos1092 4 года назад +1

    Tus vídeos son muy buenos

    • @cctmexico
      @cctmexico  4 года назад

      ¡Muchas gracias por tan amable comentario!

  • @andresfelipeangelciro6911
    @andresfelipeangelciro6911 3 года назад

    Excelente, muchas gracias por tu video.
    Tengo una pregunta, ¿ cómo hago para cambiar el tipo de dato en una columna cuando el nombre de esa columna está separada por espacios?
    De antemano gracias, un saludo.

  • @juanf3596
    @juanf3596 4 года назад +2

    Hola, disculpen me sale lo siguiente:
    FileNotFoundError: [Errno 2] FIle ATP.csv does not exist: 'ATP.csv' que puedo hacer

  • @luisaguila7583
    @luisaguila7583 2 года назад +2

    Me gustan los videos y como se presenta, pero la música no acompaña y a momentos sobrepasa el volumen de tu voz. Saludos

    • @cctmexico
      @cctmexico  2 года назад

      Los nuevos vídeos ya no tienen música, esperamos que les sean de utilidad ^_^

  • @nobodycaresmeself
    @nobodycaresmeself 4 года назад +1

    muchas gracias!!!

  • @rubengutierrez3736
    @rubengutierrez3736 5 лет назад +2

    El archivo en formato csv ya no está disponible en la ruta indicada. Por favor compartirlo. Muchas gracias

    • @maynermoran2577
      @maynermoran2577 5 лет назад +1

      que le podemos hacer

    • @cctmexico
      @cctmexico  5 лет назад

      Hola, lo pueden encontrar en: bit.ly/2NSPYQa

    • @cctmexico
      @cctmexico  5 лет назад

      Hola, lo pueden encontrar en: bit.ly/2NSPYQa

  • @maxyupanquiconza5247
    @maxyupanquiconza5247 7 лет назад +1

    Buenos aportes los que se hace en toda esta colección de vídeos sobre pandas felicidades, tengo una consulta al momento de importar los datos del CSV o XLSX estos datos no se importan como data frame?, gracias

    • @cctmexico
      @cctmexico  7 лет назад

      ¡Muchas gracias por su amable comentario! Para hacerlos como Data Frame, se necesita un paso (ver minuto 4:20) pero es muy sencillo :)

    • @maxyupanquiconza5247
      @maxyupanquiconza5247 7 лет назад +1

      Gracias si lo vi, en caso de yo no llevarlo a un data frame podria procesar sus datos?

    • @cctmexico
      @cctmexico  7 лет назад

      Así es se puede trabajar con la información, incluso copiar datos a otras estructuras como arreglos

  • @viroxxx
    @viroxxx Год назад

    Una pregunta. El temario, software, ejemplos, ejercicios son viables a este año actual (2023)? o si hay cambios de raíz significativos que afecten este curso?

    • @cctmexico
      @cctmexico  Год назад

      Si, se pueden aplicar sin problemas al 2023 y en caso de haber alguna modificación en la instrucción el mismo Pandas lo indica.

    • @viroxxx
      @viroxxx Год назад +1

      @@cctmexico Perfecto. Gracias!

  • @Bloodcrack7740
    @Bloodcrack7740 10 месяцев назад +1

    Hola que tal tengo una duda en que ruta se debe dejar el archivo csv?

    • @cctmexico
      @cctmexico  10 месяцев назад

      Hola! En la misma ruta en la que estés escribiendo tu código :)

  • @plutarcocriterion754
    @plutarcocriterion754 4 года назад +1

    Muy buen video
    Gracias.
    Con solo 4 lineas los import, el read y el print info me aparecen estos mensajes :File "pandas\_libs\parsers.pyx", line 874, in pandas._libs.parsers.TextReader._read_low_memory
    No se a que se deben
    Hay que hacerle algo especial al archivo?

    • @cctmexico
      @cctmexico  4 года назад

      No habíamos visto antes ese error, pero nos encontramos esta información que te podría ayudar: stackoverflow.com/questions/59393510/getting-errors-memory-from-pandas-dataframe-from-csv

  • @landscapehistorylab
    @landscapehistorylab 4 года назад

    Cuando intento importar el archivo con nombre 'GC_MCultivos2019.csv' me salen los siguientes errores. ¿A qué puede ser debido? Muchas gracias.
    During handling of the above exception, another exception occurred:
    Traceback (most recent call last):
    File "C:\Users\GFyMA\Documents\Python_spyder\prueba.py", line 3, in
    datos=pd.read_csv('GC_MCultivos_2019.csv')
    File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 676, in parser_f
    return _read(filepath_or_buffer, kwds)
    File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 454, in _read
    data = parser.read(nrows)
    File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1133, in read
    ret = self._engine.read(nrows)
    File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 2037, in read
    data = self._reader.read(nrows)
    File "pandas\_libs\parsers.pyx", line 860, in pandas._libs.parsers.TextReader.read
    File "pandas\_libs\parsers.pyx", line 875, in pandas._libs.parsers.TextReader._read_low_memory
    File "pandas\_libs\parsers.pyx", line 952, in pandas._libs.parsers.TextReader._read_rows
    File "pandas\_libs\parsers.pyx", line 1084, in pandas._libs.parsers.TextReader._convert_column_data
    File "pandas\_libs\parsers.pyx", line 1137, in pandas._libs.parsers.TextReader._convert_tokens
    File "pandas\_libs\parsers.pyx", line 1254, in pandas._libs.parsers.TextReader._convert_with_dtype
    File "pandas\_libs\parsers.pyx", line 1269, in pandas._libs.parsers.TextReader._string_convert
    File "pandas\_libs\parsers.pyx", line 1459, in pandas._libs.parsers._string_box_utf8
    UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 37: invalid continuation byte

  • @sergiogomezvega5023
    @sergiogomezvega5023 5 лет назад +1

    Disculpen, sí no hace nada de eso, qué me recomiendan, trabajo igual en el entorno de spyder y todo como lo tienen. En el vídeo anterior en la creación de las dataframe no tuve ningún error.
    Saludos.

    • @sergiogomezvega5023
      @sergiogomezvega5023 5 лет назад +1

      aclaro, sí está todo dentro de la misma carpeta

    • @cctmexico
      @cctmexico  5 лет назад

      Primero, que bueno que estás iniciando en Python, ya verás que con la práctica se hará cada vez más fácil, ¿Te manda algún mensaje de error? Este video te podría ser de utilidad, para resolver errores:
      ruclips.net/video/X46F2-OxxqY/видео.html

  • @Xjcios
    @Xjcios 4 года назад

    tengo una consulta tengo mi dataframe df y para crear otro solo pongo "df2 = df" habría alguna diferencia en como lo realizas en el vídeo "df2 = pd.DataFrame(df)"

    • @cctmexico
      @cctmexico  4 года назад

      Hola Julio, no hay diferencia, saludos!

  • @ISVO
    @ISVO 4 года назад

    hola buenos vídeos, una consulta... si o si hay que convertirlo a dataframe? que pasa si no lo convertimos no podemos aplicar los comandos sobre el csv importado? siempre hay que pasar los archivos importados csv/excel a dataframe para poder trabajar sobre los mismo? gracias

    • @cctmexico
      @cctmexico  4 года назад

      Hola Ismael, al leer el csv con pandas ya queda como un dataframe, saludos!

  • @victorhugoachocallaromero
    @victorhugoachocallaromero 5 лет назад +2

    Muy bueno pero el audio de fondo muy fuerte, o mejor lo quitan. saludos

    • @cctmexico
      @cctmexico  5 лет назад +1

      Muchas gracias por el amable comentario, en los nuevos vídeos el audio ya está más controlado ;)

  • @guillermomontecinos4497
    @guillermomontecinos4497 4 года назад +1

    Hola como estas, me podrias ayudar a sacar estos tildes de la data núm.: no se como sacarlos de la data. por favor

    • @cctmexico
      @cctmexico  4 года назад +1

      A nosotros nos ha pasado, en una hoja de cálculo (Excel o Libre office calc) cambia el tipo de carácteres, eso es cuando lo abres y te pregunta las opciones para importar el texto

    • @guillermomontecinos4497
      @guillermomontecinos4497 4 года назад

      @@cctmexico gracias excelente curso

  • @damianomarsilva3233
    @damianomarsilva3233 4 года назад +1

    fantástico.

  • @saulivanberistainpetriz6255
    @saulivanberistainpetriz6255 5 лет назад +1

    Hola, muchas felicidades por tan buenos vídeos que forma tan buena de explicar! tengo una duda, yo tengo un conjunto de archivos JSON (6000) con un monton de registros cada archivo, los quiero unir en un solo dataframe de pandas (todos los archivos tienen la misma estructura algo así como un copy/paste) para hacer un solo conjunto de datos he investigado algunas formas de hacerlo con pandas pero siempre que lo intento al ejecutar se reinicia el núcleo. ¿sabe alguna forma de lograrlo correctamente? ¿el equipo en el que lo intento tiene buenas prestaciones de Hardware (i7 y 16 gb de ram) ¿sera que son muchos registros y se traba al procesarlos? quiero hacer todo lo que hizo en este vídeo pero con ese conjunto de datos :( espero me pueda orientar al respecto. Gracias :)

    • @cctmexico
      @cctmexico  5 лет назад

      ¡Muchas gracias por tan amable comentario! ^_^ aquí nos encontramos una pregunta en stackoverflow.com que podría guiarte: stackoverflow.com/questions/21218866/combinging-multiple-json-objects-as-one-dataframe-in-python-pandas
      De todas formas lo vamos anotar como #petición para trabajar con ese tipo de archivos :)

  • @danny_phantom100
    @danny_phantom100 5 лет назад

    ¿Cómo puedo corregir el siguiente erroe? 'utf-8' codec can't decode byte 0xf3

    • @cctmexico
      @cctmexico  5 лет назад

      Hola Daniel nos encontramos esta respuesta, en stackoverflow puedes agregar esta línea:
      read_csv('file', encoding = "ISO-8859-1")
      Más información:
      stackoverflow.com/questions/18171739/unicodedecodeerror-when-reading-csv-file-in-pandas-with-python

    • @sergiogomezvega5023
      @sergiogomezvega5023 5 лет назад

      @@cctmexico esto sirvió a mi comentario anterior

  • @CaldensesIncondicionales
    @CaldensesIncondicionales 4 года назад

    Hola cuando imprimo los datos del datafrsme me sale un error. ' module 'pandas' has no attribute 'dataframe'

    • @juanmatd36
      @juanmatd36 4 года назад

      es DataFrame, con mayúsculas

  • @fpejavier
    @fpejavier 4 года назад

    Tengo un archivo en Excel con 1500 filas y 20 columnas, las columnas nones tienen una fecha y las pares tienen un precio, la situacion es la siguiente: las filas no se corresponden con la fecha, es decir, la fila 1 del precio 1 tiene una fecha y la fila 1 del precio 2 tiene una fecha diferente, esto asi para todas las filas, ademas de que en algunos casos no hay fechas, son celdas vacias; el objetivo es hacer que las fechas empaten y que al final solo se use una columna de fecha para todos los precios, como lo puedo resolver?
    Saludos

    • @cctmexico
      @cctmexico  4 года назад

      Con gusto anotamos la idea como un vídeo #petición

    • @fpejavier
      @fpejavier 4 года назад

      @@cctmexico gracias! Quedo atento

  • @juansequerae
    @juansequerae 5 лет назад

    No encuentro el archivo de data para poder hacer el ejercicio, lo pueden compartir?

    • @cctmexico
      @cctmexico  5 лет назад

      De aquí lo obtuvimos :)
      www.kaggle.com/jordangoblet/atp-tour-20002016

  • @arturoriveroshernandez7699
    @arturoriveroshernandez7699 4 года назад

    Si en lugar de leer un archivo .csv quisiera leer un archivo .txt igual de grande que el video se puede?

    • @cctmexico
      @cctmexico  4 года назад

      Si, si se puede, nos encontramos con este ejemplo:
      data = pd.read_csv('output_list.txt', sep=" ", header=None)
      data.columns = ["a", "b", "c", "etc."]

    • @arturoriveroshernandez7699
      @arturoriveroshernandez7699 4 года назад

      @@cctmexico Gracias, si me lee el archivo pero me manda toda una linea en cada fila no me crea mas columnas, ejemplo si tengo en mi txt 1,2,3,4,5,6 me lo guarda asi en mi varible data:
      a
      1 1,2,3,4,5,6
      y quisiera que me lo guardara así:
      a b c d e f
      1 1 2 3 4 5 6
      No se si sea posible lograr eso?

  • @alejandrodeharo9509
    @alejandrodeharo9509 4 года назад +1

    El archivo que ponen no son los datos del video

    • @cctmexico
      @cctmexico  4 года назад

      Muchas gracias por el aviso, ya actualizamos la liga: bit.ly/3aGNf5C

  • @KarlVonBismark
    @KarlVonBismark 4 года назад

    Que distribución Linux usas?
    Saludos

    • @cctmexico
      @cctmexico  4 года назад

      Hola! Actualmente tenemos Ubuntu 18.04.3 LTS (Bionic Beaver)