He visto una gran cantidad de tutoriales sobre pandas y sus videos son muy buenos, mis favoritos por la claridad y sencillez con que explican todas las funciones y métodos utilizadas. Buen trabajo.
Gracias Liliana por compartir tus conocimientos, mis respetos para usted , no me pierdo ninguno de sus videos ¡¡¡¡¡EXCELENTES VIDEOS!!!! No le haga caso a un fulano que se hace llamar "rw03" de esos miles que se ocultan en el anonimato
Muchas gracias por el video!!!, soy nuevo en esto y tu canal me esta ayudando mucho. Además creo que aprendo rápido cuando la persona que me esta enseñando tiene una voz tan bonita :3
Excelente video! que bueno haber encontrado este canal, solo una observación, ahora ya no se usaria "datos.ix" pues "ix" ya es obsoleto, ahora el comando debería ser "datos.loc".
Hola!, la verdad estoy super emocionado con tus videos. me han ayudado un mucho para realizar mis proyectos. Felicidades!!! sigue así. Solo con una recomendación, no he visto tus videos reciente pero en este lo escuche con audífonos y pues se escucha cuando respiras etc. Si te animas con un micro seria super y nuevamente Gracias por tus videos. (espero no incomodar con esto)
Hola, disculpa lo estoy haciendo por jupyter y ya pude leer mi base de datos, pero, no he logrado que la lea en columna sino que la esta leyendo separada por comas en una sola celda
Ya muchas de estas cosas que usted me sugiere las tengo aprendidas. Estoy de hecho programando en python, realizando algunos códigos que me permitan obtener indicadores para poder evaluar a los sistemas que estoy estudiando con motivo de mi tesis. Sin embargo, hay cosas que no se como realizarlas. En el proceso me aparece dudas específicas como la que le pregunté.
Cuando instalas desde la distribución de Anaconda, Pandas viene incluido :) Con Google Colab, puedes programar en línea, sin necesidad de instalar nada :D aquí una introducción de cómo usarlo: ruclips.net/video/p3KaUXZhXtQ/видео.html
Hola, cómo puedo hacer para graficar dos columnas de ese archivo y luego discriminar por otra columna?Por ejemplo, gráficas año e internet y que me descrimine por el porcentaje de teléfono que usa.
tambien como puedo hacer para imprimir la fila con el menor porcentaje de telefono fijo pero delimitado a que solo puede imprimir la fila con los datos de año, computadora y telefono?
+Edinson Sanchez Hola! Aún no tenemos el vídeo, pero aquí te dejamos la liga para bajar Anaconda para Windows, es muy sencillo y así podrás tener acceso a la gran mayoría de librerías de Python incluyendo Pandas: www.continuum.io/downloads
No sé por qué no lee el archivo, no sé si se guarda en una carpeta o que estoy haciendo mal pero el csv lo tengo en descargas y lo nombro tal cual y no lo identifica
Muy buen tuto Liliana, tenía una consulta. Cómo hago para leer un xlsx pero a partir de la 3ra fila y la segunda columna. Es decir los datos empiezan desde la celda B2
hola yo tengo un data_set el cual tiene una columna datetime que esta cada segundo en las filas, quisiera mostrar la fila de los datos partienda que la fila 1 comienza en 1 segundos y se salte a la fila 60 ya que ahi completa el minuto como tal.
Hola, me podrias indicar en que campeta tengo que guardar los datos. Utilizo Anaconda , pero parece el error File b'svcdatos.csv' does not exist , como puedo saber la carpeta en la cual se esta ejecutando, o tienen algun nombre en especifico.
Hola! Debe ser en la carpeta donde estás guardando tu código, revisa si el nombre es el mismo, por una letra que no sea igual, te manda ese error, saludos!
estoy tratando de imprimir un dataframe de un archivo csv pero la primera columna me la corre un espacio de este modo fecha residuo masa huella 2018-04-14 23:00:03 platano -555.66 -1111.32 organico 2018-04-14 23:00:41 hoja de papel -555.66 -1111.32 papel 2018-04-14 23:00:52 botella de cerveza -555.66 -1111.32 vidrio categoria material principal 2018-04-14 23:00:03 platano1 NaN 2018-04-14 23:00:41 papel comun NaN 2018-04-14 23:00:52 vidrio ambar NaN es decir que para mi caso me deja la columna de la fecha sin etiqueta como soluciono esto?
Tal vez este vídeo te puede ser de utilidad: ruclips.net/video/2yDPI--i7hI/видео.html en caso de que no, puedes intentar poner tu pregunta en el sitio stackoverflow.com responden muy rápido y puedes hacer la pregunta en Inglés o Español
Hola! ¡Excelente pregunta! Aquí nos encontramos un ejemplo: import pandas as pd pd.read_csv("../data_folder/data.csv") Fuente: stackoverflow.com/questions/35384358/how-to-open-my-files-in-data-folder-with-pandas-using-relative-path
muy buen video! Te hago una consulta... si yo quisiera hacer lo mismo pero que sea el usuario quien elija un año... osea hago un input para que ingrese un año y solo quiero mostrar los datos de una sola columna de la tabla, por ejemplo telefono... como deberia hacer? gracias
gracias por los videos. Quiero realizar este manejo de datos pero en una interfaz grafica creada con pyqt5, como puedo cargar un archivo excel con los datos y luego realizar sumas de estos? gracias
De nada, gracias a tí por vernos ^_^ justo vamos a subir en la próxima semana un vídeo de Pandas con QTDesigner! Para las operaciones en las columnas, puede ser algo como esto: var = df.groupby('title_year').budget.sum() lo vemos a detalle en este vídeo: ruclips.net/user/edit?o=U&video_id=xaM-YolPFB0
Excelente voy a bajarme el pandas que es el que me hace falta he estado haciendo un programa con un .csv y usando tkinter para la interfaz gráfica y puede ser que pandas me sea de gran utilidad en el mismo. Cuando este más completo me gustaría enviarle dicho código. He estado estudiando el lenguaje y analizando datos de una lotería de triple en mi país Venezuela me he dado cuenta algunas cosas interesantes. No vaya a pensar que soy un jugador jeje de hecho soy Ingeniero Químico solo que me gusta la programación y bueno aprovechando que estoy aprendiendo a usar python pensé en meterle análisis estadístico a esos datos a ver si logro observar algún patrón recurrente o algo que me genere alguna tendencia para inferir estadisticamente algunos números con un mayor grado de confiabilidad. Se que suena medio tonto estudiar números de triples pero bueno no pierdo nada con estudiar por ahora aun no juego nada si he logrado inferir algunos pero aun no estoy convencido del método aun me falta profundizar un poco más otros detalles.
+gramirez_25 Ramirez ¡Excelente! Nosotros en CCTMÉXICO también habemos Ing. Químicos y después podríamos trabajar en comparar los datos que obtengamos de los dos países, acá en México están disponibles los datos de una lotería (podría llamarse así) que se llama Melate, tal vez haya algo interesante..y si no al menos aprendimos más sobre el uso de esta excelente herramienta!
Hola, una duda: si quiero que me salgan todos los datos pero python me oculta varias columnas y filas (por el espacio de visualización, supongo) como hago para que sí me muestre todo?
Hola buen video y buena explicacion. Tengo una duda si tengo un Objeto con sus respectivos atributos, y quiero llenarlo a partir de un dataFrame, donde cada fila seria un objeto y cada columna sus atributos, con que funcion podria realizarlo, solo encontre esa de ix y una de loc e iloc pero ninguna es en si lo que quiero solo me ayudan a extraer ciertas columnas o filas pero una un fila de una en una y al meterlo en un For me arma listas pero de caracteres :(.
Hola! Muchas gracias por vernos y dejarnos tan amable comentario, tal vez te pueda ser de utilidad este vídeo: ruclips.net/video/7Ssb7IDOQ0k/видео.html aquí extraemos sólo algunas columnas y algunos elementos de una columna determinada, utilizando justamente ciclos For y diccionarios, ojála te sea de utilidad, saludos!
Una pregunta. Tengo un archivo .csv y tengo ya mi código hecho. Pero no sé bien cómo hacer que vaya leyendo cada dato conforme se ejecuta el programa. Y para graficarlos, los guardo en listas. Y con matplotlib grafico
Me encanto. Quisiera comparar dos columnas y saber que datos estan repetidos en la columna dos de la collumna 1 y hacer una comulna 3 (con los datos compartidos en la columna uno y dos).
disculpa, empeze a estudiar python desde ayer, donde queda el directorio donde lee python los archivos, y csv q tio de archivo es, es un archivo de sql, o de q base de datos
Hola, si yo quisiera escribir sobre lineas de esta BD osea aplicar CRUD a este csv , se puede hacer. Modificar directamente el archivo o es obligatorio exportarlo a un csv resultante?
Nos encontramos información que te puede ayudar con esa pregunta, este artículo: stupidpythonideas.blogspot.mx/2014/09/how-to-edit-file-in-place.html y por si lo ocupas este vídeo: ruclips.net/video/F1TNkJMgMBE/видео.html
Oye disculpa si quiero hacer un programa que comparé dos archivos planos y de estos ir comparando fila contra fila que elementos van cambiando y en una tercera fila hacerles un vector a estas dos para ver cuáles cambian como le hago?
maestra muy buen video gracias, tengo la duda si existe la forma de seleccionar el archivo desde un cuadro de dialogo emergente en pandas, asi como se hace en tkinter? he buscado mucho en pandas pero no encuentro informacion, le agradeceria si me comparte
Una pregunta: si ya tengo python 3.4.3 y he instalado varios módulos por el pip e instalo anaconda para usar spyder debo desintalar todo o no es necesario? tambien instale por el pip ipython y jupyter no pudo instalar PyQt5 ni 4 instalo spyder pero no logro saber como abrir el entorno de spyder abrí la pg de anaconda y la version de python que tiene es 3.6 quisiera saber si automaticamente los modulos que tengo van a servir y si debo actualizarlos o no va a ser necesario?
Para correr Spyder aquí le dejamos el minuto del vídeo, donde lo hacemos (ruclips.net/video/Ww2kfuLpqGQ/видео.htmlm18s) Nada más es cuestión de buscarlo (con el explorador de archivos) En cuanto a las versiones, podría hacer la prueba, nosotros tuvimos dos versiones diferentes de Python en la misma computadora sin problema.
hola, tengo una columna donde tengo datos como 12 manzanas, 32 manzanas, 1 manzana, 10 manzanas y quiero ordenarlas por el numero pero no se como ordenar un dato con un entero y un str
Estimada Liliana. Buenos días ante todo deseando se en cuentre bien. Soy Carlos Alberto Rodriguez Proenza y le escribo desde Querétaro. Hace algún tiempo le escribí comentándole que estoy realizando un doctorado en la unam en el área de ciencia e ingeniería de materiales, más esfecíficamente en simulaciones moleculares. Para llevar a cabo esto, debo trabajar con grandes bases de datos las cuales obtengo con software de acceso libre llamado LAMMPS y el cual estoy corriendo dentro de linux. La versión de linux que tengo es Debian 8. Por otro lado, de toda esta base de datos necesito obtener un número (indicador) bajo condiciones de simulación diferentes y así poder extraer conclusiones de los sistemas que estudio. Dentro de las variables que hay en mi base de datos se encuentran, el identigicador (id) del atomo, tipo de átomo (type) así como sus correspondientes coordenadas x, y, z. Hace algún tiempo usted explicaba en un video como tratar este tipo de archivos csv usando pandas el cual me resultó de gran utilidad en computadoras en las cuales tengo instalado python 3.6 y en windows 10. Sin embargo, en otra de mis computadoras no puedo usar pandas porque estoy usando Debian 8 y la versión de python que tengo es la 2.7. Necesitaría poder ordenar mis datos por una columna específica (un campo específico) y no lo he podido lograr para seguir avanzando. Pandas no lo puedo usar en esta versión de python y spyder ya que esta versión de python no lo tiene dentro de sus librerías. Me gustaría preguntarle que de que otra forma podría hacer esto una vez leido el archivo? Si no es molestia para usted le podría enviar uno de estos archivos así como el código que estoy usando para tratar de ordenar estos datos. Le estaré muy agradecido por ello. Es de suma importancia para poder seguir avanzando en mi tema de tesis. Aprecio mucho la gran labor de ayuda que ha venido realizando con sus videos. Una disculpa por escribir tanto. Le envío un afectuoso saludo. Atentamente. Carlos Alberto Rodríguez Proenza.
Muchas gracias por tan amables comentarios!! Si, con mucho gusto recibimos sus archivos, vamos un poco retrasados con las peticiones, pero en cuanto podamos atendemos la petición! Nos los puede hacer llegar al correo: cctmexico@gmail.com y mientras tanto, también podría intentar poner la pregunta en Stack Overflow (responden a preguntas en español e Inglés) Reciba muchos saludos afectuosos y ya verá que si se podrá resolver, lo del orden de sus datos.
Estimada Liliana. Le estoy escribiendo desde Querétaro. Actualmente estoy realizando mi tesis de doctorado en el área de física teórica y estoy trabajando con grandes bases de datos en la realización de simulación computacional. Quería preguntarle como, a partir de un archivo csv, el cual tiene varios campos, se puede ordenar el archivo por un determinado campo usando pandas. Por otro lado, como podría hacer lo mismo, pero ahora con una porción del archivo. Lo siguiente es una porción de uno de mis archivos de salida. Como podría ordenar este archivo por el campo id? id,type,xs,ys,zs 500,1,0.413068,0.247238,0.139937 384,1,0.509008,0.225649,0.113632 391,1,0.596777,0.212693,0.0827694 91,1,0.554459,0.155958,0.15268 396,1,0.678003,0.227263,0.134453 183,1,0.263006,0.32626,0.129268 199,1,0.355738,0.315005,0.0961778 572,1,0.398526,0.368158,0.0291984 563,1,0.449962,0.296985,0.0700937 710,1,0.431955,0.334981,0.152336 612,1,0.486912,0.343823,0.000879648 754,1,0.541953,0.275987,0.0351425 737,1,0.529449,0.313131,0.123254 137,1,0.573823,0.36481,0.0435543 108,1,0.618594,0.298632,0.0910618 566,1,0.700857,0.316037,0.147745 189,1,0.15596,0.453291,0.147866
¡Qué gusto saber que nos escribe desde el muy bello estado de Querétaro! Si le parece bien el próximo Martes subimos el vídeo con el orden (ascendente/descendente?) utilizando para uno de los ejemplos los datos que nos mandó.
Hola, buenas noches, dos dudas, la primera, si no tengo ningún encabezado pero solo quiero extraer la columna 2 que tiene solamente números, existe alguna manera de extraer por el número de columna?, la segunda es referente a si puedo escribir solamente esta columna en un archivo que se guarde en extensión csv, txt, etc.? Muchas gracias
+Hiram Abif Meza Landero Para escribir esa columna a un archivo de texto puedes probar esta linea: df.to_csv('file_name', sep='\t') donde df sería la lista que quieres enviar al archivo, nosotros lo vamos a probar y en cuanto este listo el vídeo, te avisamos. Saludos!
Hola Liliana, necesito su ayuda por favor, lo que sucede es que estoy leyendo un archivo .txt que no tiene encabezados por lo que la primera fila Python la interpreta como si fuera el encabezado, necesito insertarle un encabezado y uso la función "df.columns" pero lo que hago es reemplazar la primera fila y no es lo que necesito, cómo puedo hacer? df = pd.read_csv(r'D:\CRZAPATA\Grabacion Masiva condiciones financieras\ENCABEZADO_DESPUES.TXT', delimiter = ";") df.columns = ['NITPAG','NITPROV','PLANPRO'] el resultado deberían ser 291 filas pero me dan 290 porque reitero que me reemplaza la primera
De nada, no tenemos alguna recomendación de libro, más que la información que está en Internet, sobre el tema y si te sirve tenemos una lista de reproducción, sobre el tema: ruclips.net/video/b4zmSqB9npI/видео.html
Hola, buenas noches, estoy realizando un código en python y requiero hacer interpolaciones entre datos específicos de un archivo. Ya logré cargar el archivo pero nose cómo escoger los datos individualmente, cualquier consejo o ayuda sería de gran ayuda. Muchas gracias.
Aquí tenemos dos vídeos, que te podrían ser de utilidad, para seleccionar datos específicos, esperamos que encuentres lo que estás ocupando: ruclips.net/video/f4dM9Hkw5nc/видео.html ruclips.net/video/lhC01D6CbVU/видео.html
Hola buenas, muy buen video... tengo una duda, si quiero acceder solo a un dato, ej: fila 1 columna 1, como lo hago ? en mi archivo no tengo el nombre de cada columna, como accedo a una columna si tener el nombre ? gracias
Muchas gracias, para saber los nombres de las columnas se puede usar df.head() para visualizar las primeras 5 líneas del Dataframe, y también se pueden acceder por índice como se muestran aquí varios ejemplos: code.i-harness.com/es/q/1e212f1
@@cctmexico Pero como hago para editar una celda especifica de un dataframe? Estoy viendo y no tengo muchas opciones, con modificar o editar me refiero a cambiar la informacion que tiene una celda
Hola! muy buen video, pero tengo una duda, al final en print(tel[tel>10]) si yo quisiera que entregara también la columna de años correspondiente a esos valores de la columna de telefonos, como la agregaría? estoy recién partiendo en python :(
Hola, explicas muy bien, muchas gracias. Me gustaría saber por qué cuando trabajo con un archivo csv de 66 filas * 7 columnas al compilar salen unos puntos tanto en algunas filas como en columnas, pero cuando quito unas columnas y algunas filas se compila todo. Muchas gracias
Muchas gracias por tan amable comentario!! Los puntitos indican que hay más números por mostrar, y alcanzaste el límite establecido para mostrarlos en la consola, si los quieres ver todos, puedes exportar a un csv: ruclips.net/video/F1TNkJMgMBE/видео.html
Hola Liliana excelente los tutoriales, tengo una inquietud. Deseo importar una matriz en excel a python, pero que esta esté organizada en forma de listas...como puedo realizar esta transformación? Gracias por tu colaboración
¡Muchas gracias por tan amable comentario! Creemos que esta pregunta es justo lo que buscas: stackoverflow.com/questions/27247832/creating-matrix-by-reading-data-from-excel
Tengo una consulta como se podria llamar a por ejemplo tengo un registro id,titulo , quiero llamar a todos los titulos='Toy Story (1995)'? siendo este un registro del csv , lo he hecho asi res = pd.merge(df, df1, on=['movie_id']) print(res['title']=='Toy Story (1995)') pero siempre me retorna, que es true y el resto false, cuando yo solo quiero que muestre esos registros donde este Toy Story (1995)
Una opción para filtrar los datos es: df=df[(df.movie_id == 'Toy Story (1995)')] Te puede ser de utilidad este vídeo donde trabajamos con la función groupby en pandas: ruclips.net/video/xaM-YolPFB0/видео.html
Aquí recomiendan hacer a través de Anaconda: pandas.pydata.org/pandas-docs/stable/install.html para instalar Anaconda aquí tenemos un vídeo que te puede ser de utilidad: ruclips.net/video/Ww2kfuLpqGQ/видео.html
Hola!, muy buen vídeo, felicitaciones! . Tengo una pregunta, ordene una lista utilizando "groupby" con la operación sum()., a partir de esa lista... ¿Cómo lo puedo ordenar en forma ascendente, extraer los 5 mayores, realizar otras operaciones a partir de esa nueva tabla? Muchas gracias quedo atento!
Buenas, me ayudarías, al correr el programa me sale este error, me puedes indicar a que se debe, estoy apenas espesando a entender el tema de las bibliotecas, gracias. Creo que la syntaxis esta correcta. import pandas as pd datos=pd.read_csv('Practica.csv',header=0) print (datos) error: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 10: invalid continuation byte
gracias ya pude solucionarlo pero te comento como lo realice para la versión 3.6 ya esta obsoleto el comando .ix te sugiere utilizar el .loc que realiza lo mismo gracias
Buenas noches, cuando realizo la prueba me sale el siguiente mensaje "In [61]: runfile('C:/Users/Ing.Andres/.spyder-py3/ManejoDatos.py', wdir='C:/Users/Ing.Andres/.spyder-py3') Traceback (most recent call last): File "C:\Users\Ing.Andres\.spyder-py3\ManejoDatos.py", line 10, in datos=pd.read_csv('Pruebas.csv', header=0) File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 676, in parser_f return _read(filepath_or_buffer, kwds) File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 448, in _read parser = TextFileReader(fp_or_buf, **kwds) File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 880, in __init__ self._make_engine(self.engine) File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1114, in _make_engine self._engine = CParserWrapper(self.f, **self.options) File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1891, in __init__ self._reader = parsers.TextReader(src, **kwds) File "pandas\_libs\parsers.pyx", line 529, in pandas._libs.parsers.TextReader.__cinit__ File "pandas\_libs\parsers.pyx", line 748, in pandas._libs.parsers.TextReader._get_header UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf1 in position 1: invalid continuation byte "
No nos habíamos topado con algo similar, pero puedes hacer tu pregunta (e incluir el código, si así lo deseas) en stackoverflow.com es completamente gratis, responden muy rápido y tienes la opción de preguntar en Inglés o Español, seguro te ayudarán con ese problema. También aquí te dejamos un vídeo, que te puede servir como guía, para agregar tu pregunta: ruclips.net/video/X46F2-OxxqY/видео.html
estimados programadores me podrian decir el metodo en python 2.7 como leer un archivo novedad,y como se ordena alfabeticamente gracias,muy buenas explicaciones
Para leer los archivos en 2.7, es el mismo procedimiento aquí dejamos las diferencias que hay entre las dos versiones: Python 2: No necesitas paréntesis para print print "Hola mundo" Python 3: Si necesitas paréntesis print ("Hola mundo") Para pedir los valores al usuario; Python 2 nombre=raw_input("Introduce tu nombre ") En Python 3 solo se pone input sin raw nombre=input("Introduce tu nombre ") Con eso ya puedes trabajar los vídeos de la versión 3 sin problema 😊 Para ordenar alfabéticamente aquí tenemos un ejemplo: ruclips.net/video/H9y2t84ov4k/видео.html
Hola tengo una consulta :) Una vez que traes una base de datos a Python, ¿Cómo puedo hacer para generar una nueva columna que resulte de la resta entre dos columnas? Y luego regresarlo a un archivo csv, para poder visualizar la modificación. Saludos cordiales.
Hola! La nueva columna, no ocupa nada más que la escribas: df['nueva']=df['A']-df['B'] Para enviar al CSV checa este vídeo: ruclips.net/video/F1TNkJMgMBE/видео.html
Hola ¿Podría darme su correo para que vea como lo he hecho?. Me dice que mi archivo csv no existe. He guardado tanto el erchivo del python y el csv en la misma carpeta y me dice que no existe. Creo que el nombre del csv lo he copiado correctamente y no se en que estoy fallando la verdad. No tengo el paquete panda creo y la versión en la que estoy trabajando es la 3.6¿Me podría revisar lo que he hecho?. Se lo mando al correo. Muchas gracias. Saludos.
Buen día, lo primero es tener instalado Pandas, nosotros lo hicimos con Anaconda, aquí tenemos un vídeo por si le es de utilidad: ruclips.net/video/Ww2kfuLpqGQ/видео.html Y en esta página: stackoverflow.com/ puede incluir su código y la pregunta (en Inglés o Español) contestan muy rápido y seguro resolverá esa duda.
si trabajas sin anaconda debes instalar panda , por ejemplo desde la shell de windows escribir : pip install pandas, luego ya ejecutas python y puedes ir escribiendo linea a linea lo que hace la profesora en este video
Hola, muy interesante los videos, puedes por favor ayudarme, tengo un archivo de excel con varias columnas y filas, ya lo leí en Spyder, deseo hacer una suma de una de las columnas, cuando se cumpla las siguientes condiciones, en una columna llamada Largo tengo varios numeros: 2, 4, 6, y 8. Y en otra varios grupos 11, 12, 14, 16, etc. Requiero sumar en otra columna que tiene vaalores, cuando se cumpla que la Columna Largo sea igual a 8, para cada uno de los grupos (11, 12, 14 y demas). Pueden ayudarme por favor. Muchisimas gracias!
¡Muchas gracias por tan amable comentario, es muy interesante la pregunta con gusto lo anotamos como #petición para trabajar en un futuro un vídeo de ese tema!
Hola, muy buenos tus vídeos me han servido mucho, pero quisiera preguntarte cómo hago para importar un archivo de Excel. Qué comando es o si es este mismo.Gracias!
¡Hola Javier! Muchas gracias por tu amable comentario, se usa: pd.read_excel('tmp.xlsx') El archivo lo debes tener en la misma carpeta de tu código Aquí te dejamos un vídeo que te puede ser de utilidad: ruclips.net/video/0IfAp19Tfzs/видео.html
Muy interesante y educativo tu vídeo, pero... ¿Hay alguna forma de extraer los datos no en una lista sino en una matriz donde solo tomemos los datos que nos interesan del archivo csv sin modificar el origen?
Aquí te dejamos un ejemplo, importamos un archivo en csv y vamos a imprmir las 5 primeras filas de datos (incluyendo los encabezados) datos=pd.read_csv('minutos2.csv') print(df.head())
Hola estoy leyendo un archivo csv y me trae los campos de excel tipo string como los llevo a float mi codigo y el error datos= pd.read_csv(r'D:\curspy\ejercicios\DATA_LL2370_MD4CSV.csv',sep='\t',delimiter =';',engine='python') print(datos.info()) print(datos.head()) nuevo=pd.DataFrame(datos) nuevo=nuevo.replace(np.nan,0) nuevo=nuevo.replace('N/A',0) print(' '*5) nuevo=nuevo.replace('N/A',0) #Saca los encabezados print(list(nuevo)) nuevo['DEPT_F']=nuevo.DEPT_F.astype(float) me da este error ValueError: could not convert string to float: '3939,75'
Hola Gonzalo, puedes probar a convertir a valor numérico como en este ejemplo: stackoverflow.com/questions/18434208/pandas-converting-to-numeric-creating-nans-when-necessary
Buenas tardes puedes revisar lo siguiente: 1) Que el archivo esté en la misma carpeta que tu código 2) Que el archivo se llame igual, que como lo estás nombrando en el código 3) Que la extensión del archivo sea CSV (A veces cuando se descargan pueden traer dos extensiones)
He visto una gran cantidad de tutoriales sobre pandas y sus videos son muy buenos, mis favoritos por la claridad y sencillez con que explican todas las funciones y métodos utilizadas. Buen trabajo.
¡Muchísimas gracias por tan amable comentario!
Muy buen video. para los que estan llegando cambien la palabra ix por iloc. Saludos
agradecido con el de arriba 🙏🙏🙏
muchas gracias
Muchas GRACIASSSSSS.
oye hermano, ¿como le haces para saber que sustituir por ese tipo de palabras o comandos cuando te bota el error?
justo esa era mi duda, ya con .iloc todo bien gracias buen dato
Gracias Liliana por compartir tus conocimientos, mis respetos para usted , no me pierdo ninguno de sus videos ¡¡¡¡¡EXCELENTES VIDEOS!!!!
No le haga caso a un fulano que se hace llamar "rw03" de esos miles que se ocultan en el anonimato
gran explicacion sencilla y muy útil gracias !!! Nota: sustituyan .ix por .loc o bien .iloc para que salga todo bien Saludos
la verdad me parece muy buena y completa tu explicación sobre el modulo pandas, eh estado buscando, pero mejor que este no, muchas gracias Liliana
Muchas gracias por el video!!!, soy nuevo en esto y tu canal me esta ayudando mucho. Además creo que aprendo rápido cuando la persona que me esta enseñando tiene una voz tan bonita :3
Muchas gracias por esta rapida y buena explicación, me salvaste en un apuro.
De nada muchas gracias, a tí por vernos!!
Excelente video! que bueno haber encontrado este canal, solo una observación, ahora ya no se usaria "datos.ix" pues "ix" ya es obsoleto, ahora el comando debería ser "datos.loc".
You are shit bruh, thank you.
Gracias por el dato :)
Hola!, la verdad estoy super emocionado con tus videos.
me han ayudado un mucho para realizar mis proyectos. Felicidades!!! sigue así.
Solo con una recomendación, no he visto tus videos reciente pero en este lo escuche con audífonos y pues se escucha cuando respiras etc.
Si te animas con un micro seria super y nuevamente Gracias por tus videos. (espero no incomodar con esto)
Excelente explicación
¡Muchas gracias por tan amable comentario!
Muchas gracias, excelente explicación!
Excelente
Muy buen video mis 10. Gracias :)
gracias por el video
excelente video!!!
Muy útil, muy buena explicación, la música de fondo lo pone más épico jajaja buen video
Jijiji que amable comentario, nos da mucho gusto saber que te agrado la explicación ^_^ muchos saludos desde México
¡Qué buen video!
¡Muchas gracias, por dejarnos tan amable comentario! ^_^
De todos los videos este no era fail, 100% legal :v
¡Nos da mucho gusto saber que el vídeo te fue de utilidad!
Hola, disculpa lo estoy haciendo por jupyter y ya pude leer mi base de datos, pero, no he logrado que la lea en columna sino que la esta leyendo separada por comas en una sola celda
Hola una pregunta: print(datos[''Cable"]) te imprime solo la columna cable, que puedo hacer para imprimir más de una columna con ese metodo
puedes hacer df[['A','B','C']]
@@cctmexico muchas gracias
recomiendo instalar la libreria xlrd si no te cargan los datos desde un excel, gracias por el video!!!
openpyxl
¡Muchas gracias por la recomendación!
Ya muchas de estas cosas que usted me sugiere las tengo aprendidas. Estoy de hecho programando en python, realizando algunos códigos que me permitan obtener indicadores para poder evaluar a los sistemas que estoy estudiando con motivo de mi tesis. Sin embargo, hay cosas que no se como realizarlas. En el proceso me aparece dudas específicas como la que le pregunté.
¡Excelente! entonces solamente son detallitos pequeños los que le hacen falta, con mucho gusto le ayudamos a resolver las dudas, saludos!!
Al instalar Python , se tiene en automático pandas ? O hay que instar pandas posterior a la instalación de Python ?
Cuando instalas desde la distribución de Anaconda, Pandas viene incluido :)
Con Google Colab, puedes programar en línea, sin necesidad de instalar nada :D aquí una introducción de cómo usarlo: ruclips.net/video/p3KaUXZhXtQ/видео.html
necesitar instalarlo desde la terminal, te recomiendo buscar un video o leer la documentación
Hola, cómo puedo hacer para graficar dos columnas de ese archivo y luego discriminar por otra columna?Por ejemplo, gráficas año e internet y que me descrimine por el porcentaje de teléfono que usa.
tambien como puedo hacer para imprimir la fila con el menor porcentaje de telefono fijo pero delimitado a que solo puede imprimir la fila con los datos de año, computadora y telefono?
buenas tienes algun video donde expliques como instalaste esas librerias de pandas
+Edinson Sanchez Hola! Aún no tenemos el vídeo, pero aquí te dejamos la liga para bajar Anaconda para Windows, es muy sencillo y así podrás tener acceso a la gran mayoría de librerías de Python incluyendo Pandas: www.continuum.io/downloads
Instala anaconda, mi estimado
He instalado Anaconda, pero al importar panda me sale el error "No module named pandas"; ¿cuál puede ser el error?
debes abrir anaconda prompt
> conda install pandas
cuando termine de cargar escibe
>pip install pandas
y listo!
No sé por qué no lee el archivo, no sé si se guarda en una carpeta o que estoy haciendo mal pero el csv lo tengo en descargas y lo nombro tal cual y no lo identifica
Muy buen tuto Liliana, tenía una consulta.
Cómo hago para leer un xlsx pero a partir de la 3ra fila y la segunda columna. Es decir los datos empiezan desde la celda B2
hola yo tengo un data_set el cual tiene una columna datetime que esta cada segundo en las filas, quisiera mostrar la fila de los datos partienda que la fila 1 comienza en 1 segundos y se salte a la fila 60 ya que ahi completa el minuto como tal.
Hola, me podrias indicar en que campeta tengo que guardar los datos. Utilizo Anaconda , pero parece el error File b'svcdatos.csv' does not exist , como puedo saber la carpeta en la cual se esta ejecutando, o tienen algun nombre en especifico.
Hola! Debe ser en la carpeta donde estás guardando tu código, revisa si el nombre es el mismo, por una letra que no sea igual, te manda ese error, saludos!
Está muy bueno, gracias. Sólo no entiendo en dónde tiene que estar almacenado el archivo csv para poder traerlo a spyder como haces acá. Saludos.
En la misma carpeta, donde tu guardes tu código, saludos y gracias por vernos!
Muy buen video gracias, una pregunta como podría cambiar todos los puntos a comas
estoy tratando de imprimir un dataframe de un archivo csv pero la primera columna me la corre un espacio de este modo
fecha residuo masa huella
2018-04-14 23:00:03 platano -555.66 -1111.32 organico
2018-04-14 23:00:41 hoja de papel -555.66 -1111.32 papel
2018-04-14 23:00:52 botella de cerveza -555.66 -1111.32 vidrio
categoria material principal
2018-04-14 23:00:03 platano1 NaN
2018-04-14 23:00:41 papel comun NaN
2018-04-14 23:00:52 vidrio ambar NaN
es decir que para mi caso me deja la columna de la fecha sin etiqueta como soluciono esto?
Tal vez este vídeo te puede ser de utilidad: ruclips.net/video/2yDPI--i7hI/видео.html en caso de que no, puedes intentar poner tu pregunta en el sitio stackoverflow.com responden muy rápido y puedes hacer la pregunta en Inglés o Español
buen video, quisiera saber como hacer, en caso de que en la fila 5 de teléfono tenga un dato como str como podría hacer para eliminar toda la fila 5
Hola! Y si deseara un archivo de una ruta específica ¿Sólo especifico la ruta o se ocupa algún otro parámetro?
Hola! ¡Excelente pregunta! Aquí nos encontramos un ejemplo:
import pandas as pd
pd.read_csv("../data_folder/data.csv")
Fuente: stackoverflow.com/questions/35384358/how-to-open-my-files-in-data-folder-with-pandas-using-relative-path
@@cctmexico ¡¡Muchas Gracias!! ¡Excelente Vídeo!
De nada ^_^ ¡Muchas gracias a tí, por vernos!
muy buen video! Te hago una consulta... si yo quisiera hacer lo mismo pero que sea el usuario quien elija un año... osea hago un input para que ingrese un año y solo quiero mostrar los datos de una sola columna de la tabla, por ejemplo telefono... como deberia hacer? gracias
¿Será algo como lo que hacemos en este vídeo? ruclips.net/video/VUjcITlNOeU/видео.html ¡Saludos!
@@cctmexico mil gracias
gracias por los videos.
Quiero realizar este manejo de datos pero en una interfaz grafica creada con pyqt5, como puedo cargar un archivo excel con los datos y luego realizar sumas de estos?
gracias
De nada, gracias a tí por vernos ^_^ justo vamos a subir en la próxima semana un vídeo de Pandas con QTDesigner! Para las operaciones en las columnas, puede ser algo como esto: var = df.groupby('title_year').budget.sum() lo vemos a detalle en este vídeo: ruclips.net/user/edit?o=U&video_id=xaM-YolPFB0
Hola Liliana, que SO usas?
Ubuntu, Saludos!
Excelente voy a bajarme el pandas que es el que me hace falta he estado haciendo un programa con un .csv y usando tkinter para la interfaz gráfica y puede ser que pandas me sea de gran utilidad en el mismo. Cuando este más completo me gustaría enviarle dicho código. He estado estudiando el lenguaje y analizando datos de una lotería de triple en mi país Venezuela me he dado cuenta algunas cosas interesantes. No vaya a pensar que soy un jugador jeje de hecho soy Ingeniero Químico solo que me gusta la programación y bueno aprovechando que estoy aprendiendo a usar python pensé en meterle análisis estadístico a esos datos a ver si logro observar algún patrón recurrente o algo que me genere alguna tendencia para inferir estadisticamente algunos números con un mayor grado de confiabilidad. Se que suena medio tonto estudiar números de triples pero bueno no pierdo nada con estudiar por ahora aun no juego nada si he logrado inferir algunos pero aun no estoy convencido del método aun me falta profundizar un poco más otros detalles.
+gramirez_25 Ramirez ¡Excelente! Nosotros en CCTMÉXICO también habemos Ing. Químicos y después podríamos trabajar en comparar los datos que obtengamos de los dos países, acá en México están disponibles los datos de una lotería (podría llamarse así) que se llama Melate, tal vez haya algo interesante..y si no al menos aprendimos más sobre el uso de esta excelente herramienta!
hola, como hago para imprimir la fila con la columna que tenga el menor porcentaje de telofono fijo?
como puedo hacer para que dentro de un conjunto de datos extraer por ejemplo el 80% de forma aleatoria
Hola, una duda: si quiero que me salgan todos los datos pero python me oculta varias columnas y filas (por el espacio de visualización, supongo) como hago para que sí me muestre todo?
Puedes exportar el dataframe a un CSV:
ruclips.net/video/F1TNkJMgMBE/видео.html
Hola buen video y buena explicacion. Tengo una duda si tengo un Objeto con sus respectivos atributos, y quiero llenarlo a partir de un dataFrame, donde cada fila seria un objeto y cada columna sus atributos, con que funcion podria realizarlo, solo encontre esa de ix y una de loc e iloc pero ninguna es en si lo que quiero solo me ayudan a extraer ciertas columnas o filas pero una un fila de una en una y al meterlo en un For me arma listas pero de caracteres :(.
Hola! Muchas gracias por vernos y dejarnos tan amable comentario, tal vez te pueda ser de utilidad este vídeo: ruclips.net/video/7Ssb7IDOQ0k/видео.html aquí extraemos sólo algunas columnas y algunos elementos de una columna determinada, utilizando justamente ciclos For y diccionarios, ojála te sea de utilidad, saludos!
como hago para ignorar un archivo txt que esta vacio y siga con los demas archivos me genera error porque el archivo esta vacio
Una pregunta. Tengo un archivo .csv y tengo ya mi código hecho. Pero no sé bien cómo hacer que vaya leyendo cada dato conforme se ejecuta el programa. Y para graficarlos, los guardo en listas. Y con matplotlib grafico
Puedes graficar directamente en Pandas: ruclips.net/video/n_LTVlxf4jM/видео.html
Me encanto. Quisiera comparar dos columnas y saber que datos estan repetidos en la columna dos de la collumna 1 y hacer una comulna 3 (con los datos compartidos en la columna uno y dos).
¡Muchas gracias por tan amable comentario! Aquí te dejamos un vídeo que te puede ser de utilidad:
ruclips.net/p/PLgHCrivozIb0ULMKfJVV-rFdRG2OeEgfq
I know it's kinda randomly asking but do anybody know a good place to watch newly released movies online?
@Makai Fernando I use Flixzone. Just search on google for it :)
@Makai Fernando i would suggest flixzone. You can find it by googling =)
@Sutton Kellan yup, I have been using Flixzone for years myself :)
disculpa, empeze a estudiar python desde ayer, donde queda el directorio donde lee python los archivos, y csv q tio de archivo es, es un archivo de sql, o de q base de datos
Hola, si yo quisiera escribir sobre lineas de esta BD osea aplicar CRUD a este csv , se puede hacer. Modificar directamente el archivo o es obligatorio exportarlo a un csv resultante?
Nos encontramos información que te puede ayudar con esa pregunta, este artículo: stupidpythonideas.blogspot.mx/2014/09/how-to-edit-file-in-place.html y por si lo ocupas este vídeo: ruclips.net/video/F1TNkJMgMBE/видео.html
Muchas gracias por tan excelente labor, ayudándonos en este mundo de Python. me sirvió mucho la respuesta.
Saludos desde Colombia
¡Nos da mucho gusto saber que los vídeos les están siendo de utilidad! Muchísimos saludos hasta la hermosa Colombia!! ^_^
Oye disculpa si quiero hacer un programa que comparé dos archivos planos y de estos ir comparando fila contra fila que elementos van cambiando y en una tercera fila hacerles un vector a estas dos para ver cuáles cambian como le hago?
Hola! ¿Qué tipo de datos tienes en los archivos? A lo mejor este vídeo te podría dar alguna idea: ruclips.net/video/vlsR11mQXm4/видео.html
maestra muy buen video gracias, tengo la duda si existe la forma de seleccionar el archivo desde un cuadro de dialogo emergente en pandas, asi como se hace en tkinter? he buscado mucho en pandas pero no encuentro informacion, le agradeceria si me comparte
como accedo a un dato en concreto, en una lila y columna?
hola tengo un archivo cvs ya creado y quiero ver como insertar datos en el
Una pregunta: si ya tengo python 3.4.3 y he instalado varios módulos por el pip e instalo anaconda para usar spyder debo desintalar todo o no es necesario? tambien instale por el pip ipython y jupyter no pudo instalar PyQt5 ni 4 instalo spyder pero no logro saber como abrir el entorno de spyder abrí la pg de anaconda y la version de python que tiene es 3.6 quisiera saber si automaticamente los modulos que tengo van a servir y si debo actualizarlos o no va a ser necesario?
Para correr Spyder aquí le dejamos el minuto del vídeo, donde lo hacemos (ruclips.net/video/Ww2kfuLpqGQ/видео.htmlm18s) Nada más es cuestión de buscarlo (con el explorador de archivos) En cuanto a las versiones, podría hacer la prueba, nosotros tuvimos dos versiones diferentes de Python en la misma computadora sin problema.
hola, tengo una columna donde tengo datos como 12 manzanas, 32 manzanas, 1 manzana, 10 manzanas y quiero ordenarlas por el numero pero no se como ordenar un dato con un entero y un str
¡Es muy interesante la pregunta con gusto lo anotamos como #petición para trabajar en un vídeo de ese tema!
Estimada Liliana. Buenos días ante todo deseando se en cuentre bien. Soy Carlos Alberto Rodriguez Proenza y le escribo desde Querétaro. Hace algún tiempo le escribí comentándole que estoy realizando un doctorado en la unam en el área de ciencia e ingeniería de materiales, más esfecíficamente en simulaciones moleculares. Para llevar a cabo esto, debo trabajar con grandes bases de datos las cuales obtengo con software de acceso libre llamado LAMMPS y el cual estoy corriendo dentro de linux. La versión de linux que tengo es Debian 8. Por otro lado, de toda esta base de datos necesito obtener un número (indicador) bajo condiciones de simulación diferentes y así poder extraer conclusiones de los sistemas que estudio. Dentro de las variables que hay en mi base de datos se encuentran, el identigicador (id) del atomo, tipo de átomo (type) así como sus correspondientes coordenadas x, y, z. Hace algún tiempo usted explicaba en un video como tratar este tipo de archivos csv usando pandas el cual me resultó de gran utilidad en computadoras en las cuales tengo instalado python 3.6 y en windows 10. Sin embargo, en otra de mis computadoras no puedo usar pandas porque estoy usando Debian 8 y la versión de python que tengo es la 2.7. Necesitaría poder ordenar mis datos por una columna específica (un campo específico) y no lo he podido lograr para seguir avanzando. Pandas no lo puedo usar en esta versión de python y spyder ya que esta versión de python no lo tiene dentro de sus librerías. Me gustaría preguntarle que de que otra forma podría hacer esto una vez leido el archivo? Si no es molestia para usted le podría enviar uno de estos archivos así como el código que estoy usando para tratar de ordenar estos datos. Le estaré muy agradecido por ello. Es de suma importancia para poder seguir avanzando en mi tema de tesis. Aprecio mucho la gran labor de ayuda que ha venido realizando con sus videos. Una disculpa por escribir tanto. Le envío un afectuoso saludo. Atentamente.
Carlos Alberto Rodríguez Proenza.
Muchas gracias por tan amables comentarios!! Si, con mucho gusto recibimos sus archivos, vamos un poco retrasados con las peticiones, pero en cuanto podamos atendemos la petición! Nos los puede hacer llegar al correo: cctmexico@gmail.com y mientras tanto, también podría intentar poner la pregunta en Stack Overflow (responden a preguntas en español e Inglés) Reciba muchos saludos afectuosos y ya verá que si se podrá resolver, lo del orden de sus datos.
Estimada Liliana. Le estoy escribiendo desde Querétaro. Actualmente estoy realizando mi tesis de doctorado en el área de física teórica y estoy trabajando con grandes bases de datos en la realización de simulación computacional. Quería preguntarle como, a partir de un archivo csv, el cual tiene varios campos, se puede ordenar el archivo por un determinado campo usando pandas.
Por otro lado, como podría hacer lo mismo, pero ahora con una porción del archivo. Lo siguiente es una porción de uno de mis archivos de salida. Como podría ordenar este archivo por el campo id?
id,type,xs,ys,zs
500,1,0.413068,0.247238,0.139937
384,1,0.509008,0.225649,0.113632
391,1,0.596777,0.212693,0.0827694
91,1,0.554459,0.155958,0.15268
396,1,0.678003,0.227263,0.134453
183,1,0.263006,0.32626,0.129268
199,1,0.355738,0.315005,0.0961778
572,1,0.398526,0.368158,0.0291984
563,1,0.449962,0.296985,0.0700937
710,1,0.431955,0.334981,0.152336
612,1,0.486912,0.343823,0.000879648
754,1,0.541953,0.275987,0.0351425
737,1,0.529449,0.313131,0.123254
137,1,0.573823,0.36481,0.0435543
108,1,0.618594,0.298632,0.0910618
566,1,0.700857,0.316037,0.147745
189,1,0.15596,0.453291,0.147866
¡Qué gusto saber que nos escribe desde el muy bello estado de Querétaro! Si le parece bien el próximo Martes subimos el vídeo con el orden (ascendente/descendente?) utilizando para uno de los ejemplos los datos que nos mandó.
Listo el vídeo, esperamos que le sea de utilidad: ruclips.net/video/H9y2t84ov4k/видео.html
Excelente video, como podemos hacer condiciones de números con datos obtenidos del archivo csv, gracias.
¡Muchas gracias por tan amable comentario! Este vídeo te puede ser de utilidad:
ruclips.net/video/ZXcaz9q2JDg/видео.html
Hola, buenas noches, dos dudas, la primera, si no tengo ningún encabezado pero solo quiero extraer la columna 2 que tiene solamente números, existe alguna manera de extraer por el número de columna?, la segunda es referente a si puedo escribir solamente esta columna en un archivo que se guarde en extensión csv, txt, etc.? Muchas gracias
+Hiram Abif Meza Landero Hola! Para extraer una sola columna sin encabezado puedes intentar con esta instrucción: print(datos.iloc[:,2:3])
+Hiram Abif Meza Landero Para escribir esa columna a un archivo de texto puedes probar esta linea: df.to_csv('file_name', sep='\t') donde df sería la lista que quieres enviar al archivo, nosotros lo vamos a probar y en cuanto este listo el vídeo, te avisamos. Saludos!
Muchas gracias por el apoyo, saludos
+Hiram Abif Meza Landero ¡De nada! Saludos!!
hola, quisiera saber si se puede sacar el numero de columnas que contiene ese archivo... Gracias
Hola! Lo puedes ver en este vídeo, a partir del minuto 1:40 ruclips.net/video/aVOIC4g75JA/видео.html
Muchas Gracias...
De nada ^_^
Hola Liliana, necesito su ayuda por favor, lo que sucede es que estoy leyendo un archivo .txt que no tiene encabezados por lo que la primera fila Python la interpreta como si fuera el encabezado, necesito insertarle un encabezado y uso la función "df.columns" pero lo que hago es reemplazar la primera fila y no es lo que necesito, cómo puedo hacer?
df = pd.read_csv(r'D:\CRZAPATA\Grabacion Masiva condiciones financieras\ENCABEZADO_DESPUES.TXT', delimiter = ";")
df.columns = ['NITPAG','NITPROV','PLANPRO']
el resultado deberían ser 291 filas pero me dan 290 porque reitero que me reemplaza la primera
Podría usarse esta instrucción:
df = pd.read_csv(file_path, header=None)
@@cctmexico Perfecto, era header=None y luego definir las columnas con df.columns. Muchas gracias.
En la versión más actualizada creo que se usa el comando iloc? O estoy equivocado?
Así es! Saludos!
@@cctmexico si si me funciono.. ix iloc
Muy buen video, gracias!... consulta: cómo puedo organizar una matriz agrupando los datos?
Cómo convierto las columnas en vectores para trabajar con los vectores?
¿Será algo como esto? ruclips.net/video/IwJaaM3eJPI/видео.html
@@cctmexico sí muchas gracias, algún libro que recomiendes tipo guía para AI para predecir.
De nada, no tenemos alguna recomendación de libro, más que la información que está en Internet, sobre el tema y si te sirve tenemos una lista de reproducción, sobre el tema:
ruclips.net/video/b4zmSqB9npI/видео.html
cuando pongo el print datos y la columna me sale error en el nombre de la columna
Tendrá algún correo adonde le pueda enviar un poco más de información sobre lo que estoy haciendo?
Si, nos puede mandar la información al correo: cctmexico@gmail.com ¡Saludos!
Hola, buenas noches, estoy realizando un código en python y requiero hacer interpolaciones entre datos específicos de un archivo. Ya logré cargar el archivo pero nose cómo escoger los datos individualmente, cualquier consejo o ayuda sería de gran ayuda. Muchas gracias.
Aquí tenemos dos vídeos, que te podrían ser de utilidad, para seleccionar datos específicos, esperamos que encuentres lo que estás ocupando:
ruclips.net/video/f4dM9Hkw5nc/видео.html
ruclips.net/video/lhC01D6CbVU/видео.html
Hola buenas, muy buen video... tengo una duda, si quiero acceder solo a un dato, ej: fila 1 columna 1, como lo hago ?
en mi archivo no tengo el nombre de cada columna, como accedo a una columna si tener el nombre ?
gracias
Muchas gracias, para saber los nombres de las columnas se puede usar df.head() para visualizar las primeras 5 líneas del Dataframe, y también se pueden acceder por índice como se muestran aquí varios ejemplos:
code.i-harness.com/es/q/1e212f1
datos.ix[0:3] no funciona en mi codigo. No han cambiado algo en pandas?
Si ix, está descontinuado puedes usar iloc
@@cctmexico Pero como hago para editar una celda especifica de un dataframe? Estoy viendo y no tengo muchas opciones, con modificar o editar me refiero a cambiar la informacion que tiene una celda
Hola! muy buen video, pero tengo una duda, al final en print(tel[tel>10]) si yo quisiera que entregara también la columna de años correspondiente a esos valores de la columna de telefonos, como la agregaría? estoy recién partiendo en python :(
se puede pasar a una interfaz grafica ?
¿Sería algo como esto? ruclips.net/video/LIvdhruc_74/видео.html
Hola, explicas muy bien, muchas gracias. Me gustaría saber por qué cuando trabajo con un archivo csv de 66 filas * 7 columnas al compilar salen unos puntos tanto en algunas filas como en columnas, pero cuando quito unas columnas y algunas filas se compila todo. Muchas gracias
Muchas gracias por tan amable comentario!! Los puntitos indican que hay más números por mostrar, y alcanzaste el límite establecido para mostrarlos en la consola, si los quieres ver todos, puedes exportar a un csv: ruclips.net/video/F1TNkJMgMBE/видео.html
@@cctmexico muchas gracias, tus vídeos son lo máximo y tienes una voz muy bonita 😀
¡Muchas gracias ^_^!
Hola Liliana excelente los tutoriales, tengo una inquietud. Deseo importar una matriz en excel a python, pero que esta esté organizada en forma de listas...como puedo realizar esta transformación?
Gracias por tu colaboración
¡Muchas gracias por tan amable comentario! Creemos que esta pregunta es justo lo que buscas: stackoverflow.com/questions/27247832/creating-matrix-by-reading-data-from-excel
Tengo una consulta como se podria llamar a por ejemplo tengo un registro id,titulo , quiero llamar a todos los titulos='Toy Story (1995)'? siendo este un registro del csv , lo he hecho asi
res = pd.merge(df, df1, on=['movie_id'])
print(res['title']=='Toy Story (1995)') pero siempre me retorna, que es true y el resto false, cuando yo solo quiero que muestre esos registros donde este Toy Story (1995)
¿Serían todos los elementos de una columna? ¿O los nombres de las columnas del Dataframe? Saludos!
Una opción para filtrar los datos es:
df=df[(df.movie_id == 'Toy Story (1995)')]
Te puede ser de utilidad este vídeo donde trabajamos con la función groupby en pandas:
ruclips.net/video/xaM-YolPFB0/видео.html
Tengo la version de python 3.6.3, como puedo instalar la libreria de panda?
Aquí recomiendan hacer a través de Anaconda: pandas.pydata.org/pandas-docs/stable/install.html para instalar Anaconda aquí tenemos un vídeo que te puede ser de utilidad: ruclips.net/video/Ww2kfuLpqGQ/видео.html
Hola buenas noches, tengo una duda, por ejemplo con la Columna del teléfono, solo quiero extraer 10 datos, como podría hacerlo?
Nos encontramos esta opción:
df1['f'] = df1.D.astype(str).str[:10].astype(int)
Hola, trato de hacer lo mismo en python (comand line) pero me dice que mi archivo no existe, y no se como ponerlo junto a phyton en la libreria
Hola Edwin, ¿Qué estás ocupando para el comand Line? (Windows? Ubuntu?) Saludos!
Hola!, muy buen vídeo, felicitaciones! . Tengo una pregunta, ordene una lista utilizando "groupby" con la operación sum()., a partir de esa lista... ¿Cómo lo puedo ordenar en forma ascendente, extraer los 5 mayores, realizar otras operaciones a partir de esa nueva tabla? Muchas gracias quedo atento!
Ya encontré la solución. el comando .nlargest(n,'columnax') me permite extraer los mayores n datos de la columna x
¡Excelente! Muchas gracias por dejar aquí la respuesta, por si alguien tiene la misma pregunta, saludos!!
Buenas, me ayudarías, al correr el programa me sale este error, me puedes indicar a que se debe, estoy apenas espesando a entender el tema de las bibliotecas, gracias.
Creo que la syntaxis esta correcta.
import pandas as pd
datos=pd.read_csv('Practica.csv',header=0)
print (datos)
error:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 10: invalid continuation byte
gracias ya encontre el problema
¡Excelente, nos da mucho gusto saberlo, muchas gracias por vernos!
Hola Instale la version 3.6 pero al ejecutar este comando print(datos.ix[0:3]) me marca error me podrias apoyar a saber porque
¿Qué error te marca?
gracias ya pude solucionarlo pero te comento como lo realice para la versión 3.6 ya esta obsoleto el comando .ix te sugiere utilizar el .loc que realiza lo mismo gracias
Perfecto!! Qué bueno que ya lo pudiste resolver y muchas gracias por dejarnos tu solución, saludos!!
Buenas noches, cuando realizo la prueba me sale el siguiente mensaje "In [61]: runfile('C:/Users/Ing.Andres/.spyder-py3/ManejoDatos.py', wdir='C:/Users/Ing.Andres/.spyder-py3')
Traceback (most recent call last):
File "C:\Users\Ing.Andres\.spyder-py3\ManejoDatos.py", line 10, in
datos=pd.read_csv('Pruebas.csv', header=0)
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 676, in parser_f
return _read(filepath_or_buffer, kwds)
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 448, in _read
parser = TextFileReader(fp_or_buf, **kwds)
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 880, in __init__
self._make_engine(self.engine)
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1114, in _make_engine
self._engine = CParserWrapper(self.f, **self.options)
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1891, in __init__
self._reader = parsers.TextReader(src, **kwds)
File "pandas\_libs\parsers.pyx", line 529, in pandas._libs.parsers.TextReader.__cinit__
File "pandas\_libs\parsers.pyx", line 748, in pandas._libs.parsers.TextReader._get_header
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf1 in position 1: invalid continuation byte
"
No nos habíamos topado con algo similar, pero puedes hacer tu pregunta (e incluir el código, si así lo deseas) en stackoverflow.com es completamente gratis, responden muy rápido y tienes la opción de preguntar en Inglés o Español, seguro te ayudarán con ese problema. También aquí te dejamos un vídeo, que te puede servir como guía, para agregar tu pregunta: ruclips.net/video/X46F2-OxxqY/видео.html
Sirve igual con archivos .tsv?
Nos encontramos esta información:
import pandas as pd
data = pd.read_csv ("file.tsv", sep = '\t')
Ya fracaso desde el comienzo, escribo el codigo igual y me dice que la variable datos is not defined. Que hago??
Quiere decir que hasta ese momento no existe la variable datos...revisa que no tengas un error en tú código y hayas cambiado el nombre de esa variable
@@cctmexico gracias por tu respuesta! Lo que hago es escribir el mismo código que tu! No se que sucede
Disculpa, como puedo escoger un reglón???!
como harias un promedio en ese caso??
Este vídeo cortito te puede servir de guía: ruclips.net/video/PcTaDiuMQQ8/видео.html
Gracias por el video Cómo podria renombrar el nombre d mis columnas
Como en este ejemplo: dg.rename(columns={'gdp':'log(gdp)'}, inplace=True)
estimados programadores me podrian decir el metodo en python 2.7 como leer un archivo novedad,y como se ordena alfabeticamente gracias,muy buenas explicaciones
Para leer los archivos en 2.7, es el mismo procedimiento aquí dejamos las diferencias que hay entre las dos versiones:
Python 2:
No necesitas paréntesis para print
print "Hola mundo"
Python 3:
Si necesitas paréntesis
print ("Hola mundo")
Para pedir los valores al usuario;
Python 2
nombre=raw_input("Introduce tu nombre ")
En Python 3 solo se pone input sin raw
nombre=input("Introduce tu nombre ")
Con eso ya puedes trabajar los vídeos de la versión 3 sin problema 😊
Para ordenar alfabéticamente aquí tenemos un ejemplo:
ruclips.net/video/H9y2t84ov4k/видео.html
Hola tengo una consulta :)
Una vez que traes una base de datos a Python, ¿Cómo puedo hacer para generar una nueva columna que resulte de la resta entre dos columnas?
Y luego regresarlo a un archivo csv, para poder visualizar la modificación.
Saludos cordiales.
Hola! La nueva columna, no ocupa nada más que la escribas:
df['nueva']=df['A']-df['B']
Para enviar al CSV checa este vídeo: ruclips.net/video/F1TNkJMgMBE/видео.html
Como puedo contar cuantos datos tiene una determinada columna??? Ayuda!!
Con Pandas, para contar los datos en la columna que se llame A quedaría así: df['A'].count()
Muchísimas gracias! 🙌🏻
¡De nada! ^_^
Se puede hacer algo similar a esto pero usando archivos .txt?
Sii! Este vídeo te puede ser de utilidad: ruclips.net/video/RACZpeVxZ6k/видео.html
Hola ¿Podría darme su correo para que vea como lo he hecho?. Me dice que mi archivo csv no existe. He guardado tanto el erchivo del python y el csv en la misma carpeta y me dice que no existe. Creo que el nombre del csv lo he copiado correctamente y no se en que estoy fallando la verdad. No tengo el paquete panda creo y la versión en la que estoy trabajando es la 3.6¿Me podría revisar lo que he hecho?. Se lo mando al correo.
Muchas gracias.
Saludos.
Buen día, lo primero es tener instalado Pandas, nosotros lo hicimos con Anaconda, aquí tenemos un vídeo por si le es de utilidad: ruclips.net/video/Ww2kfuLpqGQ/видео.html
Y en esta página: stackoverflow.com/ puede incluir su código y la pregunta (en Inglés o Español) contestan muy rápido y seguro resolverá esa duda.
si trabajas sin anaconda debes instalar panda , por ejemplo desde la shell de windows escribir : pip install pandas, luego ya ejecutas python y puedes ir escribiendo linea a linea lo que hace la profesora en este video
Hola, muy interesante los videos, puedes por favor ayudarme, tengo un archivo de excel con varias columnas y filas, ya lo leí en Spyder, deseo hacer una suma de una de las columnas, cuando se cumpla las siguientes condiciones, en una columna llamada Largo tengo varios numeros: 2, 4, 6, y 8. Y en otra varios grupos 11, 12, 14, 16, etc. Requiero sumar en otra columna que tiene vaalores, cuando se cumpla que la Columna Largo sea igual a 8, para cada uno de los grupos (11, 12, 14 y demas). Pueden ayudarme por favor. Muchisimas gracias!
¡Muchas gracias por tan amable comentario, es muy interesante la pregunta con gusto lo anotamos como #petición para trabajar en un futuro un vídeo de ese tema!
Como se puede limitar una columna (colocar un máximo) a los datos ingresados
Hola, muy buenos tus vídeos me han servido mucho, pero quisiera preguntarte cómo hago para importar un archivo de Excel. Qué comando es o si es este mismo.Gracias!
¡Hola Javier! Muchas gracias por tu amable comentario, se usa: pd.read_excel('tmp.xlsx') El archivo lo debes tener en la misma carpeta de tu código
Aquí te dejamos un vídeo que te puede ser de utilidad:
ruclips.net/video/0IfAp19Tfzs/видео.html
Muy interesante y educativo tu vídeo, pero... ¿Hay alguna forma de extraer los datos no en una lista sino en una matriz donde solo tomemos los datos que nos interesan del archivo csv sin modificar el origen?
Buenas tardes si quisiera listar el nombre de las columnas, ["Año","Computadora"......], como podría conseguirlo gracias
Aquí te dejamos un ejemplo, importamos un archivo en csv y vamos a imprmir las 5 primeras filas de datos (incluyendo los encabezados)
datos=pd.read_csv('minutos2.csv')
print(df.head())
Cómo se descarga Spyder para Python?
Aquí se los mostramos cómo y de dónde descargarlo: ruclips.net/video/Ww2kfuLpqGQ/видео.html
Me sale este bug: module 'pandas' has no attribute 'reader_csv' que hago??
Tal vez falta el nombre del archivo a leer?
¿Por qué está cansada? muy buen video
Hola estoy leyendo un archivo csv y me trae los campos de excel tipo string como los llevo a float mi codigo y el error
datos= pd.read_csv(r'D:\curspy\ejercicios\DATA_LL2370_MD4CSV.csv',sep='\t',delimiter =';',engine='python')
print(datos.info())
print(datos.head())
nuevo=pd.DataFrame(datos)
nuevo=nuevo.replace(np.nan,0)
nuevo=nuevo.replace('N/A',0)
print('
'*5)
nuevo=nuevo.replace('N/A',0)
#Saca los encabezados
print(list(nuevo))
nuevo['DEPT_F']=nuevo.DEPT_F.astype(float)
me da este error
ValueError: could not convert string to float: '3939,75'
Hola Gonzalo, puedes probar a convertir a valor numérico como en este ejemplo:
stackoverflow.com/questions/18434208/pandas-converting-to-numeric-creating-nans-when-necessary
buenas tardes señora me dice que no existe el archivo estoy trabajando en windows
Buenas tardes puedes revisar lo siguiente:
1) Que el archivo esté en la misma carpeta que tu código
2) Que el archivo se llame igual, que como lo estás nombrando en el código
3) Que la extensión del archivo sea CSV (A veces cuando se descargan pueden traer dos extensiones)