⚙ Engenharia de dados Criando um programa de manipulação de dados em python.

Codifike

Просмотров 14 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 2 дек 2024

Комментарии • 98

@Codifike 20 дней назад
Descubra como se tornar um Engenheiro de Dados com o Método Data Pro:
metododatapro.codifike.com.br/
@alexcampos4439 2 года назад ⁺¹
Fabricio, obrigado pela difusão de conhecimentos.
Para quem estiver com problema em gerar o arquivo .csv:
- coloque ".txt" ( ponto na frente do txt ) caso esqueça que tem um ponto entre estes dois parâmetros ( {year_date}.{type_file} ).
- caso tenha problema com resultado do arquivo .csv, aconselho mudar para arquivo .xlsx mudando o ( df_final.to_csv ) para ( df_final.to_excel e final_file = 'all_bovespa.xlsx' )
São apenas modificações que funcionaram no meu script.
@Codifike 2 года назад ⁺¹
Obrigado Alex
@beatrizgomes8077 3 года назад ⁺¹
Salve!
Ainda bem que assisti esse vídeo, pois é muito bom!
Não para, continua postando os vídeos, por favor!
@Codifike 3 года назад
Olá Beatriz, que bom que você gostou
@marverom2 4 года назад ⁺¹
só tenho uma palavra pra definir o conteúdo do seu canal, Sensacional !
@Codifike 4 года назад ⁺¹
Oi Marcelo muito obrigado 👍
@roga0507 4 года назад ⁺¹
Muito, conteúdo muito bom, não dá pra para de assistir!
@FabiodosSantosPY 2 года назад
Conteudo denso e bem explicado, falta isso aqui no YT pra muitas pessoas que resolvem gerar conteudo sobre Dados.
Parabéns cara!!! virei fã do canal.
@Codifike 2 года назад ⁺¹
Obrigado Fábio
@JoaoPaulo-rv4pe 2 года назад
É muito massa ver o código rodar liso. Obg por compartilhar esse conhecimento!
@Codifike 2 года назад
E para isso que criei o canal
@brunogeraldine5628 Год назад
O vídeo é tão bom que faz toda essa engenharia parecer fácil.. Tipo "mamão c/ açúcar"..
@Codifike Год назад ⁺¹
Obrigado
@giselesilva9862 2 года назад
Explicação excelente, direto , pratico
Parabéns!!
@Codifike 2 года назад
Obrigado Gisele
@rebecajesus3375 Год назад ⁺¹
Faz mais video assim, sobre etl, muito bom!
@Codifike Год назад ⁺¹
Oi vou fazer sim
@laiosilva6111 2 года назад
Conheci seu canal há 2 dias, nunca dei tanto like kkkk
Parabéns pelo conteúdo e pelo conhecimento tbm
@Codifike 2 года назад ⁺¹
Muito Obrigado
@bola4289 2 года назад
quando lançar o curso e se estiver dentro do meu orçamento, farei com toda certeza...
Otimos videos, ótimas explicações, ótimo conteúdo... PARABENS
@Codifike 2 года назад
Muito Obrigado
@felipegaleno1563 Год назад
Parabéns pelo video, gosto muito de assistir seus vídeos, sempre aprendendo um pouco mais. Obrigado por compartilhar seus conhecimentos.
@Codifike Год назад
Eu que agradeço
@lucaslira5 2 года назад
Show! parabéns pelo conteúdo meu amigo e um grande abraço.
@Codifike 2 года назад
Valeu Lucas obrigado
@heliomar93 4 года назад
pô cara, vídeo excelente, exatamente o q tava procurando
@heliomar93 4 года назад
se me permite uma sugestão: Web Scraping
@Codifike 4 года назад ⁺¹
Oi Heliomar, muito obrigado
@Codifike 4 года назад ⁺¹
@@heliomar93 Anotado. Aqui quem manda são os inscritos :)
@alexandresmaniotto8246 3 года назад
Canal incrível, didática excelente.
@Codifike 3 года назад
Valeu Alexandre, muito obrigado. Um abraço
@vandersonluisrosaduraes3403 2 года назад
Canal fenomenal, o melhor sem dúvidas!
Cara, uma dúvida, como faço pra puxar os anos automático? Sem ter que colocar ano por ano, tipo se adicionar o 2021, rodar de novo sem ter que colocar o 2021?
@moreira20momoreira28 4 года назад ⁺¹
Muito Bom, excelente explicação, somente uma duvida estes codigos que voce mostra para fazer o tratamento dos dados da B3, voce não disponibilizou para baixar ne?
@Codifike 4 года назад ⁺¹
Sim, no site da codifike, tem um link para meu github onde tem os códigos. Você pode ver nas descrições. Abraços.
@Seligaemmim 2 года назад
Preciso de um programa ou código que rode automaticamente , que me mostre quais ações sobem de um determinado horário ate o fechamento. Com estatísticas das que sobem mais por período. Tipo no último mês , no trimestre e semestre passando por 1 ano a 2 anos.
@alegbento 2 года назад
Excelente! Obrigado!!!
@MrCochico01 Год назад ⁺²
Não consegui achar o layout...
@lucasamaral4296 3 года назад
Muito bom, parabéns!!!
@Codifike 3 года назад
Valeu Lucas obrigado
@abuju 3 года назад
boa tarde, gostei da didática, sucinto e direto. parabéns. mas meu problema está aqui...
como no começo do vídeo, apresentou erro de Unicode... consegui seguir com - r´ - e tudo funcionou até se formatar o programa. Seguindo à risca me aparece o erro abaixo:
ao usar f´ aparece esse erro: SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape
mas qdo uso no path: - r´ - aparece esse erro: -> 11 concat_files = (path, name_file, year_date, type_file, final_file)
NameError: name 'path' is not defined.
Como resolver esse problema?
@gregoricastelhano2003 Год назад
Muito bom #etl #engenhariadedados #python
@claudioalvesferreira945 3 года назад
Ótimo Video! Agora imagina que cada linha tem informações diferentes, teria alguma maneira de pegar estas informações sendo que aparentemente consigo definir apenas um layout no colspecs.
@Codifike 3 года назад ⁺²
Oi Claudio que bom que gostou. Esse script é para dados estruturados. Para dados não estruturados, precisamos ter outra abordagem
@claudioalvesferreira945 3 года назад
@@Codifike Valew
@marcelo9223 Год назад
obrigado pela aula!!!
@Codifike Год назад
Bons estudos!
@edgarcaria 2 года назад
muito bom! conteúdo bem bacana!
@Codifike 2 года назад
Obrigado
@brayan-mesquita 4 года назад
Muito bom!
@Codifike 4 года назад
Obrigado Brayan
@efrainlirio3165 7 месяцев назад
excelente
@juniordeandrade3385 3 года назад
Excelente conteúdo, parabéns.
Tenho uma dúvida, estou aprendendo python. Na hora que você dividiu por 100 para arredondar os números, daria para usar a função Round do python?
@Codifike 3 года назад ⁺¹
Oi Junior,que bom que está gostando do nosso conteúdo.
Eu dividi por 100 pois o campo não estava com separador de 2 casas decimais. Round seria para arredondamento. Abraços
@leandrosoares2861 2 года назад
Conteúdo massa!
@Codifike 2 года назад
Obrigado 🤙
@wiulamesoares1099 2 года назад
o meu nao ta abrindo esse ARquivo
que vc pega os numeros
@FAKENUM83R 2 года назад
Boa tarde. É normal os itens da tabela ficarem todos para o lado direito ? E o meu arquivo quando abre também , os tópicos da tabela estão separados por vírgula. Usei o exemplo do vídeo e o do github também.
@Codifike 2 года назад
Isso acontece quando não é informado tipo de separador,no vídeo foi usado ponto e vírgula .
@andreyluiz-lw8wf 2 года назад
Opa, tô achando muito daora o conteúdo, estou só com uma dúvida, como seria para ajustar os numeros das colunas qtd_negocios e volume_negocios para INT? Estou fazendo com o COTAHIST desse ano e veio cheio de números. Agradeço se puder me ajudar, abraço!
@Codifike 2 года назад ⁺¹
Da uma lida neste link www.google.com/url?sa=t&source=web&rct=j&url=www.digitalocean.com/community/tutorials/how-to-convert-data-types-in-python-3&ved=2ahUKEwjohrOnrtj7AhUOspUCHVHhBDwQFnoECAgQBQ&usg=AOvVaw1yFInWRviqOxXYThC6Gr9K
@THIAGOSILVA-dg1vd 3 года назад ⁺¹
tentei esse codigo tudo deu certos no final execuçao error cocant_files 'is not defined'
@Codifike 3 года назад
Verifique se está tudo certinho com as variáveis, Diretório do arquivo
@theelaine123456789 3 года назад
Fiz pelo google colab e exportei em csv fazendo download
@Codifike 3 года назад
Oi Elaine, que bom que conseguiu. Abraços
@vitoriabelo2346 3 года назад
Olá! Estou com problemas para conseguir gerar o arquivo all_bovespa.csv
Inicialmente foi gerado o seguinte erro: read_files takes 3 positional arguments but 4 were given, na linha: df=read_files(path,name_file,y,type_file). Acabei tirando o y. Porém, agora sigo com o erro: FileNotFoundError: [Errno 2] No such file or directory: "C:\\Users\\User\\Desktop\\MERCADO_FINANCEIRO\\COTAHIST_A['2018', '2019', '2020'].txt" já tentei alterar para somente 1 data e conferi severas vezes o código. Poderia me ajudar? Obrigada!
@Codifike 3 года назад
Oi Vitoria, o seu caminho é passando a lista inteira, tem que passar os anos 1 de cada vez. Use o codigo que está no meui github github.com/fabrimatt/engenharia_de_dados
@SuperTudoaqui 3 года назад
Ótimo conteúdo!! O meu código está certo roda tudo, mas não extrai para o excel todos os ativos, por exemplo, eu procuro pela LUPA3, no txt (COTAHIST_A2021.txt) tem mas no excel não. ...Tem algo que posso fazer para melhorar? Obrigado pelos videos e parabéns pelo canal!!!
@Codifike 3 года назад
Oi Davi, verifique o arquivo .csv, se estiver lá , o problema deve ser no excel
@publicont8625 2 года назад
Quando substituí o arquivo por _file apresenta o seguinte erro: nonameError: name '_file' is not defined. Como resolver?
@Codifike 2 года назад
O código esta no meu github nas descrições, dá uma olhada se não esqueceu nada
@MrLiecht 4 года назад
Muito bacana. eu to fazendo o mesmo código que vc fez mas ta dando erro na data. eu baixei os arquivos da b3 hj e elas não estão no mesmo formato que vc mostrou no vídeo. estão aparecendo apenas 3 algarismos para o ano. será que a b3 modificou alguma coisa? eu vi que a última atualização deles foi dia 05/10. tem como arrumar isso?
@Codifike 4 года назад
Oi Ranan, o arquivo que você baixou são os históricos?
@MrLiecht 4 года назад
@@Codifike isso! eu baixei os mesmos arquivos que vc baixou do mesmo local da B3 (inclusive baixei o 2020) mas o ano não está em um formato adequado (está apresentando 3 algarismos para o ano) e quando eu mando colocar o ano em um formato adequado (como vc fez) apresenta uma msg de erro (justamente pelo fato de não estar em um formato adequado).
@Codifike 4 года назад
@@MrLiecht esse é o link do arquivo histórico. Baixa o anual : www.b3.com.br/pt_br/market-data-e-indices/servicos-de-dados/market-data/historico/mercado-a-vista/series-historicas/
@felipepereira2028 3 года назад
Como é que eu adiciono o caminho para ele ler o arquivo obtido da B3?
@Codifike 3 года назад
Oi Felipe pode seguir o código que está aqui: github.com/fabrimatt/engenharia_de_dados
@infosacci 3 года назад
Excelente script. Tentei gerar um arquivo de 2010 a 2021 e encontrei erros em 2 anos, conforme mensagens abaixo. Alguma sugestão sobre como corrigir esse problema? Na msg de erro aparece a posição onde houve o erro de "decoe byte":
2012: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 7188: invalid continuation byte
2014: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 5378: invalid continuation byte
@Codifike 3 года назад ⁺¹
Oi Paulo, me parece que está vindo algum caractere errado. Mas sempre usei o arquivo do bovespa e nunca tive problema.Tente essa dica: stackoverflow.com/questions/13471665/unicodedecodeerror-utf-8-codec-cant-decode-byte-0xc7-in-position
@willownot 3 года назад
Olá amigo, estou querendo entrar para a engenharia de dados, é possivel empreender(sem ser via freelancer)? Algo escalável ?
@Codifike 3 года назад
Olá Wyllow , freelancer seria maneira mais rápida para começar a empreender, pois você pode pegar projetos para fazer sem sair de onde está (caso esteja em um emprego). Outra maneira é partindo para emprego na área de dados onde tem bastante procura atualmente. Abraços
@willownot 3 года назад
@@Codifike entendi, é por que isso não é algo escalável, o tempo né
@willownot 3 года назад
@@Codifike se tratando de empresa prestadora de serviços ou de algo escalável acha que não tem espaço?
@Codifike 3 года назад
@@willownot Também é uma opção, prestar serviço para várias empresa
@ivansalt1969 3 года назад
Onde consigo o layout?
@Codifike 3 года назад
Oi Ivan no próprio site da bovespa em dados históricos tem o arquivo de layout.
@ivansalt1969 3 года назад
@@Codifike O problema é que eu só achei desatualizado, não encontro o de 2021
@Codifike 3 года назад ⁺¹
@@ivansalt1969 segue o link www.b3.com.br/data/files/33/67/B9/50/D84057102C784E47AC094EA8/SeriesHistoricas_Layout.pdf
@wiulamesoares1099 2 года назад
nao estou consegundo o layout
@charlesmiranda6311 3 года назад
esta dando erro na hora que informo o endereço do arquivo txt. no minuto 14. alguem pode me ajudar?
@Codifike 3 года назад
Oi Charles, se estiver no windows, tem que colocar como no vídeo com barras duplas, e atentar para não ter nenhum caracter especial(cedilha, acento) e se possível retire espaços
@charlesmiranda6311 3 года назад
@@Codifike ainda não consegui.
@Codifike 3 года назад
@@charlesmiranda6311 O link do código está aqui: github.com/fabrimatt/engenharia_de_dados
@marcelo9223 Год назад
Como você sabia que tinha que dividir por 100?
O que significam as abreviações, N(), X(), V()?
@Codifike Год назад ⁺¹
Os valores vierem como string, então converti e depois fiz a divisão pois queria 2 casas decimais
@tiagottfufc739 2 года назад
O meu código não está puxando os arquivos txt. Dando erro ainda na importação.
# Importar bibliotecas
import pandas as pd
!pip install fsspec
colspecs = [(2,10),
(10,12),
(12,24),
(27,39),
(56,69),
(69,82),
(82,95),
(108,121),
(152,170),
(170,188)
]
names = ['data_pregao','codbdi','sigla_acao','nome_acao','preco_abertura','preco_maximo','preco_minimo','preco_fechamento','qtd_negocios','volume_negocios']
df = pd.read_fwf('C://Users//Tiago//Documents//bovespa//COTAHIST_A2021.txt', colspecs = colspecs, names = names, skiprows = 1)
Aparece a seguinte mensagem:
FileNotFoundError: [Errno 2] No such file or directory: '/content/C://Users//Tiago//Documents//bovespa//COTAHIST_A2021.txt'
Como resolver???
@Codifike 2 года назад
Olá parece que o caminho está errado ( tem um content na frente do C:) da uma olhada na barra de endereço do windows e pega o caminho de lá.
@tiagottfufc739 2 года назад ⁺¹
@@Codifike Oi bom dia. Muito obrigado pelo retorno. Eu estava copiando do computador e de nenhuma forma deu certo. Coloquei os arquivos no drive, montei dentro do colab e peguei o caminho do drive. Agora funcionou. Vou seguir o restante do vídeo. Muito obrigado.

Следующие

Автовоспроизведение

💰 Machine learning na bolsa de valores // Prevendo preço das ações usando python #machinelearning