⚙ Engenharia de dados Criando um programa de manipulação de dados em python.

Поделиться
HTML-код
  • Опубликовано: 2 дек 2024

Комментарии • 98

  • @Codifike
    @Codifike  20 дней назад

    Descubra como se tornar um Engenheiro de Dados com o Método Data Pro:
    metododatapro.codifike.com.br/

  • @alexcampos4439
    @alexcampos4439 2 года назад +1

    Fabricio, obrigado pela difusão de conhecimentos.
    Para quem estiver com problema em gerar o arquivo .csv:
    - coloque ".txt" ( ponto na frente do txt ) caso esqueça que tem um ponto entre estes dois parâmetros ( {year_date}.{type_file} ).
    - caso tenha problema com resultado do arquivo .csv, aconselho mudar para arquivo .xlsx mudando o ( df_final.to_csv ) para ( df_final.to_excel e final_file = 'all_bovespa.xlsx' )
    São apenas modificações que funcionaram no meu script.

  • @beatrizgomes8077
    @beatrizgomes8077 3 года назад +1

    Salve!
    Ainda bem que assisti esse vídeo, pois é muito bom!
    Não para, continua postando os vídeos, por favor!

    • @Codifike
      @Codifike  3 года назад

      Olá Beatriz, que bom que você gostou

  • @marverom2
    @marverom2 4 года назад +1

    só tenho uma palavra pra definir o conteúdo do seu canal, Sensacional !

    • @Codifike
      @Codifike  4 года назад +1

      Oi Marcelo muito obrigado 👍

  • @roga0507
    @roga0507 4 года назад +1

    Muito, conteúdo muito bom, não dá pra para de assistir!

  • @FabiodosSantosPY
    @FabiodosSantosPY 2 года назад

    Conteudo denso e bem explicado, falta isso aqui no YT pra muitas pessoas que resolvem gerar conteudo sobre Dados.
    Parabéns cara!!! virei fã do canal.

    • @Codifike
      @Codifike  2 года назад +1

      Obrigado Fábio

  • @JoaoPaulo-rv4pe
    @JoaoPaulo-rv4pe 2 года назад

    É muito massa ver o código rodar liso. Obg por compartilhar esse conhecimento!

    • @Codifike
      @Codifike  2 года назад

      E para isso que criei o canal

  • @brunogeraldine5628
    @brunogeraldine5628 Год назад

    O vídeo é tão bom que faz toda essa engenharia parecer fácil.. Tipo "mamão c/ açúcar"..

  • @giselesilva9862
    @giselesilva9862 2 года назад

    Explicação excelente, direto , pratico
    Parabéns!!

  • @rebecajesus3375
    @rebecajesus3375 Год назад +1

    Faz mais video assim, sobre etl, muito bom!

  • @laiosilva6111
    @laiosilva6111 2 года назад

    Conheci seu canal há 2 dias, nunca dei tanto like kkkk
    Parabéns pelo conteúdo e pelo conhecimento tbm

    • @Codifike
      @Codifike  2 года назад +1

      Muito Obrigado

  • @bola4289
    @bola4289 2 года назад

    quando lançar o curso e se estiver dentro do meu orçamento, farei com toda certeza...
    Otimos videos, ótimas explicações, ótimo conteúdo... PARABENS

  • @felipegaleno1563
    @felipegaleno1563 Год назад

    Parabéns pelo video, gosto muito de assistir seus vídeos, sempre aprendendo um pouco mais. Obrigado por compartilhar seus conhecimentos.

  • @lucaslira5
    @lucaslira5 2 года назад

    Show! parabéns pelo conteúdo meu amigo e um grande abraço.

    • @Codifike
      @Codifike  2 года назад

      Valeu Lucas obrigado

  • @heliomar93
    @heliomar93 4 года назад

    pô cara, vídeo excelente, exatamente o q tava procurando

    • @heliomar93
      @heliomar93 4 года назад

      se me permite uma sugestão: Web Scraping

    • @Codifike
      @Codifike  4 года назад +1

      Oi Heliomar, muito obrigado

    • @Codifike
      @Codifike  4 года назад +1

      @@heliomar93 Anotado. Aqui quem manda são os inscritos :)

  • @alexandresmaniotto8246
    @alexandresmaniotto8246 3 года назад

    Canal incrível, didática excelente.

    • @Codifike
      @Codifike  3 года назад

      Valeu Alexandre, muito obrigado. Um abraço

  • @vandersonluisrosaduraes3403
    @vandersonluisrosaduraes3403 2 года назад

    Canal fenomenal, o melhor sem dúvidas!
    Cara, uma dúvida, como faço pra puxar os anos automático? Sem ter que colocar ano por ano, tipo se adicionar o 2021, rodar de novo sem ter que colocar o 2021?

  • @moreira20momoreira28
    @moreira20momoreira28 4 года назад +1

    Muito Bom, excelente explicação, somente uma duvida estes codigos que voce mostra para fazer o tratamento dos dados da B3, voce não disponibilizou para baixar ne?

    • @Codifike
      @Codifike  4 года назад +1

      Sim, no site da codifike, tem um link para meu github onde tem os códigos. Você pode ver nas descrições. Abraços.

  • @Seligaemmim
    @Seligaemmim 2 года назад

    Preciso de um programa ou código que rode automaticamente , que me mostre quais ações sobem de um determinado horário ate o fechamento. Com estatísticas das que sobem mais por período. Tipo no último mês , no trimestre e semestre passando por 1 ano a 2 anos.

  • @alegbento
    @alegbento 2 года назад

    Excelente! Obrigado!!!

  • @MrCochico01
    @MrCochico01 Год назад +2

    Não consegui achar o layout...

  • @lucasamaral4296
    @lucasamaral4296 3 года назад

    Muito bom, parabéns!!!

    • @Codifike
      @Codifike  3 года назад

      Valeu Lucas obrigado

  • @abuju
    @abuju 3 года назад

    boa tarde, gostei da didática, sucinto e direto. parabéns. mas meu problema está aqui...
    como no começo do vídeo, apresentou erro de Unicode... consegui seguir com - r´ - e tudo funcionou até se formatar o programa. Seguindo à risca me aparece o erro abaixo:
    ao usar f´ aparece esse erro: SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape
    mas qdo uso no path: - r´ - aparece esse erro: -> 11 concat_files = (path, name_file, year_date, type_file, final_file)
    NameError: name 'path' is not defined.
    Como resolver esse problema?

  • @gregoricastelhano2003
    @gregoricastelhano2003 Год назад

    Muito bom #etl #engenhariadedados #python

  • @claudioalvesferreira945
    @claudioalvesferreira945 3 года назад

    Ótimo Video! Agora imagina que cada linha tem informações diferentes, teria alguma maneira de pegar estas informações sendo que aparentemente consigo definir apenas um layout no colspecs.

    • @Codifike
      @Codifike  3 года назад +2

      Oi Claudio que bom que gostou. Esse script é para dados estruturados. Para dados não estruturados, precisamos ter outra abordagem

    • @claudioalvesferreira945
      @claudioalvesferreira945 3 года назад

      @@Codifike Valew

  • @marcelo9223
    @marcelo9223 Год назад

    obrigado pela aula!!!

  • @edgarcaria
    @edgarcaria 2 года назад

    muito bom! conteúdo bem bacana!

  • @brayan-mesquita
    @brayan-mesquita 4 года назад

    Muito bom!

  • @efrainlirio3165
    @efrainlirio3165 7 месяцев назад

    excelente

  • @juniordeandrade3385
    @juniordeandrade3385 3 года назад

    Excelente conteúdo, parabéns.
    Tenho uma dúvida, estou aprendendo python. Na hora que você dividiu por 100 para arredondar os números, daria para usar a função Round do python?

    • @Codifike
      @Codifike  3 года назад +1

      Oi Junior,que bom que está gostando do nosso conteúdo.
      Eu dividi por 100 pois o campo não estava com separador de 2 casas decimais. Round seria para arredondamento. Abraços

  • @leandrosoares2861
    @leandrosoares2861 2 года назад

    Conteúdo massa!

  • @wiulamesoares1099
    @wiulamesoares1099 2 года назад

    o meu nao ta abrindo esse ARquivo
    que vc pega os numeros

  • @FAKENUM83R
    @FAKENUM83R 2 года назад

    Boa tarde. É normal os itens da tabela ficarem todos para o lado direito ? E o meu arquivo quando abre também , os tópicos da tabela estão separados por vírgula. Usei o exemplo do vídeo e o do github também.

    • @Codifike
      @Codifike  2 года назад

      Isso acontece quando não é informado tipo de separador,no vídeo foi usado ponto e vírgula .

  • @andreyluiz-lw8wf
    @andreyluiz-lw8wf 2 года назад

    Opa, tô achando muito daora o conteúdo, estou só com uma dúvida, como seria para ajustar os numeros das colunas qtd_negocios e volume_negocios para INT? Estou fazendo com o COTAHIST desse ano e veio cheio de números. Agradeço se puder me ajudar, abraço!

    • @Codifike
      @Codifike  2 года назад +1

      Da uma lida neste link www.google.com/url?sa=t&source=web&rct=j&url=www.digitalocean.com/community/tutorials/how-to-convert-data-types-in-python-3&ved=2ahUKEwjohrOnrtj7AhUOspUCHVHhBDwQFnoECAgQBQ&usg=AOvVaw1yFInWRviqOxXYThC6Gr9K

  • @THIAGOSILVA-dg1vd
    @THIAGOSILVA-dg1vd 3 года назад +1

    tentei esse codigo tudo deu certos no final execuçao error cocant_files 'is not defined'

    • @Codifike
      @Codifike  3 года назад

      Verifique se está tudo certinho com as variáveis, Diretório do arquivo

  • @theelaine123456789
    @theelaine123456789 3 года назад

    Fiz pelo google colab e exportei em csv fazendo download

    • @Codifike
      @Codifike  3 года назад

      Oi Elaine, que bom que conseguiu. Abraços

  • @vitoriabelo2346
    @vitoriabelo2346 3 года назад

    Olá! Estou com problemas para conseguir gerar o arquivo all_bovespa.csv
    Inicialmente foi gerado o seguinte erro: read_files takes 3 positional arguments but 4 were given, na linha: df=read_files(path,name_file,y,type_file). Acabei tirando o y. Porém, agora sigo com o erro: FileNotFoundError: [Errno 2] No such file or directory: "C:\\Users\\User\\Desktop\\MERCADO_FINANCEIRO\\COTAHIST_A['2018', '2019', '2020'].txt" já tentei alterar para somente 1 data e conferi severas vezes o código. Poderia me ajudar? Obrigada!

    • @Codifike
      @Codifike  3 года назад

      Oi Vitoria, o seu caminho é passando a lista inteira, tem que passar os anos 1 de cada vez. Use o codigo que está no meui github github.com/fabrimatt/engenharia_de_dados

  • @SuperTudoaqui
    @SuperTudoaqui 3 года назад

    Ótimo conteúdo!! O meu código está certo roda tudo, mas não extrai para o excel todos os ativos, por exemplo, eu procuro pela LUPA3, no txt (COTAHIST_A2021.txt) tem mas no excel não. ...Tem algo que posso fazer para melhorar? Obrigado pelos videos e parabéns pelo canal!!!

    • @Codifike
      @Codifike  3 года назад

      Oi Davi, verifique o arquivo .csv, se estiver lá , o problema deve ser no excel

  • @publicont8625
    @publicont8625 2 года назад

    Quando substituí o arquivo por _file apresenta o seguinte erro: nonameError: name '_file' is not defined. Como resolver?

    • @Codifike
      @Codifike  2 года назад

      O código esta no meu github nas descrições, dá uma olhada se não esqueceu nada

  • @MrLiecht
    @MrLiecht 4 года назад

    Muito bacana. eu to fazendo o mesmo código que vc fez mas ta dando erro na data. eu baixei os arquivos da b3 hj e elas não estão no mesmo formato que vc mostrou no vídeo. estão aparecendo apenas 3 algarismos para o ano. será que a b3 modificou alguma coisa? eu vi que a última atualização deles foi dia 05/10. tem como arrumar isso?

    • @Codifike
      @Codifike  4 года назад

      Oi Ranan, o arquivo que você baixou são os históricos?

    • @MrLiecht
      @MrLiecht 4 года назад

      @@Codifike isso! eu baixei os mesmos arquivos que vc baixou do mesmo local da B3 (inclusive baixei o 2020) mas o ano não está em um formato adequado (está apresentando 3 algarismos para o ano) e quando eu mando colocar o ano em um formato adequado (como vc fez) apresenta uma msg de erro (justamente pelo fato de não estar em um formato adequado).

    • @Codifike
      @Codifike  4 года назад

      @@MrLiecht esse é o link do arquivo histórico. Baixa o anual : www.b3.com.br/pt_br/market-data-e-indices/servicos-de-dados/market-data/historico/mercado-a-vista/series-historicas/

  • @felipepereira2028
    @felipepereira2028 3 года назад

    Como é que eu adiciono o caminho para ele ler o arquivo obtido da B3?

    • @Codifike
      @Codifike  3 года назад

      Oi Felipe pode seguir o código que está aqui: github.com/fabrimatt/engenharia_de_dados

  • @infosacci
    @infosacci 3 года назад

    Excelente script. Tentei gerar um arquivo de 2010 a 2021 e encontrei erros em 2 anos, conforme mensagens abaixo. Alguma sugestão sobre como corrigir esse problema? Na msg de erro aparece a posição onde houve o erro de "decoe byte":
    2012: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 7188: invalid continuation byte
    2014: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 5378: invalid continuation byte

    • @Codifike
      @Codifike  3 года назад +1

      Oi Paulo, me parece que está vindo algum caractere errado. Mas sempre usei o arquivo do bovespa e nunca tive problema.Tente essa dica: stackoverflow.com/questions/13471665/unicodedecodeerror-utf-8-codec-cant-decode-byte-0xc7-in-position

  • @willownot
    @willownot 3 года назад

    Olá amigo, estou querendo entrar para a engenharia de dados, é possivel empreender(sem ser via freelancer)? Algo escalável ?

    • @Codifike
      @Codifike  3 года назад

      Olá Wyllow , freelancer seria maneira mais rápida para começar a empreender, pois você pode pegar projetos para fazer sem sair de onde está (caso esteja em um emprego). Outra maneira é partindo para emprego na área de dados onde tem bastante procura atualmente. Abraços

    • @willownot
      @willownot 3 года назад

      @@Codifike entendi, é por que isso não é algo escalável, o tempo né

    • @willownot
      @willownot 3 года назад

      @@Codifike se tratando de empresa prestadora de serviços ou de algo escalável acha que não tem espaço?

    • @Codifike
      @Codifike  3 года назад

      @@willownot Também é uma opção, prestar serviço para várias empresa

  • @ivansalt1969
    @ivansalt1969 3 года назад

    Onde consigo o layout?

    • @Codifike
      @Codifike  3 года назад

      Oi Ivan no próprio site da bovespa em dados históricos tem o arquivo de layout.

    • @ivansalt1969
      @ivansalt1969 3 года назад

      @@Codifike O problema é que eu só achei desatualizado, não encontro o de 2021

    • @Codifike
      @Codifike  3 года назад +1

      @@ivansalt1969 segue o link www.b3.com.br/data/files/33/67/B9/50/D84057102C784E47AC094EA8/SeriesHistoricas_Layout.pdf

  • @wiulamesoares1099
    @wiulamesoares1099 2 года назад

    nao estou consegundo o layout

  • @charlesmiranda6311
    @charlesmiranda6311 3 года назад

    esta dando erro na hora que informo o endereço do arquivo txt. no minuto 14. alguem pode me ajudar?

    • @Codifike
      @Codifike  3 года назад

      Oi Charles, se estiver no windows, tem que colocar como no vídeo com barras duplas, e atentar para não ter nenhum caracter especial(cedilha, acento) e se possível retire espaços

    • @charlesmiranda6311
      @charlesmiranda6311 3 года назад

      @@Codifike ainda não consegui.

    • @Codifike
      @Codifike  3 года назад

      @@charlesmiranda6311 O link do código está aqui: github.com/fabrimatt/engenharia_de_dados

  • @marcelo9223
    @marcelo9223 Год назад

    Como você sabia que tinha que dividir por 100?
    O que significam as abreviações, N(), X(), V()?

    • @Codifike
      @Codifike  Год назад +1

      Os valores vierem como string, então converti e depois fiz a divisão pois queria 2 casas decimais

  • @tiagottfufc739
    @tiagottfufc739 2 года назад

    O meu código não está puxando os arquivos txt. Dando erro ainda na importação.
    # Importar bibliotecas
    import pandas as pd
    !pip install fsspec
    colspecs = [(2,10),
    (10,12),
    (12,24),
    (27,39),
    (56,69),
    (69,82),
    (82,95),
    (108,121),
    (152,170),
    (170,188)
    ]
    names = ['data_pregao','codbdi','sigla_acao','nome_acao','preco_abertura','preco_maximo','preco_minimo','preco_fechamento','qtd_negocios','volume_negocios']
    df = pd.read_fwf('C://Users//Tiago//Documents//bovespa//COTAHIST_A2021.txt', colspecs = colspecs, names = names, skiprows = 1)
    Aparece a seguinte mensagem:
    FileNotFoundError: [Errno 2] No such file or directory: '/content/C://Users//Tiago//Documents//bovespa//COTAHIST_A2021.txt'
    Como resolver???

    • @Codifike
      @Codifike  2 года назад

      Olá parece que o caminho está errado ( tem um content na frente do C:) da uma olhada na barra de endereço do windows e pega o caminho de lá.

    • @tiagottfufc739
      @tiagottfufc739 2 года назад +1

      @@Codifike Oi bom dia. Muito obrigado pelo retorno. Eu estava copiando do computador e de nenhuma forma deu certo. Coloquei os arquivos no drive, montei dentro do colab e peguei o caminho do drive. Agora funcionou. Vou seguir o restante do vídeo. Muito obrigado.