Tutorial Airflow para engenharia de dados

Поделиться
HTML-код
  • Опубликовано: 7 янв 2025

Комментарии •

  • @Codifike
    @Codifike  Месяц назад

    Descubra como se tornar um Engenheiro de Dados com o Método Data Pro:
    metododatapro.codifike.com.br/

  • @juninho7619
    @juninho7619 Год назад +4

    A melhor parte é ver os erros, quando a gente vê esses vídeos com 0 erros pensamos que estamos fazendo tudo errado no dia a dia, pois só conseguimos rodar depois de corrigir várias vezes o código. Agora vendo pessoas experts sendo "gente como a gente" o vídeo fica muito mais interessante.
    Parabéns, gostei muito do conteúdo todo.

  • @oiwelder
    @oiwelder 11 месяцев назад +1

    xcom - 17:40
    operators - 09:08
    ti(taskinstance) - 18:30

  • @alynneoya
    @alynneoya 2 года назад +1

    Bom é assim pq a gente aprende o que fazer qdo erra! Adorei! Parabéns!

  • @orafaelgf
    @orafaelgf 3 года назад +2

    Ótimo video. Tem pouco material didático de airflow. Se possível, faça um vídeo da instalação tanto no Linux (wsl) quanto no docker, por favor. Vejo muita dúvida disso na comunidade do telegram tb.

  • @MatheusOrnelas777
    @MatheusOrnelas777 Год назад

    Muito bom, parabéns pelas aulas, muito bem explicado, a comunidade brasileira precisa desse tipo de material por aqui, valeuzao

  • @gustavoaraujo4299
    @gustavoaraujo4299 3 года назад +1

    Segura meu like aí. 26 minutos muito objetivo, parabéns. Ótimo conteúdo.

    • @Codifike
      @Codifike  3 года назад

      Obrigados Gustavo

  • @jakscileyaraujo2441
    @jakscileyaraujo2441 2 года назад +1

    Sensacional! Obrigado pela explicação. Grava mais aulas sobre o AirFlow.

    • @Codifike
      @Codifike  2 года назад +1

      Que bom que gostou. Vou gravar sim.Abraços

  • @MaurilioCardosoGoncalves
    @MaurilioCardosoGoncalves 2 года назад +1

    Conteúdo muito bacana! Parabéns!
    Uma ideia de vídeo. Poderia falar sobre xcom e sua utilização em diferentes operadores (como pegar valores de uma consulta sql, python, etc).

  • @smurfazul7981
    @smurfazul7981 Год назад +2

    Boa noite! Obrigado pelo conteúdo.Gostaria sim de um vídeo de instalação do Airflow

  • @danilosilvaandrade9780
    @danilosilvaandrade9780 2 года назад

    Me inscrevi e não perco mais um vídeo seu! Ótima aula, didática, e inclusive ver os erros fez toda diferença, parabéns!!!

    • @Codifike
      @Codifike  2 года назад +1

      Muito obrigado

  • @leonardovenancio9561
    @leonardovenancio9561 Год назад +1

    Muito massa!!
    Será que teriamos um vídeo de integração do airflow com o databricks?

  • @ThiagoSantos-wd8pe
    @ThiagoSantos-wd8pe Год назад

    muito boa essa ferramenta, gostei bastante. Faço algumas RPA de dados de fornecedores da empresa. Eles disponibiliza no site ou servidor FTP deles e eu faço uma automação para ir la buscar e salvar no disco e inserir no BI. Atualmente, eu faço pelo agendador de tarefas do windows msm. Me interessei por essa ferramenta, estava pensando em modularizar minha automação com POO mas essa ferramenta me chamou atenção. Você me deu varios insights aqui com esse simples video.

  • @andreandre9506
    @andreandre9506 2 года назад +3

    Por favor, Professor, poderia fazer um video de instalação e configuração do Airflow no windows?

    • @Codifike
      @Codifike  2 года назад +1

      Já fiz segue o link: ruclips.net/video/w8Z--fpEpyU/видео.html

  • @ztfeelingsgameraccountgame8665
    @ztfeelingsgameraccountgame8665 3 года назад

    ótima aula de airflow! parabéns pelo conteúdo

  • @jessedasilva313
    @jessedasilva313 2 года назад

    Mano, muito bom. parabéns!! ótima didática

  • @helioleal6828
    @helioleal6828 2 года назад

    Sensacional esse vídeo, melhor coisa é deixar dar os erros porque na vida real é assim não e verdade ?
    Muito obrigado pelo vídeo

  • @LuizHenrique-qr3lt
    @LuizHenrique-qr3lt 3 года назад

    Muito boa cara! Parabéns!!

  • @thyalldgreville7861
    @thyalldgreville7861 5 месяцев назад

    Conteúdo de ótima qualidade

  • @fabiotelles6048
    @fabiotelles6048 2 года назад

    Muito objetivo! Parabéns! Além do like, ganhou um seguidor.

    • @Codifike
      @Codifike  2 года назад

      Muito obrigado 😃

  • @hjbramos
    @hjbramos 2 года назад

    Ótima explicação! Obrigado!

  • @MatheusQuiarati
    @MatheusQuiarati 2 года назад

    Muito bom, cara!! Parabéns!!

  • @davelemos9464
    @davelemos9464 2 года назад

    Adorei o canal. Parabéns!!!

  • @luizgustavo8272
    @luizgustavo8272 Год назад

    Excelente vídeo. Parabéns !!!

  • @xlukizera
    @xlukizera 3 года назад

    Daora AirFlow, poderia fazer mais videos hehe seria um pipeline interessante de se ver por completo, daria para usar pySpark?

  • @Diegonardons
    @Diegonardons Год назад

    excelente material

  • @felipesembay4888
    @felipesembay4888 2 года назад

    Funcionou perfeito o tutorial.

  • @hevertoncss
    @hevertoncss Год назад

    Fantástico o conteúdo!

  • @TheCoringa05
    @TheCoringa05 2 года назад +2

    Ola, poderia ensinar a linkar o airflow com o github, realizar o metodo upsert e armazenar os dados em um s3 na amazon?

    • @Codifike
      @Codifike  2 года назад

      Vou ver se consigo

  • @rodrigomarques7128
    @rodrigomarques7128 2 года назад

    Que demais!!! Incrível!!!

  • @gdsantos2002
    @gdsantos2002 2 года назад

    Muito útil, obrigado.

    • @Codifike
      @Codifike  2 года назад

      Eu q agradeço por assistir

  • @nandoestagium
    @nandoestagium 2 года назад +1

    Top man!!!!
    Ajudou muito!!! Fiz uma pequena adaptação no cod para ver na pratica a segmentação de escolha de tarefa.
    def captura_conta_dados():
    quantidade = [500,2500]
    qtd = random.choice(quantidade)
    return qtd
    def e_valida(ti):
    qtd = ti.xcom_pull(task_ids = 'captura_conta_dados')
    if (qtd > 1000):
    return 'nvalido'
    return 'valido'
    with DAG('verifica_numeros_fer', start_date = datetime(2021,12,1),
    schedule_interval="*/1 * * * *", catchup=False) as dag:
    O complicado é que ele só segue um fluxo não alternando entre um ou outro, saberia se ha algo que devemos executar a mais?

  • @AndersonLenz
    @AndersonLenz Год назад

    Muito obrigado!

  • @pedrolaender123
    @pedrolaender123 Год назад

    Ótimo conteúdo

  • @juliocezarbarbosa4419
    @juliocezarbarbosa4419 3 года назад

    Perfeito

  • @charlessodre7690
    @charlessodre7690 3 года назад +1

    Show!!!

    • @Codifike
      @Codifike  3 года назад

      Obrigado Charles

  • @andreshernandocerquerameji2148

    Brigado. Da Colombia

  • @Canal_doDx
    @Canal_doDx 10 месяцев назад

    Muito bom

  • @LuizHenrique-qr3lt
    @LuizHenrique-qr3lt 2 года назад +1

    Mostra como instala o airflow na máquina pfv!!!

  • @deiveflores3556
    @deiveflores3556 8 месяцев назад

    Excelente explicação e didática! a partir desse video comecei a fazer alguns testes e me deparei com uma conexao odbc, não consegui implementá-la. Meu banco de dados em questão é um sybase que geralmente usa um conector sqlanyware, consigo conectar o banco pelo isql dentro do container, mas não consegui colocá-lo no airflow, se vc puder dar alguma dica ou um video q eu possa reproduzir aqui ficaria grato.

    • @Codifike
      @Codifike  8 месяцев назад

      Oi Deive qual o erro?

  • @rafhapla
    @rafhapla 2 года назад

    Gostaria de ver também sobre a instalação do mesmo

  • @caiquemascanha
    @caiquemascanha Год назад

    Excelente aula!
    Só uma dúvida, no caso eu colocando pra iniciar hoje (31/10/2023) e a cada 30min, ele vai rodar eternamente a cada 30min?
    Tipo no dia 01/11/2023 vai executar as 00:30:00 depois 01:00:00 e assim por diante?

    • @Codifike
      @Codifike  Год назад +1

      Sim, começará a executar em 31 de outubro de 2023 e continuará executando a cada 30 minutos indefinidamente. Então, sim, no dia 01/11/2023, ele executará às 00:30:00, 01:00:00 e assim por diante.

    • @caiquemascanha
      @caiquemascanha Год назад

      @@Codifike top!
      Quando lança um curso pra nós de Airflow?
      Mais uma dúvida, consigo monitor um banco em tempo real com Airflow e a cada registro novo ele pegar esses dados e jogar em meu S3 na aws para o data lake?

    • @Codifike
      @Codifike  Год назад

      @@caiquemascanha o curso estará dentro da formação engenheiro de dados que estou montando edeve ficar pronto no início do ano que vem. Quanto a parte do airflow, Sim, você pode usar o Apache Airflow para monitorar um banco de dados e transferir novos registros para um bucket S3 na AWS. No entanto, é importante notar que o Airflow não é uma ferramenta de processamento em tempo real. Ele é mais adequado para tarefas de processamento em lote e agendadas. Dito isso, você pode configurar um DAG para executar em intervalos curtos, como a cada minuto, para simular uma espécie de monitoramento em "quase tempo real". O melhor seria usar o kafka

  • @gabrielevangelista4956
    @gabrielevangelista4956 Год назад

    Muito bom o vídeo. Mas o meu está dando conflito com uma outra dag que vem por padrão com o mesmo nome. Com as tasks, extract transform and load. E ai fica revezando em Graphs essa, com a que eu construi

    • @Codifike
      @Codifike  Год назад +2

      Olá Gabriel, não pode ter dags com mesmo nome, mude a sua dag para evitar o conflito.

  • @firewolftutoriais
    @firewolftutoriais 3 года назад

    excelente aula sobre o airflow!!
    Gostaria de saber se há alguma forma de realizar um backup das DAGs do Airflow e seus atuais status (ligadas e desligadas) igual tem o import e export das conexões...
    Trabalho com Airflow a pouco tempo e sempre que vou realizar o processo de cleanup preciso startar todas as que usamos manualmente (mais de 300 atualmente), sendo que algumas precisam ficar desligadas. Existe essa função de restaurar elas em seu status atual?

    • @Codifike
      @Codifike  3 года назад +1

      OlÁ, Obrigado . Não entendi sua pergunta

    • @firewolftutoriais
      @firewolftutoriais 3 года назад

      @@Codifike Quando realizamos o cleanup do Airflow, todas as DAGs são deletadas, junto com os logs... quando eu subo as conexões mais tarde as DAGs voltam mas todas desligadas, queria saber se tem como fazer um backup dessas DAGs pra qnd voltar elas, não precisar ligar todas novamente uma por uma correndo o risco de ligar alguma que nao era pra ter ligado

  • @gabrielevangelista4956
    @gabrielevangelista4956 4 месяца назад +1

    No meu não funciona, não consigo descobrir o porquê.
    Até a parte da criação da DAG ele roda tranquilo, quando eu importo as duas primeiras linhas de código, fica aquele pontilhado amarelo em baixo apontando que não existe a biblioteca ou que não está no interpretador correto

    • @eusoucibele6617
      @eusoucibele6617 Месяц назад

      o meu tambem aconteceu isso não sei por que

  • @thiagolopes1871
    @thiagolopes1871 Год назад +1

    Muito bom seu curso, gostaria um curso assim, onde encontro?

    • @Codifike
      @Codifike  Год назад +3

      Ainda está em fase de roteiro, mas vai sair😜

    • @thiagolopes1871
      @thiagolopes1871 Год назад

      @@Codifike Poxa que bacana, aguardo ansioso!

  • @GustavoOliveira-c1e
    @GustavoOliveira-c1e Год назад

    quando eu rodo o docker-compose up, o terminal fica rodando infinitamente rsrs, não sei o que é.

  • @joseantoniodasnevesneto9446
    @joseantoniodasnevesneto9446 Год назад

    Bom dia. Quais são as extensions do vscode que vc tem instaladas para conseguir desenvolver o que foi demonstrado no conteúdo do vídeo?

    • @Codifike
      @Codifike  Год назад

      Docker, python,

    • @joseantoniodasnevesneto9446
      @joseantoniodasnevesneto9446 Год назад

      DOcker, python .... e como estou usando uma pasta git para sincronizar com o airflow no servidor, instalei tb as extensões do git.

  • @joaovictor349
    @joaovictor349 2 года назад

    Olá, adorei o vídeo e ficou extremamente bem explicado. Uma dúvida que eu tenho é: quando termina a task eu consigo ver o resultado dela? No vídeo foi pego as informações de um lugar, e logo em seguida validado, mas eu queria ver esses dados. Seria possível?

    • @Codifike
      @Codifike  2 года назад

      Oi João, sim,na vida real as task geralmente são usadas para carga em tabelas. Neste caso o resultado seria os dados nas tabelas

  • @joao.megale
    @joao.megale 2 года назад

    Boa, quanto a conexão com outros bancos de dados, posso fazer direto no script em python usando os conectores das bibliotecas pelo import? (na própria DAG)
    Obrigado
    Abs

    • @Codifike
      @Codifike  2 года назад +1

      Pode. E o SQL pode ficar em arquivo separado sendo chamado na task

  • @weiriveltonfernandes8794
    @weiriveltonfernandes8794 2 года назад

    Olá! Sou bem leigo na ferramenta ainda. Quando desligo o computador e vou logar novamente no airflow, como inicializo a ferramenta de novo? Pra logar no localhost:8080? Obrigado!

    • @Codifike
      @Codifike  2 года назад

      Oi, vc tem que iniciar novamente o docker na sua máquina e executar os comandos de start

  • @oiwelder
    @oiwelder Год назад +1

    Seria possível orquestrar Jupyter notebook's com Airflow?

    • @Codifike
      @Codifike  Год назад +4

      Sim, estou montando um material sobre isso.

    • @oiwelder
      @oiwelder Год назад

      @@Codifike você é o cara. Se pudesse me inscrevia mais uma vez...hehe

    • @Codifike
      @Codifike  Год назад

      @@oiwelder Obrigado

  • @emersonvalentin7099
    @emersonvalentin7099 Год назад

    Estou com dificuldade na criação de uma DAG; eu crio a DAG mas ela não aparece no apache airflow. Uso Virtual Box com ubuntu instalado mas meu PC é windows

    • @Codifike
      @Codifike  Год назад

      Dá uma checada se o nome está que na criacao da dag e o mesmo que está procurando na UI. Pode também restartar o docker pois as vezes o airflow não atualiza a a tabela de metadados onde as dags estão.

  • @michaelmoreira2786
    @michaelmoreira2786 2 года назад

    Recebo o erro e_valida() missing 1 required positional argument:ti , na segunda task.
    Alguém teve este mermo problema? valeu

    • @Codifike
      @Codifike  2 года назад

      Esta esperando um argumento e não foi passado nenhum. da uma olhada no código , para ver se não esqueceu nada

  • @jhonynorton7243
    @jhonynorton7243 10 месяцев назад

    Excelente vídeo meu caro, parabéns!
    Uma dúvida, meu objetivo é extrair dados de uma base postgre e salvar um .csv localmente no docker.
    Inicialmente fiz o código python salvando o .csv em uma pasta local, porém ao rodar no airflow e salvar no docker, recebo o erro de não ter permissão para criar pasta e salvar arquivo no docker.
    Com qual código altero essa permissão para poder salvar no docker?
    Erro recebido no Airflow: PermissionError: [Errno 13] Permission denied: '/opt/airflow/dados/DesafioGitHub/output_data/csv

    • @Codifike
      @Codifike  10 месяцев назад

      Olá , Uma boa prática é nunca salvar nada no docker, vc deve apontar para uma diretório que vc tenha permissão como um bucket s3 ou um diretório na rede

  • @vitorpereira5461
    @vitorpereira5461 2 года назад +1

    precisa de um python avançadinho, não entendi mt bem o que você importou ai e o por que dessa sintaxe

    • @gabrielfigueiredo6037
      @gabrielfigueiredo6037 2 года назад

      Sim, é preciso já ter um conhecimento bom de python para iniciar na eng. De dados

  • @rodolfoshinozuka2089
    @rodolfoshinozuka2089 Год назад

    cara eu sou muito burro mesmo, pq pelo que to vendo aqui nos comentarios so eu nao consegui.....Parabens pelo canal, mas eu nao assisto mais, me confundiu mais do que ajudou.