OS 5 PASSOS PARA ORGANIZAR SEU DATALAKE | Data Engineering

O que você PRECISA SABER para ser ENGENHEIRO DE DADOS JR *Na visão dos Especialistas*

Mão no código como usar o Spark com pyspark

I BOUGHT A WRECKED GT3RS TO FIX MY PORSCHE THAT WENT SWIMMING

Unstable SMP: The First War

Inside Kelly Ripa & Mark Consuelos’s Sophisticated NYC Townhouse | Open Door | Architectural Digest

Disk Partition | Como Otimizar seu LakeHouse | PySpark + Databricks

Big Data Masters

Просмотров 3,6 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 11 дек 2024

Комментарии • 10

@christiangoncalves5168 2 года назад
Excelente conteúdo! Trabalho com engenharia de dados mas com ambiente totalmente onprimesse... Estou migrando para a azure e aprendendo muito com seus conteúdos
@williancavalcante9163 3 года назад ⁺¹
Sensacional!! A maneira como você introduz um problema de negocio para apresentar a tecnologia e de como é importante seguir boas praticas de otimização fica extremamente fácil de entender. Sua didática é muito boa, parabéns! Gostaria de ver um video seu apresentando um problema de negocio que precisa ser resolvido com tecnologias de mensageria ou eventos e qual a diferença entre um e outro já que muitas vezes nos confundimos com a terminologia e mostrar a importância de se desenhar bem esse tipo de arquitetura.
@bigdatamasters32 3 года назад
Muito Obrigado Willian! Anotei seu pedido e vou tentar trazer em breve mais vídeos sobre processamento streaming!
@cleitonsouza6292 2 года назад
Olá. Exelente video. Estou começando agora com Spark. E gostaria de ver um exemplo dessa otimização usando conexão jdbc.
@RossittoS 3 года назад
Muito bom!!
@adrianobarbosa9738 2 года назад
geralmente eu particiono quebrando dia_partition, mes_partition e ano_partition
@MrDanieldavila 3 года назад ⁺¹
Ótimo vídeo, muito bom, sem palavras para agradecer.
13:36 Cara, que coisa simples, mas que eu não sabia. Eu posso usar uma lista, ou descontruir algo nesse sentido?
Recentemente tive eu que buscar de várias api's, o que alterava entre elas era o id, será que tem como aplicar algo nesse sentido?
@bigdatamasters32 3 года назад ⁺¹
Fala Daniel! Beleza?
Você pode passar alguns parâmetros no caminho dos arquivos como se fosse uma espécie de "REGEX".
Sobre as APIS não ficou claro se a pergunta era sobre o particionamento ou sobre a listagem dos arquivos.
Se for sobre a listagem, então sim, seria interessante você consumir somente os arquivos da API que vc quer e essa forma pode te ajudar.
Se for sobre o particionamento, vc pode usar o ID da API como chave de partição e acelerar suas queries.
@MrDanieldavila 3 года назад
@@bigdatamasters32 legal, obrigadão por responder. Vou procurar particionar por id.
@JoaoVictor-xc8mp 3 года назад ⁺¹
databricks é pago ? e se eu for partir para aprender programação na nuvem como aws ou ate mesmo o azure, preciso investir dinheiro para adquirir uma maquina na nuvem ?

Следующие

Автовоспроизведение

OS 5 PASSOS PARA ORGANIZAR SEU DATALAKE | Data Engineering

OS 5 PASSOS PARA ORGANIZAR SEU DATALAKE | Data Engineering

O que você PRECISA SABER para ser ENGENHEIRO DE DADOS JR *Na visão dos Especialistas*

O que você PRECISA SABER para ser ENGENHEIRO DE DADOS JR *Na visão dos Especialistas*

Mão no código como usar o Spark com pyspark

Mão no código como usar o Spark com pyspark

I BOUGHT A WRECKED GT3RS TO FIX MY PORSCHE THAT WENT SWIMMING

I BOUGHT A WRECKED GT3RS TO FIX MY PORSCHE THAT WENT SWIMMING

Unstable SMP: The First War

Unstable SMP: The First War

Inside Kelly Ripa & Mark Consuelos’s Sophisticated NYC Townhouse | Open Door | Architectural Digest

Inside Kelly Ripa & Mark Consuelos’s Sophisticated NYC Townhouse | Open Door | Architectural Digest

I’m struggling postpartum… this has been so hard | VLOG

I’m struggling postpartum… this has been so hard | VLOG

Construindo Pipelines de Dados no Databricks com Workflows | Live #22

Construindo Pipelines de Dados no Databricks com Workflows | Live #22

Apache Iceberg - Row-level Updates

Apache Iceberg - Row-level Updates

A Tale of Three Apache Spark APIs: RDDs, DataFrames, and Datasets - Jules Damji

A Tale of Three Apache Spark APIs: RDDs, DataFrames, and Datasets - Jules Damji

Spark - Coalesce vs Repartition

Spark - Coalesce vs Repartition

Governança de Dados na prática com Databricks Unity Catalog

Governança de Dados na prática com Databricks Unity Catalog

PySpark Tutorial

PySpark Tutorial

ETL com os Dados da ZAP Imóveis utilizando Databricks e Azure DataLake Gen 1 | #ETLHandsOn01

ETL com os Dados da ZAP Imóveis utilizando Databricks e Azure DataLake Gen 1 | #ETLHandsOn01

Criando um Data Pipeline Fim a Fim com Arquitetura Delta no Apache Spark

Criando um Data Pipeline Fim a Fim com Arquitetura Delta no Apache Spark

LAVROV's interview with Tucker CARLSON 😁 [Parody]

LAVROV's interview with Tucker CARLSON 😁 [Parody]

JASMIN TRANS: XALIMANI O’LISHINI YULDUZ USMONOVA BILGAN EKAN... #shokuz

JASMIN TRANS: XALIMANI O’LISHINI YULDUZ USMONOVA BILGAN EKAN... #shokuz

Фронт рассыпается слишком быстро

Фронт рассыпается слишком быстро

НУБ И ПРО ПАРКУРЯТ ВОКРУГ МОНСТРОВ В МАЙНКРАФТ ! НУБИК ПРОХОДИТ ПАРКУР ТРОЛЛИНГ В MINECRAFT

НУБ И ПРО ПАРКУРЯТ ВОКРУГ МОНСТРОВ В МАЙНКРАФТ ! НУБИК ПРОХОДИТ ПАРКУР ТРОЛЛИНГ В MINECRAFT

Мы сильно накосячили! Нужно красить заново 😩 Конец проекта Passat CC!

Мы сильно накосячили! Нужно красить заново 😩 Конец проекта Passat CC!

Жириновский про Сирию! Башар Асад сбежал, армия отступает

Жириновский про Сирию! Башар Асад сбежал, армия отступает

选哪边呢？ #小丑 #天使 #shorts

选哪边呢？ #小丑 #天使 #shorts

Une petite copie de moi est tombée face contre terre 🤧💩

Une petite copie de moi est tombée face contre terre 🤧💩

Ничего не бывает просто так 😂

Ничего не бывает просто так 😂