Making Apache Spark™ Better with Delta Lake

Delta Lake Deep Dive: Streaming Delta Lake with Apache Spark Structured Streaming

Lakehouse: Delta Lake 2.0.0 e Apache Spark 3.2 para Pipelines de Dados Inteligentes | Live #77

Shadow 3.0 Damage Report from Hitting Cleetus’ Crown Vic

Patrick Mahomes made an UNREAL play to win the game | Kansas City Chiefs Vs Los Angeles Chargers

Man Buys Box of Amazon Returns. Instantly Regrets It. (w/@ClimateTown )

Introdução ao Delta Lake + Apache Spark

Big Data Masters

Просмотров 5 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 11 дек 2024

Комментарии • 12

@MrGhustavo22 Год назад ⁺²
Resumo do Vídeo:
O vídeo é uma introdução ao Delta Lake e ao Apache Spark, abordando suas funcionalidades e como utilizá-los em conjunto para resolver problemas de processamento distribuído de big data.
- 00:01 Neste vídeo, o palestrante faz uma introdução ao Delta Lake e ao Apache Spark, explicando como essas tecnologias se complementam.
- 05:00 Este vídeo mostra como instalar o Delta Lake com o Apache Spark em seu ambiente e como importar o pacote "delta" para sua aplicação.
- 10:02 Delta Lake é um tipo de dado muito utilizado para leitura e escrita, sendo mais rápido e permitindo armazenar dados com esquemas complexos.
- 15:01 O Delta Lake possui recursos como verificação de esquema e evolução de esquema para garantir a qualidade e consistência dos dados.
- 20:04 O Delta Lake resolve o problema de atributos nulos, permite fazer updates e deletes em nível de linha e é necessário usar o pacote Delta para isso.
- 25:04 A atualização de registros na tabela Delta Lake pode ser feita usando o método "merge", e é possível especificar as colunas que serão atualizadas.
- 30:05 Delta Lake tem um período de retenção padrão de 30 dias, mas pode ser configurado para períodos maiores ou menores.
- 35:06 Este trecho explica como usar o Delta Lake com o Apache Spark e como especificar sua própria lógica para cada micro batch.
Gerado por Monica AI. Adquira o seu agora! 👉 monica.im?r=480529
@pittixixitosilveira3876 2 года назад ⁺²
Isso n foi uma aula, foi uma surra
@fabiobattestin3609 4 года назад ⁺²
slc pai, maninho é monstrão nessas fita de delta lake chamaaaa
@levialberto4379 2 года назад
Parabéns pelo vídeo. Spark é tão foda cara..amo essa parada.
@mateusspagnoldasilveira5639 3 года назад ⁺¹
Excelente vídeo, muito bem explicado
@bigdatamasters32 3 года назад ⁺³
Muito obrigado Mateus! Em breve irei fazer um vídeos com as novas features do Delta!
@denermoreira15 2 года назад
ótimo conteudo, parabéns !
@Gabriel-iq2vf Год назад
O dataset não existe mais... Podia atualizar o link
@josepaulo9054 2 года назад
Vitor, Boa tarde, voltei a ver ser vídeo e tenho uma duvida que eu gostaria de tirar com você:
Imaginando um cenário:
Onde eu tenho um arquivo .csv que tenho as vendas diarias:
01/07/2022 - 4 vendas para 4 clientes. (Id_Cliente = 1,2,3 e 4)
02/07/2022 - 10 vendas para 2 clientes. (Id_Cliente = 1 e2)
03/07/2022 - 14 vendas para 4 clientes. (Id_Cliente = 1 ).
04/07/2022 - 24 vendas para 3 clientes.. (Id_Cliente = 2)
Eu processo os arquivos por dia e pensando em Time Travel, caso eu list o arquivo via Dataframe, os rtetornos serão:
01/07/2022 - 4 registros serão mostrados
02/07/2022 - 14 registros serão mostrados
03/07/2022 - 28 registros serão mostrados
04/07/2022 - 52 registros serão mostrados
E no final dentro do Delta Lake conterá 52 linhas ?
@antialiasing16x 5 лет назад
Muito bom!
@josepaulo9054 2 года назад
Cara, Parabéns pelo video e pela iniciativa, uma duvida que ficou pra mim, eu posso usar o Delta Lake dentro da AWS, onde em vez de eu gerar informações no formato parquet, posso gerar em Delta Lake ?
@fabgnr 3 года назад
Muito bom! Parabéns!
Um dúvida: Pq na hora de visualizar vc passa para Data Frame? Só é possível visualizar se for Data Frame? É necessário passar para Data Frame sempre que for visualizar?

Следующие

Автовоспроизведение

Making Apache Spark™ Better with Delta Lake

Making Apache Spark™ Better with Delta Lake

Delta Lake Deep Dive: Streaming Delta Lake with Apache Spark Structured Streaming

Delta Lake Deep Dive: Streaming Delta Lake with Apache Spark Structured Streaming

Lakehouse: Delta Lake 2.0.0 e Apache Spark 3.2 para Pipelines de Dados Inteligentes | Live #77

Lakehouse: Delta Lake 2.0.0 e Apache Spark 3.2 para Pipelines de Dados Inteligentes | Live #77

Shadow 3.0 Damage Report from Hitting Cleetus’ Crown Vic

Shadow 3.0 Damage Report from Hitting Cleetus’ Crown Vic

Patrick Mahomes made an UNREAL play to win the game | Kansas City Chiefs Vs Los Angeles Chargers

Patrick Mahomes made an UNREAL play to win the game | Kansas City Chiefs Vs Los Angeles Chargers

Man Buys Box of Amazon Returns. Instantly Regrets It. (w/@ClimateTown )

Man Buys Box of Amazon Returns. Instantly Regrets It. (w/@ClimateTown )

Coldplay - ALL MY LOVE (Official Video) (Directors' Cut)

Coldplay - ALL MY LOVE (Official Video) (Directors' Cut)

How to Merge Spark DataFrame - Complex type | Spark Scenario Based Question | PySpark | LearntoSpark

How to Merge Spark DataFrame - Complex type | Spark Scenario Based Question | PySpark | LearntoSpark

Disk Partition | Como Otimizar seu LakeHouse | PySpark + Databricks

Disk Partition | Como Otimizar seu LakeHouse | PySpark + Databricks

25. What is Delta Table ?

25. What is Delta Table ?

Data Lakehouse: Tudo que você precisa saber!

Data Lakehouse: Tudo que você precisa saber!

Delta Lake Optimization with Himanshu Arora

Delta Lake Optimization with Himanshu Arora

O FIM DO NUBANK? O QUE ESTÁ ACONTECENDO COM OS BANCOS? QUAL O IMPACTO DOS JUROS E DA INADIMPLÊNCIA?

O FIM DO NUBANK? O QUE ESTÁ ACONTECENDO COM OS BANCOS? QUAL O IMPACTO DOS JUROS E DA INADIMPLÊNCIA?

ETL Descomplicado: Crie um processo de Extração, Transformação e Carga com Azure e Spark Databricks!

ETL Descomplicado: Crie um processo de Extração, Transformação e Carga com Azure e Spark Databricks!

Otimizações no Apache Spark: Spill, Skew e Shuffle | Live #76

Otimizações no Apache Spark: Spill, Skew e Shuffle | Live #76

“Don’t stop the chances.”

“Don’t stop the chances.”

А моя мартышка у свекрови дома полы моет! - смеялся муж на корпоративе… Но его ждал сюрприз…

А моя мартышка у свекрови дома полы моет! - смеялся муж на корпоративе… Но его ждал сюрприз…

Артемий Лебедев - О синих волосах, гибкости и магазинусе / Опять не Гальцев

Артемий Лебедев - О синих волосах, гибкости и магазинусе / Опять не Гальцев

Хабиб в углу - залог ПОБЕДЫ 🤩 #UFC311

Хабиб в углу — залог ПОБЕДЫ 🤩 #UFC311

Qizim 160-qism (milliy serial) | Қизим 160 қисм (миллий сериал)

Qizim 160-qism (milliy serial) | Қизим 160 қисм (миллий сериал)

ГОЛОЛЕД и ЛЕТНЯЯ РЕЗИНА!

ГОЛОЛЕД и ЛЕТНЯЯ РЕЗИНА!

Cool Items!🥰 New Gadgets, Smart Appliances, Kitchen Tools Utensils, Home Cleaning, Beauty #shorts

Cool Items!🥰 New Gadgets, Smart Appliances, Kitchen Tools Utensils, Home Cleaning, Beauty #shorts