APACHE-SPARK-COM-DELTA-LAKE-E-APACHE-ICEBERG

Apache Spark com Delta Lake e Apache Iceberg

Bem-vindo à documentação do projeto de demonstração do Apache Spark com Delta Lake e Apache Iceberg. Este projeto tem como objetivo mostrar as principais funcionalidades e diferenças entre essas duas tecnologias de gerenciamento de dados.

Visão Geral

Este projeto contém exemplos práticos de como utilizar o Apache Spark em conjunto com:

Estrutura do Projeto

Modelos de Dados

Delta Lake - Modelo de Vendas

erDiagram
    VENDAS {
        int id_venda PK
        string produto
        int quantidade
        decimal valor_unitario
        date data_venda
        string status
    }

Iceberg - Modelo de Funcionários

erDiagram
    FUNCIONARIOS {
        int id_funcionario PK
        string nome
        string cargo
        string departamento
        decimal salario
        date data_admissao
        boolean ativo
    }

Começando

Para começar a explorar os exemplos, navegue pelas seções: