Skip to content

michaelscaldas/etl_comex_duckbd

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ETL de Dados do Comércio Exterior com DuckDB e MinIO Este repositório contém um pipeline para processar dados do comércio exterior, utilizando DuckDB para processamento de dados, MinIO para armazenamento, e Metabase para visualização dos dados. O pipeline é dividido em três camadas: Raw, Bronze e Silver.

Visão Geral O pipeline de ETL realiza as seguintes etapas:

Extração: Dados são extraídos para o bucket Raw no MinIO.

Transformação: Os dados são carregados e transformados utilizando DuckDB. As transformações incluem limpeza, filtragem e formatação de colunas.

Carregamento: Os dados transformados são salvos em formato Parquet no bucket Bronze.

A partir daí, são carregados e processados novamente para gerar dados finais no bucket Silver.

Visualização: Os dados carregados no bucket Silver são usados para criar dashboards e relatórios interativos no Metabase.

Alguns processos foram desenvolvidos de forma explícita para fins acadêmicos. Recomendo que, ao adaptar ou implementar esses processos, você siga as melhores práticas de desenvolvimento e segurança para garantir um sistema robusto e seguro.

About

Processo de ETL com python usando duckdb

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%