O que é ETL?

Você ja deve ter ouvido falar sobre ETL, afinal de contas, a área de dados está em alta e só tem a crescer, ETL faz parte desta área tão promissora.

Processos de ETL estão sempre no mesmo contexto de Data Warehouse(DW) e Business Intelligence (BI). Mas afinal de conta, o que é e o que significa ETL?
ETL significa Extract, Transform and Load, ou traduzindo para o português, Extração, Transformação e Carga.
De forma geral, o ETL é o processo de limpeza dos dados vindos de diversos sistemas organizacionais.

Como você já deve ter percebido, o ETL é dividido em 3 etapas, e vamos exatamente falar um pouquinho sobre cada umas delas.

EXTRAÇÃO:
A primeira etapa do processo, e como o próprio nome ja diz, pode ser entendida como a fase onde os dados são extraídos dos sistemas online empresariais, dados que são gerados a todo momento, e conduzidos para a área temporária, como assim podemos chamar.
Resumindo o resumo: Extração: parte que extrai os dados de uma ou mais fontes de dados.

TRANSFORMAÇÃO:
Após a extração, teremos recursos para trabalharmos com a transformação dos dados.
Nesta etapa são corrigidos, tratados e organizados as diversas inconsistências que podem ocorrer, assim se adaptando corretamente com as regras do negócio.
Resumindo o resumo: Transformação: Realiza os tratamentos necessários nos dados obtidos pela extração.

CARGA:
E finalmente a etapa de carga, que não pode ocorrer sem a transformação ser bem sucedida, ou seja, assim que acontecem todas as tratativas necessárias nos dados, a carga para o DW poderá ser iniciada, e é exatamente esta ultima fase que garante a integridade dos dados.
Resumindo o resumo: Carga: Carrega todos os dados para o data warehouse.

Resumo – Processo de ETL

O ETL é criador das estruturas de dimensões e fatos, e a ponte principal entre o processo operacional e o Data Warehouse. É imprescindível que você aprenda sobre Datawarehouse e sobre a criação de dimensões e fatos para conseguir desenvolver processos de ETL.
O ETL é o pontapé inicial para quem pretende trabalhar com dados, hoje que tanto se fala sobre o assunto mas poucos ainda sabem exatamente como tudo funciona.

Caso você ainda tenha duvidas sobre o que é ETL ou se gostaria de aprender mais sobre ferramentas de ETL e como realizar estes tipos de processos na prática, não se esqueça de deixar um comentário. Dependendo do interesse, estaremos criando um novo curso sobre como realizar processos de ETLs com ferramentas robustas e como isto pode ajudar na sua empresa, sua carreira e seu conhecimento.

Para aprendermos mais a fundo sobre ETL não podemos deixar de aprender sobre a ferramenta usada para estes processo, e com isto falaremos sobre o Pentaho! Mas isto vamos deixar para um próximo post.

Deixe uma resposta