Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Agenda
Manipulao de dados no PDI Controlando o fluxo de dados Transformaes no rowset Tratamento de erros e validao de dados
Janeiro de 2010
Value Mapper
IN1177 - Banco de Dados para Suporte Deciso
http://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+v3.2.+Steps
Janeiro de 2010
Exerccios 11, 12 e 13
Manipulando um conjunto de dados com
Janeiro de 2010
Janeiro de 2010
Janeiro de 2010
Janeiro de 2010
Exerccio 14
Filtrando linhas de um dataset
Janeiro de 2010
Janeiro de 2010
Cpia do Fluxo
O dataset inteiro copiado para os steps subsequentes
Distribuio do Fluxo
O dataset distribudo em partes iguais e enviado para os steps subsequentes
IN1177 - Banco de Dados para Suporte Deciso Janeiro de 2010
Janeiro de 2010
Janeiro de 2010
Exerccios 15, 16 e 17
Copiando e distribuindo um dataset
Janeiro de 2010
Transformaes no Rowset
Algumas transformaes que podem ser
Janeiro de 2010
um elemento diferente Em alguns casos, uma nica linha no descreve completamente o elemento
Janeiro de 2010
Janeiro de 2010
Janeiro de 2010
Janeiro de 2010
de entrada, gerar na sada um novo dataset com dados consolidados ou agregados. Semelhana com ferramentas de cross tab (ex.: Pivot no Excel)
Janeiro de 2010
Group By
Univariate statistics Split fields Row normalizer Row flattener Sort rows Split fields to rows Unique rows
Janeiro de 2010
Exerccio 18
Fazendo converses no rowset
Janeiro de 2010
Tratamento de Erros
At agora...
Erros encontrados nas transformaes Janela de Logging
Janeiro de 2010
Tratamento de Erros
Janeiro de 2010
Janeiro de 2010
Tratamento de Erros
Como tratar?
Detectando o erro e
enviando as linhas com problemas para outro stream. Quando a quantidade de erros grande? Quando os erros so crticos?
Opo: usar o step Abort, da
categoria Flow
Janeiro de 2010
Tratamento de Erros
Como personalizar um arquivo de log no PDI?
Step Write to log, categoria
Utility
Janeiro de 2010
Validao de dados
Boas prticas no desenvolvimento das atividades de ETL
Janeiro de 2010
Validao de dados
Categoria de steps Validation
Step Data Validator
Validao de tipos de
Janeiro de 2010
Campo selecionado no atende a um padro Campo selecionado um dos valores permitidos em uma lista
IN1177 - Banco de Dados para Suporte Deciso
Exerccio 19
Validando o contedo dos dados
Janeiro de 2010
Resumo da Semana 2
Steps de transformao Filtragem de dados Cpia e distribuio do stream Transformaes no rowset
Tratamento de erros
Validao do tipo e contedo dos dados
Janeiro de 2010
Bibliografia
Janeiro de 2010