Sei sulla pagina 1di 5

Tpicos especiais em Instrumentao Nuclear II Alunos: Jos Daniel Soares de Paiva Marcelo da Rocha Leo de Magalhes Prof.

: Pesquisador Dr. Associado Elvis Joacir De Frana

Dados da concentrao de elementos qumicos (mg kg-1) em biomonitores epifticos em duas estaes do ano. Os biomonitores foram instalados na Costa Brasileira com o objetivo de avaliar a disponibilidade de elementos qumicos para o ecossistema (ver arquivo anexado)

Questes 1) Testar a distribuio do conjunto de dados (univariada e bivariada). Verificar a necessidade de transformao dos dados. Dica: transformao raiz quadrada pode ser aplicvel 2) H diferena nas concentraes mdias para cada elemento qumico entre as estaes de amostragem? Checar normalidade dos desvios. Dica: teste t para amostras independentes. 3) Obter a matriz de correlao de Pearson, indicando quais correlaes foram significativas 4) Ao empregar a anlise por componentes principais, indicar as variveis correlacionadas, agrupando-as. a. Correlacionar os resultados com a questo 3. b. Quantas componentes foram necessrias para explicar a varincia do conjunto de dados? 5) Aplicar a anlise fatorial por componentes principais e mtodo da mxima verossimilhana. a. Comparar os grupos de variveis com aqueles obtidos na questo 4. b. Quantos fatores foram necessrios? Apresentar grfico ilustrando a determinao do nmero de fatores. c. Quais as variveis mais representativas nos fatores? 6) Utilizar os resultados da anlise por componentes principais e da anlise fatorial para a construo de dendrograma (anlise de cluster).

1. Aps anlise dos histogramas plotados no software Statistica, verificou-se uma distribuio no normal dos dados. Fato esse que foi corrigida por meio da transformao raiz quadrada. 2. A figura abaixo representa o teste t para variveis independentes. Com base nele podemos verificar um padro de distribuio normal para o desvio-padro, com exceo dos elementos qumicos Na e As. O que nos permite concluir que o fator estao no ir influenciar nos resultados obtidos, com exceo do Na e As.

3. Na figura abaixo so apresentados os resultados obtidos para correlao entre os elementos qumicos atravs da matriz de correlao de Pearson. Todos os dados representados apresentaram valores significativos para a correlao entre eles.

4. Ao analisar o grfico abaixo, podemos inferir que o nmero de fatores utilizados sero 3, pois a partir do 4 fator nota-se uma tendncia a zero no eixo dos autovalores. Esses 3 fatores correspondem a uma probabilidade de aproximadamente 78%.
Eigenvalues of correlation matrix Active variables only 11 10 53.65% 9 8 7

Eigenvalue

6 5 4 3 2 1 0 -1 -2 0 2 4 6 8 10 12 14 16 18 20 Eigenvalue number 15.40% 8.92% 6.38% 4.05% 3.39% 2.70% 2.14% 1.53% .80% .46% .30% .11% .10% .05% .02% .01%

Com base nos grfico de PCA entre fatores 1 e 2; entre os fatores 1 e 3, observa-se o agrupamento das variveis: Fe, Sm, Sc, Th, Cs, La e Ce.
Projection of the variables on the factor-plane ( 1 x 1 Sr Ca K Rb
Factor 3 : 8.92%
Zn Co 0.5 Ba Fe Sm Ce La Sc Th As Cs -0.5 Sr Ca Rb K

2)
1

Projection of the variables on the factor-plane ( 1 x

3)

0.5

Ba Br Na Fe Cs Sm Sc Th La Ce Zn

Factor 2 : 15.40%

As Co

Na

-0.5

Br

-1 -1 -0.5 0 Factor 1 : 53.65% 0.5 1 Active

-1 -1 -0.5 0 Factor 1 : 53.65% 0.5 1 Active

5. Como a Anlise Fatorial se baseia nas correlaes existentes entre as variveis, primeiramente foi avaliada a matriz de correlaes. Observou-se quais os valores significativos para justificar o uso desta tcnica. Para valores de correlao prximos a 1, considerou-se adequado o uso da tcnica, e valores prximos a 0 indicam que provavelmente a tcnica inadequada para o uso em questo.

O mtodo utilizado foi a Anlise de Componentes principais e o mtodo da Mxima Verossimilhana. Para a escolha do nmero de fatores utilizados, foi empregado autovalor que mostra a varincia explicada por cada valor, ou seja, quanto cada fator consegue explicar da varincia total. Em seguida analisa-se o grfico. Assim quando o grfico tende zero no eixo dos autovalores, escolhe-se o nmero de fatores a serem utilizados.

Como se pode observar na tabela acima, apenas os fatores 1 e 2, apresentaram valores significativos para as correlaes. Os valores que esto em vermelho so os valores que so melhores explicados pelo fator utilizado. O fator 1 tem maior capacidade para explicar as variveis As, Ce, Cs, Fe, La, Sc, Sm, Th, enquanto o fator 2, explica melhor Ca e Sr.
Plot of Eigenvalues 10 9 8 7 6 5 4 3 2
1 11 10 53.65% 9 8 7 Eigenv alues of correlation matrix Active variables only

Eigenvalue

Value

6 5 4 3 2 15.40% 8.92% 6.38% 4.05% 3.39% 2.70% 2.14% 1.53% .80% .46% .30% .11% .10% .05% .02% .01%

1 0 1 2 Number of Eigenvalues 3

0 -1 -2 0 2

10

12

14

16

18

20

Eigenv alue number

A partir dos grficos acima se pode notar qu a partir do ponto 4, o grfico apresenta um comportamento de tender a zero no eixo Y, o que justifica a escolhe de apenas trs fatores.

6.
Tree Diagram for 17 Variables Single Linkage Euclidean distances 8 7 6 5 4 3 2 1 0 Rb K Sr Ca Ba Na Br Zn Co Cs Fe Sc Th Sm La Ce As

Linkage Distance

Potrebbero piacerti anche