Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Dados da concentrao de elementos qumicos (mg kg-1) em biomonitores epifticos em duas estaes do ano. Os biomonitores foram instalados na Costa Brasileira com o objetivo de avaliar a disponibilidade de elementos qumicos para o ecossistema (ver arquivo anexado)
Questes 1) Testar a distribuio do conjunto de dados (univariada e bivariada). Verificar a necessidade de transformao dos dados. Dica: transformao raiz quadrada pode ser aplicvel 2) H diferena nas concentraes mdias para cada elemento qumico entre as estaes de amostragem? Checar normalidade dos desvios. Dica: teste t para amostras independentes. 3) Obter a matriz de correlao de Pearson, indicando quais correlaes foram significativas 4) Ao empregar a anlise por componentes principais, indicar as variveis correlacionadas, agrupando-as. a. Correlacionar os resultados com a questo 3. b. Quantas componentes foram necessrias para explicar a varincia do conjunto de dados? 5) Aplicar a anlise fatorial por componentes principais e mtodo da mxima verossimilhana. a. Comparar os grupos de variveis com aqueles obtidos na questo 4. b. Quantos fatores foram necessrios? Apresentar grfico ilustrando a determinao do nmero de fatores. c. Quais as variveis mais representativas nos fatores? 6) Utilizar os resultados da anlise por componentes principais e da anlise fatorial para a construo de dendrograma (anlise de cluster).
1. Aps anlise dos histogramas plotados no software Statistica, verificou-se uma distribuio no normal dos dados. Fato esse que foi corrigida por meio da transformao raiz quadrada. 2. A figura abaixo representa o teste t para variveis independentes. Com base nele podemos verificar um padro de distribuio normal para o desvio-padro, com exceo dos elementos qumicos Na e As. O que nos permite concluir que o fator estao no ir influenciar nos resultados obtidos, com exceo do Na e As.
3. Na figura abaixo so apresentados os resultados obtidos para correlao entre os elementos qumicos atravs da matriz de correlao de Pearson. Todos os dados representados apresentaram valores significativos para a correlao entre eles.
4. Ao analisar o grfico abaixo, podemos inferir que o nmero de fatores utilizados sero 3, pois a partir do 4 fator nota-se uma tendncia a zero no eixo dos autovalores. Esses 3 fatores correspondem a uma probabilidade de aproximadamente 78%.
Eigenvalues of correlation matrix Active variables only 11 10 53.65% 9 8 7
Eigenvalue
6 5 4 3 2 1 0 -1 -2 0 2 4 6 8 10 12 14 16 18 20 Eigenvalue number 15.40% 8.92% 6.38% 4.05% 3.39% 2.70% 2.14% 1.53% .80% .46% .30% .11% .10% .05% .02% .01%
Com base nos grfico de PCA entre fatores 1 e 2; entre os fatores 1 e 3, observa-se o agrupamento das variveis: Fe, Sm, Sc, Th, Cs, La e Ce.
Projection of the variables on the factor-plane ( 1 x 1 Sr Ca K Rb
Factor 3 : 8.92%
Zn Co 0.5 Ba Fe Sm Ce La Sc Th As Cs -0.5 Sr Ca Rb K
2)
1
3)
0.5
Ba Br Na Fe Cs Sm Sc Th La Ce Zn
Factor 2 : 15.40%
As Co
Na
-0.5
Br
5. Como a Anlise Fatorial se baseia nas correlaes existentes entre as variveis, primeiramente foi avaliada a matriz de correlaes. Observou-se quais os valores significativos para justificar o uso desta tcnica. Para valores de correlao prximos a 1, considerou-se adequado o uso da tcnica, e valores prximos a 0 indicam que provavelmente a tcnica inadequada para o uso em questo.
O mtodo utilizado foi a Anlise de Componentes principais e o mtodo da Mxima Verossimilhana. Para a escolha do nmero de fatores utilizados, foi empregado autovalor que mostra a varincia explicada por cada valor, ou seja, quanto cada fator consegue explicar da varincia total. Em seguida analisa-se o grfico. Assim quando o grfico tende zero no eixo dos autovalores, escolhe-se o nmero de fatores a serem utilizados.
Como se pode observar na tabela acima, apenas os fatores 1 e 2, apresentaram valores significativos para as correlaes. Os valores que esto em vermelho so os valores que so melhores explicados pelo fator utilizado. O fator 1 tem maior capacidade para explicar as variveis As, Ce, Cs, Fe, La, Sc, Sm, Th, enquanto o fator 2, explica melhor Ca e Sr.
Plot of Eigenvalues 10 9 8 7 6 5 4 3 2
1 11 10 53.65% 9 8 7 Eigenv alues of correlation matrix Active variables only
Eigenvalue
Value
6 5 4 3 2 15.40% 8.92% 6.38% 4.05% 3.39% 2.70% 2.14% 1.53% .80% .46% .30% .11% .10% .05% .02% .01%
1 0 1 2 Number of Eigenvalues 3
0 -1 -2 0 2
10
12
14
16
18
20
A partir dos grficos acima se pode notar qu a partir do ponto 4, o grfico apresenta um comportamento de tender a zero no eixo Y, o que justifica a escolhe de apenas trs fatores.
6.
Tree Diagram for 17 Variables Single Linkage Euclidean distances 8 7 6 5 4 3 2 1 0 Rb K Sr Ca Ba Na Br Zn Co Cs Fe Sc Th Sm La Ce As
Linkage Distance