Sei sulla pagina 1di 17

Estatstica

Ano: 2013 Aluno: Ayrton Jos Vasconcelos Rosendo da Silva Curso: Engenharia Qumica

Trabalho 1
Beanplot
1. O Beanplot O beanplot utiliza como forma de densidade um polgono dado por um trao de densidade normal e sua verso espelhada. Tal polgono muitas vezes parece um pouco como um violino, que tambm usada no violinplot. Em R um trao densidade pode ser calculado utilizando density. Para calcular esse trao de densidade, uma largura de banda deve ser selecionada. Por padro, a implementao de beanplot usa o mtodo Sheather-Jones para selecionar uma largura de banda por lote, o que parece ser preferido e prximo do ideal. As larguras de banda por lote so calculadas sobre todos os lotes, a fim de ter uma comparao justa entre os lotes. A utilizao da mesma largura de banda para todos os lotes tem um pequeno efeito colateral para lotes que contm poucos pontos de dados. Em tal caso, a largura de tal lote pode tornar-se muito grande, chamando a ateno de um lote menos interessante em termos de significncia estatstica. Para superar este problema, a largura de um lote com menos de 10 pontos de dados dimensionado de forma linear (para um lote com trs pontos de dados apenas 3/10 da sua largura normal). 2. Boxplot x Beanplot Enquanto um boxplot e suas variaes fazem uso da mediana de um grupo de pontos de dados, por padro, um beanplot utiliza a mdia do grupo, e tambm mostra uma mdia geral. Isso porque uma mdia mais fcil de ser explicada a no matemticos, e uma mdia geralmente d informaes teis quanto usabilidade de um trao de densidade.

3. Exemplo de Cdigo:
> library(beanplot) > df <- data.frame(a = rnorm(100), > beanplot(df)

b = rnorm(100), c = rnorm(100))

4. Exemplos Visuais

(Exemplo do item 3)

Trabalho 2 (dupla com Vanessa Feij)


1.

#Leitura de dados dados<-read.table("questionario.txt", header = TRUE) #Abrindo arquivo para escrita de dados sink(file = "resultados.txt", append = "FALSE") #Sumarizando os dados summary(dados) png("1Turma.png") #Criando uma tabela da varivel turma, onde computada a frequncia de cada caso. Tabela1 <-table(dados$Turma) #Imprimindo a varivel tabela Tabela1 #Grfico de barras da varivel turma (criando a tabela). barplot(Tabela1, main = "Grfico de Barras - Varivel Turma", xlab = "Turma", ylab = "Frequncia", ylim=c(0,30)) Tabela2 <- table(dados$Sexo) png("2Sexo.png") #Grfico de pizza da varivel Sexo. pie(Tabela2, main = "Grafico de Setores - Variavel Sexo") png("3Idade.png") #Boxplot da varivel Idade. boxplot(dados$Idade, main = "Box Plot - Varivel Idade") png("4altura.png") #Histograma da varivel Altura (utilizando a frequncia). hist(dados$Alt, main = "Histograma - Varivel Altura - Frequncia", xlab = "Altura", ylab = "Frequncia") png("5peso.png") #Histograma da varivel peso (utilizando a frequncia). hist(dados$Peso, main = "Histograma - Varivel Peso - Frequncia", xlab = "Peso", ylab = "Frequncia") png("6Filhos.png") #Criando uma tabela da varivel filhos, onde computada a frequncia de cada caso. Tabela4 <-table(dados$Filhos) #Imprimindo a varivel tabela Tabela4 #Grfico de barras da varivel filhos (criando a tabela). barplot(Tabela4, main = "Grfico de Barras - Varivel Filhos", xlab = "Quantidade de Filhos", ylab = "Frequncia", ylim=c(0,30)) Tabela5 <- table(dados$Fuma) png("7Fuma.png") #Grfico de pizza da varivel Fuma. pie(Tabela5, main = "Grafico de Setores - Variavel Fuma") Tabela6 <- table(dados$Toler) png("8Tolerancia.png") #Grfico de pizza da varivel Toler (tolerncia ao fumo). pie(Tabela6, main = "Grafico de Setores - Variavel Toler") png("9Exerc.png") #Boxplot da varivel Exerc.

boxplot(dados$Exerc, main = "Box Plot - Varivel Exerc") png("10Cine.png") #Boxplot da varivel Cine. boxplot(dados$Cine, main = "Box Plot - Varivel Cine") Tabela7 <- table(dados$OpCine) png("11OpCine.png") #Grfico de pizza da varivel OpCine. pie(Tabela7, main = "Grafico de Setores - Variavel OpCine") png("12TV.png") #Boxplot da varivel TV. boxplot(dados$TV, main = "Box Plot - Varivel TV") Tabela8 <- table(dados$OpTV) png("13OpTV.png") #Grfico de pizza da varivel OpTV. pie(Tabela8, main = "Grafico de Setores - Variavel OpTV") 2. png("14CineTurma.png") #Boxplot da varivel Cine x Turma. boxplot(Cine ~ Turma, data = dados, main = "Box Plot da Varivel Cinema Para cada Turma", ylab = "Cinema") png("15PesoTurma.png") #Boxplot da varivel Peso x Turma. boxplot(Peso ~ Turma, data = dados, main = "Box Plot da Varivel Peso Para cada Turma", ylab = "Peso") png("16TVTurma.png") #Boxplot da varivel TV x Turma. boxplot(TV ~ Turma, data = dados, main = "Box Plot da Varivel TV Para cada Turma", ylab = "TV") png("17AltTurma.png") #Boxplot da varivel Altura x Turma. boxplot(Alt ~ Turma, data = dados, main = "Box Plot da Varivel Altura Para cada Turma", ylab = "Altura") png("18IdadeTurma.png") #Boxplot da varivel Idade x Turma. boxplot(Idade ~ Turma, data = dados, main = "Box Plot da Varivel Idade Para cada Turma", ylab = "Idade") png("19FilhosTurma.png") #Boxplot da varivel Filhos x Turma. boxplot(Filhos ~ Turma, data = dados, main = "Box Plot da Varivel Filhos Para cada Turma", ylab = "Filhos") png("20ExercTurma.png") #Boxplot da varivel Exerce x Turma. boxplot(Exerc ~ Turma, data = dados, main = "Box Plot da Varivel Exerc Para cada Turma", ylab = "Exerc")

3. png("21PesoFuma.png") #Boxplot da varivel Peso x Fuma. boxplot(Peso ~ Fuma, data = dados, main = "Box Plot da Varivel Peso Para quem Fuma", ylab = "Peso") png("22CineOpCine.png") #Boxplot da varivel Cine x OpCine. boxplot(Cine ~ OpCine, data = dados, main = "Box Plot da Varivel Cine Para cada OpCine", ylab = "Cine") png("22TVOpTV.png") #Boxplot da varivel TV x OpTV. boxplot(TV ~ OpTV, data = dados, main = "Box Plot da Varivel TV Para cada OpTV", ylab = "TV") png("23PesoSexo.png") #Boxplot da varivel Peso x Sexo. boxplot(Peso ~ Sexo, data = dados, main = "Box Plots da Varivel Peso Para cada Sexo", ylab = "Peso") 4. library("beanplot") png("24beanplotidade.png") beanplot(dados$Idade, log="y", ylab="Idade", main = "Beanplot - Varivel Idade") library("beanplot") png("25beanplotaltura.png") beanplot(dados$Alt, log="y", ylab="Altura", main = "Beanplot - Varivel Altura") library("beanplot") png("26beanplotpeso.png") beanplot(dados$Peso, log="y", ylab="Peso", main = "Beanplot - Varivel Peso") library("beanplot") png("27beanplotfilhos.png") beanplot(dados$Filhos, log="y", ylab="Filhos", main = "Beanplot - Varivel Filhos") Justificativas:

1. Turma: Grfico de barras - Varivel Qualitativa Sexo: Grfico de pizza - Varivel Qualitativa Idade: Boxplot - Varivel Quantitativa Altura: Histograma - Varivel Quantitativa Peso: Histograma - Varivel Quantitativa Filhos: Grfico de barras - Varivel Quantitativa Fuma: Grfico de pizza - Varivel Qualitativa Tolerncia: Grfico de pizza - Varivel Qualitativa Exerc: Boxplot - Varivel Quantitativa Cine: Boxplot - Varivel Quantitativa OpCine: Grfico de pizza - Varivel Qualitativa TV: Boxplot - Varivel Quantitativa

OpTV: Grfico de pizza - Varivel Qualitativa

2.

Utilizando boxplot, vemos que: No h uma diferena significativa quanto ao nmero de vezes que cada turma vai ao cinema. A turma B pode ser considerada mais pesada que a turma A. No h uma diferena significativa quanto a quantidade de horas que cada turma assiste TV. No h uma diferena significativa entre a altura mdia das turmas. No h uma diferena significativa quanto a idade mdia entre as turmas. A quantidade de filhos tambm no difere significativamente. Os alunos da Turma B praticam mais horas de exerccio.

3. 1. 2. 3. 4. Peso x Fumante. O boxplot diz que quem fuma no necessariamente mais pesado. Idas ao Cinema x Opnio sobre as salas de cinema: No esto diretamente ligados. Horas de TV x Opnio da programao: Quem acha a programao melhor, tende a assistir mais. Peso x Sexo: Os homens so mais pesados que as mulheres.

Imagens:

(Obs.: Acabei esquecendo que tinha que enviar as imagens, e s lembrei agora.)

Trabalho 3
1)

Somente A: 10 Somente B: 35 A B: 65 AB: 20

a) P(A) =

b) P(B) =

c) P(~A) =

d) P(~B) =

e) P(A|B) =

f) P(B|A) =

2) PF = % dos produtos que possuem falha = 5% F1 = % dos produtos com falha que tiveram esta identificada = 99% dos 5% = 4,95% do total F2 = % dos produtos bons identificados com falha = 12% dos 95% = 11,4% do total FT = % total dos produtos identificados com falha = 16,35% do total

P=

= 30,5%

3) 1 - O que So Redes Bayesianas: Uma rede bayesiana uma forma de representar o conhecimento de um domnio onde no se tem certeza de todas as variveis presentes. Atravs da probabilidade podemos responder, com nveis de certeza, a questes formuladas com base em evidncias de uma situao. 2 - Como uma Rede Bayesiana representada: Uma rede bayesiana pode ser representada por um grafo acclico dirigido, onde cada n ter informaes probabilsticas daquele evento, e com arcos representando dependncias entre esses eventos. 3 - Como construir uma Rede Bayesiana (variveis, estrutura e pesos): Russel (1995), diz que para se construir uma rede bayesiana necessrio tomar certas precaues. Primeiro deve-se construir a tabela de probabilidades condicionais de forma que esta seja uma boa representao do domnio. Para isso utiliza-se a equao para o clculo da tabela de probabilidades condicionais: P(x1,..., xn) = P(xi | Pais(Xi)) para 0 i n, onde: Pais, na equao, representa os ns pais da rede. Porm, ela ser reescrita para: P(x1,..., xn) = P(xn | xn 1,..., x1)P(xn 1,..., x1) Reescrevendo a equao para que cada conjuno de probabilidades reduza-se a uma probabilidade condicional e uma conjuno menor, tem-se como resultado a seguinte equao: P(x1,...,xn) = P(xn | xn 1,...,x1)P(xn 1 | xn 2,...,x1)...P(x2 | x1)P(x1) = P(xi | xi 1,...,x1 )para0 in Comparando esta equao com a equao para o clculo da tabela de conjuno de probabilidades, chega-se seguinte equao resultado: P(Xi | Xi 1,..., X1) = P(Xi | Pais(Xi)) para Pais(Xi) {xi 1,...x1} Segundo Russel (1995), esta equao expressa que uma rede bayesiana a representao correta de um domnio, se e somente se, cada n condicionalmente independente de seus predecessores, dado seu n pai. Portanto, para se construir uma rede cuja estrutura represente devidamente o domnio do problema, necessrio que, para todo n da rede, esta propriedade seja atendida. Intuitivamente, os pais de um n Xi devem conter todos os ns X1, ..., Xi-1 que influenciem diretamente em Xi. Sendo assim, o procedimento para a construo de uma rede bayesiana seria: escolher um conjunto de variveis Xi que descrevam o domnio; escolher uma ordem para as variveis, de acordo com a relevncia das mesm as para o domnio;

enquanto existir variveis: escolher uma varivel Xi e adicion-la como sendo um n na rede; determinar os ns pais(Xi) dentre os ns que j estejam na rede e que satisfaam a equao: P(Xi | Xi 1,..., X1) = P(Xi | Pais(Xi)) para Pais(Xi) {xi 1,...x1}; definir a tabela de probabilidades condicionais para Xi. 4 - O que so Redes Bayesianas Dinmicas: Uma Rede Bayesiana Dinmica (RBD) uma Rede Bayesiana que representa um modelo probabilstico temporal como aquele que pode ser visto na figura abaixo: em cada instante t, St um conjunto de variveis de estado (no observadas, podendo ser discretas ou contnuas) e Et um conjunto de variveis de evidncia (observadas, podendo ser discretas ou contnuas).

Figura: RBD de primeira ordem 5 - Apresente algum artigo Bayesianas: No achei nenhum. na rea de Engenharia Qumica que utilize Redes

Trabalho 4

ic.media <- function(x,sigma2,conf.level){ n<-length(x) xbarra<-mean(x) z<-qnorm((1+conf.level)/2) LI <- xbarra - z*sqrt(sigma2)/sqrt(n) LS <- xbarra + z*sqrt(sigma2)/sqrt(n) return(c(LI,LS)) }

Potrebbero piacerti anche