Sei sulla pagina 1di 9

Ficha 1 CONEP

Descrio de dados

One Sample t-test


Data: PK...
t = 15.7982, df = 9, p-value = 7.186e-08
Alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
38.90769 51.91231
Sample estimates:
Mean: 45.41
Median: 46.00
SD: 9.089609

Histograma

with(manuel, stem.leaf(F1, na.rm=TRUE))


1 | 2: represents 12
leaf unit: 1
n: 90
1 2. | 8
3 3* | 11
9 t | 222333
11 f | 45
14 s | 777
21 3. | 8889999
Diagrama de caule e folhas
27 4* | 011111
36 t | 223333333
(12) f | 444445555555
42 s | 666777777
33 4. | 8888889999
23 5* | 0000111
16 t | 22333
11 f | 4455
7 s | 67
5 5. | 9
4 6* | 0
3 t | 22
f|
1 s|7
summary(manuel)
numSummary(manuel[,"F1"], statistics=c("sd", "IQR"), quantiles=c(0,.25,.5,+ .75,1))
sd: 7.658935
IQR: 8.775
N: 90
Median :45.50
Mean:45.53

A mediana a medida de localizao do centro da distribuio dos dados. o valor que


divide ao meio os elementos da amostra de dados, isto , 50% dos elementos da amostra
so menores ou iguais mediana e os outros 50% so maiores ou iguais mediana, logo,
onumero que caracteriza o centro da distribuio 45.50.
Como os dados referidos so quantitativos continuos o intervalo de confiana ser calculado
seguindo uma distribuio normal, uma vez que o nmeros de observaes soperior a 30.
O intervalo que contem 50% dos dados no centro :

manuel <-c(49.2, 53.9, 50.0, 44.5, 42.2, 42.3, 32.3, 31.3, 60.9, 47.5, 43.5, 37.9, 41.1, 57.6,
40.2, 45.3, 51.7, 52.3, 45.7, 53.7, 51.0, 45.7, 45.9, 50.0, 32.5, 67.2, 55.1, 59.6, 48.6, 50.3, 45.1,
46.8, 47.4, 38.3, 43.5, 44.0, 62.2, 62.9, 56.3, 35.8, 38.3, 33.5, 48.5, 47.4, 49.6, 41.3, 55.2, 52.1,
34.3, 31.6, 38.2, 46.0, 47.0, 41.2, 39.8, 48.4, 49.2, 32.8, 47.9, 43.3, 49.3, 54.5, 54.1, 44.5, 46.2,
44.4, 45.1, 41.5, 43.4, 39.1, 39.1, 41.6, 43.1, 43.7, 48.8, 37.2, 33.6, 28.7, 33.8, 37.4, 43.5, 44.2,
53.0, 45.1, 51.9, 50.6, 48.5, 39.0, 47.3, 48.8)
> ic.media <- function(x, conf = 0.50){
+ n <- length(x)
+ media <- mean(x)
+ variancia <- var(x)
+ quantis <- qt(c((1-conf)/2, 1 - (1-conf)/2), df = n)
+ ic <- media + quantis * sqrt(variancia/n)
+ return(ic)
+}
> ic.media(manuel)
[1] 44.98548 46.07896
o intervalo que contem , aproximadamente, 95% da distribuio :
> manuel <-c(49.2, 53.9, 50.0, 44.5, 42.2, 42.3, 32.3, 31.3, 60.9, 47.5, 43.5, 37.9, 41.1, 57.6,
40.2, 45.3, 51.7, 52.3, 45.7, 53.7, 51.0, 45.7, 45.9, 50.0, 32.5, 67.2, 55.1, 59.6, 48.6, 50.3, 45.1,
46.8, 47.4, 38.3, 43.5, 44.0, 62.2, 62.9, 56.3, 35.8, 38.3, 33.5, 48.5, 47.4, 49.6, 41.3, 55.2, 52.1,
34.3, 31.6, 38.2, 46.0, 47.0, 41.2, 39.8, 48.4, 49.2, 32.8, 47.9, 43.3, 49.3, 54.5, 54.1, 44.5, 46.2,
44.4, 45.1, 41.5, 43.4, 39.1, 39.1, 41.6, 43.1, 43.7, 48.8, 37.2, 33.6, 28.7, 33.8, 37.4, 43.5, 44.2,
53.0, 45.1, 51.9, 50.6, 48.5, 39.0, 47.3, 48.8)
> ic.media <- function(x, conf = 0.95){
+ n <- length(x)
+ media <- mean(x)
+ variancia <- var(x)
+ quantis <- qt(c((1-conf)/2, 1 - (1-conf)/2), df = n)
+ ic <- media + quantis * sqrt(variancia/n)
+ return(ic)
+}
> ic.media(manuel)
[1] 43.92833 47.13611

Histograma

O grfico tem uma distribuio assimtrica positiva


com outlyer (pois h uma lmpada com tempo de
vida exageradamente maior> 4000), sendo que a
maioria das lmpadas (22) tem um tempo de vida
entre as 500 e as 1000 horas. Entre as 0 e 500
horas, encontra-se um nmero considervel de
lmpadas da amostra (15), sendo que as restantes
tm um valor acima das 1000 horas (12 lmpadas)

Mdia e Mediana
Obtido no R:
Mdia = 871.22
Mediana = 728.5
Os valores obtidos com a mdia e mediana, verifica-se que a mdia relativamente superior
mediana, logo tem uma assimetria positiva e que a medida mais adequada a mediana.

PERCENTIL
Em estatstica descritiva, os percentis so medidas que dividem a amostra ordenada (por
ordem crescente dos dados) em 100 partes, cada uma com uma percentagem de dados
aproximadamente igual
563.5

Desvio padro
645.3818

Grfico de pontos. Mdia ,mediana, desvio padro

Mdia: 23.6
Mediana: 22
Desvio padro:12.25

b)Percentil 90
39.2

c) Como no temos valores em relao ao tempo de vida das 5 lmpadas restantes no


podemos calcular a mdia uma vez que a mdia necessita sempre dos valores
correspondentes. Mas, para calcular a mediana no necessitamos desses valores uma vez que
s precisamos dos dois elementos mdios indicados na tabela e deles calcular o respectivo
valor mediano.

> data4 <- read.delim(file.choose(), header=T, sep="\t")


>
> data4
X190.graus X220.graus X240.graus X260.graus
1
7228
1764
1175
600
2
7228
2436
1175
744
3
7228
2436
1521
744
4
8448
2436
1569
744
5
9167
2436
1617
912
6
9167
2436
1665
1128
7
9167
3108
1665
1320
8
9167
3108
1713
1464
9
10511
3108
1953
1896
10 10511
3108
1953
1896

b.Calcule o tempo mdio at falha para cada uma das quatro temperaturas.

summary(temp)
X190.graus
X220.graus
Min. : 7228
Min. :1764
1st Qu.: 7533
1st Qu.:2436
Median : 9167 Median :2436
Mean : 8782 Mean :2638
3rd Qu.: 9167 3rd Qu.:3108
Max. :10511 Max. :3108

X240.graus
Min. :1175
1st Qu.:1533
Median :1641
Mean :1601
3rd Qu.:1701
Max. :1953

X260.graus
Min. : 600
1st Qu.: 744
Median :1020
Mean :1145
3rd Qu.:1428
Max. :1896

library(RODBC, pos=14)
temp <- sqlQuery(channel = 1, select * from [Excel2DataCSV$])
names(temp) <- make.names(names(temp))
library(abind, pos=15)
library(e1071, pos=16)
numSummary(temp[,"X190.graus"], statistics=c("mean", "sd", "IQR",
"quantiles"), quantiles=c(0,.25,.5,.75,1))
summary(temp)

5.O ficheiro student.dat contm informao sobre 54 estudantes


dum curso de Estatstica da Universidade do Iwoa. Foram
registados valores para as variveis seguintes: altura (em
polegadas), peso (em libras), gnero (masculino/feminino) e o nme
ro de filhos biolgicos.
a. Mostre a distribuio da altura, do peso e do nmero de filhos.
Use grficos de pontos, histogramas, diagramas de caule e folha e
caixas de bigode. Sumarize as distribuies
numericamente, atravs da mdia, da mediana e do desvio-padro.
> manuel <- read.table("C:/Users/Manuel/Desktop/new 1.txt", header=TRUE,
+ sep="", na.strings="NA", dec=".", strip.white=TRUE)

Distribuio normal:

Potrebbero piacerti anche