Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estatstica Computacional
(Licenciatura em Matemtica)
Durao: 2h Exame - Resoluo 13-06-11
Observao: A resoluo completa das perguntas inclui a justificao do raciocnio utilizado.
NOME: --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
1. Num estudo sobre o aprisionamento de golfinhos em redes de pesca, obtiveram-se dados relativos ao
nmero de golfinhos aprisionados diariamente em redes de pesca ao largo dos Aores, nos 257 dias de 1998
em que o estado do tempo permitiu a sada de barcos.
a) Apresenta-se seguidamente a tabela de frequncias da distribuio do nmero de golfinhos
aprisionados.
Nmero de golfinhos aprisionados
Cumulative
Frequency Percent Valid Percent Percent
Valid 0 27 10,5 10,5 10,5
1 40 15,6 15,6 26,1
2 74 28,8 28,8 54,9
3 52 20,2 20,2 75,1
4 33 12,8 12,8 87,9
5 16 6,2 6,2 94,2
6 8 3,1 3,1 97,3
8 3 1,2 1,2 98,4
9 3 1,2 1,2 99,6
13 1 ,4 ,4 100,0
Total 257 100,0 100,0
(i) Porque razo os valores da coluna Percent coincidem com os da coluna Valid Percent?
Porque no h missings (no-respostas).
b) No prximo quadro figuram algumas medidas descritivas obtidas com o software SPSS:
Statistics
Localizao: em mdia, ficaram aprisionados 2.6 golfinhos por dia. A mediana 2 sendo este
tambm o valor mais frequente (moda).
Disperso: A amostra apresenta um desvio padro corrigido igual a 1.862 ao qual corresponde
uma varincia corrigida igual a 3.468.
Como o coeficiente de assimetria positivo (igual a 1.439) conclui-se que a amostra apresenta
assimetria positiva. Esta concluso tambm pode ser obtida observando que a mdia
superior moda=mediana. Alm disso, como
|Skewness/Std. Error of Skewness|=|1.439/0.152|=9.5 (aprox.),
valor este que muito superior a 2, podemos dizer que a assimetria considervel.
(iv) Qual o objectivo do output que figura a seguir? Qual a concluso correspondente?
Percentiles
Percentiles
5 10 25 50 75 90 95
Weighted QI obtido com o teste A
Average (Def1) 131.76 133,66 135,99 138,41 142,12 144,44 145,64
O terceiro quartil igual a 142.12, o que significa que o QI de cerca de 75% dos indivduos da
amostra, calculado com o teste A, inferior ou igual a 142.12.
b) Observe os box-plots paralelos relativos aos resultados dos dois testes e os dois histogramas que se
seguem e associe a cada box-plot o histograma correspondente.
(iii) Indique um intervalo de confiana para o valor mdio do QI obtido com o teste A.
No quadro acima, podemos observar que um i.c. para mA 139 com grau de confiana 0.95
]-1.563, -0.354[. Como -1.563 < mA 139 < -0.354 equivalente a -1.563+139 < mA < -0.354+139,
conclui-se que um i.c. para mA, com grau de confiana 0.95, ]137.437, 138.646[.
e) Para testar se h diferena entre os valores mdios dos QI obtidos com os dois testes, considere os dois
outputs seguintes.
(i) Indique as hipteses em teste. Qual dos dois outputs adequado para o efeito pretendido?
As hipteses em teste so H0: mA= mB vs H1: mA mB, com mB definido analogamente a mA, mas
relativamente ao teste B. No entanto, estamos perante amostras emparelhadas (resultados dos
teste A e B para o mesmo indivduo i, i=1,2,, 72). Nesta situao, aquelas hipteses escrevem-se
habitualmente na forma H0: mD= 0 vs H1: mD 0, sendo mD o valor mdio da v.a.r. D=X-Y (Y: v.a.
que representa o valor do QI obtido com o teste B).
Os dois outputs correspondem a testes para a diferena mA= mB, mas o segundo output o
adequado para o efeito pretendido, porque os valores mdios em teste dizem respeito a
amostras emparelhadas, como j foi referido.
a) Admita que as populaes relativas s taxas de alcoolmia dos condutores dos veculos pesados e dos
veculos ligeiros tm a mesma forma.
A fim de averiguar se existem diferenas significativas entre a localizao de tais populaes, foi
efectuado o teste U de Mann-Whitney, que forneceu o seguinte output:
(iii) Em que condies poderia utilizar, para o mesmo efeito, o teste t (de Student) de comparao de
mdias?
Poderia utilizar o o teste t se as dimenses das duas amostras fossem superiores a 30 ou se
pudessem ser consideradas como provenientes de populaes normais (ou seja, se fosse
possvel aceitar a normalidade de X e de Y).
b) Pretende-se tambm relacionar a idade do condutor com o excesso de velocidade com que seguia o veculo.
Neste sentido, foram construdos o diagrama de disperso e o quadro que se seguem.
Symmetric Measures
Value
Interval by Interval Pearson's R -,855
Ordinal by Ordinal Spearman Correlation -,890
N of Valid Cases 40
B. Outro aspecto que foi objecto do estudo diz respeito s condies em que ocorreram os acidentes
registados. Uma amostra de 500 acidentes envolvendo automveis ligeiros permitiu obter informaes
sobre as causas dos acidentes, o dia da semana em que tiveram lugar e as caractersticas dos veculos
acidentados.
a) A fim de averiguar se a incidncia dos acidentes a mesma nos vrios dias da semana, foi efectuado o
teste de ajustamento do qui-quadrado, que conduziu aos seguintes resultados:
Codia
H0: P(Ai) = 1/7, i=1,,7 vs H1: P(Ai) 1/7, para algum i=1,,7, onde Ai o acontecimento o
acidente ocorre no i-simo dia da semana.
(ii) Ser recomendvel tomar uma deciso com base neste output? Admitindo que sim, qual seria a
deciso? Sim, porque no h frequncias esperadas inferiores a 5. O p-valor aproximadamente
igual a 0 logo inferior aos nveis de significncia usuais (iguais ou superiores a 0.01). Assim,
rejeita-se H0, concluindo-se que a incidncia dos acidentes no a mesma nos vrios dias da
semana.
b) Dados oficiais baseados em estudos anteriores indicavam que 20% dos acidentes se deviam a
manobras perigosas. Aps vrias campanhas de sensibilizao junto dos automobilistas, a PRP
esperava que esta percentagem tivesse diminudo.
Com base no nmero de acidentes causados por manobras perigosas na amostra observada, foi
efectuado um teste binomial que forneceu o output seguinte:
Binomial Test
Seja p a proporo de acidentes devidos a manobras perigosas. Pretendemos testar H0: p = 0.2 vs
H1: p < 0.2 ou, de modo equivalente, H0: 1-p = 0.8 vs H1: 1-p > 0.8. Ora o output aqui apresentado
diz respeito precisamente a este teste (porque 1-p representa a proporo de acidentes que no
so devidos a manobras perigosas). A amostra aponta no sentido de H1, porque a proporo
observada de acidentes no devidos a manobras perigosas 0.842 > 0.8. Assim, o p-valor do teste
que se pretende realizar 0.01 < 0.05, pelo que H0 rejeitada, aceitando-se que p < 0.2. Conclui-
se, portanto, que as campanhas foram bem sucedidas.
c) Para cada veculo acidentado, foram ainda observados o grau do ferimento do condutor (classificado
em Ligeiro, Grave ou Mortal) e a cilindrada do veculo (classificada em Baixa, Mdia ou Alta). A
amostra bidimensional obtida encontra-se resumida na seguinte tabela de contingncia:
(140/500)*100% = 28%
(ii) De entre os condutores que apresentavam ferimentos graves, qual a percentagem dos que conduzia
um veculo de alta cilindrada?
(iii) O Menu Crosstabs do software SPSS permitiu ainda construir o quadro que se segue relativo
relao entre o grau do ferimento do condutor e a cilindrada do veculo.
Symmetric Measures
Value
Ordinal by Kendall's tau-b -,010
Ordinal Kendall's tau-c -,009
Gamma -,018
N of Valid Cases 500
4. Uma equipa de bilogos dedicou-se ao estudo de certa espcie de ursos. Com este objectivo, seleccionou
aleatoriamente 44 animais adultos daquela espcie, de entre os que vivem numa determinada reserva natural, e
observou-os durante um ano, tendo registado valores de vrias variveis.
Por forma a relacionar o peso de um urso antes da hibernao (Y, em kg) com o permetro do seu trax (x, em
cm), procedeu-se ao ajustamento de um modelo de regresso linear, tendo sido obtidos os seguintes
resultados:
a) Porque que o modelo de regresso linear , neste caso, adequado para relacionar Y com x?
Porque o valor do coeficiente de correlao linear (Pearson) muito prximo de 1 (R = 0.958).
Portanto, um urso com 160 cm de permetro do trax, dever pesar cerca de 229.125 kg.
c) Quais so as hipteses dos testes a que se referem os dois p-valores que figuram no segundo quadro?
O modelo de regresso Yi = 0+ 1 xi + i, i=1,...,44, sendo uma v.a.r. centrada. O primeiro p-valor
corresponde ao teste de H0: 0 = 0 vs H1: 0 0 e o segundo p-valor corresponde ao teste de H0: 1 = 0 vs
H1: 1 0.