A estatstica uma cincia que estuda uma ou varias caractersticas ou
propriedades de uma populao tendo por base a recolha, classifcao, apresentao e interpretao dos dados sobre o fenmeno em estudo. Noes bsicas sobre estatstica: - Populao: sobre quem o estudo - Amostra: quem responde - Varivel estatstica: sobre o que o estudo - Unidade estatstica: cada elemento da populao - Efectivo da populao: n!mero de elementos da populao - enso: estudo estatstico que incide sobre todos os elementos de uma populao - !onda"em: estudo estatstico em que se utili"a apenas uma amostra da populao Variveis estatsticas: A varivel estatstica aquilo que se est# a estudar, e esta pode ser: - Varivel estatstica #ualitativa: no podem ser e$pressas numericamente, pois relacionam situa%es como a cor da pele, cor dos olhos, marca de refri&erante, marca de automvel, preferncia musical entre outras. - Varivel estatstica #uantitativa: so e$pressas numericamente, quer traves de uma conta&em, quer atravs de uma medio' podem dividir-se em varivel estatstica #uantitativa discreta que s toma valores isolados, como por e$emplo o n!mero de irmos' e em varivel estatstica #uantitativa continua que toma qualquer valor de um dado intervalo, como por e$emplo a altura, a temperatura, o peso. Planeamento e a#uisio de dados: (ma an#lise estatstica envolve, &eralmente, duas fases fundamentais e com ob)ectivos distintos: $ Estatstica %escritiva, que visa descrever o real de forma a permitir entend-lo melhor' trata da recolha, classifcao e reduo dos dados com vista a descrever e interpretar a realidade actual ou factos passados relativos ao con)unto observado. * seu ob&ectivo informar' prevenir' esclarecer. $ Estatstica (ndutiva que, a partir de uma amostra da populao, permite estender os resultados + populao inteira' trata de estabelecer conclus%es relativas a um con)unto mais vasto de indivduos ,populao- a partir da observao de parte dela ,amostra-. Ao seleccionar uma amostra: - deve ser aleatrio - deve ter elementos sufcientes A amostra pode ser: - Amostra representativa da populao: estamos perante uma amostra bem recolhida, ou se)a, si&nifca que representa bem a populao - Amostra enviesada: estamos perante uma amostra mal recolhida, ou se)a, no representa bem a populao. Aplicao e concreti)ao dos processos referidos: ../ 0ase - identi*cao do ob&ecto do estudo estatstico: decide-se o ob)ecto do estudo e a vari#vel a estudar 1./ 0ase - recol+a de dados: atravs de inquritos, observa%es... 2./ 0ase - or"ani)ao e apresentao de dados: redu"ir os dados obtidos e or&ani"a-los em tabelas ou &r#fcos 3./ 0ase - anlise e interpretao de resultados: fase em que se obtm as conclus%es . onstruo de tabelas de fre#u,ncia: n!mero de dias ,-i- n!mero de pessoas ,*- 0i fri fri ,4- 0ri ,4- .5 6 6 5,. .5 .5 .1 2 7 5,58 8 .8 .2 7 .8 5,.8 .8 21 .6 9 16 5,.7 .7 65 .: 8 2. 5,.1 .1 81 1. .5 3. 5,15 15 71 11 7 39 5,.8 .8 97 25 . 65 5,51 1 .55 ;otal 65 . .55 -i - todas as op%es referentes # vari#vel estatstica em estudo * - fre#u,ncia absoluta, numero de efectivos de $i .i - fre#u,ncia absoluta acumulada - soma-se sempre o que est# para tr#s em f fri - fre#u,ncia relativa - f<total fri /01 - fre#u,ncia relativa em 0 .ri - fre#u,ncia relativa acumulada - soma-se o que est# para tr#s em fri ,4- Na m#uina: ir # tabela: =;A; > ?@A; -i - 23 - * - 24 - .i - 25 - cumsum ,1 B@ > CA=; > *D=- ,C1- fri - 26 - C1<;*;AC fri /01 - 27 - C3 $ .55 .ri - 28 - cumsum ,1 B@ > CA=; > *D=- ,C6- (mportante: .. Euando o estudo estatstico sobre uma varivel estatstica #ualitativa ,no -i tem letras- a tabela de frequncia no tem as colunas de fre#u,ncias acumuladas .i e .ri. 1. Euando o total no d 399 na fre#u,ncia relativa: retira$se um ao mais pe#ueno, por e$emplo: 5,25:8: F 5,2. 5,5:894 F 5,57 G- retira-se aqui, fa"-se batota. 1 23 24 25 26 27 28 %ados a"rupados em classe: Dara descobri-mos o n!mero de classes: - n F 13 ,efectivo da populao<total- - 4 ; < n ,sendo = o numero de classes-: 1 . F 1' 1 1 F 3' 1 2 F 7' 1 3 F .8' 1 6 F 21 - = F 6 classes - -ma- $ -min F .51 - 85 F 31 - F F 7,3 G- amplitude da classe 7,6 G- amplitude da classe defnitiva classes marca de classes ,-i- f 0i fri fri ,4- 0ri conta&e m H85' 85,7H 8 8 5,16 16 16 llllll H87,6' ::H 6 .. 5,1. 1. 38 lllll H::' 76,6H 3 .6 5,.: .: 82 llll H76,6' 93H 6 15 5,1. 1. 73 lllll H93' .51,6H 3 13 5,.8 .8 .55 llll ;otal 13 . .55 13 classes - -i - todas as op%es referentes # vari#vel estatstica em estudo * - fre#u,ncia absoluta, numero de efectivos de $i .i - fre#u,ncia absoluta acumulada - soma-se sempre o que est# para tr#s em f fri - fre#u,ncia relativa - f<total fri /01 - fre#u,ncia relativa em 0 .ri - fre#u,ncia relativa acumulada - soma-se o que est# para tr#s em fri ,4- conta"em - 2 >epresentaes "r*cas: - %ia"rama de caule $ e $ fol+as: Adade dos pais dos alunos e da professora de IAJ=: - ?r*co ircular: @eve ter ateno que este tipo de &r#fcos, construdos, de um modo &eral, para dados #ualitativos: - tem de ter le&enda e a percenta&em de cada sector' - tem a #rea de cada sector i&ual + frequncia' - deve ter um titulo. ?ste um tipo de &r#fco bastante atractivo e muito !til para estabelecer compara%es entre as frequncias das diferentes cate&orias. Bo entanto no deve ser usado quando a vari#vel pode assumir muitas modalidades diferentes. Para calcular a amplitude dos @n"ulos: fri A 589B 3 Dai -K 39 65 38 38 2. 29 37 8. 36 29 38 29 35 69 Ie -K 65 32 35 27 3. 3. 33 35 36 35 35 68 3: 7 2 9 9 9 : 6 3 2 . . 5 5 5 5 5 5 . 6 8 8 8 7 9 8 5 6 5 9 8 . $ Picto"rama: =o &r#fcos onde se utili)am f&uras ou smbolos alusivos varivel em estudo. @eve ter em conta que no &r#fco: - tem de e$istir a le&enda do smbolo' - o smbolo deve de estar relacionado com a caracterstica em estudo' - o n!mero de smbolos proporcional # frequncia' - os smbolos podem ser desenhados em linhas ou em colunas' - os smbolos devem poder dividir-se se&undo ei$os de simetria. *s picto&ramas so &r#fcos muito su&estivos e de f#cil leitura. Bo entanto so pouco precisos. - ?r*cos de Carras: =o &r#fcos formados por um con)unto de barras em que a altura proporcional +s frequncias. Bum dos ei$os marcam-se as frequncias ,absolutas ou relativas- e no outro os valores da vari#vel. As barras devem fcar i&ualmente distanciadas umas das outras. (ma das vanta&ens a sua f#cil construo. 6 - ?r*cos de lin+as: ?ste tipo de &r#fco utili"ado para representar informao que varia ao lon&o do tempo. Bota: s para variveis estatsticas contnuas - Disto"ramas: ?stes &r#fcos utili"am-se sempre que os dados esto a&rupados em classes, na forma de intervalos, devendo ter-se em conta que: - no ei-o +ori)ontal representa-se os intervalos das classes' - no ei-o vertical representa-se as fre#u,nciasE $ no histo&rama as barras so )untas. Bota: s para variveis estatsticas contnuas 8 Bota: Euando as amplitudes no so i"uais' tem de se calcular a altura das barras F f<amplitude - Pol"onos de fre#u,ncias: Bota: para fre#u,ncias absolutas e relativas * pol&ono parte do ponto mdio de uma classe fctcia com frequncia "ero, passa pelos pontos mdios de cada uma das classes e termina no ponto mdio de outra classe fctcia de frequncia "ero. Bota: para fre#u,ncias absolutas acumuladas e relativas acumuladas Bo pol&ono de frequncias acumuladas no se recorre + marca da classe. L esquerda do limite inferior da primeira classe, a frequncia acumulada "ero a # direita da !ltima classe . ,ou o efectivo se for frequncia absoluta- : Fedidas de locali)aoGmedidas de tend,ncia central: $ Fdia: , - o quociente da soma de todos os lados pelo numero dos lados, ou se)a: Bo caso em que os dados so discretos e esto or&ani"ados em tabelas, podemos calcular a mdia do se&uinte modo: A marca da classe obtm$se fa"endo a mdia: $ Foda: ,I o - o valor da vari#vel ao qual corresponde uma maior frequncia ,absoluta ou relativa- Euando e$istem dois valores com a mesma fre#u,ncia di"-se que a amostra bimodal. Euando os valores t,m todos a mesma fre#u,ncia di"-se que a amostra amodal. Euando e$istem vrios valores com a fre#u,ncia mais alta di"-se que a amostra plurimodal. A moda pode ser calculada nos dois tipos de vari#veis ,#ualitativas e #uantitativas- e a Hnica #ue se pode calcular para dados #ualitativos. Jaso os dados este)am a"rupados em classes' indicaremos a classe modal, e determinamos &rafcamente um valor apro$imado para esta medida atravs de um +isto"rama. 7 $ Fediana: - o valor que divide o con)unto de dados ,ordenados por ordem crescente ou decrescente- em duas partes com o mesmo numero de observa%es. =e o n!mero de dados impar' a mediana o valor centralI =e o n!mero de dados par' a mediana a media aritmtica dos valores centraisI .3 .6 .6 .6 .: .: .7 .3 .6 .6 .6 .: .: .7 .9 =e o numero de dados for muito "rande: - se o n!mero de dados n impar, a ordem M da mediana dada por - se o n!mero de dados n par, a mediana a media dos valores de ordens Jaso os dados este)am a&rupados em classes, indicaremos a classe mediana e determinaremos &eometricamente um valor apro$imado da mediana: 9 ento: F F .8 Dodemos di"er que mediana o valor #ue divide a amostra /or"ani)ada por ordem crescente1 ao meio' isto ' metade dos elementos do con&unto de dados so menores ou i"uais mediana' en#uanto #ue os restantes so superiores ou i"uaisI Fedidas de locali)ao: $ Juartis: .5
.. .1 $ %ia"rama de e-tremos e #uartis: ?$emplo .3: As notas do 0rancisco nos primeiros testes do 1/ perodo nas diferentes disciplinas foram as se&uintes: 7 .1 .3 .6 .6 .: .: .9 15 Dor observao dos dados, conclumos que E. F .2, F .6 e E2 F .7, o valor m#$imo 15 e o valor mnimo 7. Analise do dia"rama: ?$iste uma maior concentrao dos dados entre o ./E e o 1/E e tambm entre o 2/E e o valor m#$imo ,$ma$.- Jomo os dados esto mais concentrados + esquerda do 1/E ento, e$iste enviesamento para a direito. ?ste dia&rama pode informar quanto ao enviesamento de uma distribuio: - %ados simtricos: os dados esto distribudos de forma simtrica - Enviesamento para a es#uerda: os dados esto mais concentrados K direita de J4 - Enviesamento para a direita: os dados esto mais concentrados K es#uerda de J4 .2 E. E1< E2 $ Percentis: dividem uma amostra ordenada em cem partes i&uais. Juando os dados esto a"rupados em classes' os percentis podem ser calculados de forma id,ntica K dos #uartis' ou se&a' no se determina o valor e-acto dos percentis mas' apenas' a classe a #ue pertencemI .3 Vanta"ens' desvanta"ens e limitaes das medidas de tend,ncia central: .6 Fedidas de disperso: $ Amplitude: a diferena entre o valor m#$imo e o valor mnimo da vari#vel: a L - m-I $ - mnI $
Amplitude (nter#uartil: a diferena entre o 2/ quartil e o ./ quartil: A # L J 5 $ J 3 N se o valor de A # for "rande, a disperso entre os valores centrais "rande. N se o valor de A # for pe#ueno, a disperso pe#uena. $ %esvio Padro: F F 1,87 idas + biblioteca idas + biblioteca n/ de alunos ,$i - - 1 ,$i - - 1 $ f 5 . :,.713 :,.713 . 2 1,7113 7,38:1 1 : 5,3813 2,1287 2 7 5..513 5,7.91 3 3 .,:313 8,9898 6 1 6,2713 .5,:86 ;otal 16 2:,33 23 F $i 24 F f 25 F ,C. - - 1 26 F ,C. - - 1 $ f .8 F .,1127 23 24 25 26 soma C3 ,1B@ > CA=; > IA;- (ntroduo "r*ca K anlise de dados bivariados: $ ?r*co de correlao ou %ia"rama de disperso: um &r#fco de pontos em que as coordenadas de cada ponto so os valores das duas vari#veis em estudo. * con)unto dos pontos num &r#fco de correlao desi&na-se por nuvem de pontos. A correlao di)$se linear se a nuvem de pontos se distribuir ao lon"o de uma lin+a recta' a recta de re"resso. ?sta representao permite analisar de que forma se relacionam as duas vari#veis: .: O P Jorrelao positiva A correlao linear positiva, porque + medida que uma varivel aumenta os valores correspondentes K outra varivel tambm aumentamI A correlao linear ne"ativa, porque + medida que uma varivel aumenta os valores correspondentes K outra varivel diminuemI .7 orrelao ne"ativa orrelao nula FMJU(NA ?>M.(A: - alcular mdia' moda' mediana' desvio padro e #uartis: !NAN > calc > .-Qar =tats .-Qar =tats C., C1 - .a)er os "r*cos: .. !NAN, ?@A;, colocar os dados na tabela C. e C1 1. 4N% > O L > ENNE>, colocar AJ; e escolher o tipo 2. ?m Olist colocar C. e em Plist colocar C1 ,escolher a marca, facultativo- 3. P(N%QP escolher o $min, o $ma$, a escala em ?scO' o Rmin, o Rma$ e a escala em ?scP 7I ?>APD .9