Sei sulla pagina 1di 8

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

Captulo VI Histogramas e curvas de distribuio

6.1. Distribuies e histogramas. 6.2. Distribuio limite 6.3. Significado da distribuio limite: frequncia esperada e probabilidade de um resultado 6.4. Valor mdio e desvio padro de uma distribuio limite

60 63 64 66

Departamento de Fsica da FCTUC

59

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

Histogramas e curvas de distribuio


6.1. Distribuies e Histogramas. Uma anlise estatstica sria requer, em geral, um nmero aprecivel de dados. Quando esse nmero significativo, um modo vantajoso de os apresentar consiste na construo de um histograma (ou grfico de barras). Vejamos um exemplo. Numa dada experincia, tendo reduzido a um nvel desprezvel os erros sistemticos, medimos um comprimento x vrias vezes e obtemos os resultados que se apresentam na tabela 6.1. Tabela 6.1 xi resultados de N = 10 medidas do comprimento x xi (cm) 25 23 24 26 28 25 24 26 26 24

Estes mesmos resultados podem ser organizados de acordo com o nmero de vezes nk que cada resultado xk acontece, tornando a avaliao dos dados mais imediata (Tabela 6.2): Tabela 6.2 xk resultados do comprimento x; nk n de vezes que se obteve o resultado xk xk (cm) nk 23 1 24 3 25 2 26 3 27 0 28 1

Tendo em conta esta nova forma de organizar os resultados, o seu valor mdio pode ser reescrito utilizando os nk e xk:

x=

x
i

x n
k k

(6.1)

A nova frmula da mdia designada por mdia pesada, visto que cada valor xk pesado pelo n de vezes que acontece, nk:
x= 23 + (24 3) + (25 2 ) + (.26 3) + 28 . 10

Note que

n
k

= N onde N o nmero total de medidas.

O n de vezes, nk, que um dado resultado xk foi obtido pode ser apresentado como uma fraco do n total de medidas N. Este novo parmetro designado por frequncia de xk e define-se, portanto, como: n (6.2) Fk = k , N
Departamento de Fsica da FCTUC

60

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

Em termos de Fk, a mdia pode agora reescrever-se como: x = xk Fk ,


k

(6.3)

sendo, portanto, a soma de todos os diferentes valores xk, cada um pesado pela sua frequncia Fk. O resultado

n
k

= N e a definio Fk =

nk implicam que N

F
k

= 1.

(6.4)

A condio acima uma condio de normalizao e a srie dos Fk diz-se normalizada. A tabela 6.3 completa a tabela 6.2 com os novos dados. Tabela 6.3 xk resultados do comprimento x; nk n de vezes que se obteve o resultado xk; Fk frequncia de cada xk
N = nk

xk (cm) nk Fk

23 1 0.1

24 3 0.3

25 2 0.2

26 3 0.3

27 0 0

28 1 0.1 10 1

As frequncias Fk especificam a distribuio de resultados, uma vez que descrevem a forma como as medidas esto distribudas pelos diferentes valores possveis. Uma distribuio de resultados pode ser apresentada graficamente num histograma ou grfico de barras. A figura 6.1 mostra o histograma correspondente aos resultados das medidas do comprimento x (Tabela 6.3).
0,30

N = 10

0,25

0,20

Fk 0,15
0,10

0,05

0,00 23 24 25 26 27 28

x (cm)

Figura 6.1 Histograma da distribuio de frequncias do comprimento x.


Departamento de Fsica da FCTUC

61

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

No histograma da figura 6.1, como os valores xk so inteiros discretos, as frequncias so representadas pela altura das linhas em cada ponto da abcissa xk. Na verdade, este grfico seria idntico (a menos de um factor de escala) ao grfico que se obteria se na ordenada fossem introduzidos directamente os valores dos nk e no dos Fk. Contudo, neste caso o grfico no estaria normalizado, o que seria uma desvantagem, como veremos mais tarde. Muitas medidas de grandezas fsicas apresentam um intervalo contnuo de valores (e no discreto, como no exemplo anterior). Suponhamos que se realizam 50 medidas de tempo com um cronmetro, a fim de se determinar o tempo de queda de um corpo. Os valores obtidos esto entre 0.91 s e 1.06 s. Com resultados deste tipo, o melhor procedimento dividir o intervalo total de valores obtidos num n conveniente de pequenos intervalos iguais. Para tal procede-se da seguinte forma geral (que ilustraremos com o exemplo da medida dos tempos): i) ii) iii) iv) Detecta-se o menor valor (de tempo) medido: (0.91 s) Detecta-se o maior valor (de tempo) medido: (1.06 s) Calcula-se a diferena entre os dois valores anteriores: (1.06 0.91 = 0.15s) Divide-se esse intervalo total num n conveniente de intervalos iguais: (tomando 5 intervalos iguais, cada intervalo ter uma largura de 0.03 s). v) Calculam-se os valores extremos desses intervalos (repare nos extremos abertos e fechados): (1 = [0.91,0.94[ s 2 = [0.94,0.97[ s 3 = [0.97,1.00[ s 4 = [1.00,1.03[ s 5 = [1.03,1.06] s.)

vi) Conta-se o nmero de valores medidos (do tempo) que caiem em cada um dos intervalos escolhidos: (Tabela 6.4). vii) Finalmente representam-se os resultados atravs de um histograma ou grfico de barras: (Figura 6.2). Tabela 6.4 k intervalos de valores, com largura 0.03 s; nk n de vezes que se obteve um tempo dentro do intervalo k; Fk frequncia de cada k
k k (s) nk Fk fk (s-1) 1 2 3 4 5

N = nk
50

[0.91,0.94[ [0.94,0.97[ [0.97,1.00[ [1.0,1.03[ [1.03,1.06] 5 0.10 2.5 12 0.24 6 25 0.5 12.5 5 0.10 2.5 3 0.06 1.5 nk , N

Neste tipo de histograma, a frequncia de cada intervalo k continua a ser dada pela razo mas corresponde rea de cada coluna, ou seja,
Fk = nk = fk k . N

(6.5)

Departamento de Fsica da FCTUC

62

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

fk a grandeza que surge na ordenada do grfico e v-se a partir da equao 6.5 que corresponde a f k =
nk . N k
18 16 14 12
-1 fk (s ) 10

N = 50

8 6 4 2 0 0,91 0,94 0,97 1,00 1,03 1,06

(s)

Figura 6.2 Histograma da distribuio de frequncias do tempo de queda de um corpo.

Uma nota final sobre a construo de histogramas: Se os intervalos so demasiado largos, muitas medidas caem no mesmo intervalo e o histograma acaba por ser um conjunto de rectngulos sem interesse. Se os intervalos so demasiado estreitos, vrios deles contero apenas um nico resultado e o histograma resultante ser constitudo por um conjunto numeroso de rectngulos estreitos quase todos com a mesma altura. A largura do intervalo deve ser, portanto, escolhida de forma a que vrias leituras caiam dentro de cada intervalo. 6.2. Distribuies Limite Em muitas experincias, medida que o n de medidas da grandeza em causa aumenta, a distribuio das medidas pelos diferentes valores possveis comea a tomar uma forma simples e definida. Com a ajuda da figura 6.3 podemos ver o que acontece ao histograma da experincia da medida do tempo quando aumentamos o nmero total de medidas N de 50 para 500 e depois para 5000. medida que N aumenta, possvel diminuir a largura dos intervalos k e, como se pode verificar, a diferena entre as alturas das colunas vai-se tornando menos abrupta e mais regular. A partir do histograma c) podemos antecipar que, se o nmero de medidas continuasse a crescer, o padro do histograma se aproximaria cada vez mais da curva contnua e simtrica sobreposta. Este comportamento traduz uma importante propriedade de muitas grandezas fsicas: medida que o n de medidas aumenta, a distribuio de frequncias aproxima-se de uma curva contnua bem definida. A curva envolvente que seria obtida para um n infinito de medidas conhecida por Distribuio Limite. Trata-se, obviamente, de uma construo terica, uma vez que nunca pode ser verdadeiramente testada experimentalmente. S um n infinito de medidas e intervalos de medida infinitesimais poderiam gerar a distribuio limite. Contudo, temos boas razes para crer que a medida experimental de muitas grandezas fsicas est
Departamento de Fsica da FCTUC

63

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

associada a uma distribuio limite, da qual o histograma se aproxima tanto mais quanto mais medidas forem realizadas.
18 16 14 12
-1 fK (s ) 10

N = 50

12 10 8

N = 500

8 6 4 2 0 0,91 0,94 0,97 1,00 1,03 1,06

fK (s )

-1

6 4 2 0 0,91

0,95

0,99

1,03

1,07

(s)

(s)

a)
N = 5000 10 8

b)

fK (s ) 6
4 2 0 0,91

-1

0,94

0,97

1,00

1,03

1,06

(s)

c)

Figura 6.3 Variao da distribuio de frequncias do tempo de queda de um corpo com o aumento do n de medidas: a) N = 50; b) N = 500; c) N = 5000.

6.3. Significado da distribuio limite: frequncia esperada e probabilidade de um resultado Designemos por f(x) a funo que representa a distribuio limite associada grandeza x. O significado dessa funo ser compreendido com a ajuda da figura 6.4.

Figura 6.4 Distribuio limite da grandeza x: (a) intervalo de largura dx; (b) intervalo de largura [a, b].

Como vimos anteriormente, num histograma a rea de cada coluna dada pelo produto f k k e essa rea corresponde frequncia das medidas que caem no intervalo k. Com a funo contnua f(x), vamos considerar um intervalo infinitesimal de largura dx, ou seja compreendido entre x e x+dx. A frequncia das medidas que caem nesse intervalo
Departamento de Fsica da FCTUC

64

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

infinitesimal igual rea f(x)dx sombreada na figura 6.4-a). Ou seja, f ( x ) dx d-nos a fraco de medidas (frequncia) que cai no intervalo [x, x+dx]. Ento, generalizando, a frequncia das medidas que caem entre dois valores a e b da grandeza x dada pela rea do grfico definida pela funo f(x) e compreendida entre x = a e x = b (rea sombreada da figura 6.4-b)). Ora essa rea corresponde ao integral de f(x) entre a e b, como sabemos. Temos assim o importante resultado:

f ( x)dx = frequncia esperada das medidas que caem entre x = a e x = b.

Usamos o termos frequncia esperada para lembrar que se trata da frequncia que esperaramos obter se realizssemos um n infinito de medidas! Por outro lado, f ( x ) dx tambm uma forma de avaliar a probabilidade de uma qualquer medida dar um valor que pertena ao intervalo entre x e x+dx. Ento,

f ( x)dx

corresponde probabilidade de uma qualquer medida dar um resultado que caia no intervalo entre x = a e x = b. Podemos assim concluir que, se fosse conhecida a distribuio limite f(x) associada medida de uma certa quantidade x, ento tambm seria conhecida a probabilidade de se obter um qualquer resultado num qualquer intervalo a x b. Como a probabilidade total de se obter um valor qualquer entre e + deve ser 1, a distribuio limite f(x) tem que satisfazer a condio de normalizao:

ou seja, f(x) 1 diz-se normalizada.


25

f ( x)dx = 1 ,

(6.6)

20

Boa preciso

f(x) (s -1)

15

10

Baixa preciso

0 0,91

0,96

1,01

1,06 t (s)

1,11

1,16

Figura 6.5 Duas distribuies limite normalizadas, correspondentes a duas experincias diferentes da medida da mesma grandeza fsica, permitem comparar a preciso com que foram realizadas as medies nos dois casos.

Em

f ( x)dx = 1 , os limites so usados por desconhecermos o intervalo real em que se situaro os


65

valores medidos numa dada experincia (e no porque se obtero valores desde + at ). Departamento de Fsica da FCTUC

TLF 2010/11

Cap. VI Histogramas e Curvas de Distribuio

A vantagem das distribuies limite serem normalizadas que podemos comparar resultados da mesma grandeza fsica realizadas, por exemplo, com sistemas experimentais diferentes. A figura 6.5 mostra duas funes limite resultantes de medidas da mesma grandeza x. Ambas apresentam o mesmo valor mdio, x = 1,06s . Contudo, o facto de ambas cobrirem a mesma rea (porque as duas funes esto normalizadas) permite-nos concluir que uma das experincias foi executada com razovel preciso (os valores obtidos estaro perto do melhor valor), dando origem a uma curva mais estreita e alta, enquanto que as medidas da outra experincia foram realizadas com baixa preciso. Neste caso, como a respectiva distribuio limite larga e achatada, isso significa que os valores encontrados apresentam elevada disperso. 6.4. Valor mdio e desvio padro de uma distribuio limite Uma vez que a distribuio limite f(x) das medidas de uma certa quantidade x descreve como que os resultados estariam distribudos depois de um n infinito de medidas, ento, se f(x) fosse conhecida partida, poderamos determinar o valor mdio que encontraramos ao fim de muitas medidas. Vimos que a mdia de qualquer n de medidas de uma mesma quantidade x pode ser avaliada por: x = xk Fk
k

onde Fk a frequncia de xk. Na distribuio limite f(x) podemos dividir todo o intervalo de valores em pequenos intervalos dxk, que vo de xk a xk+dxk. A frequncia de valores em cada intervalo pode escrever-se como Fk = f ( xk )dxk . (6.7) No limite, quando todos os intervalos tenderem para o intervalo infinitesimal dx, obtemos, ento:

x = xf ( x )dx ,

(6.8)

que corresponde ao valor esperado para a mdia x da grandeza x se se realizasse um n infinito de medidas. Quanto varincia (e, portanto, ao desvio padro), partindo da definio para um n total de medidas N, 1 N 2 2 = (xi x ) , x N 1 i =1 substituindo os diferentes xi por nkxk e atendendo a que no limite de um n infinito de medidas perde significado a diferena entre N e N-1, vem, seguindo consideraes semelhantes s utilizadas para obter a equao 6.8:

2 = x

n (x
k k

x)

= Fk ( x k x ) = ( x k x ) f ( x k )dx k
2 2 k k

2 = x

(x x )2 f (x )dx ,

(6.9)

que corresponde ao valor esperado para a varincia 2 (e, a partir dele, para o desvio padro x

x ) se se realizasse um n infinito de medidas.


Departamento de Fsica da FCTUC

66

Potrebbero piacerti anche