Sei sulla pagina 1di 48

UNIVERSIDADE CATÓLICA DE

MOÇAMBIQUE - TETE
Faculdade de Gestão de Recursos Naturais e Mineralogia

Apresentacao da cadeira e do
docente aos alunos e vice versa

Docente: Andissene Andissene


Unidade Temática

 Introdução à Estatística
 Estatística Descritiva
 Teoria de probabilidades
 Variáveis Aleatórias Discretas (Distribuição Binomial)
 Variáveis Aleatórias Continuas (Distribuição Normal)
Formas de avaliação

 Assiduidade;
 Participação nas aulas;
 Trabalhos em grupo/individuais;
 Seminários;
 Testes;
 Exames.
Alguma questao
Docente: Andissene Andissene
Introdução a estatística
 Estatística é um conjunto de métodos e processos
quantitativos que servem para colectar, organizar, analisar
ou estudar e interpretar um determinado fenómenos.

 E o objecto de estudo é o dado, com o objectivo de analisar


o mesmo.
Estatística

A estatística divide se em duas partes que são:

 Estatística descritiva - é a parte da estatística que descreve


os dados observados.

 Estatística indutiva ou inferencial - é a parte que tem


como objectivo obter e generalizar conclusões para a
população a partir de uma amostra, isso através do cálculo
de probabilidades.
Estatística
População ou universo – é a colecção de todos os elementos
com uma dada característica comum.
Amostra – é aparte da população que é seleccionada para
análise.
Dado – é a unidade mínima da informação recolhida.
Variável – é a característica relativa a todos indivíduos
observados a qual nos interessa estudar estatisticamente.
Rol – é uma sequência ordenada dos dados sendo de forma
crescente ou decrescente.
Variável
Quantitativas – são os que identificam alguma quantidade ou
característica susceptível a medida e podem ser:

Discretas – podem assumir apenas alguns valores.


Ex: número de maquinarias numa planta e mineração,
número de trabalhadores numa mineração.

Contínuas – podem assumir uma infinidade de valores.


Ex: peso das rochas, temperatura.
Variável
Qualitativas – são aquelas que identificam alguma qualidade,
categoria ou características não susceptíveis a medida, que
podem ser:

Nominais – apenas identificam categorias não existindo


uma ordenação.
Ex: naturalidade, nacionalidade, raça, etc., etc.
Ordinais – que permitem ordenar as categorias.
Ex: qualidade do carvão (baixa, media e alta);
AMOSTRAGEM
É o processo utilizado para seleccionar uma amostra a partir
de uma população. Esta selecção pode ser com ou sem
reposição usando dois tipos de métodos: Amostragem
aleatória/ probabilística e não aleatória/ não probabilística.

Amostra com reposição é aquela em que cada elemento


da população pode ser escolhido mais de uma vez.

Amostra sem reposição nesta, cada elemento da


população não pode ser escolhido mais de uma vez.
Muito obrigado ate a próxima!
Métodos ou Principais Técnicas de
Amostragem

 Amostragem Aleatória - são as que selecionam os indivíduos da


população de forma que todos tenham as mesmas
probabilidades ou chances de participar da amostra.

 Amostragem aleatória simples


 Amostragem sistemática
 Amostragem estratificada
Amostragem aleatória simples
Amostragem Aleatória Sistemática:
 Quando não é possível enumerar as unidades da população, mas
sabendo esta já está ordenada, neste caso escolhe-se todos os n
múltiplos membros.

Exemplo: Suponhamos que numa área de indução tenha 720


colaboradores de uma determinada empresa, dentre os quais
deseja-se uma amostra formada por 30 destes colaboradores.
Amostragem Aleatória Estratificada

 Quando dividimos a população em subgrupos ou extractos


específicos diferentes uns dos outros, mas que juntos formam
a população.
Amostragem Aleatória Estratificada
Exemplo: Deseja-se fazer uma estimativa do tempo médio de
trabalho dos engenheiros de várias categorias de uma empresa
através de uma amostra de tamanho 10. Usando a amostragem
aleatória estratificada seleccione os engenheiros a pertencerem a
tal amostra. Categorias N° de
Trabalhadores

Eng. Minas 30
Geologos 10
Eng. 60
Processamento
Total 100
Amostragem não Aleatória

 Este método é de caracter pragmatico ou intuitivo, ou seja, a


selecção dos indivíduos da população pode ser feita através de
uma opinião pessoal do pesquisador fazendo com que alguns
desses indíviduos não tenha chance de ser escolhido para fazer
parte da amostra.
Tipos de amostras não aleatórias:

 Amostra Intencional é composta por elementos da população


seleccionados intencionalmente pelo investigador, porque este
considera que esses elementos possuem características típicas ou
representativas da população;
Tipos de amostras não aleatórias:

 Amostra por Conveniência os elementos são escolhidos por


conveniência ou por facilidade.
Tipos de amostras não aleatórias:

Amostra “Snowball” é tipo de amostra intensional em que o


investigador escolhe um grupo inicial de indivíduos e pede-lhes o
nome de outros indivíduos pertencentes a mesma população.

Amostragem de Voluntários: Nesse tipo de amostragem, os


elementos da amostra são definidos pela opção do próprio
elemento em participar do processo.
Determinação de Amostra

Três fatores técnicos são considerados no cálculo do tamanho da


amostra:

 a precisão,

 o nível de confiança

 variabilidade da amostra.
Determinação de Amostra

A precisão é determinada pelo desvio do valor da estimativa na amostra


em relação ao verdadeiro valor do parâmetro na população, também
conhecido como margem de erro.

O nível de confiança é um valor de probabilidade complementar ao erro


estatístico. O erro estatístico, por sua vez, é a probabilidade em que a
amostra sorteada não represente a população.

Em relação à variabilidade da amostra, podemos dizer que, quanto mais


homogénea a população, menor será a necessidade de uma amostra
grande. Poucos elementos representam bem a amostra.
Tamanho de amostra em população

Para determinar o tamanho da amostra, pode usar a fórmula de


Yamane (1967).
N
n 2
1  N (e)
Onde:
N – número total da população.
n – tamanho da amostra.
e – nível de significância/margem de erro

Exemplo: Determine o tamanho da amostra usando a fórmula


de Yamane, tendo em conta a margem de erro de 5% num
universo de 1500.
Razões do uso da técnica de amostragem

Infinidade da população
Rapidez/Tempo
Precisão dos resultados
Problemas de acessos
Economia
Instabilidade política
Problemas demográficos
Tabela de distribuição de
frequências
Definição - é uma tabela na qual encontramos os possíveis
valores de uma variável agrupados ou não em classes com as
suas respectivas frequências.

Dados brutos – é o conjunto de dados numéricos obtidos


inicialmente.

Amplitude total ou range (R) – é a diferença entre o maior e o


menor valores observados, dada pela seguinte formula:
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
Tabela de distribuição de
frequências
Frequência absoluta (𝒇𝒊 ) - é o numero de vezes que o elemento
aparece na amostra, ou o numero de elementos pertencentes a
uma classe.

Frequência absoluta acumulada (𝒇𝒂𝒄 ) −é a soma das frequências


absolutas do valor inferiores ou iguais ao valor dado.

Frequência relativa (𝒇𝒓 ) - é a percentagem ou proporção da quele


valor da amostra ou categoria em relação ao numero total de
𝑓𝑖
observações, ou seja: 𝑓𝑟 =
𝑛
Distribuição de frequências de
dados não agrupados
Exemplo: Apos o desflorestamento numa determinada área
devido a exploração de um determinado minério, a empresa
responsável investiu na plantação na mesma área onde foi
constatada a seguinte quantidade plantada diariamente:
14 12 11 14 13
12 14 13 11 12
12 14 10 15 11
15 13 16 14 14
a) Faça o rol
b) Ache a amplitude total
c) Faça a distribuição das frequências
Distribuição de frequências de
dados agrupados
Número de classes (K) – não há uma formula exacta para o calculo
de numero de classes mas 𝐾 = 5 𝑝𝑎𝑟𝑎
𝑛 ≤ 25 𝑜𝑢 𝐾 ≅ 𝑛 𝑝𝑎𝑟𝑎 𝑛 > 25.

Já a formula de Sturges 𝐾 ≅ 1 + 3,22 log 𝑛 em que


𝑛 = 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎.

Exemplo:
𝑛 = 49, 𝑒𝑛𝑡𝑎𝑜 𝐾 = 49 = 7 𝑜𝑢 𝐾 ≅ 1 + 3,22 log 49 ≅ 7

Amplitude das classes (h): ℎ = 𝑅 ÷ 𝐾


Distribuição de frequências de
dados agrupados
Limite das classes
I. 6 ⊢⊣ 10 𝑜𝑢 [6; 10]
II. 6 ⊢ 10 𝑜𝑢 [6; 10[
III. 6 − 10 𝑜𝑢 ]6; 10[
IV. 6 ⊣ 10 𝑜𝑢 ]6; 10]

Ponto médio ou marca da classe – é a media aritmética


entre o limite inferior e o superior da classe.
10+12
Exemplo: Se 10 ⊢ 12, teremos 𝑋𝑖 = = 11, como o
2
ponto médio.
Distribuição de frequências de
dados agrupados
Exemplo: Suponhamos que uma certa empresa teria exportado
para os países vizinhos as seguintes quantidades em (toneladas) do
seu minério processado como mostra os seguintes dados em rol:

150 154 155 157 160 161 162 164 166 169

151 155 156 158 160 161 162 164 167 170

152 155 156 158 160 161 163 164 168 172

153 155 156 160 160 161 163 165 168 173
Representação gráfica de dados
não agrupados em classe
Exemplo: Apos o desflorestamento numa determinada área devido a
exploração de um determinado minério, a empresa responsável investiu na
plantação na mesma área onde foi constatada a seguinte quantidade
plantada diariamente :

xi fi fr(%) fac F(%)


10 1 5 1 5
a) Represente graficamente 11 3 15 4 20
12 4 20 8 40
13 3 15 11 55
14 6 30 17 85
15 2 10 19 95
16 1 5 20 100
∑ 20 100
Representação gráfica de dados
não agrupados em classe
Gráfico de reflorestamento
7

4
fi
3

0
10 11 12 13 14 15 16
Quantidades
Representação gráfica de dados
não agrupados em classe
Gráfico de reflorestamento
16
Q
u 15
a
n 14
t
i 13
d
a 12
d
e 11
s
10

0 1 2 3 4 5 6 7
fi
Representação gráfica de
dados agrupados em classe

Histograma – é a representação gráfica de uma distribuição de


frequências por meio de rectângulos justapostos.

Polígono de frequências – é a representação gráfica de uma


distribuição por meio de um polígono.
Representação gráfica de
dados agrupados em classe

Suponhamos que uma certa empresa teria exportado para os


países vizinhos as seguintes quantidades em (toneladas) do seu
minério processado como mostra a tabela a seguir:

Represente-os graficamente.
Representação gráfica de
dados agrupados em classe
quantidades
em
(toneladas) xi fi fr(%) fac F(%)

150 Ⱶ 154 152 4 10 4 10

154 Ⱶ 158 156 9 22.5 13 32.5

158 Ⱶ 162 160 11 27.5 24 60

162 Ⱶ 166 164 8 20 32 80

166 Ⱶ 170 168 5 12.5 37 92.5

170 Ⱶ 174 172 3 7.5 40 100


∑ ___ 40 100 ____
Representação gráfica de
dados agrupados em classe
Gráfico do minério exportado
12

10

fi 6

0
150 Ⱶ 154 154 Ⱶ 158 158 Ⱶ 162 162 Ⱶ 166 166 Ⱶ 170 170 Ⱶ 174
Quantidades (toneladas)
Representação gráfica de
dados agrupados em classe
Gráfico do minério exportado
12

10

fi 6

0
150 Ⱶ 154 154 Ⱶ 158 158 Ⱶ 162 162 Ⱶ 166 166 Ⱶ 170 170 Ⱶ 174
Quantidades (toneladas)
Medidas de tendência central
de dados não agrupados
Media aritmética simples – é o conjunto de todos o valores
𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ao quociente que se obtém da soma de todos os
valores pelo efectivo numero total n.

𝑥𝑖
Simbolicamente, 𝑥 =
𝑛

Exemplo: Calcule a media aritimetica dos


seguintes dados: 3, 7, 8, 12, 15.
Medidas de tendência central
de dados não agrupados
Media aritmética ponderada – se uma variável discreta toma os
valores 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 com a suas respectivas frequências absolutas
𝑓1 , 𝑓2 , 𝑓3 , … , 𝑓𝑛 respectivamente, a media aritmética é dada por:

𝑓𝑖 𝑥𝑖 xi fi fr(%) fac F(%)


𝑥= 10 1 5 1 5
𝑛 11 3 15 4 20
12 4 20 8 40
Exemplo: Calcule a media
13 3 15 11 55
aritmética dos s dados ao 14 6 30 17 85
lado: 15 2 10 19 95
16 1 5 20 100
∑ 20 100
Moda

Moda (𝑴𝒐 ) - é o valor da variável que corresponde a maior


frequência. Portanto, existem series estatísticas com duas modas
(bimodal), com três (trimodal), etc. E também existem series em
que não existe a moda.

Para o exemplo anterior a moda é a variável 14 (𝑴𝒐 = 𝟏𝟒) pois, a


sua 𝒇𝒊 = 𝟔 que é a maior de todas as outras.
Mediana

Mediana 𝑴𝒆 𝒐𝒖 (𝒙) – quando colocados em ordem crescente,


a mediana é o valor que divide a amostra ou a população em
duas partes iguais. Assim:

𝑛+1
Se n for impar, a mediana será o elemento central de ordem
2
caso contrario, ou seja se for par, a mediana será a media entre
𝑛 𝑛
os elementos centrais de ordem e + 1.
2 2
Mediana

xi fi fr(%) fac F(%)


10 1 5 1 5
11 3 15 4 20
12 4 20 8 40
13 3 15 11 55
14 6 30 17 85
15 2 10 19 95
16 1 5 20 100
∑ 20 100
Medidas de tendência central de
dados agrupados em classes

Media aritimética ponderada

𝑓𝑖 𝑥𝑖
𝑥=
𝑛
Medidas de tendência central de
dados agrupados em classes
𝑛
Mediana 2
− 𝑓
𝑥 = 𝑙𝑀𝑑 + ×ℎ
𝑓𝑀𝑑

Onde:
𝑙𝑀𝑑 – limite inferior da classe mediana
𝑛 – tamanho da amostra ou numero de elementos
𝑓 – somatório de todas as frequências absolutas
anteriores a classe mediana
𝑓𝑀𝑑 – Frequência absoluta da classe mediana
ℎ - Amplitude da classe mediana
Medidas de tendência central de
dados agrupados em classes

Moda 𝑀𝑜 = 𝑙 +
∆1
×ℎ
∆1 + ∆2

Onde:
𝑙 – Limite inferior da classe modal
∆1 − diferença entre a frequência absoluta da classe
modal e a frequência absoluta da classe anterior
∆2 − diferença entre a frequência absoluta da classe
modal e a frequência absoluta da classe seguinte
ℎ − amplitude da classe modal
Exemplo:
 Calculemos as medidas anteriormente referidas para o exemplo
referente a tabela abaixo.
quantidades
em
(toneladas) xi fi fr(%) fac F(%)

150 Ⱶ 154 152 4 10 4 10

154 Ⱶ 158 156 9 22.5 13 32.5

158 Ⱶ 162 160 11 27.5 24 60

162 Ⱶ 166 164 8 20 32 80

166 Ⱶ 170 168 5 12.5 37 92.5

170 Ⱶ 174 172 3 7.5 40 100


∑ ___ 40 100 ____
Muito obrigado!

Potrebbero piacerti anche