Sei sulla pagina 1di 39

PORTFÓLIO

Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Geografia e Planeamento

PORTFÓLIO

NELSON LABRUJÓ

A60367

Este trabalho contém 39 folhas (incluída esta capa)

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
1
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

 Introdução:

Foi para dar cumprimento do Programa da Unidade Curricular de Introdução à Estatística, que
inicialmente se decidiu elaborar este trabalho.

Sendo o Portfólio, também, uma ferramenta de auxílio na aprendizagem do formando, é com


esse, agora, objectivo principal que me irei dedicar ao longo dos próximos textos.

Aproveitando toda a pesquisa por mim já feita, bem como todo o material disponibilizado pela
Docente ao longo deste tempo, encaro este trabalho como um reforço fundamental na aquisição
de conhecimento e como um auxiliar, um manual, de consulta futura.

Trabalhoso este sistema de trabalho, não me coíbe no entanto de o levar a cabo, pois está posto
de parte qualquer copy-paste de material existente, querendo isso sim, aprender e registar essa
aprendizagem nestas páginas.

Não encaro à priori este trabalho estanque, mas sim aberto a novas actualizações, pois tal como
mencionei anteriormente o mesmo é encarado como uma ferramenta de aglutinação de
conhecimento com o fim último de enriquecimento do meu saber.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
2
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

 Estrutura e Organização:

Como fio condutor dos conteúdos do trabalho é o Programa da Unidade Curricular, o que permite
uma melhor leitura e acompanhamento.
Neste primeiro Portfólio, vulgo T1pfolioESTdez2010, os temas em análise iniciam com a Estatística
Descritiva e termina na Medida de Dispersão.

No final da explicação de cada item é indicada a fonte originária da informação.

São também colocados no final de cada item exemplos para melhor compreensão (da Docente e
do Aluno)

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
3
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

 Apresentação:

Sou o aluno n.º A60367 inscrito no curso de Geografia e Planeamento ministrado na Universidade
do Minho em Guimarães.

Sou natural e residente em Valença do Minho e nasci em 1969.

Desde o inicio da minha vida profissional em 1988 que sou empregado de escritório, com funções
em diversas áreas o que me permitiu e permite uma abrangência de conhecimentos em várias
áreas.

A nível académico terminei o secundário em 1991 sendo que só agora ficaram reunidas todas as
condições para poder frequentar um curso superior.

Quanto a formação complementar, desde 1993 que tenho realizado alguma actualização de
conhecimentos frequentando acções de formação, sendo possuidor neste momento de Curso de
Aptidão Profissional ao nível da formação.

No que respeita a conhecimentos informáticos, possuo alguma experiência ao nível de Word,


Excel e Acess na óptica do utilizador, que me permitem tirar partido destas aplicações para uso
profissional e também a nível académico.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
4
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

 Conteúdos:
Os componentes deste primeiro Trabalho (T1), são os que sumariamente se indicam e
seguem a lógica do Programa da Unidade Curricular.

Introdução á Estatística Descritiva;


Introdução á Estatística Inferencial;
Dados, sua organização e tipo de distribuição;
Medidas de tendência Central;
Medidas de Localização;
Medidas de Dispersão.

 Objectivos:

Cumprir o estabelecido no Plano Curricular da disciplina;

Auxiliar o estudo da matéria da Unidade Curricular;

Construção de manual dinâmico para actualização, e utilização futura.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
5
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

ESTATÍSTICA DESCRITIVA:

Segundo definição no Dicionário de Estatística da Universidade de Lisboa Estatística Descritiva é cit. “Ramo
da Estatística que tem por finalidade descrever certas propriedades relativas a um conjunto de dados.”
Fonte: http://www.educ.fc.ul.pt/icm/icm2003/icm24/dicionario.htm

ESTATÍSTICA INFERENCIAL OU INDUTIVA:

Segundo definição no Dicionário de Estatística da Universidade de Lisboa Estatística Inferencial é cit. “Ramo
da Estatística que procura inferir propriedades da população a partir de propriedades verificadas numa
amostra da mesma”
Fonte: http://www.educ.fc.ul.pt/icm/icm2003/icm24/dicionario.htm

ETAPAS DO MÉTODO ESTATÍSTICO

Num estudo estatístico existem um conjunto de passos que devem ser realizados por forma a dar
ao trabalho uma estrutura sólida de desenvolvimento do trabalho.

Esses passos designar-se-ão por Fases ou Etapas, a saber:

Definição do Problema – Nesta fase/etapa, a correcta identificação do problema a investigar é


fundamental para que o todo o trabalho seguinte seja o mais correcto possível. As Variáveis
(características) a estudar têm de ser bem definidas, claras.
Exemplos: Altura de um grupo de alunos, Peso de um grupo de habitantes de uma povoação,
Frequência de batimentos cardíacos de um grupo de indivíduos, etc…;

Planificação dos trabalhos – Depois de definido o problema, é necessário determinar o processo


de como obter as informações, sobre a variável ou variáveis (características) a estudar; É nesta
fase/etapa que se define se se opta pela Observação da População/Universo ou pela Amostra
É aqui também que se define que tipo de processo de recolha se vai utilizar para obter os dados,
seja através de Questionários, Observação, Pesquisa bibliográfica, etc.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
6
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Recolha de dados – Nesta fase/etapa são colhidos os dados ou feitas as observações das variáveis
através de um dos seguintes processos, Questionários, Observação, Pesquisa bibliográfica, etc.

Organização de dados – É aqui que depois de recolhidos os dados, os mesmos são tratados, por
forma a permitir uma análise dos mesmos. Neste tratamento os mesmos são contados e
agrupados o que vai facilitar o estudo da(s) variáveis(s) a estudar.

Apresentação de dados – Há duas formas de apresentar os dados, por Gráficos ou por Tabela, não
se eliminando uma à outra, pelo contrário as mesmas complementam-se, pois foram
desenvolvidos métodos de análise apenas pelo aspecto gráfico de curvas e linhas.

Análise e Interpretação de dados – Momento final de todo o processo investigatório, no qual são
interpretados os resultados através da obtenção de novos números (Medidas de Tendência
Central, de Dispersão, de Simetria, de Localização) os quais também têm expressão gráfica, para
uma melhor análise e interpretação. Pode-se entrar aqui na Estatística Inferencial ou Indutiva, pois
os mesmos poder-nos-ão permitir efectuar generalizações.
Fonte:http://webcache.googleusercontent.com/search?q=cache:JFJ1Swr7IygJ:www.esev.ipv.pt/mat1ciclo/textos/Textos_apteorico/fases%2520do
%2520m%C3%A9todo%2520estat%C3%ADstico.doc+fases+do+metodo+estatistico&cd=2&hl=pt-PT&ct=clnk&gl=pt

FONTES PRIMÁRIAS, FONTES SECUNDÁRIAS e FONTES TERCIÁRIAS


Fonte, por definição aqui aplicada à estatística, é pessoa, instituição ou documento que constitui a
origem da informação. Assim, poderemos ter dois tipos de fonte, ou seja, origens de informação
de três níveis.
A necessidade de distinguir Tipos de Fontes é necessário, pois para garantir o rigor da informação
em alguns trabalhos é exigida a consulta de fonte primárias. Conforme a informação se vai
distanciando da origem mais corrompida a informação fica.
Fonte: http://www.bib.uevora.pt/1-1-

Fontes Primárias:
Estas são as Fontes que contêm a informação original, são os primeiros emissores de dados.
Exemplos: Questionários, Inquéritos, Entrevistas, Livros e artigos que apresentem ideias originais,
Autobiografias, Diários, Artigos de jornal quando escritos na altura dos acontecimentos, etc.
Fonte: http://www.bib.uevora.pt/1-1-

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
7
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Fontes Secundárias:
Fontes que analisam, interpretam e comentam as fontes primárias. Os seus dados não são
originais, são isso sim, uma evolução destes, houve uma intervenção nos mesmos que se traduz
numa apresentação de novos dados.
Exemplo: Bibliografia, Artigos de jornal quando acrescentam comentário ou opinião, Directórios,
etc.
Fonte: http://www.bib.uevora.pt/1-1-

Fontes Terciárias:
Obras especializadas que, grosso modo, repertoriam, seleccionam, e organizam informações de
fontes primárias e secundárias.
Exemplo: Dicionários, Enciclopédias.
Fonte: http://www.bib.uevora.pt/1-1-

Para este trabalho estão a ser utilizadas apenas Fontes Secundárias e Fontes Terciárias.

POPULAÇÃO e AMOSTRA

População ou Universo:
Designa-se assim, o conjunto de indivíduos ou unidades que possuem pelo menos uma
característica comum entre sí.
Exemplo: Alunos do 1º ano do curso de Geografia da UM, Fogos da Freguesia de Valença, etc.

Amostra
É um subconjunto finito da População/Universo, que permite o investigador estudar a População
sem ter de usar todos os indivíduos ou unidades da mesma.
Exemplo: 10 % dos Alunos do 1º ano do curso de Geografia da UM, 15% dos Fogos da Freguesia de
Valença, etc.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
8
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

1.4 - TIPOS DE AMOSTRA

A Amostra pode ser Representativa ou Viciada.


tipo de amostra cada um dos indivíduos ou unidades, têm a mesma probabilidade de vir a ser
incluído na amostra, pois o procedimento de selecção dá à priori a mesma probabilidade a todos
eles.
Amostra Representativa – Neste caso a Amostra é possuidora de todas as características da
População/Universo, o que vai permitir que a generalização das conclusões sejam mais próximas
da realidade.
Fonte: http://pt.wikipedia.org/wiki/Amostra_aleat%C3%B3ria

Exemplo:
Neste tipo de amostra existe um critério mais ou menos subjectivo que permite a inclusão de
determinados indivíduos ou unidades na amostra. Não se conhece a probabilidade dos
indivíduos/unidades fazerem parte da amostra
Amostra Não Representativa ou Enviesada – Ocorre quando a Amostra não inclui pelo menos
uma característica da População/Universo, isto faz com que as generalizações sejam erróneas e
não adequadas à realidade.

Fonte: http://pt.wikipedia.org/wiki/Amostra_aleat%C3%B3ria

Exemplo:

1.4 - TIPOS DE AMOSTRAGEM

Para que seja definida a Amostra, ou seja, os indivíduos / unidades da população/universo a


estudar, é necessário aplicar um método. Assim temos algumas formas de efectuar essa tarefa,
dependendo também de como estão organizados os indivíduos/unidades. Apresentam-se a seguir
apenas 3.

Amostragem Casual ou Aleatória Simples – Equivalente a um sorteio lotérico. Na prática, ela pode
ser feita numerando-se a população de 1 a n+1 e depois sorteando-se, por meio de um dispositivo
aleatório qualquer, k números desta sequência, os quais corresponderão aos seres que pertencem
à amostra.
Exemplo: arranjar uma amostra representativa para a pesquisa da altura de 70 alunos de uma
escola.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
9
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

a) numeramos os alunos de 01 a 70
b) escrevemos esses números de 01 a 70 em papéis e colocamo-los numa caixa; depois tiramos 7
números que formarão a amostra, nesta caso, 10% da população.
O pesquisador pode tirar qualquer número, desde que seja por sorteio. Mas este tipo de sorteio é
muito atribulado quando o número de elementos da amostra é grande. Por isso, foi criada a
Tabela de Números Aleatórios, que varia de bibliografia em bibliografia. Para conseguirmos os
individuos/unidades da amostra usando a Tabela, sorteamos um algarismo qualquer dela, a partir
do qual consideramos quantos algarismos dali vamos precisar. Serão estes os elementos da
amostra. A leitura da tabela pode ser feita de qualquer forma, desde que antes de principiado o
procedimento. Para o nosso caso dos alunos, consideramos uma linha, tomando os números de 2
algarismos, por exemplo esta linha:
61 02 01 81 73 92 60 66 72 58 53 34
Evidentemente, os números 72, 73, 81 e 92 não servirão pois não constam na população, assim
como devemos tirar o número que se repete. Então, temos:
61 02 01 60 66 58 53 (só os sete da amostra, o 34 ficou de fora pois
seria o 8º)
Mede-se a altura destes 7 alunos e tem-se uma amostra da estatura dos 70.
É o próprio pesquisador que pode sortear os números. A Tabela é tanto mais útil quando maior for
o número de indivíduos/unidades da amostra.
Fonte: http://recantodasletras.uol.com.br/visualizar.php?idt=72156

Amostragem Proporcional Estratificada - Muitas vezes a população se divide em subpopulações,


que são os estratos. Como é admissível que a variável em estudo mostre, de estrato em estrato,
uma conduta heterogênea e, dentro de cada estrato, um conduta homogênea, é bom que o
sorteio dos seres da amostra veja a importância tais estratos. Esta amostragem, além de ver que
os estratos existem, arruma os elementos da amostra de forma proporcional ao número de
elementos do mesmo.

Exemplo: julgando, ainda no exemplo anterior, que dos 70 alunos, 42 sejam homens e 28 sejam
mulheres, vamos obter a amostra proporcional estratificada, sendo que são dois os estratos (os
dois sexos) e queremos uma amostra de 10% dos 70. Logo, temos:

a)

SEXO POPULAÇÃO 10% AMOSTRA

Masculino 42 10 . 42 : 100 = 4,2 4

Feminino 28 10 . 28 : 100 = 2,8 3

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
10
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Total 70 10 . 70 : 100 = 7,0 7

b) Numeramos de 01 a 42 os homens e de 43 a 70 as mulheres. Tomando na Tabela de


Números Aleatórios outra linha qualquer, temos, por exemplo:
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40

Temos, então:

Os alunos de número 28 22 18 03 (para os homens)


Os alunos de número 57 56 53 (para as mulheres)

Fonte: http://recantodasletras.uol.com.br/visualizar.php?idt=72156

Amostragem Sistemática – Estando já os indivíduos/unidades da população ordenados, não é


preciso fazer um código de referência, como exemplo temos linhas de produção, prédios numa
rua, etc. Nestes casos, a selecção dos elementos que formarão a amostra pode ser feita por um
sistema aplicado pelo pesquisador.

Exemplo: numa avenida com 400 prédios, desejamos conseguir uma amostra formada de 20
destes prédios. Então, neste caso, fazemos assim: como 400 : 20 = 20, sorteamos um número de 01
a 20, que seria o primeiro elemento seleccionado para a amostra. Os demais elementos seriam
contados de 20 em 20. Assim, se o número sorteado fosse o 09, tomaríamos, por um lado da
avenida, o 9º prédio, o 29º, o 49º, o 69º..., até voltarmos ao início da avenida, pelo outro lado.
Fonte: http://recantodasletras.uol.com.br/visualizar.php?idt=72156

1.6 DADOS (BRUTOS, AGRUPADOS E NÃO AGRUPADOS)

Dados, são as informações recolhidas pelo investigador na 3ª fase/etapa do Método Estatístico.


Estes Dados podemos classificá-los em 3 tipos.

Dados Brutos – São dados sem qualquer tipo de tratamento, resultam directamente das
observações realizadas junto da Amostra.
Exemplo: Os resultados do questionário efectuado aos alunos do curso de GeP da UM

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
11
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Dados Agrupados – São dados que, após uma manipulação do investigador sobre os Dados Brutos,
se encontram agrupados em classes ou grupos, aquando da fase 4 do Método Estatistico,
Organização de Dados.
Exemplo: Numa Tabela de Frequências do questionário ao alunos do curso de GeP da UM, a coluna
de Frequências Acumuladas, ou a coluna de Frequência Absolutas das variáveis em classes
eventualmemte criadas.

Dados Não Agrupados – São dados que, após uma intervenção do investigador nos Dados Brutos,
se encontram apresentados de forma ordenada, mas sem qualquer tipo de aglutinação.

Exemplo: Numa Tabela de Frequências do questionário ao alunos do curso de GeP da UM, a coluna
de Frequências Absolutas de cada variável por cada individuo/unidade da amostra.

TIPOS DE ANÁLISE (Univariada, Bivariada e Multivariada)


Por Análise entende-se o acto praticado na 4ª fase do Método Estatístico (Análise/Interpretação)
dos dados obtidos e que, tal como vimos no item anterior, já se encontram organizados de forma
digamos que inteligível e assim, susceptível de poder ser interpretada e analisada.

Análise Univariada – É a interpretação de apenas uma variável isoladamente, seja ela única ou
não no estudo em causa, mas que entre esta e todas as outras não exista dependência. Ou seja,
entre as variáveis não poderá existir uma relação de complementaridade ou outro tipo de
influência. Assim, poder-se-á fazer a interpretação dos dados fornecidos para essa variável e poder
arriscar generalizações para a População.

Exemplo: Num estudo aos alunos de GeP do 1º ano da UM, as variáveis em causa eram, Idade,
Local de Residência. Estas variáveis entre si não se influenciam mutuamente, pelo que as
conclusões a retirar da análise de cada uma delas isoladamente são válidas.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
12
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Análise Bivariada - É a interpretação de apenas duas variáveis. Entre elas existe uma relação de
complementaridade ou outro tipo de influência. Assim, a interpretação dos dados fornecidos para
essas duas variáveis permite efectuar generalizações para a População.

Exemplo: Num estudo aos alunos de GeP do 1º ano da UM, as variáveis em causa eram, Idade,
Local de Residência, Médias obtidas no Ensino Secundário, Gosto pelo. Estas variáveis entre si não
se influenciam mutuamente, pelo que as conclusões a retirar da análise de cada uma delas
isoladamente são válidas.

Análise Multivariada - É a interpretação e análise de mais do que duas variáveis as quais por si só
poderão não ter significado mas que em conjunto sim que o obterão. Deste modo os dados
interpretados por este tipo de análise podem explicar, ou por outra, inferirimos sobre o fenómeno
e extrapolamos conclusões a aplicar à População.

Exemplo: Num estudo aos alunos de GeP do 1º ano da UM, as variáveis em causa eram, Idade,
Local de Residência, Médias obtidas no Ensino Secundário, Gosto pelo. Estas variáveis entre si não
se influenciam mutuamente, pelo que as conclusões a retirar da análise de cada uma delas
isoladamente não são válidas. No entanto se as analisarmos entre elas poderemos tirar ilações.

1.9 TIPOS DE VARIAVEIS, ESCALAS DE MEDIÇÃO E TRATAMENTO DE DADOS


1.9.1 TIPOS DE VARIÁVEIS (QUALITATIVAS e QUANTITIVAS)
Variáveis Qualitativas – São as características que não possuem valores quantitativo, mas por sua
vez possuem são definidas por várias categorias, ou seja, representam uma classificação dos
indivíduos. Não podem ser expressas numericamente, pois relacionam situações como a cor da
pele, cor dos olhos, marca de refrigerante, marca de automóvel, preferência musical entre outras.
Elas podem ser divididas em ordinais e nominais.
Fonte: http://leg.ufpr.br/~shimakur/CE055/node8.html e http://www.mundoeducacao.com.br/matematica/variaveis-na-estatistica.htm

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
13
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Variáveis Qualitativas Ordinais – Estas variáveis, apesar de não serem numéricas, obedecem a
uma relação de ordem, ou seja, existe uma ordenação dentro da categoria.
Exemplo: conceitos como óptimo, bom, regular e ruim, classe social, grau de instrução, mês de
observação (Janeiro, Fevereiro, Março,…) etc.
Fonte: http://leg.ufpr.br/~shimakur/CE055/node8.html e http://www.mundoeducacao.com.br/matematica/variaveis-na-estatistica.htm

Variáveis Qualitativas Nominais – Já as variáveis qualitativas nominais não estão relacionadas à


ordem, elas são identificadas apenas por nomes,
Exemplo, as cores: vermelho, amarelo, preto, azul, rosa, verde, etc. As marcas de carros, nome de
bebidas, local de nascimento, entre outros
Fonte: http://leg.ufpr.br/~shimakur/CE055/node8.html e http://www.mundoeducacao.com.br/matematica/variaveis-na-estatistica.htm

Variáveis Quantitativas – São as características que podem ser medidas numa escala quantitativa,
ou seja, apresentam valores numéricos que fazem sentido. É usada a representação numérica. Elas
podem ser classificadas em discretas e contínuas.
Fonte: http://leg.ufpr.br/~shimakur/CE055/node8.html e http://www.mundoeducacao.com.br/matematica/variaveis-na-estatistica.htm

Variáveis quantitativas discretas ou descontinuas - Acontecem relacionadas a situações limitadas.


Pode-se dizer também que características mensuráveis que podem assumir um valor finito ou
infinito cantável de valores. Geralmente são o resultado de contagens.
Exemplo: número de revistas vendidas, quantidade de consultas médicas, número de filhos de um
casal, numero de cigarros fumados por dia, etc.
Fonte: http://leg.ufpr.br/~shimakur/CE055/node8.html e http://www.mundoeducacao.com.br/matematica/variaveis-na-estatistica.htm

Variáveis quantitativas contínuas – Nestas características a abrangência pertence a um intervalo


que se caracteriza por valores infinitos e que podem assumir valores numa escala contínua.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
14
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Exemplo, o peso de um produto, altura dos alunos de uma escola, velocidade de objetos, idade,
pressão arterial, tempo (relógio), outras situações.
Fonte: http://leg.ufpr.br/~shimakur/CE055/node8.html e http://www.mundoeducacao.com.br/matematica/variaveis-na-estatistica.htm

1.9.2 ESCALAS DE MEDIÇÃO


Escalas de Medição - São escalas de medição de atributos qualitativos e quantitativos. Estas
podem ser de vários tipos:

Fonte: http://pt.shvoong.com/exact-sciences/statistics/1897465-escalas-medi%C3%A7%C3%A3o/

Escalas binárias ou dicotómicas. Estas escalas medem atributos que têm apenas
dois valores:
Exemplo, SIM OU NÃO; MORTO OU VIVO; PRESENTE OU AUSENTE; HOMEM OU MULHER; etc.

Fonte: http://pt.shvoong.com/exact-sciences/statistics/1897465-escalas-medi%C3%A7%C3%A3o/

Escalas categoriais ou nominais. Estas escalas são utilizadas para organizar dados segundo
categorias mutuamente exclusivas e exaustivas. Medem atributos com mais de dois
valores não numéricos e com ordem de grandeza arbitrária, ou seja, os atributos (estado civil,
religião, cor do cabelo...) não estão relacionados numericamente entre si. Nas escalas categoriais
ou nominais as categorias ou nomes são mutuamente exclusivos, ou seja, cada elemento é
incluído numa única categoria.
Exemplo,. ESTADO CIVIL, RELIGIÃO, COR DO CABELO,

Fonte: http://pt.shvoong.com/exact-sciences/statistics/1897465-escalas-medi%C3%A7%C3%A3o/

Escalas ordinais. - Estas escalas são utilizadas para atribuir um valor numérico a pessoas ou
objectos que se classificam em categorias segundo uma ordem de grandeza mas não quantificam
a diferença entre os valores consecutivos.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
15
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Exemplo,

Fonte: http://pt.shvoong.com/exact-sciences/statistics/1897465-escalas-medi%C3%A7%C3%A3o/

Escalas de intervalos. Estas escalas medem atributos com mais de dois valores numéricos que têm
intervalos iguais e que podem ser ordenados.
Exemplo,

Fonte: http://pt.shvoong.com/exact-sciences/statistics/1897465-escalas-medi%C3%A7%C3%A3o/

Escala de razão, escala racional ou escala de proporção. É uma escala de intervalos que, para além
de possuir valores conhecidos entre os seus intervalos, estabelece a relação entre dois valores em
relação a zero. Nesta escala são possíveis todas as operações aritméticas (somas, subtrações,
divisões e multiplicações), porque o zero tem significado.
Exemplo,

Fonte: http://pt.shvoong.com/exact-sciences/statistics/1897465-escalas-medi%C3%A7%C3%A3o/

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
16
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

3 ORGANIZAÇÃO DOS DADOS. TIPOS DE DISTRIBUIÇÕES


Os Dados, valores obtidos após a investigação junto da População ou Amostra, têm de ser
organizados por forma a se tornarem inteligíveis, o que irá depois permitir a sua interpretação.

Organização dos Dados – Após serem obtidos os dados os mesmos são objecto de uma
intervenção do investigador. Essa intervenção tem como objectivo último, que os mesmos se
tornem interpretáveis. Assim os dados podem organizar-se em Dados ordenados e/ou agrupados,
os quais se podem apresentar em Tabelas e em Gráficos. Sob estas formas de apresentação é
possível “trabalhar” os dados e deles obter informações, que de outra forma seria impossível.

3.1.1 Frequências Absolutas – É o numero de ocorrências de determinada variável, durante o


estudo da amostra.
Exemplo, VER QUADRO N.º 1
3.1.2. Frequências Acumuladas – Após a ordenação crescente dos dados da variável, somando o
número de ocorrências de cada dado às ocorrências do dado ao anterior obtém-se as Frequências
Acumuladas da amostra.
Exemplo,VER QUADRO N.º 1

3.2.1 Frequências Relativas – São as Frequências Absolutas apresentadas sob a forma de


percentagem.
Exemplo,VER QUADRO N.º 1

3.2.2. Frequências Relativas Acumuladas – São as frequências Acumuladas apresentadas sona a


forma de percentagem
Exemplo,VER QUADRO N.º 1

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
17
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Exemplo,
População: Alunos de GeP da UM 1º ano
Amostra: Alunos que estão inscritos na disciplina Introdução à Estatística
Variável: Notas obtidas em Introdução à Estatística no 1º Semestre
Dados obtidos: 11, 13, 11, 15, 16, 12, 11, 14, 15, 18

QUADRO 1

Alunos Classificações Frequência Frequência


Absoluta Acumulada
Carlos 9 1 1
António 11 1 2
Geraldino 17 1 3
Fábio 12 1 4
Bela 13 1 5
Isidoro 14 1 6
João 15 1 7
Deolinda 10 1 8
Ernesto 16 1 9
Hermenegildo 19 1 10

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
18
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

3.3 ANÁLISE DE DADOS


Os dados depois de obtidos junto da População ou Amostras, são organizados o que permite a sua
análise e interpretação, por parte do investigador.
Para a análise concorrem várias factores, tais como as Medidas de Tendência Central, as Medidas
de Localização ou as Medidas de Dispersão. A leitura destes medidas tanto pode ser feita através
de algarismos resultantes de fórmulas matemáticas, como também, e muito mais intuitivo, de
forma gráfica. Ao serem mostrados de forma gráfica os resultados das fórmulas matemáticas, a
sua leitura torna-se muito mais expressiva, e de compreensão muito mais célere.
Estes vários tipos de mensuração permitem extrair informações dos dados iniciais e assim
extrapolar as conclusões para toda a população, ou seja, permitindo explicar um determinado
fenómeno que ocorre nessa população, entramos assim no campo da Estatística Indutiva ou
Inferencial.

3.4 REPRESENTAÇÃO GRÁFICA, TIPOS DE GRÁFICOS. REGRAS DE


CONSTRUÇÃO

3.4.1. Representação Gráfica – Tal como já mencionei no ponto 3.3 a representação Gráfica
permite uma análise e interpretação dos dados muito mais intuitiva, célere e aprofundada. O
desenho de curvas, linhas, pontos, pictogramas e outros num gráfico permitem uma leitura
imediata dos dados e mais ainda, da correlação que poderá existir entre as várias Medidas e
Variáveis. A inteligibilidade desta forma de apresentação é excelente, pois o investigador fica
liberto para uma análise mais elaborada, uma vez que não consome tantos recursos em execução
de análise de resultados de fórmulas matemáticas. Se bem que as tenha que realizar a
interpretação dos resultados é muito mais explicito e não exige tanta abstracção.

3.4.2 Tipos de Gráficos – Existem vários tipos de gráficos que podem ser usados em Estatística
para apresentação dos dados. Uns adaptam-se melhor que outros em função do tipo de
informações que se pretendem obter. Como informação complementar fica também registado de
que existem dois grupo de gráficos, a saber, Gráficos Planos e Gráficos em 3D. Focarnos-e-mos
principalmente no grupo dos Gráficos Planos, por ser mais adequado ao trabalho em causa.

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
19
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

GRÁFICOS PLANOS:

GRÁFICOS DE BARRAS (vantagens)


Classificações por Aluno
Hermenegildo

Ernesto

João

Deolinda

Isidoro

Bela CLASSIFICAÇÕES

Fábio

Geraldino

Carlos

António

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
20
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

GRÁFICOS DE COLUNAS

Classificações por Aluno


20
19
18
17
16
15
14
13
12
11
10
9
8
CLASSIFICAÇÕES
7
6
5
4
3
2
1
0

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
21
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

HISTOGRAMA

Classificações por Aluno


20
19
18
17
16
15
14
13
12
11
10
9
8
7 CLASSIFICAÇÕES
6
5
4
3
2
1
0

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
22
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

GRÁFICOS EM 3D

PICTOGRAMA
19

18
CLASSIFICAÇÕES

17

16

15

14

13

12

11

10

0 A B C D E F G H I J

ALUNOS

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
23
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

4 MEDIDAS DE TENDÊNCIA CENTRAL (Média, Moda e Mediana)

4.1 Média Aritmética Simples – A media aritmética resulta da soma de todas as observações e
dividindo-se essa soma pelo número total de observações.
Fonte: http://www.uff.br/cdme/medidasposicao/medidasposicao-html/MedidasDePInt.html

4.1.1 FÓRMULAS Para Dados Populacionais e/ou Amostrais Não Agrupados

4.1.1.1 Fórmula para População

Xi – Valores Observados
N – Tamanho da População

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
24
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

4.1.1.2 Fórmula para Amostra

– Valores Observados
n – Tamanho da População

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
25
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

4.1.2 FÓRMULAS Para Dados Populacionais e/ou Amostrais Agrupados/Classificados

– É a Média Amostral

– É a Média populacional

– São os valores dados

– São as frequências absolutas

– São as frequências relativas

– São os pontos médios das classes

FREQUÊNCIAS ABSOLUTAS FREQUÊNCIAS RELATIVAS

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
26
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Propriedades da Média Aritmética


A média dos desvios dos valores da variável em relação à média é nula
A média do quadrado dos desvios dos valores da variável em relação è média é mínima

Vantagens da Média Aritmética


Fácil de calcular e interpretar;
Permite o uso de toda a informação de que se dispõe e é precisa do ponto de vista matemático.

Desvantagens da média:

Pode não corresponder a qualquer valor da variável em questão e no caso de classes abertas pode
estar enviesado;

Pode ser muito influenciada por valores extremos ou aberrantes, podendo ser facilmente
enviesada (assimetria).

Outras médias conhecidas:


Média geométrica
Média harmónica

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
27
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

4.2 MEDIANA e suas propriedades


MEDIANA é o valor que divide a série de dados/distribuição ao meio

Para dados Não Agrupados / Classificados

Obtém-se ordenando os dados por ordem crescente ou decrescente e considerando o valor


central como o valor da mediana

No caso em que o nº de observações é PAR:


Será o valor da média entre os elementos centrais de ordem

No caso em que o nº de observações é ÍMPAR:


será o valor central de ordem

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
28
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Para dados classificados

Calcula-se em ordem a

A partir das frequências acumuladas identifica-se a classe mediana, que é aquela que contém a
mediana;

Calcula-se o valor exacto da mediana através da seguinte fórmula:


No caso de se usarem as frequências absolutas

No caso de se usarem frequências relativas

Características da MEDIANA

Fácil cálculo e compreensão;


Os valores extremos não afectam o valor da mediana, pois é determinado pelo número de
observações;
É um valor com bastante capacidade explicativa no caso das distribuições bastante assimétricas;
Todavia, é um mau estimador e por isso pouco útil em termos inferenciais

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
29
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

4.3 MODA e SUAS PROPRIEDADES

MODA é o valor mais frequente / categoria com mais observações

Para dados não classificados


- Basta verificar qual dos valores/categorias se repete mais vezes;

Para dados classificados


Identifica-se a classe modal, que é aquela que contém maior número de valores (maior frequência
absoluta ou relativa);
Calcula-se o valor da moda através da seguinte fórmula:
No caso de se usarem as frequências absolutas

No caso de se usarem as frequências relativas

Por representação gráfica


Características da moda:
Tem menor utilidade que a média e a mediana;
Nem sempre existe uma única moda nas distribuições, podendo as mesmas serem bi ou
multimodais;
O(s) valor(es) da moda não são influenciados pelos valores extremos;

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
30
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

5 MEDIDAS DE LOCALIZAÇÃO ou De TENDÊNCIA NÃO CENTRAL


(Quartis, Decis, Percentis)

Estas são medidas que dão a localização dos valores de uma variável.
Permitem separar determinadas % de observações
dentro de uma distribuição e dividi-la em n partes iguais;
O cálculo destas medidas é semelhante ao da mediana (que também é um valor separador);

Dados não classificados:


Determina-se directamente o valor correspondente

Dados classificados:
As fórmulas de cálculo são idênticas à usada no cálculo da mediana, apenas havendo de
considerar a posição do novo valor na distribuição:

QUARTIS
No caso de se usarem as frequências absolutas:

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
31
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

No caso de se usarem as frequências relativas:

PERCENTIS
No caso de se usarem as frequências absolutas:

No caso de se usarem as frequências relativas:

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
32
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

6 MEDIDAS DE DISPERSÃO (Variância, Desvio-Padrão, Desvio Médio)

Utilidade:
Servem para verificar da representatividade das medidas de localização;

Por vezes diferentes distribuições têm os mesmos valores de medidas de localização mas
apresentam formatos bastante diferenciados;

Existem 2 tipos de medidas de dispersão:


medidas de distância, que não recorrem ao cálculo prévio das medidas de localização;
medidas de confronto, que recorrem ao cálculo prévio das medidas de localização

Amplitude/Intervalo de variação
Diferença entre o valor máximo e mínimo da variável
R= Xi Max – Xi Min

Amplitude/Intervalo inter-quartis
Diferença entre o terceiro e o primeiro quartis (50% das observações centrais);
IQ= Q3 – Q1

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
33
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Desvio absoluto médio populacional

Dados não classificados:

Dados classificados:

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
34
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Variância e desvio-padrão populacional

Dados Não Classificados:

Dados Classificados:

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
35
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Coeficiente de variação (em %)


(Trata-se de uma medida de dispersão relativa)

Propriedades das medidas de dispersão

Amplitude/Intervalo de variação: [Max-min]


Simples e de cálculo muito fácil;
Como se considera apenas os dois valores extremos pode levar facilmente a
interpretações erradas sobre a distribuição

Intervalo inter - quartis


Considera apenas 50% das ocorrências;
O seu cálculo é muito fácil;
Como não é afectada pelos valores extremos, deve usar-se quando as distribuições
são muito assimétricas;
Pode usar-se quando as classes extremas são abertas, dado que as ignora;

Desvio absoluto médio


Considera todas as observações relativamente a uma medida de tendência central
(média ou mesmo a mediana);
É de fácil interpretação;
Por se basear no uso de módulos o seu cálculo perde eficácia em certas situações .
Desvio padrão/variância:
Bastante útil, devido à sua capacidade matemática, para ser usado na inferência
estatística;
É afectado por todos os valores observados, podendo ser fortemente influenciado
pelos valores extremos. Pouco aconselhado em distribuições muito assimétricas.
A sua comparabilidade depende da unidade de medida das variáveis

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
36
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

Propriedades das medidas de dispersão

Coeficiente de variação:
Permite comparar dispersões de variáveis que usem unidades de medida
diferentes;
Valores de cv acima de 50% indicam fraca representatividade da média e
elevada dispersão dos dados. Quanto mais abaixo de 50% estiver maior será
a representatividade da média e menor a dispersão dos dados;

Notas adicionais

Como calcular uma % de casos entre dois valores numa distribuição de dados classificados?

Usando a seguinte fórmula:

Como determinar se uma distribuição é normalmente distribuída?

• 1º Verificando se no intervalo estão 68,3% dos casos;

• 2º Verificando se no intervalo estão 95,5% dos casos;

• 3º Verificando se no intervalo estão 99,7% dos casos

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
37
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

MEDIDAS DE ASSIMETRIA
(métodos de medição do enviesamento de uma distribuição)

Comparando as medidas de tendência central

Média = mediana = moda a distribuição é simétrica;

média > mediana > moda a distribuição é assimétrica positiva ou enviesada à esquerda;

média < mediana < moda a distribuição é assimétrica negativa ou enviesada à direita;

Medição do grau de assimetria

Coeficiente Pearson

Coeficiente de Pearson (Bowley)

Quando G = 0 a distribuição é simétrica


Quando G > 0 a distribuição é assimétrica positiva
Quando G < 0 a distribuição é assimétrica negativa

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
38
PORTFÓLIO
Estatística
Código: T1pfolioESTdez2010
Universidade do Minho
Instituto de Ciências Sociais

MEDIDAS DE ACHATAMENTO OU CURTOSE


(Servem para verificar da intensidade das frequências na vizinhança dos valores centrais)

Existem distribuições:
Leptocúrticas
Mesocúrticas
Platicúrticas

Medição do grau de achatamento

Coeficiente de curtose:

se K = 0,263 a distribuição é mesocúrtica


se K > 0,263 a distribuição é platicúrtica
se K < 0,263 a distribuição é leptocúrtica

OBSERVAÇÕES FINAIS DO PORTFÓLIO:


Todos os dados colocados neste trabalho a desde a Folha 24 até à 39, têm origem
exclusiva na documentação facultada pela Docente

Nelson Labrujó (A60367)- E-mail:nelsonlabrujo@gmail.com Site: http://sites.google.com/site/nelsonlabrujo/


Valença 08-12-2010
39

Potrebbero piacerti anche