Sei sulla pagina 1di 2

Aula I – Estatística

Estatística é a ciência que se ocupa de coletar, organizar, analisar e interpretar dados a fim de tomar decisões.
Fases do Método Estatístico: Definição do problema, planejamento da pesquisa, coleta dos dados, apuração dos dados,
exposição ou apresentação dos dados e análise dos dados.
Ramos da estatística
O estudo da estatística divide-se em dois ramos principais, a estatística descritiva e a estatística inferencial.
A estatística descritiva é o ramo que trata da organização, do resumo e da apresentação de dados. (Descreve os dados)
A estatística inferencial é o ramo que trata de tirar conclusões sobre uma população a partir de uma amostra. A
ferramenta básica no estudo da estatística inferencial é a probabilidade. (Analisa os dados)

Dados consistem em informações provenientes de observações, contagens, medidas ou respostas.


Existem dois tipos de conjunto de dados que você irá usar ao estudar estatística. Esses conjuntos são chamados de
populações e amostras.
População é o conjunto de elementos que desejamos observar para obter determinados dados. Temos a população finita,
que contêm um número conhecido de elementos, e a população infinita, que contêm um número desconhecido ou muito
grande de elementos.
Amostra é o subconjunto de elementos retirados da população que estamos observando para obter determinados dados.
Parâmetro é uma descrição numérica de uma característica da população.
Estatística é uma descrição numérica de uma característica da amostra.

Técnicas de amostragem
Uma amostra aleatória simples é aquela no qual toda amostra possível de mesmo tamanho tem a mesma chance de ser
selecionada. Uma maneira de coletar uma amostra aleatória simples é atribuir um número diferente para cada membro
da população e então usar uma tabela de números aleatórios. Através de sorteio.
Uma amostra aleatória é aquela na qual todos os membros da população têm chances iguais de serem selecionados.
Amostra estratificada: Quando for importante que uma amostra tenha membros de cada segmento da população.
Dependendo do foco do estudo, os membros da população serão divididos em dois ou mais subconjuntos diferentes,
chamados estratos, que compartilham uma característica similar, como idade, gênero, etnicidade ou até mesmo
preferência política, sexo masculino e feminino.
Amostra sistemática: É aquela no qual é atribuído um número a cada membro da população, lista de chamada, lista iptu,
uma rua. A população já está numerada.
Amostra por agrupamento: Quando a população apresenta ocorrência natural de subgrupos, cada um deles com
características similares, pode ser mais apropriada uma amostra por agrupamento. Para selecionar uma amostra, divida a
população por grupos. Trabalhar por regiões.
Uma amostra tendenciosa é aquela que não é representativa da população da qual foi extraída. Lembre-se de que,
quando um estudo é feito com dados imprecisos, os resultados são questionáveis.

Coleta de dados
Há várias maneiras de coletar dados. Frequentemente, o foco do estudo determina a melhor maneira de coletá -los. A
seguir, apresentamos um breve resumo de quatro métodos de coleta de dados.
Fazendo um censo – Um censo é a contagem ou medição de parte da população. O censo fornece informações completas.
Difícil de ser realizado.
Usando uma amostra – Uma amostra é a contagem ou medição de parte da população. As estatísticas calculadas a partir
da amostra são usadas para predizer vários parâmetros populacionais. O uso da amostra é frequentemente mais prático
que o censo.
Usando uma simulação – Uma simulação é o uso de um modelo matemático ou físico para produzir as condições de uma
situação ou de um processo. As simulações permitem estudar situações que seria pouco prático ou até mesmo perigoso
criar na vida real.
Realizando um experimento – Ao se realizar um experimento é aplicado um tratamento a uma parte da população e são
observadas as respostas. Uma segunda parte da população é usada como um grupo de controle.

Variável é a característica que observamos numa pesquisa e que pode assumir diferentes valores em cada elemento da
amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores
numéricos ou não numéricos.
Variáveis podem ser classificadas da seguinte forma:
Variáveis Quantitativas (medições e contagens): são as características que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser classificadas em contínuas ou
discretas.
Quantitativas discretas: características de apenas um número inteiro. Geralmente são o resultado de contagens.
Exemplos: pessoas, objetos, número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia ,
ponto obtido, números de peças. (Variáveis com muitos valores repetidos).
Quantitativas contínuas, características que assumem infinitos valores fracionais. Usualmente devem ser medidas através
de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade, gastos com
alimentação, valor de imóvel, diâmetro de peças, temperatura registrada. (Variáveis com poucos valores repetidos).
Variáveis Qualitativas (qualidade): são as características de qualidade que não possuem valores quantitativos, mas, ao
contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Não podem ser
expressas em valores numéricos. Podem ser classificadas em dois grupos: nominais ou ordinais.
Qualitativas nominais: são as qualidades, somente a classificação de dados. Exemplos: sexo, cor dos olhos, fumante/não
fumante, doente/sadio, opinião, religião, estado civil, tipo sanguíneo, raça cachorro, time de futebol, ramo de atividade
empresa. Nesse nível, os dados são categorizados usando-se nomes, marcas ou qualidades. Não podem ser expressas em
valores numéricos,
Qualitativas ordinais: são qualidades com classificação, permite que se estabeleça uma ordem nos seus resultados.
Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro,
fevereiro,..., dezembro), nível sócio econômico, classificação em concurso, escolaridade da pessoa.

Medidas de Tendência Central


Uma medida de tendência central é um valor que representa uma entrada típica, ou central, de um conjunto de dados. As
três medidas de tendências central mais usadas são a média, a mediana e a moda.
A média de um conjunto de dados é a soma das entradas de dados dividida pelo número de entradas.
A mediana de um conjunto de dados é o dado que fica no meio quando as entradas são colocadas em ordem crescente ou
decrescente. Se o conjunto de dados tiver um número par de entradas a mediana será a média entre os dois pontos que
estiverem no meio do conjunto.
A moda de um conjunto de dados é aquela entrada que ocorre com maior frequência. Se nenhuma entrada é repetida, o
conjunto de dados não possui moda. Se duas entradas ocorrem com a mesma frequência elevada, cada entrada é uma
moda e os dados são chamados de bimodais.
Média ponderada é a média de um conjunto de dados cujas entradas têm pesos variáveis. Uma média é dada pela
multiplicação da nota pelo peso junto com a soma dos produtos.

Séries estatísticas (Tabelas)


É toda tabela que apresenta a distribuição de um conjunto de dados quantitativos em função da época, do local ou da
espécie. Podemos classificá-las como séries históricas ou cronológicas, geográficas, específicas ou categóricas.
Séries temporais descrevem os valores do estudo da variável em determinado local, época, discriminados segundo os
intervalos de tempos variáveis.
Séries geográficas são os valores de variáveis que acontecem em determinado local, região e instante, discriminados
segundo regiões.
Séries específicas são valores da variável, em determinado tempo e local, discriminado segundo especificações ou
categorias, como: espécie de animais, raças, tipos de línguas.

Gráficos estatísticos
Forma de apresentação dos dados coletados na pesquisa, precisa ter clareza, simplicidade e veracidade, pode ser
representado por desenho ou figuras geométricas.
Os elementos que compõem o gráfico estatístico são: o título, legenda (se tiver 2 variáveis), título de eixos e fontes.
Gráfico de linhas: tipo de gráfico que utiliza linha poligonal para representar a série estatística, muito usado em séries
temporais. No eixo X são colocadas as variáveis, e no eixo Y usamos a escala das frequências.
Gráfico de colunas: Representação por meio de retângulos não contíguos, dispostos verticalmente. Os retângulos
possuem a mesma base e as alturas são proporcionais aos respectivos dados. No eixo X são as variáveis.
Gráfico de barras: Representação por meio de retângulos dispostos horizontalmente. Os retângulos possuem mesma
altura e os seus comprimentos são proporcionais aos respectivos dados. No eixo Y as variáveis e no X as escalas das
frequências.
Gráfico de Setores ou Pizza: É designado por meio de um círculo, onde cada classe é representada por um setor circular,
cujo ângulo é proporcional ao tamanho da amostra. É utilizado quando se deseja mostrar as partes de um todo, ou seja,
quando se deseja comparar proporções.
Histograma: O histograma é um gráfico composto por retângulos justapostos (colado no outro), em que a base de cada
um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência. Gráfico utilizado para variáveis
continuas, trabalhando com intervalo de dados.

Potrebbero piacerti anche