Sei sulla pagina 1di 57

ESTASTÍSTICA

ESTASTÍSTICA
ESTASTÍSTICA

Sumário

1

Ferramentas Estatísticas

4

1.1 - O que é Estatística?

4

1.2 - Onde se aplica a Estatística na Engenharia?

4

1.3 - Definições Básicas da Estatística

6

2. Planejamento para Coleta e Análise de Dados

7

 

2.1 - Exemplo 1: Folha de verificação para a distribuição do processo de produção

9

2.2 - Exemplo 2: Folha de verificação para item defeituoso

10

2.3 – Exemplo 3: Folha de verificação para localização de defeitos

11

3 -

Estatística Descritiva

13

4 - Gráficos Estatísticos

13

 

4.1 - Diagramas

14

4.2 - Estereogramas

16

4.3 - Pictogramas

16

4.4 - Cartogramas

16

4.5 - Gráficos dos Dados na Ordem Cronológica

17

4.6 - Histogramas de Freqüência ou Distribuição de Freqüências

17

4.6.1 - Como construir um Histograma

23

4.6.2 - Tipos de Histograma

24

4.7 - Características amostrais

26

4.8 - Medidas de Tendência Central

27

4.9 - Medidas de Dispersão

27

4.10 - Cálculo de Médias e Desvios Padrões a partir de Tabelas de Freqüência

29

5 - Diagramas de Dispersão

30

 

5.1 - Como Construir um Diagrama de Dispersão

31

5.2 - Como Interpretar os Diagramas de Dispersão

33

5.3 - Cálculo de Coeficientes de Correlação

34

6 – Ajustamento de Curvas e o Método dos Mínimos Quadrados

36

 

6.1 - Equações das Curvas de Ajustamento

37

6.2 - O Método dos Mínimos Quadrados

37

6.3 - Relações Não-Lineares

38

6.4 - A Parábola de Mínimos Quadrados

40

6.5 - Regressão

41

6.6 - Aplicações das Séries Temporais

43

6.7 - Problemas que envolvem mais de duas variáveis

44

7 - Modelos de Probabilidade para Experimentos

45

 

7.1 - Espaço Amostral

46

7.2 - Eventos

47

7.3 - Análise Combinatória

47

7.4 - Teoremas

48

7.5 - Distribuições Discretas de Probabilidade

48

7.6 - Distribuições Contínuas de Probabilidade

50

Referências Bibliográficas

56

2

Observações

Observações Esta apostila foi organizada com objetivo de fornecer aos alunos da disciplina Estatística Aplicada a

Esta apostila foi organizada com objetivo de fornecer aos alunos da disciplina Estatística Aplicada a Engenharia material de pesquisa e estudo, complemento da sala de aula.

O material aqui exposto tem como origem, além das minhas anotações, as anotações do Prof. Luís Francisco Marcon Ribeiro, quando professor desta disciplina e uma coletânea de vários livros de Estatística, Controle Estatístico de Processo e sobre Qualidade citados nas Referências Bibliografias desta.

3

1 FERRAMENTAS ESTATÍSTICAS

1.1 - O que é Estatística?

Segundo JURAN:

E STATÍSTICAS 1.1 - O que é Estatística? Segundo JURAN: 1. É a ciência da tomada

1. É a ciência da tomada de decisão perante incertezas;

2. Coleta, análise e interpretação de dados;

3. É um “kit” de ferramentas que ajuda a resolver problemas;

4. Base para a maior parte das decisões tomadas quanto ao controle da qualidade, assim como em quase todas as outras áreas da atividade humana moderna.

Vista dessa forma, a Estatística não deve ser confundida como uma disciplina isolada, e sim, compreendida como uma ferramenta ou um conjunto de ferramentas, disponível para a solução de problemas em diversas áreas do conhecimento. Segundo FEIGENBAUM: “Precisão significativamente aumentada em produção de itens e produtos tem sido acompanhada pela necessidade de métodos aperfeiçoados para medição, especificação e registro dela. A estatística, denominada ciência das medições, representa uma das técnicas mais valiosas utilizadas nas quatro tarefas, e isso tem ficado cada vez mais evidente”.

1.2 - Onde se aplica a Estatística na Engenharia?

As aplicações concentram-se fundamentalmente em dois campos de ação: o Controle Estatístico do Processo e o Controle Estatístico da Qualidade.

Definições segundo JURAN:

1. Processo: é qualquer combinação específica de máquinas, ferramentas, métodos, materiais e/ou pessoas empregadas para atingir qualidades específicas num produto ou serviço. Estas qualidades são chamadas de “características de qualidade”, que podem ser uma dimensão, propriedade do material, aparência, etc.

2. Controle: é um ciclo de feedback (realimentação) através da qual medimos o desempenho real, comparando-o com o padrão, e agimos sobre a diferença.

3. Controle Estatístico do Processo (CEP): aplicação de técnicas estatísticas para medir e analisar a variação nos processos.

4. Controle Estatístico da Qualidade (CEQ): aplicação de técnicas estatísticas para medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de diagnóstico, planos de amostragem e outras técnicas estatísticas.

Segundo FEIGENBAUM, provavelmente, mais importante do que os próprios métodos estatísticos, têm sido o impacto causado sobre o pensamento industrial pela filosofia que representam. O “ponto de vista

4

estatístico” resume-se essencialmente nisto: a variabilidade na qualidade do produto deve ser constantemente estudada:

estatístico” resume-se essencialmente nisto: a variabilidade na qualidade do produto deve ser constantemente estudada:

Dentro de lotes de produto;

Em equipamentos de processo;

Entre lotes diferentes de um mesmo produto;

Em características críticas e em padrões;

Em produção piloto, no caso de novos produtos.

Esse ponto de vista, que enfatiza o estudo da variação, exerce efeito significativo sobre certas atividades no controle da qualidade. Ainda segundo FEIGENBAUM, cinco ferramentas estatísticas tornaram-se amplamente utilizadas nas tarefas de controle da qualidade:

1. Distribuição de freqüências;

2. Gráficos de controle;

3. Aceitação por amostragem;

4. Métodos especiais;

5. Confiabilidade.

Na abordagem do papel dos métodos estatísticos no gerenciamento de processos de produção,

independentemente dos tipos de produtos ou de

métodos de produção usados, as causas de produtos defeituosos são universais. Variação, esta é a causa.” “Variações nos materiais, na condição dos equipamentos, no método de trabalho e na inspeção são as causas dos defeitos.”

os métodos estatísticos são ferramentas eficazes para a melhoria do

processo produtivo e redução de seus defeitos”. O primeiro passo na busca da verdadeira causa de um defeito é a cuidadosa observação do fenômeno

do defeito. Após tal observação cuidadosa, a verdadeira causa torna-se evidente. As ferramentas estatísticas, diz KUME, conferem objetividade e exatidão à observação. As máximas da forma estatística de pensar são:

KUME também faz referência à variabilidade. Diz que, “(

)

Ainda segundo KUME, “(

)

1. Dar maior importância aos fatos do que os conceitos abstratos;

2. Não expressar fatos em termos de intuição ou idéias. Usar evidências obtidas a partir de resultados específicos da observação;

3. Os resultados da observação, sujeitos como são a erros e variações, são partes de um todo obscuro. A principal meta da observação é descobrir esse todo obscuro;

4. Aceitar o padrão regular que aparece em grande parte dos resultados observados como uma informação confiável.

5

O conhecimento dominado ato o presente momento não é nada mais que um embasamento para

O conhecimento dominado ato o presente momento não é nada mais que um embasamento para

hipóteses futuras. Uma vez que isso tenha sido compreendido, a forma de pensar mencionada pode ser

aproveitada para aprofundar a compreensão do processo produtivo e dos meios para melhorá-lo.

1.3 - Definições Básicas da Estatística

1) FENÔMENO ESTATÍSTICO: é qualquer evento que se pretenda analisar, cujo estudo seja possível da aplicação do método estatístico. São divididos em três grupos:

Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples

observação. A estatística dedica-se ao estudo desses fenômenos. Ex: A natalidade na Grande Vitória,

O preço médio da cerveja no Espírito Santo, etc.

Fenômenos individuais:

nascimento na Grande Vitória, cada preço de cerveja no Espírito Santo, etc.

Fenômenos de multidão: quando a s características observadas para a massa não se verificam para o particular. 2) DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos. 3) POPULAÇÃO: é o conjunto total de elementos portadores de, pelo menos, uma característica comum. 4) AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. 5) PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-la.Para definirmos um parâmetro devemos examinar toda a população.Ex: Os alunos do 2º ano da Universidade Federal do Ceará (UFC) têm em média 1,70 metros de estatura. 6) ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da amostra. 7) ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo.

são aqueles que irão compor os fenômenos de massa. Ex: cada

Exemplo de classificação dicotômica do atributo: A classificação dos alunos da UNIJUÍ quanto ao sexo.

atributo: sexo

dicotomia: duas subclasses ( masculino e feminino)

classe:

alunos da UNIJUÍ

Exemplo de classificação policotômica do atributo: Alunos da UNIJUÍ quanto ao estado civil.

atributo: estado civil

dicotomia: mais de duas subclasses ( solteiro, casado, divorciado, viúvo, etc.)

classe: alunos da UNIJUÍ

8) VARIÁVEL: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Variável Qualitativa: Quando seu valores são expressos por atributos: sexo, cor da pele,etc.

6

Variável Quantitativa: Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados

Variável Quantitativa: Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos

resultados possui uma estrutura numérica, trata-se portanto da estatística de variável e se dividem em

:

Variável Discreta ou Descontínua: Seus valores são expressos geralmente através de números

inteiros não negativos. Resulta normalmente de contagens.Ex: Nº de alunos presentes às aulas de introdução à estatística econômica no 1º semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36.

Variável Contínua: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura atual do seu corpo.

Exercício 01

Classifique as variáveis em qualitativas ou quantitativas (contínuas ou discretas):

.

Cor dos olhos das alunas

Resp: qualitativa

.

Índice de liquidez nas índústrias capixabas

Resp: quantitativa contínua

.

Produção de café no Brasil

Resp: quantitativa contínua

.

Número de defeitos em aparelhos de TV

Resp: quantitativa discreta

.

Comprimento dos pregos produzidos por uma empresa

Resp: quantitativa contínua

.

O ponto obtido em cada jogada de um dado

Resp: q

2. PLANEJAMENTO PARA COLETA E ANÁLISE DE DADOS

As ferramentas devem ser utilizadas de maneira eficiente para alcançar o sucesso. Para tanto, o processo deve incluir:

1. planejamento cuidadoso da coleta de dados;

2. análise de dados para tirar conclusões estatísticas e

3. transição para a resposta ao problema técnico original.

Segundo JURAN, alguns passos-chave são:

1. Coletar informações anteriores suficientes para traduzir o problema de engenharia em problema específico que possa ser avaliado por métodos estatísticos;

2. Planejar a coleta de dados:

a. Determinar o tipo de dados necessários – quantitativos (mais custo, mais útil) e qualitativos;

b. Determinar se quaisquer dados prévios estão disponíveis e são aplicáveis ao presente problema;

7

c. Se o problema exigir uma avaliação de várias decisões alternativas, obter informações sobre as

c. Se o problema exigir uma avaliação de várias decisões alternativas, obter informações sobre as conseqüências econômicas de uma decisão errada.

d. Se o problema exigir a estimação de um parâmetro, definir a precisão necessária para a estimativa;

e. Determinar se o erro de medição é grande o suficiente para influenciar o tamanho calculado da amostra ou o método da análise de dados;

f. Definir as suposições necessárias para calcular o tamanho da amostra exigido;

g. Calcular o tamanho da amostra necessário considerando a precisão desejada do resultado, erro amostral, variabilidade dos dados, erros de medição e outros fatores;

h. Definir quaisquer requisitos para preservar a ordem das medições quando o tempo for um parâmetro chave;

i. Determinar quaisquer requisitos para coletar dados em grupos definidos – diferentes condições a serem avaliadas;

j. Definir o método de análise de dados e quaisquer hipóteses necessárias;

k. Definir os requisitos para quaisquer programas de computador que venham a ser necessários.

3. Coletar dados:

a. Usar métodos para assegurar que a amostra é selecionada de forma aleatória;

b. Registrar os dados e também as condições presentes no momento de cada observação;

c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente

para se fazer previsões válidas para o futuro.

4. Analisar os dados:

a. Selecionar os dados;

b. Avaliar as hipóteses previamente estabelecidas. Se necessário, tomar atitudes corretivas (novas observações);

c. Aplicar técnicas estatísticas para avaliar o problema original;

d. Determinar se dados e análises adicionais são necessários;

e. Realizar “análises de sensibilidade” variando estimativas amostrais importantes e outros fatores na análise e observando o efeito sobre as conclusões finais.

5. Rever as conclusões da análise de dados para determinar se o problema técnico original foi avaliado ou se foi modificado para se enquadrar nos métodos estatísticos.

6. Apresentar os resultados:

a. Estabelecer as conclusões de forma significativa, enfatizando os resultados nos termos do problema original, e não na forma dos índices estatísticos usados na análise;

b. Apresentar graficamente os resultados quando apropriado. Usar métodos estatísticos

simples no corpo do relatório e colocar as análises complexas em um apêndice.

7. Determinar se as conclusões do problema específico são aplicáveis a outros problemas ou se os dados e cálculos poderiam ser úteis para outros problemas.

8

Como dito acima, quando for preciso coletar dados é essencial esclarecer sua finalidade e ter

Como dito acima, quando for preciso coletar dados é essencial esclarecer sua finalidade e ter valores

que reflitam claramente os fatos. Além disso, em situações reais, a simplicidade deve ser uma linha mestra. O formulário, normalmente de papel, deve ser produzido com os itens a serem verificados de forma que os dados possam ser coletados de forma fácil e concisa.

O formulário, ou FOLHA DE VERIFICAÇÃO, deve:

1. facilitar a coleta de dados;

2. organizar os dados simultaneamente à coleta para que possam ser facilmente usados mais tarde e

3. conter dados, os quais podem (devem) ser registrados através de marcas ou símbolos simples.

A seguir têm-se alguns tipos de folhas de verificação:

1. Folha de Verificação do processo de produção;

2. Folha de Verificação para verificação de item defeituoso;

3. Folha de Verificação para localização de defeitos e

4. Folha de Verificação para verificação de defeito.

2.1 - Exemplo 1: Folha de verificação para a distribuição do processo de produção

Suponha que se queira conhecer a variação nas dimensões de um certo tipo de peça cuja

especificação de usinagem seja 8,300±0,008mm. Para estudar a distribuição dos valores característicos do processo, são normalmente usados histogramas (gráficos). Valores como a média e variância são calculados com base no histograma e a forma da distribuição também é examinada de várias maneiras. Na construção de um gráfico, é muito incômodo coletar uma grande quantidade de dados e, em seguida, desenhar um gráfico mostrando a distribuição das freqüências. Uma maneira mais simples é classificar os dados exatamente no instante de sua coleta. O formulário abaixo é um exemplo de uma folha de verificação que deve ser previamente preparada. Cada vez que uma medição é feita, uma marca é colocada na quadrícula apropriada, para que se tenha o gráfico pronto no momento em que as medições forem encerradas.

9

Figura 1 - Folha de Verificação para Distribuição do Processo Produtivo 2.2 - Exemplo 2:
Figura 1 - Folha de Verificação para Distribuição do Processo Produtivo 2.2 - Exemplo 2:

Figura 1 - Folha de Verificação para Distribuição do Processo Produtivo

2.2 - Exemplo 2: Folha de verificação para item defeituoso

A figura abaixo mostra uma folha de verificação usada no processo de inspeção final de um certo

produto de plástico. O inspetor faz uma marca sempre que encontra um defeito. No fim do dia, ele pode verificar rapidamente a quantidade total e os tipos de defeitos que ocorreram.

O mero conhecimento da quantidade total de defeitos não nos leva às ações corretivas, mas se uma

folha de verificação for utilizada, pistas muito importantes podem ser obtidas para a melhoria do processo, porque os dados mostram claramente quais tipos de defeitos são freqüentes e quais não são. Mas é necessário definir claramente, de antemão, como os defeitos devem ser registrados quando

forem encontrados dois ou mais num mesmo produto e, então, dar instruções completas para as pessoas que farão a contagem. Na folha de verificação abaixo, entretanto, a quantidade total de defeitos foi de 62 porque, em alguns casos, foram encontrados dois ou mais defeitos num mesmo item.

10

Figura 2 - Folha de Verificação para Itens Defeituosos 2.3 – Exemplo 3: Folha de
Figura 2 - Folha de Verificação para Itens Defeituosos 2.3 – Exemplo 3: Folha de

Figura 2 - Folha de Verificação para Itens Defeituosos

2.3 – Exemplo 3: Folha de verificação para localização de defeitos

Defeitos externos tais como riscos e manchas são encontrados em todos os tipos de produtos e

muitos esforços estão sendo feitos em várias fábricas para reduzi-los. A folha de verificação para localização de defeitos tem uma função poderosa na solução deste tipo de problema. Geralmente, as folhas de verificação desse tipo têm um croqui ou uma vista ampliada onde são anotadas as marcas, permitindo a observação da distribuição das ocorrências de defeitos. A figura abaixo mostra um exemplo utilizado por um fabricante de máquinas na inspeção de aceitação de peças fundidas. O defeito a ser verificado é “bolha presa”. Anteriormente o fornecedor era apenas informado sobre a rejeição ou aceitação de cada lote e a quantidade de defeitos por lote. A qualidade, contudo, não havia apresentado nenhuma melhoria.

A introdução da folha de verificação possibilitou um estudo mais detalhado dos lotes, indicando onde

havia maior probabilidade de ocorrer bolhas. Com esta informação, a qualidade da peça melhorou muito

porque ficou mais fácil encontrar as causas dos defeitos. Esta folha de verificação conduz facilmente à tomada de ações e é indispensável para o diagnóstico

do processo, porque as causas dos defeitos podem, freqüentemente, ser encontradas através do exame dos locais onde ocorrem os defeitos e pela cuidadosa observação do processo para determinar o por que os defeitos se concentram nesses locais.

A folha de verificação da figura abaixo é usada para apontar a localização de defeitos. Além disso,

folhas de verificação são algumas vezes usadas para uma estratificação ainda maior, de modo a encontrar as causas de defeitos. De forma geral, a maioria dos estudos voltados à detecção das causas de defeitos envolve a

associação dos dados de causas com os dados dos correspondentes efeitos, disposição dos dados numa ordem

11

que mostre claramente esta correspondência, e mais tarde, análise dos dados através da estratificação por

que mostre claramente esta correspondência, e mais tarde, análise dos dados através da estratificação por

causas ou da construção de dispersão.

por causas ou da construção de dispersão. Figura 3 - Folha de Verificação para Localização de

Figura 3 - Folha de Verificação para Localização de Defeitos

3 - Folha de Verificação para Localização de Defeitos Figura 4 - Folha de Verificação para

Figura 4 - Folha de Verificação para Localização de Defeitos

Exercício Num processo de polimento de lentes, trabalham dois operários, cada um operando duas máquinas.

Ultimamente, a fração defeituosa deste processo tem aumentado. Os operários estão solicitando uma

mudança de máquinas, alegando que as que estão atualmente em uso são muito velhas. O pessoal técnico

12

encarregado do processo diz que os operários deveriam ser mais cuidadosos porque eles estão cometendo

encarregado do processo diz que os operários deveriam ser mais cuidadosos porque eles estão cometendo erros por falta de atenção. O que você faria numa situação semelhante? Explique detalhadamente.

3 - ESTATÍSTICA DESCRITIVA

Viu-se anteriormente um roteiro para coleta e análise de dados. As séries de dados, basicamente, são provenientes de duas fontes: os “dados históricos” e os “dados de experimentos planejados”. Os dados históricos são séries de dados existentes e, em geral, analisar estatisticamente esses dados é mais econômico (tempo e despesas) se comparado com dados obtidos a partir de experimentos planejados. Mesmo com uma análise estatística complexa, em geral, pouco sucesso se obtém com tais dados. No controle de um processo, algumas razões para esse insucesso ocorrer são:

As variáveis do processo podem estar altamente correlacionadas entre si, tornando impossível distinguir a origem de um determinado efeito. As variáveis do processo podem ter sido manipuladas para controlar o resultado do processo.

As variáveis do processo têm abrangência pequena em relação ao intervalo de operação do processo.

Outras variáveis que afetam o resultado do processo podem não ter sido mantidas constantes, e serem as reais causadoras dos efeitos observados no processo. Por essas razões, recomenda-se a análise de séries de dados históricos apenas para a indicação de variáveis importantes a serem observadas em um experimento planejado. Os dados de experimentos planejados são coletados com o objetivo estudar e analisar um problema. São dados reunidos em diversas séries de variáveis com aparente importância em um processo, enquanto se mantém constantes (com valores registrados) todas as outras variáveis que possivelmente poderiam alterar o resultado. Aqui tratar-se-á de métodos práticos de organização de dados. Segundo SPIEGEL 4 : “A parte da estatística que procura somente descrever e analisar um certo grupo, sem tirar quaisquer conclusões ou inferências sobre um grupo maior, é chamada estatística descritiva ou dedutiva.” Freqüentemente dois ou mais métodos de organização são utilizados para descrever com clareza dados coletados. Alguns desses métodos são: gráficos dos dados na ordem cronológica, distribuição e histogramas de freqüência, características amostrais, medidas de tendência central e medidas de dispersão.

4 - GRÁFICOS ESTATÍSTICOS

São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. Têm como características principais, o uso de escalas, a existência de um sistema de coordenadas, a simplicidade, clareza e veracidade de sua representação.

4 M. R. SPIEGEL. Estatística. São Paulo: Makron Books, 1993.

13

Os gráficos podem ser:

Os gráficos podem ser: 1. Gráficos de informação: gráficos destinados principalmente ao público em geral,

1. Gráficos de informação: gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes ou

2. Gráficos de análise: gráficos que prestam-se melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico.

Mas o uso indevido de Gráficos pode trazer uma idéia falsa dos dados que estão sendo analisados,

chegando mesmo a confundir o leitor, tratando-se, na realidade, de um problema de construção de escalas.

.

Os gráficos pode ser classificados em: Diagramas, Estereogramas, Pictogramas e Cartogramas.

.

4.1 - Diagramas

São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser :

.1 - Gráficos em barras horizontais. .2 - Gráficos em barras verticais ( colunas ). Quando as legendas não são breves usa-se de preferência os gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica.

a ser observada é a cronológica, se a série for histórica, e a decrescente , se

14

.3 - Gráficos em barras compostas. .4 - Gráficos em colunas superpostas. Eles diferem dos

.3 - Gráficos em barras compostas. .4 - Gráficos em colunas superpostas. Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. .5 - Gráficos em linhas ou lineares.

ou mais atributos. .5 - Gráficos em linhas ou lineares. São freqüentemente usados para representação de

São freqüentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a

parte interna da figura formada pelos gráficos desses fenômeno é denominada de área de excesso.

.6 - Gráficos em setores. Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Obs: As séries temporais geralmente não são representadas por este tipo de gráfico.

.

15

4.2 - Estereogramas São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados

4.2 - Estereogramas

São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem.

de ser interpretado dada a pequena precisão que oferecem. 4.3 - Pictogramas São construídos a partir

4.3 - Pictogramas

São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo:

e não de detalhes minuciosos. Veja o exemplo abaixo: 4.4 - Cartogramas São ilustrações relativas a

4.4 - Cartogramas

São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.

16

Dados obtidos de uma amostra servem como base para uma decisão sobre a população. Quanto
Dados obtidos de uma amostra servem como base para uma decisão sobre a população. Quanto

Dados obtidos de uma amostra servem como base para uma decisão sobre a população. Quanto maior for o tamanho da amostra, mais informação obtemos sobre a população. Porém, um aumento do tamanho da amostra também implica um aumento da quantidade de dados e isso torna difícil compreender a população, mesmo quando estão organizados em tabelas. Em tal caso, precisa-se de um método que possibilite conhecer a população num rápido exame. Um histograma atende às necessidades, por meio da organização de muitos dados num histograma, pode-se conhecer a população de maneira objetiva.

4.5 - Gráficos dos Dados na Ordem Cronológica

Representação gráfica do resultado Y versus a ordem cronológica de execução do experimento (diagrama do resultado Y versus tempo t). Nesse tipo de gráfico, alguns dos possíveis fenômenos que podem ser observados são:

Curva de aprendizagem dos experimentadores (pontos no início do experimento).

Tendências dentro de um determinado período (horas, turnos, dias, etc.), freqüentemente em função de aquecimento, fadiga, e outros fatores relacionados com o tempo.

Aumento ou diminuição da variabilidade dos dados com o tempo, podendo representar curva de aprendizagem ou características relativas ao material.

4.6 - Histogramas de Freqüência ou Distribuição de Freqüências

É uma ferramenta estatística apropriada para a apresentação de grandes massas de dados numa forma que torna mais clara a tendência central e a dispersão dos valores ao longo da escala de medição, bem como a freqüência relativa de ocorrência dos diferentes valores. Para um melhor entendimento do procedimento de distribuição de freqüências apresentar-se-á dois exemplos de organização de dados, apresentado por JURAN e KUME. A tabela 4.1 apresenta “dados brutos” (dados que não foram numericamente organizados) de medidas de resistência elétrica de 100 bobinas. Essa forma de apresentação de dados é de difícil entendimento.

17

Tabela 4.1 Dados Brutos: Resistência (ohms) de 100 bobinas 3,37 3,34 3,38 3,32 3,33 3,28

Tabela 4.1 Dados Brutos: Resistência (ohms) de 100 bobinas

3,37

3,34

3,38

3,32

3,33

3,28

3,34

3,31

3,33

3,34

3,29

3,36

3,30

3,31

3,33

3,34

3,34

3,36

3,39

3,34

3,35

3,36

3,30

3,32

3,33

3,35

3,35

3,34

3,32

3,38

3,32

3,37

3,34

3,38

3,36

3,37

3,36

3,31

3,33

3,30

3,35

3,33

3,38

3,37

3,44

3,32

3,36

3,32

3,29

3,35

3,38

3,39

3,34

3,32

3,30

3,39

3,36

3,40

3,32

3,33

3,29

3,41

3,27

3,36

3,41

3,37

3,36

3,37

3,33

3,36

3,31

3,33

3,35

3,34

3,35

3,34

3,31

3,36

3,37

3,35

3,40

3,35

3,37

3,32

3,35

3,36

3,38

3,35

3,31

3,34

3,35

3,36

3,39

3,31

3,31

3,30

3,35

3,33

3,35

3,31

A tabela 4.2 apresenta os mesmos dados depois da tabulação. As marcações na coluna “tabulação

têm a função de evidenciar qual é a tendência central e a dispersão. A coluna “Freqüência” é a contagem

dessas marcações.

Tabela 4.2 Tabulação de valores de resistência de 100 bobinas

Resistência

Tabulação

Freqüência

Freqüência

(ohms)

Acumulada

3,44

|

1

1

3,43

1

3,42

1

3,41

|

|

2

3

3,40

|

|

2

5

3,39

|

|

|

|

4

9

3,38

| | | | | | | | | | | | | | |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
 

6

15

3,37

8

23

3,36

|

|

|

13

36

3,35

|

|

|

|

14

50

3,34

|

|

12

62

3,33

 

10

72

3,32

9

81

3,31

9

90

3,30

5

95

3,29

|

|

|

3

98

3,28

|

1

99

3,27

|

1

100

Total

100

18

A tabela 4.2 mostra uma escala de valores entre 3,44 W e 3,27 W ou

A tabela 4.2 mostra uma escala de valores entre 3,44W e 3,27W ou 17 intervalos de 0,01W cada.

Quando se deseja reduzir o número de tais intervalos, os dados são agrupados em “classes”. Agrupar os dados

em classes é uma importante ferramenta para resumir grandes massas de dados brutos, no entanto acarreta

perda de alguns detalhes.

A

seguir, são apresentados os passos recomendados por JURAN para construir uma distribuição de

freqüência:

1 o ) Decidir quanto ao número de classes.

A Tabela 4.3 apresenta diretrizes adequadas para a maioria dos casos. Segundo JURAN, “essas

diretrizes não são rígidas e devem ser adaptadas quando necessário”.

Tabela 4.3 Número de células na distribuição de freqüências

Número de

Número recomendado

observações

de classes

20 - 50

6

51 - 100

7

101

- 200

8

201

- 500

9

501 - 1000

10

Mais de 1000

11 a 20

2 o ) Calcular aproximadamente a dimensão i da classe.

A dimensão da classe é

i = maior observação - menor observação número de classes

Deve-se arredondar o resultado para algum número conveniente.

3 o ) Construir as classes, fazendo uma lista dos seus limites. Deve-se observar que:

a- Os limites de classe devem ter um decimal a mais que os dados reais, sendo o último dígito igual a 5.

b- A dimensão da classe deve ser constante para toda a distribuição de freqüência.

4 o ) Enquadrar e assinalar cada observação dentro da classe apropriada (coluna “Tabulação”) e calcular a

freqüência f para cada classe (colunas “Freqüência” e “Freqüência acumulada”).

Aplicando-se cada passo à distribuição de freqüência dos valores de resistência, observa-se que:

Pela tabela 4.3, o número de classes recomendado para 100 observações é 7.

Considerando-se 7 classes, e sabendo-se que a maior observação é 3,44W e a menor observação é 3,27W

(amplitude R = 0,17W), então o intervalo de classe calculado é (3,44 - 3,27)/7 que é igual a 0,024W.

Arredondando para 0,03W, observa-se que a amplitude passa a ser 7 x 0,03W que é igual a 0, 21W (maior

19

que a amplitude real de 0,17 W ) e abrange toda a escala real das

que a amplitude real de 0,17W) e abrange toda a escala real das observações. No entanto se recalcularmos

a amplitude, agora considerando 6 classes, obtém-se 6 x 0,03W que é igual a 0, 18W (maior que a

amplitude real de 0,17W) e igualmente abrange toda a escala real das observações, com a vantagem de

utilizar um número menor de classes. A partir dessas considerações decide-se agrupar os dados da tabela

4.1 numa distribuição de freqüência de somente seis classes com 0,03W de extensão cada.

Constroem-se as classes conforme a tabela 4.4.

Tabela 4.4 Distribuição de freqüência dos valores de resistência

Resistência (ohms)

Limites

Pontos

Freqüência

Freqüência

medianos

acumulada

3,265 - 3,295

3,28

5

5

3,295 - 3,325

3,31

23

28

3,325 - 3,355

3,34

36

64

3,355 - 3,385

3,37

27

91

3,385 - 3,415

3,40

8

99

3,415 - 3,445

3,43

1

100

100

Uma das muitas maneiras de representar graficamente uma distribuição de freqüência, é o histograma

de freqüência. A Figura 4.1 mostra os dados de resistência elétrica da tabela 4.4 representados na forma de

histograma.

40 36 35 30 27 25 23 20 15 10 8 5 5 1 0
40
36
35
30
27
25
23
20
15
10
8
5
5
1
0
3,28
3,31
3,34
3,37
3,40
3,43
3,265 - 3,295
3,295 - 3,325
3,325 - 3,355
3,355 - 3,385
3,385 - 3,415
3,415 - 3,445
freqüência

classes de resistência (ohms)

Figura 4.1- Histograma de resistência.

20

Os histogramas são largamente utilizados na comparação de aptidão de processos com seus limites de

Os histogramas são largamente utilizados na comparação de aptidão de processos com seus limites

de tolerâncias. Segundo JURAN, “análises de histogramas, para que sejam tiradas conclusões além dos dados

amostrais, devem ser baseadas em pelo menos 50 medições.”

Um outro exemplo de organização de dados é proposto por KUME. Deseja-se investigar a

distribuição dos diâmetros de eixos de aço produzidos em um processo de usinagem, os diâmetros de 90 eixos

foram medidos conforme mostra a Tabela 4.5.

Tabela 4.5 - Dados originais do problema

Amostra

01-10

11-20

21-30

31-40

41-50

51-60

61-70

71-80

81-90

2,510

2,527

2,529

2,520

2,535

2,533

2,525

2,531

2,518

Resultado das Medições (mm)

2,517

2,536

2,523

2,514

2,523

2,510

2,515

2,545

2,527

2,522

2,506

2,523

2,512

2,526

2,542

2,520

2,524

2,511

2,522

2,541

2,523

2,534

2,525

2,524

2,519

2,522

2,519

2,510

2,512

2,519

2,526

2,532

2,530

2,526

2,520

2,531

2,511

2,515

2,528

2,530

2,522

2,521

2,527

2,519

2,527

2,519

2,521

2,543

2,532

2,502

2,522

2,522

2,519

2,529

2,532

2,536

2,538

2,526

2,530

2,535

2,542

2,529

2,528

2,543

2,529

2,518

2,523

2,522

2,540

2,540

2,522

2,519

 

2,525

2,524

2,534

2,520

2,514

2,528

2,528

2,513

2,521

 

Procedimento

 

Exemplo

Etapa 1 – Calcular a amplitude (R) Obtenha o maior e o menor dos valores observados e calcule R.

Etapa 1 – Calcular R

 

R

foi obtida a partir do maior e do menor valores

observados (Tabela 4.6)

 

R

= (o maior valor) – (o menor valor)

O

maior valor =

2,545

O

maior e o menor dos valores observados podem ser

O

menor valor = 2,502

 

facilmente obtendo-se o máximo e o mínimo dos valores de cada coluna da tabela de observações. Depois, tomando-se o maior dos valores máximos e o

Portanto:

 

R

= 2,545 – 2,502 = 0,043

 

menor dos valores mínimos, acha-se os limites da tabela.

 

Etapa 2 – Determinar o intervalo de classe

Etapa 2 – Determinar o intervalo de classe

O

intervalo de classe é determinado de forma que

amplitude, que compreende o maior e o menor dos valores, seja dividida em intervalos de mesmo tamanho.

0,043 / 0,002 = 21,5 adota-se 22 (número inteiro mais próximo)

Para obter o tamanho dos intervalos, divida R por 1, 2

0,043 / 0,005 =

8,6 adota-se

9

ou

5 (ou 10; 20; 50 ou 0,1; 0,2; 0,5; etc.) de forma a

(número inteiro mais próximo)

obter de 5 a 20 intervalos de classe de tamanho igual. Quando houver duas possibilidades, use o tamanho de intervalo menor se o número de valores observados for maior ou igual a 100, e o tamanho de intervalo

0,043 / 0,010 =

4,3 adota-se 4

(número inteiro mais próximo)

 

21

maior se houver 99 ou menos valores observados.   Etapa 3 – Preparar a tabela

maior se houver 99 ou menos valores observados.

 

Etapa 3 – Preparar a tabela de freqüência Prepare um formulário como o da Tabela 4.7, no qual possam ser registradas as classes, o ponto médio, as marcas de freqüência, freqüência, etc.

Etapa 3 – Preparar a tabela de freqüência

Prepare uma tabela conforme mostra a Tabela 4.7

Tabela 4.6 - Determinação da Amplitude

Amostra

01-10

11-20

21-30

31-40

41-50

51-60

61-70

71-80

81-90

 
 

2,510

2,527

2,529

2,520

2,535

2,533

2,525

2,531

2,518

Resultado das Medições (mm)

2,517

2,536

2,523

2,514

2,523

2,510

2,515

2,545

2,527

Menor e Maior valores da Tabela

2,522

2,506

2,523

2,512

2,526

2,542

2,520

2,524

2,511

2,522

2,541

2,523

2,534

2,525

2,524

2,519

2,522

2,519

2,510

2,512

2,519

2,526

2,532

2,530

2,526

2,520

2,531

2,511

2,515

2,528

2,530

2,522

2,521

2,527

2,519

2,527

2,519

2,521

2,543

2,532

2,502

2,522

2,522

2,519

2,529

2,532

2,536

2,538

2,526

2,530

2,535

2,542

2,529

2,528

2,543

2,529

2,518

2,523

2,522

2,540

2,540

2,522

2,519

 

2,525

2,524

2,534

2,520

2,514

2,528

2,528

2,513

2,521

 

Máximo

2,543

2,541

2,543

2,534

2,535

2,542

2,542

2,545

2,531

2,545

Mínimo

-9

-9

-9

-9

-9

-9

-9

-9

-9

2,502

Etapa 4 – Determinar os limites das classes Determine os limites dos intervalos, de forma que englobem o menor e o maior dos valores registrados, e anote-os na tabela de freqüência. Determine, primeiro, o limite inferior da primeira classe e adicione a este o tamanho do intervalo para obter o limite entre a primeira e a segunda classe. Quando fizer isso, assegure-se de que a primeira classe contém o menor valor observado e que os valores dos limites tenham uma casa decimal a mais do que a precisão dos valores medidos. Depois, adicione sucessivamente o tamanho do intervalo ao valor do limite anterior para obter o segundo limite, o terceiro, e assim por diante, e verifique se a última classe inclui o maior valor observado.

Etapa 4 – Determinar os limites das classes Os limites da primeira classe devem ser determinados como 2,5005 e 2,5055 de forma que a classe inclua o menor valor 2,502; os limites da segunda classe devem ser determinados como 2,5055 e 2,5105, e assim por diante. Registre esses limites numa tabela de freqüência.

Etapa 5 – Calcular o ponto médio da classe Usando a equação seguinte, calcule o ponto médio das classes e anote-os na tabela de freqüência.

 

Etapa 5 – Calcular o ponto médio da classe Ponto médio da primeira classe

 

=

2,5005

+

2,5055 =

2,503 ,

Ponto médio da primeira classe

=

soma dos limites superior e inferior da primeira classe

   
 

2

 

2

Ponto médio da segunda classe

Ponto médio da segunda classe

 
 

soma dos limites superior e inferior da segunda classe

=

2,5055

+

2,5105 =

2,508

=

2

 

2

22

e assim por diante.     Os pontos médios da segunda classe, da terceira classe

e

assim por diante.

   

Os pontos médios da segunda classe, da terceira classe

e assim por diante.

demais classes, também podem ser obtidos da seguinte forma:

e

Ponto médio da segunda classe = ponto médio da primeira classe + intervalo de classe

Ponto médio da terceira classe = ponto médio da segunda classe + intervalo de classe

Etapa 6 - Obter as freqüências Leia os valores observados um por um e registre as freqüências obtidas em cada classe usando marcas de contagem em grupos de 5, como segue:

Etapa 6 - Obter as freqüências Registre as freqüências (Tabela 4.7)

 

Freqüência

1

2

3

4

5

 

Notação da

/

//

///

////

////
////

freqüência

 

Freqüência

6

7

 

Notação da

////
////

/

//// //

//// //

freqüência

Ponto Médio Classe Marcas de Freqüências Freqüência f da Classe 1 2,5005 – 2,5055 2,503
Ponto Médio
Classe
Marcas de Freqüências
Freqüência f
da Classe
1 2,5005 – 2,5055
2,503
/
1
2 2,5055 – 2,5105
2,508
////
4
3 2,5105 – 2,5155
2,513
//// ////
9
4 2,5155 – 2,5205
2,518
//// //// ////
14
5 2,5205 – 2,5255
2,523
//// ////
////
//// //
22
6 2,5255 – 2,5305
2,528
//// //// //// ////
19
7 2,5305 – 2,5355
2,533
//// ////
10
8 2,5355 – 2,5405
2,538
////
5
9 2,5405 – 2,5455
2,543
////
/
6
Total
-
-
90
Observação: (1) A soma das freqüências f tem que ser igual à quantidade (n) de dados levantados. (2) A
freqüência relativa, quando necessária, é obtida pela divisão de f por n.

4.6.1 - Como construir um Histograma

Em uma folha de papel quadriculado, marque o eixo horizontal com uma escala. É melhor que a escala não seja baseada nos limites de intervalo das classes e sem na unidade de medida dos dados, 10 gramas correspondendo 10mm, por exemplo. Isto torna-a conveniente para fazer comparações entre vários histogramas que descrevem fatores e características semelhantes, bem como com especificações (padrões). Deixe um espaço aproximadamente igual ao intervalo de classe em cada extremidade do eixo horizontal, antes da primeira e após a última classe. Marque o eixo vertical do lado esquerdo com uma escala de freqüência e, se necessário, trace o eixo vertical do lado direito e marque-o com uma escala de freqüência relativa. A altura da classe com a

23

freqüência máxima deveria ser de 0,5 a 2,0 vezes a distância entre os valores máximo

freqüência máxima deveria ser de 0,5 a 2,0 vezes a distância entre os valores máximo e mínimo do eixo horizontal. Marque os valores dos limites das classes no eixo horizontal. Usando o intervalo de classe como base, desenhe um retângulo cuja altura corresponda à freqüência daquela classe. Trace uma linha no histograma para representar a média e, se for o caso, trace também os limites da especificação. Numa área em branco do histograma, anote o histórico dos dados (o período em que os dados foram

coletados, etc.), a quantidade de dados (n), a média x e o desvio-padrão (s).

de dados ( n ), a média x e o desvio-padrão ( s ). 4.6.2 -

4.6.2 - Tipos de Histograma

É possível obter informações úteis sobre a população pela análise da forma do histograma. seguintes formas são típicas, podendo utiliza-las como modelos para análise de um processo.

24

As

a) Tipo geral (simétrico ou em forma de sino)   Forma: O valor médio do
a) Tipo geral (simétrico ou em forma de sino)   Forma: O valor médio do

a)

Tipo geral (simétrico ou em forma de sino)

 

Forma:

O

valor médio do histograma está no meio da amplitude dos dados.

A freqüência é mais alta no

meio e torna-se gradualmente mais baixa na direção dos extremos. A forma é simétrica.

Nota:

Esta é a forma que ocorre mais freqüentemente.

 

b)

Tipo pente (tipo multi-modal)

 

Forma:

Várias classes têm, como vizinhas, classes com menor freqüência.

 

Nota:

Esta forma ocorre quando a quantidade de dados incluídos na classe varia de classe para classe ou quando existe uma tendência particular no modo como os dados são arredondados

c)

Tipo assimétrico positivo (tipo assimétrico negativo)

 

Forma:

O

valor médio do histograma fica localizado à esquerda (direita) do centro da amplitude. A

freqüência decresce de modo um tanto abrupto em direção à esquerda (direita), porém de modo suave em direção à direita (esquerda). É assimétrica.

Nota:

Esta forma ocorre quando o limite inferior (superior) é controlado, ou teoricamente, ou por um valor

de

especificação, ou quando valores menores (maiores) do que um valor não ocorrem.

d)

Tipo abrupto à esquerda (tipo abrupto à direita)

Forma:

O

valor médio do histograma fica localizado bem à esquerda (direita) do centro da amplitude. A

freqüência decresce abruptamente à esquerda (direita), e suavemente em direção à direita (esquerda).

É

assimétrica.

Nota:

Esta é uma forma que ocorre freqüentemente quando é feita uma inspeção separadora 100% por causa da baixa capacidade do processo e também quando a assimetria positiva (negativa) se torna ainda mais extrema.

25

e) Tipo achatado Forma: As freqüências das classes formam um achatamento porque as classes possuem

e)

Tipo achatado

Forma:

As freqüências das classes formam um achatamento porque as classes possuem mais ou menos a mesma freqüência, exceto aquelas das extremidades.

Nota:

Esta forma ocorre com a mistura de várias distribuições que têm diferentes médias.

f)

Tipo abrupto à esquerda (tipo abrupto à direita)

Forma:

A freqüência é baixa próximo ao meio da amplitude de dados e existe um pico em cada lado.

Nota:

Esta forma ocorre quando duas distribuições, com médias muito diferentes, são misturadas.

g)

Tipo pico isolado

Forma:

Num histograma do tipo geral existe mais um pequeno pico isolado.

Nota:

Esta é uma forma que surge quando há uma pequena inclusão de dados provenientes de uma distribuição diferente, como nos casos de anormalidade de processo, erro de medição ou inclusão de dados de um processo diferente.

4.7 - Características amostrais

A estatística descritiva propõe um método simples de extrair informações de uma massa de números aparentemente sem lógica. Estas características podem representar:

Um valor típico ou central. Enquadram-se média, mediana e moda.

Uma medida de dispersão. Enquadram-se variância, desvio-padrão e amplitude.

Uma medida de freqüência. Enquadra-se a curva de percentil.

Uma curva de percentil é um gráfico de a distribuição percentil acumulada dos dados (freqüência acumulada) versus os valores dos dados. Por exemplo para os dados de resistência das 100 bobinas da Tabela

4.2 constrói-se a curva de percentil conforme a Figura 4.2.

100 90 80 70 60 50 40 30 20 10 mediana = 3,34 0 escala
100
90
80
70
60
50
40
30
20
10
mediana = 3,34
0
escala percentil y
3,27
3,29
3,31
3,33
3,35
3,37
3,39
3,41
3,43

resistência x

Figura 4.2- Curva de percentil para um conjunto de dados.

26

Percebe-se pela curva que, por exemplo, 5% dos dados estão com ou abaixo de 3,29

Percebe-se pela curva que, por exemplo, 5% dos dados estão com ou abaixo de 3,29W, e assim pode- se avaliar as chances de ocorrência dos valores. A maioria dos trabalhos estatísticos usa a curva de percentil sob o nome função de distribuição dos dados. Observa-se ainda que nenhum dos dados é descartado (ou agrupado) na elaboração da curva, preservando todas as informações, ao contrário do histograma dos dados.

4.8 - Medidas de Tendência Central

A maioria das distribuições de freqüência exibe uma “tendência central”, isto é, uma forma tal que a

maior parte das observações se acumula na área entre os dois extremos. Tendência Central é um dos conceitos

fundamentais em toda a análise estatística.

Há três medidas principais de tendência central: média aritmética, mediana e moda.

A Média Aritmética (ou simplesmente média) é usada para distribuições simétricas ou quase

simétricas, ou para distribuições que têm um único pico dominante. É calculada somando-se as observações e

dividindo-se pelo número de observações.

 n x

i

X

=

i = 1

n

(4.1)

A Mediana é o valor central quando os dados estão ordenados por valor. É usada para reduzir o

efeito dos valores extremos ou para dados que possam ser ordenados mas que não sejam economicamente

mensuráveis (tons de cor, aparência visual, odores). Na curva percentil, é o valor da escala horizontal onde a curva alcança a altura 50%.

A Moda é o valor que ocorre com maior freqüência. É usada para distribuições extremamente

assimétricas, situações irregulares onde dois picos são encontrados, ou para eliminar os efeitos dos valores extremos.

4.9 - Medidas de Dispersão

Os dados estão sempre dispersos ao redor da zona de tendência central, e a extensão dessa dispersão é chamada dispersão ou variação. Uma medida de dispersão é a segunda das duas medidas mais fundamentais em toda a análise estatística. Há várias medidas de dispersão. A mais simples é a Amplitude, que é a diferença entre os valores máximo e mínimo dos dados. Como a amplitude é baseada em dois números, é mais útil quando o número de observações é pequeno ( cerca de 10 ou menos).

O Desvio-Padrão é a medida mais importante de variação, ele determina a dispersão dos valores em

relação à média. A definição do Desvio-Padrão da amostra é:

s =

 ( X - X ) 2 n - 1
 ( X
- X
) 2
n -
1

(4.2)

Onde: s é o desvio-padrão amostral, X os valores observados, X a média aritmética e n o número de observações. Quando é necessário distinguir entre o desvio padrão de uma população e o de uma amostra dela

extraída, adota-se freqüentemente o símbolo (s) e (s) respectivamente.

Para fins de cálculo uma fórmula equivalente é:

s =

2 2 n  ( X ) - (  X ) n ( n
2
2
n
 (
X
)
- (
 X
)
n ( n -
1)
27

(4.3)

1)

O Desvio Padrão tem as seguintes propriedades:

A Variância é o quadrado do desvio-padrão. Ou seja:

V

= s 2

é o quadrado do desvio-padrão. Ou seja: V = s 2 Com dados em forma de

Com dados em forma de distribuição de freqüência, cálculos simplificados podem facilitar a determinação da média e do desvio-padrão.

onde A tem origem arbitrária.

ou ainda,

s

f X = A + Á Ê Â d ' ˆ ˜ i Ë n
f
X
= A
+ Á Ê Â
d ' ˆ ˜ i
Ë
n
¯
2 )
2
n
( fd
'
- (
. Â
Â
f d
.
'
)
= i
n n -
(
1)
(
)
2
 fd '
 (
2 )
fd '
-
n
s
= i
(
n -
1)

(4.4)

(4.5)

(4.6)

Se um conjunto de dados é ordenado em ordem de grandeza, o valor médio (ou média aritmética dos dois valores médios) que divide o conjunto em duas partes iguais é a mediana. Por extensão desse conceito, pode-se pensar nos valores que dividem o conjunto em quatro partes iguais. Esses valores, representados por Q 1 , Q 2 e Q 3 denominam-se primeiro, segundo, terceiro quartis, respectivamente, sendo o valor Q 2 igual à mediana.

A diferença entre Q 1 e Q 3 é a amplitude quartil. A amplitude semi-quartil é definida por:

q =

Q

3

-

Q

1

2

(4.7)

Semelhantemente, os valores que dividem os dados em dez partes iguais denominam-se decis e são

, D 9 enquanto que os valores que dividem os dados em cem partes iguais

O quinto decil e o qüinquagésimo percentil

representados por D 1 , D 2 ,

chamam-se percentis

e são representados por P 1 , P 2 ,

, P 99 .

correspondem à mediana. O 25º e o 75º percentis correspondem ao 1º e 3º quartis, respectivamente.

Exemplo 4.1 Considere-se as notas de dois grupos de 10 alunos cada:

Grupo A

3,0

4,5

4,5

5,0

5,0

5,0

6,5

6,5

7,0

8,0

Grupo B

1,0

2,0

3,0

4,0

5,0

6,0

7,0

8,0

9,0

10,0

Esses grupos têm a mesma quantidade de elementos e admitem a mesma média aritmética ( X = 5,5 ), mas apresentam variações bem diferentes em torno dessa média. O grupo A apresenta notas mais uniformes e o grupo B apresenta notas mais variadas. Observe-se os quartis:

Grupo A

3,0

4,5

4,5

5,0

5,0

5,0

6,5

6,5

7,0

8,0

 

Q 1

Q 2

 

Q 3

Grupo B

1,0

2,0

3,0

4,0

5,0

6,0

7,0

8,0

9,0

10,0

As amplitudes semi-quartis são:

28

q

q

A

B

=

65

-

45 =

=

80

2

-

30 =

2

10

25

q q A B = 65 - 45 = = 80 2 - 30 = 2

4.10 - Cálculo de Médias e Desvios Padrões a partir de Tabelas de Freqüência

Como exemplo, pode-se calcular a média e o desvio padrão dos diâmetros de 90 eixos, conforme mostrado na Tabela 4.7. Como a quantidade de dados é grande e os dados estão agrupados em uma tabela de freqüência, a média e o desvio padrão são calculados como segue:

Tabela 4.7 - Tabela de Freqüências de uma amostra 90 eixos

Classe

Ponto Médio x

Freqüência f

d'

d.f

d².f

1

2,5005 – 2,5055

2,503

1

-4

-4

16

2

2,5055 – 2,5105

2,508

4

-3

-12

36

3

2,5105 – 2,5155

2,513

9

-2

-18

36

4

2,5155 – 2,5205

2,518

14

-1

-14

14

5

2,5205 – 2,5255

2,523

22

0

0

0

6

2,5255 – 2,5305

2,528

19

1

19

19

7

2,5305 – 2,5355

2,533

10

2

20

40

8

2,5355 – 2,5405

2,538

3

3

15

45

9

2,5405 – 2,5455

2,543

6

4

24

96

 

Total

90

-

30

302

29

  Procedimento     Exemplo   Etapa 1 Prepare um formulário de cálculo como o
 

Procedimento

   

Exemplo

 

Etapa 1 Prepare um formulário de cálculo como o da Tabela

 

Etapa 2 Anote os limites das classes, os pontos médios das classes e a freqüência f.

 

Etapa 3 Atribua o ponto médio 0 (d’ = 0) para a classe que tem freqüência f máxima e anote 0 na coluna u.

Etapa 3 Atribua 0 (zero) ao ponto médio da classe número 5 da coluna d’.

Escreva –1, -2,

 

na direção dos menores valores

observados e, +1, +2, valores observados.

 

na direção dos maiores

A relação entre x e d’ é expressa pela seguinte equação:

 

d '=

(

x

-

A

)

 

i

onde, A – é o ponto médio da classe onde u = 0 i – é o tamanho do intervalo de classe

A = 2,523 i = 0,005

 

Etapa 4 Insira os produtos de d’ e f na coluna fd’, e os produtos de d’ e fd’ na coluna f(d’)²

Etapa 4

 

Nº. 1

Nº. 2

fd’ = (-4) . 1 = -4 fd’ = (-3) . 4 = -12

 
 

.

Obtenha a soma de cada coluna e anote-as nos espaços reservados.

Nº. 1

Nº. 2

f(d’)² = (-4)² . 1 = 16 f(d’)² = (-3)² . 4 = 36

 
 

.

 d

'

f

= f d

1

'

1

+ f

2

d

'

2

+

 

Â

fd ' = (-4) + (-12) +

+ 24 = 30

 

 d

f = f

1

(

d

'

1

)

2

+ f

2

(

d

'

2

)

2

+

Â

f (d ' )² = 16 + 36 +

+ 96 = 302

Etapa 5

 

Etapa 5

 

Calcule x usando a seguinte equação:

 
 

x

=

A

+

i Ê Á Â

fd ' ˆ

˜

 

x

= 2,523 + 0,005.

30

90

=

2,523

+

0,00167

=

2,52467(mm)

 

Ë

n

¯

   

Etapa 6 Calcule s (ss) usando a equação:

 

Etapa 6

 
2 30 302 - 90 (90 - 1)
2
30
302 -
90
(90
-
1)
 
 

s

=

( ) 2 ( ) Â fd ' 2 Â fd ' - n i
(
)
2
(
)
Â
fd '
2
Â
fd '
-
n
i
(
n -
1)
 

s

= 0,005

=

0,00906(mm)

5 - DIAGRAMAS DE DISPERSÃO

( 1 )

Na prática, é muitas vezes essencial estudar a relação entre duas variáveis associadas como, por exemplo, o grau a dimensão de uma peça de máquina irá variar em função da mudança da velocidade de um torno.

1 KUME, HITOSHI, 1993, “Métodos Estatísticos para Melhoria da Qualidade”, Capítulo 6, pp. 74-95

30

Para estudar a relação entre duas variáveis, tais como dito acima, pode-se usar o chamado

Para estudar a relação entre duas variáveis, tais como dito acima, pode-se usar o chamado diagrama de dispersão. Diagrama de Dispersão é uma forma de gráfico onde simplesmente representa-se graficamente cada par de variáveis de uma série de dados em um sistema de eixos. Tomando como exemplo os dados da Tabela 5.1 abaixo, pode-se construir um diagrama de dispersão:

Tabela 5.1

Ponto de Dados

X

1

X

2

Y

1

-2

1

10

2

-1

-2

5

3

0

-5

0

5.1 - Como Construir um Diagrama de Dispersão

Um diagrama de dispersão é construído conforme as seguintes etapas:

Etapa 1

Coletar dados em pares (X,Y) entre os quais deseja-se estudar as relações, e organize-os em uma tabela. É desejável que se tenha pelo menos 30 pares de dados.

Etapa 2

Encontrar os valores máximo e mínimo, tanto para X como para Y. Defina as escalas dos eixos horizontal e vertical de forma que ambos os comprimentos sejam aproximadamente iguais; assim, o diagrama ficará mais fácil de interpretar. Determinar, para cada eixo, entre 3 e 10 divisões para as unidades da escala de graduação, e utilize números inteiros para torna-lo mais fácil de ler. Quando duas variáveis consistirem em um fator e uma característica da qualidade, use o eixo horizontal X para o fator e o eixo vertical Y para a característica da qualidade.

Etapa 3

Marcar os dados num papel milimetrado. Quando os mesmos valores de dados forem obtidos a partir de diferentes observações, mostre estes pontos, desenhando círculos concêntricos (), ou marcando o segundo ponto rente ao primeiro.

Etapa 4

Inserir todos os itens necessários.

Certificar de que os seguintes itens sejam incluídos para que

qualquer pessoa, além do autor do diagrama, possa entende-lo num rápido exame:

a. Título do diagrama;

b. Período de tempo;

c. Quantidade de pares de dados;

d. Denominação e unidade de medida de cada eixo;

e. Nome (etc.) da pessoa que elaborou o diagrama.

Exemplo 5.1 Um fabricante de tanques plásticos, que os fabricava pelo processo de moldagem a sopro, encontrou problemas de tanques defeituosos com paredes finas. Suspeitou-se que a variação da pressão do ar, dia a dia, era a causa das paredes finas não-conformes. A Tabela 5.2 mostra dados sobre a pressão de sopro e a percentagem defeituosa.

31

Tabela 5.2 – Dados da Pressão de Sopro e Percentagem Defeituosa de Tanques de Plástico

Tabela 5.2 – Dados da Pressão de Sopro e Percentagem Defeituosa de Tanques de Plástico

 

Pressão de

Percent.

 

Pressão de

Percent.

Data

Sopro

Defeituosa

Data

Sopro

Defeituosa

(kgf/cm²)

(%)

(kgf/cm²)

(%)

Out

1

8,6

0,889

Out

22

8,7

0,892

2

8,9

0,884

23

8,5

0,877

3

8,8

0,874

24

9,2

0,885

4

8,8

0,891

25

8,5

0,866

5

8,4

0,874

26

8,3

0,896

8

8,7

0,886

29

8,7

0,896

9

9,2

0,911

30

9,3

0,928

10

8,6

0,912

31

8,9

0,886

11

9,2

0,895

Nov

1

8,9

0,908

12

8,7

0,896

2

8,3

0,881

15

8,4

0,894

 

5

8,7

0,882

16

8,2

0,864

6

8,9

0,904

17

9,2

0,922

7

8,7

0,912

18

8,7

0,909

8

9,1

0,925

19

9,4

0,905

9

8,7

0,872

Etapa 1

Conforme visto na Tabela 5.2, existem 30 pares de dados.

Etapa 2

Neste exemplo, indicamos a pressão de sopro por X (eixo horizontal) e a percentagem defeituosa por Y (eixo vertical).

Assim:

O

valor máximo de x:

x máx = 9,4 (kgf/cm²)

O

valor mínimo de x:

x mín = 8,2 (kgf/cm²)

O

valor máximo de y:

y máx = 0,928 (%)

O

valor mínimo de y:

y mín = 0,864 (%)

Marca-se divisões para graduação:

no eixo horizontal – em intervalos de 0,5(kgf/cm²) de 8,0 a 9,5(kgf/cm²) no eixo vertical – em intervalos de 0,01(%) de 0,85 a 0,93(%)

Etapa 3

Marca-se os pontos no gráfico.

Etapa 4

Anota-se o período de tempo a que se refere a amostra coletada (1 de outubro a 9 de novembro), a quantidade de amostras (n = 30), o eixo horizontal (pressão de sopro [kgf/cm²]), o eixo vertical (percentagem defeituosa [%]), e o título do diagrama (diagrama de dispersão da pressão do sopro e a percentagem defeituosa).

32

Figura 5.1 – Exemplo de Diagrama de Dispersão 5.2 - Como Interpretar os Diagramas de
Figura 5.1 – Exemplo de Diagrama de Dispersão 5.2 - Como Interpretar os Diagramas de

Figura 5.1 – Exemplo de Diagrama de Dispersão

5.2 - Como Interpretar os Diagramas de Dispersão

Assim como é possível avaliar o formato de uma distribuição em um histograma, a distribuição global dos pares de dados pode ser interpretada a partir de um diagrama de dispersão. Ao proceder a leitura, a primeira coisa que se deve fazer é examinar se há ou não pontos atípicos no diagrama. Geralmente, pode-se julgar que quaisquer pontos afastados do grupo principal (Figura 5.2) resultaram de erros na medição ou registro de dados, ou foram causados por alguma mudança nas condições de operação. É necessário excluir esses pontos para análise da correlação. Contudo, ao invés de desprezar completamente estes pontos, deveria ser dada a devida atenção à causa de tais irregularidades pois, muitas vezes, informações inesperadas, porém muito úteis, são obtidas descobrindo-se por que eles ocorreram. Existem muitos tipos de padrões de dispersão, e alguns destes são dados da Figura 5.3. Nesta figura, tanto na .1 como na .2, Y aumenta com X; este é o caso da correlação positiva. E ainda, como a .1 mostra esta tendência de forma notável, diz-se que ela apresenta forte correlação positiva. As Figuras .4 e .5 mostram o oposto da correlação positiva, pois à medida que X aumenta, Y diminui; este é o caso da chamada correlação negativa. A Figura .4 indica uma forte correlação negativa. A Figura .3 mostra o caso em que X e Y não têm nenhuma relação específica; portanto, dizemos que não há correlação. Na Figura .6, à medida que X aumenta, Y varia num padrão curvo. Isto será explicado posteriormente.

aumenta, Y varia num padrão curvo. Isto será explicado posteriormente. Figura 5.2 – Exemplo de Pontos

Figura 5.2 – Exemplo de Pontos Suspeitos

33

.1 - Correlação Positiva .2 - Correlação Negativa .3 - Pode haver Correlação Positiva .4
.1 - Correlação Positiva .2 - Correlação Negativa .3 - Pode haver Correlação Positiva .4
.1 - Correlação Positiva .2 - Correlação Negativa .3 - Pode haver Correlação Positiva .4

.1 - Correlação Positiva

.2 - Correlação Negativa

.1 - Correlação Positiva .2 - Correlação Negativa .3 - Pode haver Correlação Positiva .4 -
.1 - Correlação Positiva .2 - Correlação Negativa .3 - Pode haver Correlação Positiva .4 -

.3 - Pode haver Correlação Positiva

.4 - Pode haver Correlação Negativa

Correlação Positiva .4 - Pode haver Correlação Negativa .5 - Não Há Correlação .6 - Não
Correlação Positiva .4 - Pode haver Correlação Negativa .5 - Não Há Correlação .6 - Não

.5 - Não Há Correlação

.6 - Não Há Correlação

Figura 5.3 – Exemplos de Correlação

5.3 - Cálculo de Coeficientes de Correlação

Para estudar a relação entre X e Y é importante traçar primeiro um diagrama de dispersão, entretanto, a fim de conhecer a força da relação em termos quantitativos, é útil calcular o coeficiente de correlação de acordo com a seguinte definição:

onde:

r =

S XY ( ) S(XX )S(YY ) .
S XY
(
)
S(XX )S(YY )
.

34

(5.1)

(

S XY

)

(

S XX

)

(

S YY

n (

= Â

i = 1

X

n (

= Â

i = 1

X

i - Â n (

X

)

2

=

i

= 1

X

2 )

i

-

)

i

n (

= Â

Y

i

i = 1

-

X

)(

Y

i

- Y

)

2

=

 n (

i

= 1

Y

i

2 )

-

Y

)

=

 n (

i = 1

X Y

i

i

-

)

Ê Á Â

n

X

Ë n = 1

i

ˆ

˜

¯

2

Ê Á Â

n

Ë n = 1

n

ˆ

Y ˜

i

¯

2

n

-

Ê Á Â

n

X

Ë n = 1

ˆ Ê

n

i ˜ Á Â

¯ Ë

n = 1

Y

i

ˆ

.

¯

˜

n