Sei sulla pagina 1di 21

UNIVERSIDADE FEDERAL DO MARANHÃO

CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA


DEPARTAMENTO DE DESENHO E TECNOLOGIA
ESPECIALIZAÇÃO EM ERGONOMIA

Tópicos de Estatística Aplicada à Ergonomia


Professora Msc. Lívia Flávia de Albuquerque Campos

São Luis
2013
SUMÁRIO

1. TIPOS DE VARIÁVEIS .......................................................................................................... 3


1.1. Variáveis dependentes .................................................................................................. 3
1.2. Variáveis Independentes ............................................................................................... 4
2. TIPOS DE DADOS ............................................................................................................... 4
2.1. Dados nominais ............................................................................................................. 5
2.2. Ordinais......................................................................................................................... 6
2.3. Intervalares ................................................................................................................... 6
2.4. De relação ..................................................................................................................... 7
3. PROCEDIMENTOS ESTATÍSTICOS........................................................................................ 8
3.1. Estatística inferencial ................................................................................................. 8
3.1.1. Estatísticas descritivas ............................................................................................... 9
3.1.2. Comparação de amostras ........................................................................................ 15
3.1.2.1. Técnicas paramétricas ............................................................................................. 16
a) Teste t de Student ........................................................................................................... 16
b) ANOVA ............................................................................................................................ 18
3.1.2.2. Técnicas não paramétricas ................................................................................... 18
a) Wilcoxon ......................................................................................................................... 18
b) Mann-Whitney ................................................................................................................ 18
c) Friedman......................................................................................................................... 19
d) Kruskal-Wallis.................................................................................................................. 19
4. RESUMO DOS PROCEDIMENTOS...................................................................................... 19
REFERÊNCIAS .......................................................................................................................... 20

2
1. TIPOS DE VARIÁVEIS

A pesquisa em Ergonomia inclui a coleta de muitos tipos de dados. Em usabilidade, por


exemplo, explica Tullis e Albert (2008), os dados incluem as taxas de conclusão da tarefa,
respostas a uma pesquisa de satisfação (subjetivo), ou o número de problemas que um
participante encontra em um teste de laboratório.

Para analisar os fenômenos em uma avaliação ergonômica é necessário entender o que


são e quais são os tipos de dados e variáveis.

As variáveis são os elementos constitutivos das hipóteses (LAKATOS; MARCONI, 1991). As


hipóteses por sua vez, constituem-se em enunciados gerais de relações entre as variáveis
(fatos, fenômenos), formulados como solução provisória para um determinado problema;
apresentando caráter explicativo ou preditivo; compatível com o conhecimento científico
(coerência externa) e revelando uma consistência lógica (coerência interna); sendo passível de
verificação empírica em suas consequências (LAKATOS; MARCONI, 1991).

Existem diversas formas de classificar os tipos de variáveis, uma delas é enquadrando-as


como dependentes ou independentes. Para Tullis e Albert (2008) em qualquer estudo em
Ergonomia deve-se identificar as variáveis independentes e as dependentes.

1.1. Variáveis independentes

A variável independente, segundo Lakatos e Marconi (1991, p. 172) é:

“É aquela que influencia, determina ou afeta a outra variável; é fator


determinante, condição ou causa para certo resultado, efeito ou
consequência; é o fator manipulado (geralmente) pelo investigador, na sua
tentativa de segurar a relação do fator com o fenômeno observado ou a ser
descoberto, para ver que influência exerce sobre um possível resultado”.

Uma variável independente de um estudo é um aspecto manipulado, devem-se


escolher as variáveis independentes com base na questão de pesquisa. Por exemplo, ao se
preocupar com as diferenças de desempenho entre homens e mulheres (Variáveis: Masculino
x Feminino), ou entre novatos e especialistas (Variáveis: Novatos x Especialistas), ou entre dois
projetos diferentes (Variáveis: Projeto A x Projeto B), todas estas são variáveis independentes
que podem ser manipuladas para responder às perguntas de investigação específicas (TULLIS;
ALBERT, 2008).
Em ergonomia variáveis independentes recorrentes em análises são:

 Gênero;
 Faixa etária;
 Produtos;
 Percentis (Antropometria), dentre outros;

3
1.2. Variáveis Dependentes

Já as variáveis dependentes consistem:

“[...] naqueles valores (fenômenos ou fatores) a serem explicados ou


descobertos, em virtude de serem influenciados, determinados ou afetados
pela variável independente; é o fator que aparece desaparece ou varia à
medida que o investigador introduz, tira ou modifica a variável
independente; a propriedade ou o fator que é efeito, resultado,
consequência ou resposta a algo que foi manipulado (variável
independente) (LAKATOS; MARCONI, 1991, p. 172)”.

Variáveis dependentes (também chamadas de resultado ou variáveis de resposta)


descrevem o que aconteceu como resultado do estudo. A variável dependente é algo que você
mede como o resultado da (ou como dependente da) manipulação das variáveis
independentes (TULLIS; ALBERT, 2008).
Variáveis dependentes em ergonomia incluem resultados, tais como taxas de sucesso,
número de erros, satisfação do usuário, tempo de conclusão de uma tarefa, dentre outras
(TULLIS; ALBERT, 2008).

Outras variáveis dependentes em ergonomia podem ser:


 Percepção de dor/esforço;
 Valores de força exercida;
 Frequência cardíaca;
 Estimação de gasto energético, dentre outras;

Segundo Tullis e Albert (2008), ao se planejar um estudo, deve-se ter ideia clara do que
se pretende manipular (variáveis independentes) e do que se pretende medir (variáveis
dependentes). Se não existe uma ideia clara disso, deve-se voltar para os objetivos da
pesquisa. Se é possível desenhar uma conexão lógica entre os objetivos da pesquisa e suas
variáveis dependentes e independentes, este estudo será bem sucedido (TULLIS; ALBERT,
2008).

2. TIPOS DE DADOS

Além dos tipos de variáveis, em estudos de ergonomia/usabilidade é necessário


compreender os quatro tipos gerais de dados: nominal, ordinal, intervalar e de relação.

Cada tipo de dado tem suas próprias forças e limitações. Ao coletar e analisar dados de
usabilidade, deve-se conhecer quais tipos de dados se está lidando e o que é possível ou não
fazer com cada tipo (TULLIS; ALBERT, 2008).

Além disso, cada tipo de dado requer um tratamento estatístico específico, os quais
também serão apresentados.

4
2.1. Dados nominais

Os dados nominais são grupos ou categorias desordenadas. Sem ordem entre as


categorias, observa-se apenas que eles são diferentes, não que um seja melhor que o outro,
apenas diferentes (TULLIS; ALBERT, 2008).

Dados nominais podem ser: características de diferentes tipos de usuários, usuários


em diferentes localizações geográficas, ou masculino em oposição ao feminino. Estas são
tipicamente variáveis independentes que permitem que se segmentem os dados por estes
grupos diferentes (TULLIS; ALBERT, 2008).

Os dados nominais também incluem variáveis dependentes, como por exemplo, o


sucesso na realização de uma tarefa, ou o número de participantes que clicaram no link A em
vez do link B, ou participantes que escolheram usar um controle remoto em vez dos controles
em um leitor de DVD (TULLIS; ALBERT, 2008).

Outros exemplos incluem:


 Faixas etárias (jovem; adulto; idoso)
 Sintomas musculoesqueléticos relatados (Questionário Nórdico – você teve
algum problema nos últimos 7 dias?);

Entre as estatísticas que podem ser usadas com dados nominais encontram-se as
simples estatísticas descritivas como contagens e frequências. Por exemplo, pode-se dizer que
45% dos participantes são do sexo feminino, ou 95% foram bem sucedidos em uma
determinada tarefa, dentre outras (TULLIS; ALBERT, 2008).

Uma informação importante ao se trabalhar com dados nominais é o método de


codificação dos dados. Pode-se utilizar, no Excel, por exemplo, uma representação de cada
grupo usando números. Por exemplo, pode-se codificar os homens como grupo'' 1'' e mulheres
como grupo'' 2''. Ou ainda como “F” e “M” (TULLIS; ALBERT, 2008).

Para este caso, a contagem pode ser feita utilizando uma fórmula de contagem no
Excel, como CONT.SE. Para isso, digite na célula onde deverá constar o resultado a seguinte
formula: =CONT.SE(<selecione os dados>;”critério”). O critério deve ser sempre o que se
deseja contar, se for o número de sujeitos femininos que estão identificados por F, coloque “F”
entre aspas, sempre (Figura 1).

Figura 1 – Formula CONT.SE no Excel, para contagem de dados nominais.


5
Uma maneira útil é organizar as planilhas por gêneros e/ou faixas etárias e/ou nível de
experiência, ou seja, de acordo com a variável independente do estudo.

Outra forma de calcular a taxa de sucesso na realização de uma tarefa é atribuir


códigos para a realização de tarefas, considerando “1” como sucesso e “0” como falha. A
média desses valores retornará o percentual de acertos no conjunto, ou seja, o percentual de
sujeitos que foram bem sucedidos na realização das tarefas (TULLIS; ALBERT, 2008).

2.2. Ordinais

Dados ordinais são ordenados em grupos ou categorias. Como o nome indica, os dados
são organizados de modo que intervalos entre as medições não são significativos. Podem ser
avaliados como dados classificados. A lista dos 100 melhores filmes, avaliado pelo American
Film Institute (AFI), mostra que o décimo melhor filme de todos os tempos, “Singing in the
Rain”, é melhor do que vigésimo melhor filme de todos os tempos, “One Flew Over the
Cuckoo’s”. Entretanto, essa avaliação não diz que “Singing in the Rain” é duas vezes melhor
que “One Flew Over the Cuckoo’s”. Um filme é apenas melhor do que o outro, pelo menos de
acordo com a AFI (TULLIS; ALBERT, 2008).

Isto se deve ao fato de que distância entre as fileiras não é significativa, não é possível
afirmar que uma categoria é duas vezes melhor que outra. Dados ordinais podem ser
verificados nas avaliações de “melhor ou pior”, “mais satisfeitos ou menos satisfeitos”, ou,
“mais grave ou menos grave”. A classificação relativa (a ordem do ranking) é a única
informação que importa (TULLIS; ALBERT, 2008).

Em ergonomia, uma ocorrência comum de dados ordinais vem de medidas


autorrelatadas, como os dados coletados por questionários. Por exemplo, um participante
pode avaliar um site como excelente, bom, regular ou ruim. Estas são posições relativas: a
distância entre excelente e bom não é necessariamente a mesma distância entre o bem e o
justo. A forma mais comum para analisar os dados ordinais é verificar as frequências. Por
exemplo, você pode relatar que 40% dos participantes avaliaram o site como excelente, 30%
como bom, 20% como justo, e 10% como ruim (TULLIS; ALBERT, 2008).

2.3. Intervalares

Dados de intervalo são dados contínuos em que as diferenças entre as medições são
significativas, mas não há ponto natural zero. Um exemplo de dados de intervalo familiares
para a maioria de nós é a temperatura, em Celsius, no qual o “zero” é definido como ponto de
congelamento, entretanto esse valor é arbitrário, pois zero grau não significa a ausência de
calor, mas identifica apenas um ponto significativo na escala de temperaturas (TULLIS; ALBERT,
2008).

Em usabilidade, a Escala de Usabilidade (SUS) é um exemplo de dados de intervalo.


SUS é baseada em dados autorrelatados a partir de uma série de perguntas sobre a
usabilidade geral de qualquer sistema. Pontuações variam de 0 a 100, com uma pontuação
superior, o SUS indica melhor usabilidade. A distância entre cada ponto ao longo da escala é
significativo no sentido de que representa um aumento incremental ou diminuição da
usabilidade percebida (TULLIS; ALBERT, 2008).
6
Intervalos de dados permitem calcular uma ampla gama de estatísticas descritivas
(incluindo médias, desvio padrão, etc.). Há também a possibilidade de aplicar estatística
inferencial que pode ser usada para generalizar sobre uma população maior. Dados de
intervalo fornecem mais possibilidades para a análise do que dados nominais ou ordinais
(TULLIS; ALBERT, 2008).

Um dos debates entre os pesquisadores que coletam e analisam avaliações subjetivas


é se você deve tratar os dados como puramente ordinais ou você pode tratá-los como sendo
de intervalo. Considere estas duas escalas (Figura 2) (TULLIS; ALBERT, 2008):

Figura 2 – Escalas: ordinal e de intervalo.

À primeira vista, pode-se dizer que as duas escalas são as mesmas, mas a diferença de
apresentação as torna diferentes. Colocar etiquetas explícitas sobre os itens da primeira escala
a torna com dados ordinais. Deixar os rótulos fora, na segunda escala e apenas rotular o ponto
final torna os dados como intervalos. Essa é a razão para que escalas mais subjetivas rotulem
os fins, ou “âncoras”, e não cada ponto de dados.
Agora, considere uma versão ligeiramente diferente da segunda escala (Figura 3)
(TULLIS; ALBERT, 2008).

Figura 3 – Escala de intervalo.

Apresentando-o desta forma, com 10 pontos ao longo da escala, torna ainda mais
evidente que os dados podem ser tratados como se fossem dados de intervalo. A
interpretação razoável da escala por um usuário é que as distâncias entre todos os pontos de
dados ao longo da escala são iguais. A questão a se perguntar quando decidir se você pode
tratar alguns dados como intervalo ou não, é se um ponto no meio do caminho entre
quaisquer dois dos pontos de dados definidos faz sentido. Se isso acontecer, então não faz
sentido analisar os dados como dados de intervalo (TULLIS; ALBERT, 2008).

2.4. De relação

São os mesmos que os dados de intervalo, com a adição de um zero absoluto. Estes
dados significam que o valor de zero, não é arbitrário, como acontece com os dados de
intervalo, mas tem algum significado inerente. Com dados de taxa, as diferenças entre as
medidas são interpretadas como uma razão/relação. Exemplos de dados de relação são a
idade, altura e peso. Em cada exemplo, zero indica ausência de idade, altura, ou peso (TULLIS;
ALBERT, 2008).

Em usabilidade, o exemplo mais óbvio de dados de relação é tempo de conclusão,


“zero segundo” restantes não significaria tempo ou a duração restante. Dados de taxa
permitem afirmar que algo é duas vezes mais rápido ou lento que outra coisa, por exemplo
(TULLIS; ALBERT, 2008).
7
Não há muitas análises adicionais que você pode fazer com dados de relação em
comparação com dados de intervalo. Uma exceção é o cálculo de uma média geométrica, que
pode ser útil para medir as diferenças de tempo. Além de que o cálculo, não há realmente
muitas diferenças entre intervalo e dados de relação em termos das estatísticas disponíveis
(TULLIS; ALBERT, 2008).

3. PROCEDIMENTOS ESTATÍSTICOS

Escolher as estatísticas corretas é fundamental. Decidir pelo teste errado e terminar


com uma conclusão incorreta poderia invalidar os resultados e invalidar a avaliação inteira. A
Figura 4 mostra alguns dos testes estatísticos mais recorrentes. O tipo de dado a ser
examinado determinará diferentes testes (TULLIS; ALBERT, 2008).

Figura 4 – A escolha do teste estatístico de acordo com os diferentes tipos de dados

A seguir serão apresentadas as principais ferramentas para análise de dados


recorrentes em Ergonomia.

3.1. Estatística inferencial

Beiguelman (2002) explica que é impraticável o estudo com toda uma população,
sendo possível tirar conclusões a respeito das características populacionais através de valores
numéricos obtidos na análise de amostras. Denomina-se Inferência estatística, a parte da
estatística que se dedica à criação e emprego de métodos para obter conclusões a respeito de
uma amostra retirada de uma população.

Tendo em mente que, para realizar a inferência estatística, é necessário, antes, a


coleta e a descrição sucinta dos dados amostrais, é importante conhecer a Estatística
Descritiva, a qual, segundo Beiguelman (2002, p. 3), “dedica-se às técnicas empregadas para
descrever o comportamento médio e a variabilidade das informações contidas nas amostras”.

8
3.1.1. Estatísticas descritivas

Estatísticas descritivas, como o nome indica, descrevem os dados sem dizer nada sobre
a população maior. Já a Estatística inferencial permite você tirar algumas conclusões ou inferir
sobre uma população maior acima e além de sua amostra (TULLIS; ALBERT, 2008).

Parte-se da Distribuição de frequências para variáveis contínuas (ver Beiguelman


(2002, p.4-9) para saber mais sobre variáveis continuas e discretas).

A Distribuição de frequências é a organização dos dados em classes de um mesmo


intervalo. Uma distribuição de frequências pode ser mais facilmente entendida quando
representada graficamente, e para isso vale-se do Histograma ou do Polígono de frequências
(BEIGUELMAN, 2002).

A figura 5 apresenta o Polígono de frequências de dados de força manual (Contração


Voluntária Máxima), de 90 sujeitos do gênero masculino, em movimento no sentido da
posição pronada para a posição neutra do punho (horário) em um modelo de interface de
maçaneta de porta (CAMPOS, 2010).

Histogram: Var1
Shapiro-Wilk W=,98611, p=,45674
Expected Normal
40

35

30

25
No. of obs.

20

15

10

0
0 1 2 3 4 5 6 7

X <= Contração Voluntária Máxima (N)

Figura 5 – Polígono de frequências.

No Polígono de frequências é fácil localizar-se a Moda, ou seja, o valor amostral que


foi observado com maior frequência. Outra vantagem da representação gráfica das
distribuições é que ela permite constatar imediatamente os casos em que há duas ou mais
modas, o que é um indicador de que a amostra é heterogênea, porque ela deve estar
representando mais de uma população, neste caso ela apresentará o polígono de frequências
similar ao que é apresentado na Figura 6. Se a amostra possui apenas uma moda é chamada
de unimodal (BEIGUELMAN, 2002).
9
Figura 6 – Polígono de frequências de amostras heterogêneas.

Para verificar a homogeneidade das amostras, o que é essencial também na escolha


dos testes estatísticos a serem aplicados.

Para realizar o teste de homogeneidade no STATISTICA® siga os seguintes passos.


Passo 1: Digite (ou cole) os 2 ou mais grupos de dados em uma mesma coluna (var1. Em
seguida, Identifique cada grupo de dados na coluna ao lado (var2) (Figura 7).

Figura 7 – Passo 1 para realizar teste de homogeneidade.

Passo 2: Clique em Statistics e selecione ANOVA e depois em Type of Analysis selecione


One-Way ANOVA, clique em OK (Figura 8).

Figura 8 – Passo 2 para realizar teste de homogeneidade.

Passo 3: Clique em Variables. Selecione a coluna com os dados (var1) e (var2), clique
em Ok (Figura 8).

10
Figura 9 – Passo 3 para realizar teste de homogeneidade.

Passo 4: Clique em Ok. Clique em More Results (Figura 10).

Figura 10 – Passo 4 para realizar teste de homogeneidade.

Passo 5: Selecione o teste Levene. Em seguida aparecerá a tela de resultado (Figura


11).

Figura 11 – Passo 4 para realizar teste de homogeneidade.

A interpretação do resultado deve ser feita da seguinte forma. Quando o valor de “p”
for maior que 0,05 a amostra é homogênea.

Voltando aos Histogramas, estes também permitem que se localize a Mediana, isto é,
a medida central do conjunto analisado. 50% dos dados se localizará à esquerda da Mediana e
os outros 50% à direita (BEIGUELMAN, 2002).

Os programas de análise estatística (SPSS®, STATISTICA®, BIOSTAT®, dentre outros)


bem como o Excel, efetuam a Distribuição de frequências de dados, o Histograma, o Polígono
de frequências, bem como a Moda e a Mediana com bastante praticidade.

11
No Excel, para calcular a Mediana utilize a formula =MED(selecione o intervalo de
dados). E para calcular a Moda, =MODO(selecione o intervalo de dados). Para o caso dos dados
apresentados no Polígono de frequências da Figura 5 a mediana e a moda são apresentados
abaixo (Figura 7) .

Histogram: Var1
Mediana 3,58
Shapiro-Wilk W=,98611, p=,45674
Expected Normal
Moda 3,84
40

35

30

25
No. of obs.

20

15

10

0
0 1 2 3 4 5 6 7

X <= Contração Voluntária Máxima (N)

Figura 12 – Mediana e moda.

Uma das principais aplicações práticas da distribuição de frequências para o caso da


Ergonomia é a Verificação da normalidade das amostras, requisito essencial para a decisão
por técnicas paramétricas ou não paramétricas.

A Distribuição Normal é uma distribuição teórica de frequências muito importante e


útil para a análise de variáveis continuas. Isso ocorre, pois são extremamente comuns as
características biológicas expressas por variáveis contínuas que mostram grande manipulação
ajustamento à distribuição representada pela curva normal (Figura 8) (BEIGUELMAN, 2002).

Figura 13 – Curva representativa de uma distribuição normal.

A verificação da Normalidade no programa STATISTICA® pode ser feito em poucos


passos.

Passo1: Digite o número de casas e variáveis necessárias para digitar os dados e clique
em OK, ou clique em Ok e copie e cole os dados previamente digitados no Excel (Figura 9).

12
Figura 14 – Passo 1 para verificação da normalidade.

Passo 2: Clique em Statistic, escolha Basic Statistic/Tables, selecione Descriptive


Statistics e clique em OK (Figura 10).

Figura 15 – Passo 2 para verificação da normalidade.

Passo 3: Na janela aberta escolha a aba Normality. Selecione o teste Shapiro-Wilk’s e


clique em Histogram. O teste Shapiro-Wilk’s é indicado para testar a normalidade (SHAPIRO,
WILK; CHEN, 1968) (Figura 11).

Figura 16 – Passo 3 para verificação da normalidade.

O resultado do teste Shapiro-Wilk deve ser interpretado da seguinte forma: quando


p>0,05, a amostra apresenta normalidade. Quando o p≤0,05 a amostra não apresenta
normalidade (SHAPIRO, WILK; CHEN, 1968).

Para a avaliação dos dados em ergonomia não há relevância a amostra ser


caracterizada como normal ou não, esta verificação é simplesmente para determinar a
utilização dos métodos paramétricos ou não paramétricos.

Até aqui já foi apresentada a importância da descrição gráfica das distribuições de


frequências na identificação do tipo de distribuição populacional. Quando a distribuição é

13
unimodal pode-se fazer a sua Descrição Aritmética, que torna as informações descritivas
ainda mais precisas, além de facilitar a comparação de diferentes amostras. Essa descrição é
feita pela Média Aritmética, ou simplesmente Média, que é simbolizada geralmente por (lê-
se x barra). A média calculada a partir dos dados amostrais serve para estimar, isto é, avaliar
o valor da média da população da qual foi extraída a amostra. Outra descrição que pode ser
realizada é o conhecimento da variação dos dados em relação a essa média, o Desvio padrão,
o qual representa a dispersão dos dados em torno da média (BEIGUELMAN, 2002).

Os mesmos passos para verificação da normalidade no STATISTICA® podem ser


seguidos para o desenvolvimento de uma tabela completa com os dados da estatística
descritiva, os quais também podem ser obtidos com facilidade no Excel.

Para desenvolver a tabela de dados descritivos no STATISTICA® ao chegar no passo 3,


clique em Advanced Normality, e selecione as estatísticas descritivas de interesse. Clique em
Summary e os resultados aparecerão na tela seguinte (Figura 12).

Figura 17 – Tabela de estatísticas descritivas.

Assim, as principais estatísticas descritivas relevantes para a análise de dados em


ergonomia podem ser resumidas em:

 Histograma: utilizado para visualização da distribuição das frequências;


 Teste de Shapiro-Wilk: utilizado para verificação da normalidade da amostra
(p>0,05, a amostra apresenta normalidade; p≤0,05 a amostra não apresenta
normalidade);
 Teste de Levene: para verificar a homogeneidade
 Moda: o valor amostral que foi observado com maior frequência;
 Mediana: a medida central do conjunto analisado;
 Média: média da população da qual foi extraída a amostra;
 Desvio padrão: a dispersão dos dados em torno da média. É relevante sempre
que são apresentados valores de médias, estes virem acompanhados dos
respectivos desvios padrão.

Segundo Tullis e Albert (2008), estas estatísticas, também conhecidas como Medidas
de tendência central são a primeira coisa que deve ser observado ao executar estatística
descritiva. Tendência central é simplesmente o meio, ou parte central de qualquer
distribuição. As três medidas mais comuns de tendência central são estas, a média, mediana e
moda. Os autores apresentam um exemplo de análise de testes de usabilidade, na análise dos
dados de tempo para a realização de uma tarefa (Figura 18).

14
Figura 18 – Medidas de tendência central na análise de dados de tempo para execução de uma tarefa em teste de
usabilidade. FONTE: Tullis e Albert (2008).

Na Figura 18, a média é de 35,1 segundos, de modo que o tempo médio para concluir
esta tarefa foi de pouco mais de 35 segundos. A média das métricas de usabilidade é
extremamente útil e é, provavelmente, a estatística mais comum citada em nos relatórios
(TULLIS; ALBERT, 2008).

A mediana 33,5 segundos, como ponto intermediário na distribuição representa que


metade dos participantes estão abaixo de 33,5 segundos, ou seja, foram mais lentos, e metade
estão acima desse valor, foram mais rápidos. Em alguns casos, a mediana pode ser mais
reveladora do que a média. Dependendo do valor do Desvio padrão, que indica a dispersão em
torno da média, é preferível utilizar para análise a mediana. De modo geral se o Desvio padrão
for muito elevado, ou seja, se a amostra envolver valores extremos de grande proporção,
considere usar a mediana (TULLIS; ALBERT, 2008).

Já a moda, que é o valor mais comumente ocorre, na figura 13 observa-se que esta é
de 22 segundos. Dois participantes completaram a tarefa em 22 segundos. Não é comum
relatar a moda em resultados de testes de usabilidade, mas pode ser útil esta informação.
Quando os dados são contínuos ao longo de um amplo espectro, tais como os tempos de
conclusão apresentados na Figura 18, a moda é geralmente menos útil. Quando os dados têm
um conjunto mais limitado de valores (como escalas de avaliação subjetiva), a moda é mais útil
(TULLIS; ALBERT, 2008).

3.1.2. Comparação de amostras

Em inferência estatística, preocupa-se em extrair conclusões sobre um grande grupo


de objetos ou eventos que ainda estão por ocorrer, com base na observação de poucos
objetos ou fatos que tenham ocorrido no passado. A estatística fornece ferramentas que
formalizam e padronizam os procedimentos para obter tais conclusões. Os procedimentos de
inferência estatística introduzem ordem em qualquer tentativa de extrair conclusões da
evidência proporcionada por amostras. Testes estatísticos determinam se, a partir da

15
evidência que coletamos podemos ter confiança no que concluímos sobre o grande grupo no
qual somente poucos objetos foram observados. Um problema comum em inferência
estatística é determinar, em termos de uma probabilidade, se diferenças observadas entre
duas amostras significam que as populações correspondentes são realmente diferentes entre
si (SIEGEL; CASTELLAN, 2006).
No desenvolvimento dos métodos de estatística moderna, as primeiras técnicas de
inferência, as Paramétricas, foram baseadas na suposição de que os dados foram extraídos de
uma população com Distribuição Normal. Um pouco mais recente assistiu-se o
desenvolvimento de um grande número de técnicas de inferência, as quais não fazem
suposições restringentes sobre a população da qual os dados são extraídos, essas técnicas são
as Não paramétricas, ou livres de Distribuição Normal (SIEGEL; CASTELLAN, 2006).

3.1.2.1. Técnicas paramétricas

a) Teste t de Student

Segundo Arango (2005, p. 253) o teste t de Student “é o método mais usado para se
avaliarem as diferenças entre as médias de dois grupos”, desde que “seja admitido que as
populações que deram origem às amostras, tenham distribuição normal e variabilidades não
significativamente diferentes”.

Quando as amostras a serem comparadas forem normais (Shapiro- Wilk) e homogêneas


(Levene) para amostras independentes aplica-se o Teste t. As principais modalidades desse
teste utilizados em ergonomia são:

- Teste t, independente, por grupos: utilizado para comparar respostas de homens e


mulheres em uma pesquisa, por exemplo. Os dados são organizados na mesma coluna e
identificados por grupos;

- Teste t, amostras dependentes: compare as respostas da mesma pessoa quanto a


questões de uma pesquisa antes e depois de um evento;

Para executar o Teste t de Student no STATISTICA®, para o caso da comparação de


respostas entre gêneros (ambas as amostras devem apresentar normalidade, caso apenas
uma apresente normalidade, aplica-se teste não paramétrico). Organize os dados em uma
coluna, separando os grupos através de um idenficador (1 para masculino e 2 para feminino,
por exemplo), depois clique em Statistcs, selecione Basic Statistics/Tables (Figura 19).

16
Figura 19 – Passo 1 para execução do Test t de “Student”.

Selecione o teste T-test Independent by variables, clique em Ok. Clique em Variables


(groups) (Figura 20).

Figura 20 – Passo 2 para execução do Test t de “Student”.

Selecione as variáveis, clique em Ok. Finalmente, clique em Summary T-test (Figura 21).

Figura 21 – Passo 3 para execução do Test t de “Student”.

17
A tela seguinte apresentará os resultados (Figura 22).

Figura 22 – Resultados do Test t de “Student”.

A interpretação destes resultados deverá ser realizada da seguinte forma: quando


p>0,05, não há diferenças estatisticamente significativas na comparação entre as amostras.
Quando o p≤0,05 há diferenças estatisticamente significativas na comparação das amostras.

b) ANOVA

É utilizada para comparar mais de duas amostras, quanto estas apresentam


normalidade de variâncias. O resultado da ANOVA apresenta se há diferenças significativas nas
comparações realizadas, mas não identifica onde essas diferenças ocorrem. Para isso é
necessário aplicar um teste Post-Hoc. Para o caso da ANOVA, realiza-se o teste de Scheffé.

3.1.2.2. Técnicas não paramétricas

Quando a normalidade é descartada em todas as amostras a serem comparadas ou em


uma delas, mesmo que a (as) outra (as) apresentem normalidade, recorre-se aos testes não
paramétricos, os mais aplicados são:

a) Wilcoxon

É utilizado para comparar um par de amostras dependentes (variáveis). Ele é projetado


para testar uma hipótese sobre a localização (mediana) de uma distribuição da população.
Muitas vezes envolve o uso de pares correspondentes, por exemplo, "antes" e "depois"
(amostras emparelhadas). Pode ser utilizada na comparação de duas situações verificadas para
o mesmo sujeito, antes x depois, ou produto A x B avaliados pelo mesmo sujeito.

b) Mann-Whitney

É utilizado para comparar duas amostras independentes (grupos), como por exemplo,
diferenças entre gêneros. Conforme Arango (2005) é apropriado “quando se tem um par de
amostras independentes e se deseja testar se as populações que deram origem a essas
amostras podem ser consideradas semelhantes ou não” (p. 277), ou seja, se entre elas
existem, ou não, diferenças estatisticamente significativas (p≤0,05).

18
Quando há normalidade nas amostras, mas apenas uma delas a serem comparadas for
homogênea para amostras independentes aplica-se o Mann-whitney para amostras
emparelhadas aplica-se o Wilcoxon.

c) Friedman

É utilizado para comparar múltiplas amostras emparelhadas (três ou mais). Pode ser
utilizada na comparação de mais de duas situações verificadas para o mesmo sujeito, antes x
durante x depois, ou produto A x B x C. Assim como na ANOVA o teste de Friedman apresenta
se há diferenças significativas nas comparações, entretanto não apresenta onde estas
diferenças ocorrem. Para isso é necessário aplicar o teste Post-Hoc de Dunn.

d) Kruskal-Wallis

É utilizado para comparar múltiplas amostras (três ou mais) independentes (grupos).


Consiste em um teste não paramétrico alternativo à ANOVA (one-way). É utilizado para
comparar três ou mais amostras. Pode ser utilizado para comparar faixas etárias, por exemplo,
distribuídas em pelo menos três grupos.

4. RESUMO DOS PROCEDIMENTOS

As informações apresentadas, baseadas na literatura consultada fornecem uma base


para o processamento de uma série de dados. A tabela abaixo (Tabela 1) apresenta um resumo
de referência, como síntese das técnicas apresentadas.

Tabela 1 – Síntese das variáveis, dados e as respectivas técnicas de análise estatística.

Tipo de
Tipos de Dados Procedimento estatístico
variável
Dependente Nominal Estatística Descritiva
Independente Ordinais Estatística Descritiva
Intervalares e de Estatística Descritiva, Comparações de amostras
Relação (Testes paramétricos e Não paramétricos)

O procedimento para a escolha do teste estatístico adequado a cada tipo amostra, pode
ser verificado no diagrama a seguir (Figura 23).

19
Teste t de Student
(duas amostras)
Homogeneidade
(Levene)
ANOVA (três ou mais
amostras)
Normal
Man-Whitney (Duas amostras
independentes)
Não homogêneo
Wilcoxon (Duas amostras
Normalidade emparelhadas)
das amostras
Man-Whitney (Duas
(Shapiro-Wilk)
amostras independentes)

Wilcoxon (Duas amostras


emparelhadas)
Não
normal Friedman (três ou mais
amostras emparelhads)

Kruskal-Wallis ( três ou mais


amostras independentes)

Figura 23 – Diagrama dos procedimentos para análise estatística.

REFERÊNCIAS

ALMEIDA, A; ELIAN, S. NOBRE, J. Modificações e alternativas aos testes de Levene e de Brown


e Forsythe para igualdade de variâncias e medias. Revista Colombiana de Estatística, v. 31,
n.2, p. 241-260, 2008.

ARANGO, H.G. Bioestatística Teórica e Computacional. Rio de Janeiro: Guanabara Koogan,


2005.

BEIGUELMAN, B. Curso Prático de Bioestatística. Ribeirão Preto: Fundação de Pesquisas


Científicas de Ribeirão Preto, 2002.

CAMPOS, L. F. de A. Avaliação de forças manuais em atividades manuais simuladas com


indivíduos adultos brasileiros de diferentes gêneros e faixas etárias: aspectos do design
ergonômico. [Dissertação de Mestrado]. Bauru: UNESP, 2010.

FIELD, A. Discovering statistics using SPSS for Windows. London: Sage, 2000.

LAKATOS, E. M.; MARCONI, M.A. Metodologia Científica. – 2ed. – São Paulo: Atlas, 1991.

PESTANA, M. H; GAGEIRO, J. N. Análise de dados para ciências sociais: a complementaridade


do SPSS. Lisboa: Edição Silabo, 2005.

SHAPIRO, S. S.; WILK, M. B.; CHEN, H. J. A comparative study of various tests of normality.
Journal of the American STATISTICA®l Association, 63, 1343-1372, 1968.

20
SIEGEL, S.; CASTELLAN, N.J. Estatística não-paramétrica para ciências do comportamento.
Porto Alegre: Artmed, 2006.

TRIOLA, M. F. Introdução à Estatística. Rio de Janeiro: Editora LTC, 1999.

TULLIS, T.; B. ALBERT. Measuring the user experience: collecting, analyzing and presenting
usability metrics. Burlington: Morgan Kaufmann, 2008.

21

Potrebbero piacerti anche