Sei sulla pagina 1di 50

MANUAL DE TREINAMENTO

SPSS

INICIANTES

Centro de Estudos de Criminalidade e Segurana Pblica

Introduo
O SPSS um software apropriado para a elaborao de anlises estatsticas de matrizes de dados. Seu uso permite gerar relatrios tabulados, grficos e plotagens de distribuies, normalmente utilizados na realizao de anlises descritivas e inferncias a respeito de correlaes entre variveis. muito vantajoso tambm no aspecto relativo interao com arquivos gerados por outros softwares, como por exemplo: ACCESS, EXCELL, LOTUS e DBASE. O objetivo desta apostila fornecer noes bsicas de manipulao do software. Ela trata de maneira simplificada de todas as etapas de uma anlise: edio de matrizes de dados, manipulao de arquivos, transformao dos dados, edio de relatrios de anlise e elaborao de anlises descritivas e de correlao entre variveis. De modo geral, os arquivos de dados a serem analisados no esto organizados no formato ideal para sua utilizao. Sendo necessrio, por exemplo, combinar arquivos de dados, classificar os casos em diferentes ordens, selecionar um subgrupo dos dados, alterar a unidade de anlise ou criar novas variveis a partir de informaes existentes em outras variveis. A apostila foi organizada buscando dar solues prticas a alguns problemas considerados freqentes por aqueles que esto comeando a se familiarizar com o software. Oque uma Matriz de Dados Antes de partirmos para a explicao da utilizao de algumas das ferramentas disponveis no SPSS, vamos dar um pequeno exemplo de como se processa a construo de uma matriz de dados. essencial termos uma idia bem clara do que uma matriz de dados, para que possamos entender os resultados estatsticos fornecidos pelo sistema.
Uma associao de bairro tomou a providncia de reunir algumas informaes a respeito dos casos de roubo que haviam ocorrido em seu bairro para tomar algumas providncias em relao a orientao do comportamento da populao. Aps algum tempo de pesquisa descobriram que, do total de quarteires do bairro, cinco quarteires pareciam ser os mais violentos. Foram reunidas, ento, as seguintes informaes a respeito destes quarteires:
Quarteir o Nmero Assaltos no ltimo Ms 30 35 50 15 45 Nmero de Agresse s Fsicas 3 22 17 30 18 Classifica o Econmica das Moradias classe mdia classe mdia classe alta classe baixa classe alta Proximidade a Grandes Vias de Trnsito prximo prximo prximo no prximo no prximo Proximidade da Delegacia de Polcia no Bairro prximo prximo no prximo no prximo prximo

1 2 3 4 5

Obs. Informaes fictcias.

Esta tabela constitui uma matriz de dados. A construo desta simples tabela e de qualquer matriz de dados possui alguns requisitos

Centro de Estudos de Criminalidade e Segurana Pblica

fundamentais para que possamos confiar nas suas informaes e desenvolver anlises relevantes. So eles: deve existir um corpo bsico de questes que so submetidos a todos os casos da maneira mais uniforme possvel, evitando problemas de interpretao cada uma das informaes (variveis) - Nmero Assaltos no ltimo
Ms; Nmero de Agresses Fsicas; Classificao Econmica das Moradias; Proximidade a Grandes Vias de Trnsito; Proximidade da Delegacia de Polcia no Bairro - deve ser arquivada ssempre com a

mesma unidade de medida a responsabilidade daquele que coleta as informaes essencial para garantir a confiabilidade das informaes presentes na matriz de dados deve-se fazer um esforo enorme para no deixar questes sem resposta

Centro de Estudos de Criminalidade e Segurana Pblica

1. Manipulao de Arquivos e Edio de Matrizes de Dados ................................................................................ 6


1.1. - CRIAO DE MATRIZES DE DADOS.................................... 8 1.1.1. - Como Criar uma Varivel ................................................ 8 1.1.2. - Como Preencher a Matriz de Dados .............................. 12 1.1.3. - Como Excluir uma Varivel ou Um Caso de Anlise dentro da Matriz de Dados ................................................................... 12 1.1.4. - Como Inserir uma Nova Varivel ou um Novo Caso dentro da Matriz de Dados ................................................................... 12 1.1.5. - Como Guardar uma Matriz de Dados na Forma de um Arquivo..................................................................................... 13 1.1.5.1. - Salvando Matrizes de Dados pela Primeira Vez na Forma de Arquivos ................................................................................... 13 1.1.5.2. - Salvando Arquivos j Existentes (Atualizando Informaes)14 1.1.5.3. - Salvando Arquivos Antigos com Novo Nome ou em Novo Diretrio ................................................................................... 14 1.1.6. - Como Abrir uma Matriz de Dados j Existente o Formato SPSS ......................................................................................... 14 1.1.7. - Como Abrir uma Matriz de Dados Elaborada no Excel ... 15 1.2. MANIPULAO DE ARQUIVOS........................................ 17 1.2.1. - Deslocamento em direo de um Caso Especfico ........ 17 1.2.2. - Como Ordenar os Casos Segundo Uma ou Mais Variveis17 1.2.3. - Como Agregar ou Reunir Subgrupos de Casos Produzindo uma Matriz de Dados com Nova Unidade de Anlise ................. 18 1.2.4. - Como transformar colunas em linhas e linhas em colunas dentro de uma Matriz de Dados ................................................ 20 1.2.5. - Como Reunir Dois Arquivos Contendo Variveis Diferentes ou Casos para Anlise Diferentes ............................................. 21 1.2.5.1. - Reunindo Dois Arquivos com Casos para Anlise Diferentes e mesmas Variveis...................................................................... 21 1.2.5.2. - Reunindo Dois Arquivos com Variveis Diferentes e mesmos Casos para Anlise..................................................................... 22

Centro de Estudos de Criminalidade e Segurana Pblica

2.1. - CLCULO ENVOLVENDO VARIVEIS J EXISTENTES EM UMA MATRIZ DE DADOS ................................................................... 25 2.2. - RECODIFICAO DE VARIVEIS...................................... 28 2.2.1. - Como Recodificar uma Varivel substituindo a Varivel Original .................................................................................... 28 2.2.2. - Como Recodificar uma Varivel Criando Nova Varivel 30 3.1. - MANIPULAO DE ARQUIVOS DE RELATRIOS DE ANLISE ................................................................................................. 32 3.1.1. - Como Guardar Arquivos Contendo Relatrios de Anlises32 3.1.2. - Como Abrir Arquivos Contendo Relatrios de Anlises . 32 3.2. - EDIO DE RELATRIOS DE ANLISE ............................. 33 3.3. SELEO DE CASOS PARA ANLISE ................................ 34 3.4. - ANLISE DESCRITIVA DOS DADOS.................................. 36 3.4.1. - Como Fazer uma Anlise Descritiva Baseada em Medidas de Tendncia Central e Disperso (moda, mdia, mediana, desvio padro, etc).............................................................................. 36 3.4.2. - Alternativa de Construo de Grficos para Anlises de Tendncia Central..................................................................... 38 3.4.3. - Summaries for Groups of Cases.................................... 39 3.4.4. - Summaries of Separate Variables................................. 40 3.4.5. - Como Fazer uma Anlise Descritiva Baseada na Distribuio de Frequncia ....................................................... 40 3.4.6. - Como Elaborar Anlises Utilizando Grficos de Controle de Processo ................................................................................... 42 3.5. - ANLISE DE ASSOCIAO ENTRE VARIVEIS ................. 44 3.5.1. - Como construir uma tabela para verificar a relao entre variveis................................................................................... 44 3.5.2. - Como construir anlises de associao entre variveis em funo de coeficientes de correlao ........................................ 45 3.5.3. - Como Construir Anlises de Regresso Linear .............. 47

Centro de Estudos de Criminalidade e Segurana Pblica

1. Manipulao de Arquivos e Edio de Matrizes de Dados


A seo do SPSS onde feita a entrada, manipulao e excluso de dados denominada SPSS Data Editor. Como podemos observar na figura abaixo, sua estrutura a de uma matriz (linhas x colunas). Podemos entender tal disposio da seguinte forma: cada coluna representa uma varivel e cada linha representa um caso. De uma forma simplificada, enquanto as colunas corresponderiam s questes de um questionrio, as linhas corresponderiam as informaes de cada questionrio aplicado. Observe que a criao da matriz de dados envolve, no apenas o preenchimento das informaes correspondentes a cada caso analisado, mas a discriminao precisa do nome, definio, tipo e outras caractersticas das variveis com que se est trabalhando.

Na figura acima, temos o exemplo de uma matriz de dados preenchida. As seguintes informaes so importantes nesta tela: 1. No cabealho encontramos o nome do arquivo com que estamos trabalhando (matriz de dados): Base Estudantes Final 2 2. Na grande faixa de cor branca localizada abaixo da barra de ferramentas do programa encontramos a seguinte informao: 1:escola esta clula correspondente ao caso 1 da varivel escola

Centro de Estudos de Criminalidade e Segurana Pblica

1 contedo da clula 3. A faixa de cor cinza localizada na margem superior da tabela nos fornece os nomes das variveis (cabealho de cada coluna) 4. A faixa de cor cinza localizada na margem esquerda da tabela nos fornece o nmero seqencial de cada caso 5. No interior da tabela, as linhas correspondem aos casos analisados (unidades de anlise) e as colunas correspondem s variveis trabalhadas (variveis de anlise).

Centro de Estudos de Criminalidade e Segurana Pblica

1.1. - Criao de Matrizes de Dados


A criao de uma matriz de dados envolve dois passos bsicos: a criao e definio precisa das caractersticas de cada varivel (coluna) da matriz e o preenchimento dos dados para cada caso de anlise existente (clulas). 1.1.1. - Como Criar uma Varivel O passo mais importante na criao de uma matriz de dados a definio das variveis. Cada varivel criada separadamente, indicando seu nome, definio, tipo, etiqueta, categorias, missing values (valores que por definio no entram nas anlises estatsticas), formato da coluna na tabela, alinhamento e tipo de mensurao. Para definir uma varivel, deve-se seguir os seguintes passos: 1. Selecione a opo Variable View opo localizada na parte inferior da tela inicial do programa

Centro de Estudos de Criminalidade e Segurana Pblica

Na tela Variable View encontramos uma interface grfica parecida com a tela inicial do programa. Nesta tela encontramos as ferramentas para construo das variveis da matriz de dados: A. Cada coluna indica um passo para estruturar a varivel a ser criada. B. Cada linha indica a varivel criada e sua estruturao

Passos para estruturar uma varivel: 1 Coluna: Name. Devemos entrar com um nome para a varivel. Este nome no pode ultrapassar 8 caracteres e no pode conter nenhum sinal algbrico ou espao em branco no seu interior. 2 Coluna: Type. Ao selecionarmos esta opo chegaremos a seguinte figura:

Entre as opes de tipo de varivel acreditamos que as seguintes so importantes na formao de um conhecimento bsico em SPSS: Numeric: estabelece que o campo ser numrico til na definio de variveis ordinais e categricas

Centro de Estudos de Criminalidade e Segurana Pblica

10

Date: estabelece um formato de campo para a entrada de datas e horas1 Dollar: estabelece um formato de campo para a entrada de valores monetrios String: estabelece que o campo ser alfa-numrico, podendo incluir qualquer tipo de informao desejada. Exemplo: nome de um municpio ou de uma pessoa. Ainda neste campo - Variable Type - podemos (Width) e o nmero de caracteres correspondentes as casas decimais (Decimal Places), quando trabalhamos com o tipo numrico. 3 Coluna: Width. Possibilita selecionar o tamanho total de caracteres da varivel. Utilizada em quase todas as opes da coluna type. 4 Coluna: Decimals. Utilizada para definir o nmero de caracteres correspondentes as casas decimais quando trabalhamos com um tipo de varivel que necessita desta funo. 5 Coluna: Label. Neste campo atribumos para o nome da varivel (definio atribuda na coluna Name) que est sendo criada um rtulo que permita uma melhor identificao da natureza da varivel. 6 Coluna: Values. Ao selecionarmos esta opo chegaremos a seguinte figura:

Para variveis categricas, o campo Value Labels permite a definio das diversas categorias de respostas. O valor a ser digitado na matriz deve ser inserido no campo VALUE e o significado corresponde inserido no campo VALUE LABEL. Para cada par de informaes deve-se selecionar a opo ADD para adicion-los a matriz de categorias. Caso algumas das categorias tenha sido definida de maneira errada, utilize as opes CHANGE ou REMOVE para fazer o seu acerto. 7 Coluna: Missing. Ao selecionarmos chegaremos a seguinte figura: a opo Missing Values

Como j foi indicado acima, aqui sero indicados todos os valores que no entraro nas anlises estatsticas que sero realizadas com a
1

No muito til quando se pretende fazer contas de durao de tempo com as variveis, pois ela no permite que se realize estes clculos. Nesta situao melhor criar trs variveis numricas: uma com o ano, outra com o ms e a ltima com a dia da data a ser guardada.

Centro de Estudos de Criminalidade e Segurana Pblica

11

matriz de dados. muito comum, por exemplo, estabelecer como missing os valores correspondentes s categorias: no respondeu, no sabe ou sem informao. Estes valores podem ser indicados de maneira precisa ou atravs de intervalos.

8 Coluna: Columns. Este campo nos permite indicar a largura da coluna na tabela da matriz de dados (Data View). 9 Coluna: Align. Permite definir o alinhamento do contedo dentro da clula na matriz de dados (Data View). De um modo geral, este campo no preenchido, utilizando o padro que o prprio SPSS traz consigo. 10 Coluna: Measure. O campo Measure,deve ser preenchido com o tipo de medida caracterstica da varivel. Esto disponveis as seguintes opes: Scale: existe uma relao ordinal entre os valores que correspondem s categorias e o valor real da distncia entre cada categoria conhecida ideal para variveis que medem em nmeros absolutos algum atributo dos casos como, por exemplo, idade, peso, altura, etc. Ordinal: existe uma relao ordinal entre os valores da varivel mas a distncia entre estes desconhecida ideal para variveis que envolvem a avaliao de satisfao e que tem categorias como as seguintes: timo, bom, regular, ruim e pssimo. No existe como definir qual a distncia precisa entre as posies timo e bom e ao mesmo tempo saber se esta distncia a mesma que existe entre as variveis regular e ruim, por exemplo. Nominal: no existe nenhuma relao ordinal entre os valores da varivel ideal para variveis que envolvem nomes de pessoas ou lugares ou variveis que contm informaes como sexo, estado conjugal, etc

Centro de Estudos de Criminalidade e Segurana Pblica

12

1.1.2. - Como Preencher a Matriz de Dados Tendo definido todas as variveis da matriz de dados, passamos para a entrada dos dados caso por caso (Data View). De um modo geral, recomenda-se que os dados sejam digitados por questionrio, ou seja, linha por linha. O preenchimento feito digitando o valor atribudo varivel em cada caso seguido do comando no teclado ( : o que far com que se passe para a prxima varivel do mesmo caso) ou (ENTER: o que far com que se passe para o prximo caso na mesma varivel). Para situaes em que os valores se repetem muito, a utilizao das opes RECORTAR (CUT), COPIAR (COPY) e COLAR (PASTE) permiten a agilizao do trabalho. 1.1.3. - Como Excluir uma Varivel ou Um Caso de Anlise dentro da Matriz de Dados Caso seja necessrio excluir uma varivel da matriz de dados, devemos selecionar a varivel com o mouse clicando sobre o cabealho da coluna (Nome da varivel) correspondente varivel que se deseja excluir. Tendo selecionado a varivel, basta apertar a tecla DELETE. O mesmo procedimento deve ser usado em relao excluso de casos, selecionando-se a linha clicando sobre a margem esquerda da linha na matriz de dados (numerada de forma sequencial). 1.1.4. - Como Inserir uma Nova Varivel ou um Novo Caso dentro da Matriz de Dados Caso seja necessrio inserir uma nova varivel no meio de variveis j existentes numa matriz de dados, devemos inseri-la atravs dos seguintes passos: 1. Escolha o lugar onde a nova varivel deve ser inserida. Selecione a varivel que est direita da nova varivel, a ser inserida, clicando sobre o cabealho da coluna (Nome da varivel) desta varivel. 2. Selecione na barra de ferramentas o menu DATA e depois INSERT VARIABLE. 3. Em seguida seguiramos todos os passos necessrios para a definio da nova varivel. Se no for necessrio inserir esta varivel no meio de outras j existentes, basta ir at a tela Variable View e seguir os passos necessrios para a definio da nova varivel aproveitando os espaos em branco existentes aps a ltima varivel j existente. Caso seja necessrio inserir um novo caso para anlise entre os casos j existentes numa matriz de dados, devemos seguir os seguintes passos: 1. Escolha o lugar onde o caso deve ser inserido. Selecione o caso que se localiza abaixo do local onde este deve ser inserido

Centro de Estudos de Criminalidade e Segurana Pblica

13

clicando sobre a barra cinza que se localiza esquerda do caso (numerada seqencialmente). 2. Seguimos, ento, o seguinte caminho: na barra de ferramentas selecionaramos DATA e depois INSERT CASE. 3. Em seguida seguimos todos os passos necessrios para o preenchimento das informaes do novo caso. Se no for necessrio inserir este novo caso entre os outros j existentes, basta ir at o fim do arquivo (abaixo) e seguir os passos necessrios para o preenchimento de uma matriz de dados. 1.1.5. - Como Guardar uma Matriz de Dados na Forma de um Arquivo 1.1.5.1. - Salvando Matrizes de Dados pela Primeira Vez na Forma de Arquivos Quando voc est criando uma matriz de dados pela primeira vez, ou seja, ainda no existe um arquivo onde voc vai guard-la, preciso criar este arquivo. O essencial nesta atividade, designada por salvar o arquivo, dar nome ao arquivo e escolher o local ou diretrio dentro no computador ou unidade de disco onde voc vai guard-lo. Voc poder salvar o arquivo antes de ter entrado com qualquer informao da matriz de dados que voc deseja editar ou poder editar uma parte ou toda a matriz e depois salvar o arquivo. Para salvar o arquivo voc dever selecionar FILE na barra de ferramentas e depois SAVE. Chegaremos na seguinte figura:

Atravs do campo SAVE AS ou do retngulo abaixo deste campo voc poder selecionar o lugar (diretrio) onde o arquivo ser guardado. Tendo feito esta seleo, basta preencher o campo NOME DO ARQUIVO com o nome que se deseja dar ao arquivo. Lembre-se sempre de utilizar nomes que sejam claros na descrio do contedo da matriz de dados. Caso voc queira salvar o arquivo em outro formato diferente do padro estabelecido pelo SPSS (*.sav), selecione o novo tipo desejado no campo SALVAR COM O TIPO.

Centro de Estudos de Criminalidade e Segurana Pblica

14

1.1.5.2. - Salvando Arquivos j Existentes (Atualizando Informaes) Para aqueles arquivos j criados anteriormente, basta selecionar FILE na barra de ferramentas e depois SAVE que o arquivo ser salvo automaticamente pelo programa com o mesmo nome e no mesmo diretrio onde ele se localiza. 1.1.5.3. - Salvando Arquivos Antigos com Novo Nome ou em Novo Diretrio Caso seja necessrio fazer uma cpia do arquivo mudando seu nome ou localizao dentro do computador, basta selecionar FILE na barra de ferramentas e depois SAVE AS. Esta opo lhe permitir retornar para a primeira tela demonstrada nesta seo, onde ser possvel designar um novo nome e localizao para o arquivo. Passar a existir duas cpias do arquivo, uma antiga com mesmo nome e localizao da primeira e uma com novo nome e localizao. 1.1.6. - Como Abrir uma Matriz de Dados j Existente o Formato SPSS Cada matriz de dados armazenada na forma de um arquivo prprio do SPSS, com terminao (.sav) Para abrirmos uma matriz de dados j existente essencial termos a informao precisa do local onde este arquivo se localiza. Seguiramos, ento, o seguinte caminho: na barra de ferramentas selecionaramos FILE, depois OPEN e em seguida DATA.... Chegaramos a seguinte figura:

No campo Examinar devemos selecionar o diretrio onde se localiza o arquivo que contm a matriz de dados com que queremos trabalhar. Em seguida selecione no quadro abaixo ao campo Examinar o arquivo ou digite no campo Nome do Arquivo o nome do arquivo a ser aberto. Tendo selecionado o arquivo, clique o mouse sobre a opo Abrir. O padro do SPSS trabalhar com a terminao (*.sav) em seus arquivos. Caso voc esteja querendo trabalhar com arquivos criados em outros sistemas, esta seleo padronizada precisar ser mudada. Teremos acesso aos diversos tipos de arquivos compatveis com o SPSS, selecionando a seta localizada direita do campo ARQUIVOS DO TIPO.

Centro de Estudos de Criminalidade e Segurana Pblica

15

Basta, ento, selecionar o tipo de arquivo desejado e seguir os passos citados acima. 1.1.7. - Como Abrir uma Matriz de Dados Elaborada no Excel O SPSS s permite a leitura de arquivos criados no Excel (verso 4.0). Este arquivo deve conter dados apenas em uma Planilha, pois somente os dados da primeira planilha do arquivo sero lidos. O arquivo deve ainda ser manipulado de modo a permitir ao SPSS identificar os nomes das variveis (a primeira clula de cada coluna no arquivo do Excel deve ser considerada como nome da varivel). Abaixo apresentamos um exemplo deste tipo de transformao, necessria por dois motivos: a tabela que se deseja transformar em uma matriz de dados do SPSS no estava na Planilha 1 (A) e continha ttulos que dificultavam a identificao pelo SPSS como nome das variveis (B). Outro problema comum est relacionado ao tamanho do nome das variveis (cabealho das colunas no Excel). Estes no devem ultrapassar 8 caracteres. Caso contrrio, sero abreviados pelo prprio SPSS, podendo trazer dificuldades posteriores para identificao das variveis.

B
Exemplo errado

Exemplo certo

Centro de Estudos de Criminalidade e Segurana Pblica

16

Estando o arquivo no formato apropriado para ser lido pelo SPSS, devemos selecionar na tela do SPSS OPEN FILE (File, Open, Data...), mostrada anteriormente, a opo Excel (*.xls) no campo Arquivos do Tipo. Aps a seleo do arquivo no diretrio onde o arquivo Excel est localizado, chegaremos tela abaixo, onde deveremos selecionar a opo Read variable names.

Esta opo indicar para o programa que ele dever ler a primeira linha do arquivo como o rtulo das variveis (nome das variveis). Bastar, ento, selecionar a opo OK para que o arquivo seja aberto pelo programa SPSS.

Centro de Estudos de Criminalidade e Segurana Pblica

17

1.2. Manipulao de Arquivos


1.2.1. - Deslocamento em direo de um Caso Especfico

Cada caso de uma matriz de dados est associada a um nmero especfico na barra cinza que se localiza esquerda da matriz de dados. Se for preciso localizar um caso especfico para fazer alguma alterao de informaes, deveremos utilizar o seguinte comando: na barra de ferramentas selecionaremos DATA e em seguida GO TO CASE. Chegaremos a seguinte tela, que dever ser preenchida com o nmero do caso existente na barra cinza descrita.

1.2.2. - Como Ordenar os Casos Segundo Uma ou Mais Variveis Podemos sempre ordenar os casos analisados (ordem crescente ou decrescente) segundo uma ou mais variveis de um banco de dados. Esta opo nos permite ver de maneira direta qual a posio dos diversos casos num ranking constitudo por todos os casos. Para tal, devemos selecionar na barra de ferramentas a opo DATA e depois SORT CASES. Chegaremos a seguinte tela:

O campo SORT BY dever ser preenchido com a varivel(s) selecionada(s) no campo da direita, com base na qual se deseja fazer a classificao dos casos. No caso da incluso de duas variveis para ordenao, a primeira varivel includa no campo SORT BY definir um primeiro padro de classificao e a segunda definir um padro de classificao dentro da primeira j realizada. O campo SORT ORDER dever ser preenchido de modo a designar se a classificao dos casos seguir ordem crescente ou decrescente. Estando estas duas opes selecionadas, bastar clicar na opo OK.

Centro de Estudos de Criminalidade e Segurana Pblica

18

1.2.3. - Como Agregar ou Reunir Subgrupos de Casos Produzindo uma Matriz de Dados com Nova Unidade de Anlise O programa SPSS nos permite agregar casos criando uma nova matriz de dados onde a unidade de anlise passa a ser subgrupos dos casos da primeira matriz. Por exemplo, podemos querer gerar uma matriz de dados contendo informaes de alguns estados a partir de uma matriz onde temos informaes sobre os municpios destes estados. Neste caso, o programa reunir as informaes dos municpios de cada estado separadamente e a unidade de anlise passar a ser o estado. Estas informaes podero ser reunidas de vrias maneiras a serem especificadas pelo usurio. Primeiro, devemos abrir o arquivo a partir do qual se deseja fazer a agregao dos casos. Em seguida, devemos selecionar a opo DATA na barra de ferramentas e depois AGGREGATE. Aparecer a seguinte tela, onde devemos estabelecer os critrios para a agregao dos casos.

O campo BREAK VARIABLE(S) dever ser preenchido com as variveis a partir das quais ser realizada a agregao dos casos (as categorias destas variveis funcionam como nveis para nova unidade de anlise que se esta criando, sub-grupos). Este campo aceita variveis de tos os tipos (numrica, string, date, etc.). Na situao discutida no exemplo, desejamos fazer a agregao por estado. Este campo indica qual ser a nova unidade de anlise para a matriz de dados. O campo AGGREGATE VARIABLE(S) dever ser preenchido com as variveis em que seus casos sero agregadas e que faro parte da nova matriz de dados. Logo abaixo deste campo aparecem as opo NAME & LABEL e FUNCTION. Ambas devero ser preenchidas para designar o tipo de funo matemtica utilizada durante a agregao de cada varivel em particular e o nome a ser atribudo para cada nova varivel a ser criada a partir desta agregao. Este campo aceita somente variveis do tipo que aceitam mensuraes matemticas. O tipo padro de agregao das variveis segue a opo MEAN (mdia dos valores) e atribui o seguinte nome a varivel a ser criada no novo banco de dados: (antigo nome abreviado para 6 letras) seguido pelo sinal (_1) que indica o nmero de operaes de agregao realizadas. Este nmero ir aumentando na medida em que se realizar agregaes dentro de arquivos j agregados anteriormente. Estas duas opes podem

Centro de Estudos de Criminalidade e Segurana Pblica

19

ser mudadas de maneira especfica para cada varivel separadamente. Para tal, selecione a varivel no campo AGGREGATE VARIABLE(S). Ao selecionarmos a opo NAME & LABEL surgir a seguinte tela:

O campo NAME dever ser preenchido com o novo nome que se deseja dar a varivel que contm o resultado da agregao. O campo LABEL dever ser preenchido com a descrio da varivel. Ao selecionarmos a opo FUNCTION surgir a seguinte tabela:

Nesta tela, poderemos selecionar a funo matemtica para agregao de cada varivel separadamente. Como j foi dito anteriormente, a opo padro do SPSS a Mean of Values (Mdia dos Valores). Basta selecionar uma das outras opes existentes para que a funo matemtica de agregao das variveis mude. Assim, cada varivel poder ter seus valores agregados por sub-grupos obedecendo uma certa funo matemtica, por exemplo: soma dos valores de todos os casos, media dos valores, maior valor, menor valor, etc. Ainda poderemos selecionar a opo SAVE NUMBER OF CASES IN BREAK GROUP AS VARIABLES, se desejarmos criar uma varivel na nova matriz de dados preenchida com o nmero total de casos agregados em cada um dos sub-grupos definidos pela BREAK VARIABLE(S). Por fim, poderemos ainda selecionar se a nova matriz de dados elaborada atravs da agregao ser guardada substituindo a antiga matriz de dados (REPLACE WORKING DATA FILE), ou seja, com o mesmo nome e localizao do antigo arquivo, ou guardada em um novo arquivo (CREATE NEW DATA FILE). Se escolhermos a ltima opo, deveremos indicar na tela abaixo o nome e localizao do novo arquivo. O programa indica como padro o nome (AGGR.SAV) para este arquivo e

Centro de Estudos de Criminalidade e Segurana Pblica

20

estabelece como localizao o diretrio (/SPSS) onde o programa foi instalado.

1.2.4. - Como transformar colunas em linhas e linhas em colunas dentro de uma Matriz de Dados Quando estamos trabalhando com bases de dados elaboradas por outros pesquisadores, pode ser necessrio utilizarmos do recurso de inverter as colunas e linhas em uma matriz de dados, para que seja possvel aproveitar tal matriz dentro do programa SPSS.

A tabela acima constitui um exemplo de um caso em que devemos fazer esta transformao. Como podemos perceber, os casos de anlise da matriz esto na coluna e correspondem s regies (1 a 7) e as variveis esto na linha e correspondem idade mdia e populao total de cada regio. Para utilizar este recurso, devemos selecionar DATA na barra de ferramentas e depois o comando TRANSPOSE. Chegaremos a seguinte tela:

O campo denominado VARIABLE dever ser preenchido com o nome das variveis a serem transformadas em casos. O campo NAME VARIABLE dever ser preenchido com o nome da varivel que contm a informao acerca do nome das variveis na nova matriz de dados. Como resultado do preenchimento acima, chegaramos matriz de dados mostrada

Centro de Estudos de Criminalidade e Segurana Pblica

21

abaixo. Como podemos ver, cada coluna da primeira matriz de dados se transformou numa linha da nova matriz de dados. A nica exceo desta transformao foi a primeira coluna, que forneceu as informaes acerca da denominao das variveis na nova matriz de dados.

A nica exigncia para a execuo deste comando pelo SPSS que as variveis a serem transformadas em casos na nova matriz de dados sejam definidas como variveis numricas. 1.2.5. - Como Reunir Dois Arquivos Contendo Variveis Diferentes ou Casos para Anlise Diferentes Com o SPSS, voc pode reunir informaes de dois arquivos diferentes. possvel agrupar informaes a partir de dois arquivos que tenham as mesmas variveis e casos para anlise diferentes ou agregar informaes de dois arquivos que tenham variveis diferentes e mesmos casos para anlise. Neste ltimo caso podemos ter, por exemplo, um arquivo contendo o tamanho da populao dos municpios de um estado e outro arquivo contendo algumas informaes scio-econmicas a respeito destes mesmos municpios. A varivel chave municpio ser utilizada para dar ordem a agregao de modo a no misturar as informaes de municpios diferentes. 1.2.5.1. - Reunindo Dois Arquivos Diferentes e mesmas Variveis com Casos para Anlise

Centro de Estudos de Criminalidade e Segurana Pblica

22

Para reunir as informaes de dois arquivos de dados que contm as mesmas variveis e casos para anlise diferentes devemos inicialmente estar com algum arquivo aberto, onde sero adicionados os novos casos. Selecione na barra de ferramentas Data depois escolha a opo Merge Files, clique em Add Cases... Isto abrir uma caixa de dilogo como a que se segue: Nesta tela deveremos indicar para o programa qual o arquivo que contm os casos a serem adicionados no arquivo j aberto. Para tal, selecionaremos o diretrio onde este arquivo se localiza e indicaremos o nome do arquivo. Podemos inclusive trabalhar com arquivos de tipos diferentes do padro do SPSS (*.sav). Aps indicado o nome do arquivo, clique com o mouse sobre o campo ABRIR. Chegaremos na seguinte figura.

O campo Variables in New Working Data File ser preenchido automaticamente pelo computador com o nome de todas as variveis comuns entre os dois arquivos e que podero, deste modo, ter os casos agregados. O campo Unpaired Variables ser preenchido automaticamente pelo computador com o nome de todas as variveis que no so comuns entre os dois bancos de dados. O usurio poder tambm fazer uma seleo das variveis que ele no deseja que tenham os casos agregados. Para isto, basta deslocar as variveis do campo das direita (variveis comuns ou compartilhadas pelos dois bancos) para o campo da esquerda (variveis no comuns) utilizando a seta presente entre os dois campos. O campo Indicate case source as variable indica para o programa que seja criada uma nova varivel neste arquivo que est sendo criado a partir da agregao. Esta varivel ser preenchida com o valores 0 e 1, onde 0 ser associado aos casos do arquivo j aberto antes da agregao e 1 para os casos do arquivo aberto posteriormente. 1.2.5.2. - Reunindo Dois Arquivos com Variveis Diferentes e mesmos Casos para Anlise Para podermos reunir as informaes de dois arquivos de dados que contm os mesmos casos para anlise e variveis diferentes, existe a necessidade de se atender a dois requisitos bsicos: existir uma varivel chave comum, ou seja, uma varivel comum aos dois bancos de dados que servir de referncia para a juno das informaes dos casos e os dois arquivos devem ter seus casos organizados em ordem crescente com base nesta varivel chave.

Centro de Estudos de Criminalidade e Segurana Pblica

23

Devemos inicialmente estar com algum arquivo aberto, onde sero adicionadas as novas variveis. Selecione na barra de ferramentas Data depois escolha a opo Merge Files, clique em Add Variables... Isto abrir uma caixa de dilogo como a mostrada a seguir.

Nesta tela deveremos indicar para o programa qual o arquivo que contm as variveis a serem adicionados no arquivo j aberto. Para tal, selecionaremos o diretrio onde este arquivo se localiza e indicaremos o nome do arquivo. Podemos inclusive trabalhar com arquivos de tipos diferentes do padro do SPSS (*.sav). Aps indicado o nome do arquivo devemos selecionar a opo ABRIR. Chegaremos na seguinte figura.

O campo Variables in New Working Data File ser preenchido automaticamente pelo computador com o nome de todas as variveis que no so comuns entre os dois arquivos e que podero, deste modo, ser agregadas. O campo Excluded Variables ser preenchido automaticamente pelo computador com o nome de todas as variveis que so comuns entre os dois bancos de dados. Neste caso, a varivel (id) necessariamente comum entre os dois arquivos pois ela a varivel chave. O campo Match cases on key variables in sorted files dever ser selecionado para que o usurio indique qual a varivel a ser utilizada como chave durante a agregao dos arquivos. Logo em seguida deve-se selecionar a varivel chave no campo Excluded Variables e inseri-la no campo Key Variable clicando sobre a seta esquerda deste campo.

Centro de Estudos de Criminalidade e Segurana Pblica

24

A funo permite ainda a seleo de alguns padres para a tcnica de agregao dos arquivos segundo as tabelas chave. Por exemplo, podemos estar querendo agregar uma matriz de dados de vrios municpios com uma matriz de vrios Estados. O banco de dados contendo as informaes dos estados poder ser utilizado como tabela chave, para que as informaes de cada estado sejam agregadas automaticamente em todos os municpios pertencentes aquele estado. Estes padres so: Working Data File is Keyed Table: a tabela chave neste caso o arquivo que j estava aberto antes do procedimento de agregao External File is Keyed Table: a tabela chave neste caso o arquivo que foi aberto durante o processo de agregao Both Files Provide Cases: os dois arquivos so encarados pelo programa como tabelas chave. O campo Indicate case source as variable indica para o programa que seja criada uma nova varivel no arquivo a ser criado com a agregao dos dados. Esta nova varivel ser preenchida com o valores 0 e 1, onde 0 ser associado aos casos do arquivo j aberto antes da agregao dos casos e 1 para os casos do arquivo aberto posteriormente. Como podemos ver na figura, todas as variveis do banco de dados aberto antes do processo de agregao (working Data File) sero seguidas sempre por um (*). As variveis do banco de dados aberto posteriormente sero seguidas sempre por um (+). O programa exige que os dois arquivos a serem agregados tenham seus casos classificados em ordem crescente segundo a varivel chave de agregao. Por isso ele sempre mostra uma mensagem informando esta exigncia antes de fazer a agregao dos arquivos.

Centro de Estudos de Criminalidade e Segurana Pblica

25

2. - Transformao de Dados 2.1. - Clculo envolvendo Variveis j Existentes em uma Matriz de Dados
Em muitas situaes, obtm-se informaes importantssimas realizando clculos a partir de variveis presentes no banco de dados. Isto envolveria basicamente a criao de uma nova varivel preenchida com o resultado da operao matemtica com as outras variveis envolvidas. Estando com o arquivo a partir do qual se deseja fazer tais clculos aberto, devemos escolher na barra de ferramentas a opo TRANSFORM e depois COMPUTE. Em seguida aparecer a tela:

Deve-se preencher o campo TARGET VARIABLE com o nome da nova varivel, onde colocaremos o resultado da conta a ser realizada. possvel especificar o tipo e definio desta nova varivel se selecionarmos o campo TYPE & LABEL.2 Esta nova varivel ser igual ao valor do resultado da operao matemtica definida no campo NUMERIC EXPRESSION. A definio deste campo segue as regras bsicas da matemtica, como por exemplo a ordem de execuo envolvendo parnteses, chaves e colchetes. O preenchimento do campo pode ser realizado atravs do clique do mouse sobre o quadro de sinais ou atravs do teclado digitando os mesmos sinais presentes na figura. Listamos, a seguir, alguns exemplos bsicos para facilitar a compreenso da utilizao do comando: Operao Varivel C igual a soma de A e B Varivel C igual a diviso de A por 100 Expresso C=A+B C = A / 100

A operao matemtica descrita no campo NUMERIC EXPRESSION pode envolver tambm a utilizao de algumas ferramentas matemticas de maior complexidade associadas, por exemplo, estatstica ou
2

Uma definio mais detalhada da nova varivel pode ser realizada tambm utilizando a rotina indicada acima para a definio de variveis.

Centro de Estudos de Criminalidade e Segurana Pblica

26

trigonometria. Para este caso, existe uma srie de funes matemticas definidas na caixa FUNCTIONS. Aps escolhida a funo matemtica, insira a funo no campo NUMERIC EXPRESSION clicando sobre a seta que est acima do campo FUNCTIONS. Outra opo presente no comando COMPUTE a possibilidade de fazer uma seleo dos casos em que a operao indicada ser realizada. Isto depender dos valores encontrados em uma ou mais variveis, presentes ou no na operao matemtica descrita. Ao selecionar a opo IF chegaremos na seguinte figura:

A opo padro a include all cases, ou seja, a operao ser realizada em todos os casos existentes no banco de dados. Podemos, no entanto, selecionar o caso em que esta operao se realizar ao clicarmos na opo: include if case satisfies condition. Indicaremos, ento, uma nova expresso numrica que deve ser satisfeita para que a operao matemtica indicada seja realizada. Tambm neste caso, a expresso numrica pode incluir funes matemticas mais complexas. Listamos, a seguir, alguns exemplos bsicos para facilitar a compreenso da utilizao do comando: Condio Varivel C menor que 100 Varivel C diferente de A Varivel C menor que a soma de A e B Expresso C < 100 C <> A C<A+B

A opo FUNCTIONS pode ainda ser utilizada para retirar informaes de tempo de variveis definidas como tipo DATE. Estas opes permitem, por exemplo, retirarmos de uma varivel preenchida como 22/12/2002 o ano da ocorrncia (2002). Seguindo os passos colocados acima para a utilizao do comando COMPUTE devemos utilizar as opes apresentadas na tabela abaixo na digitao da frmula para retirarmos cada um dos itens desejados.

Centro de Estudos de Criminalidade e Segurana Pblica

27

Comando
XDATE.HOUR XDATE.MINUTE XDATE.TIME XDATE.YEAR XDATE.MONTH XDATE.MDAY XDATE.QUARTER XDATE.SECOND XDATE.WEEK XDATE.WKDAY XDATE.JDAY

Informao Desejada
HORA MINUTO NMERO SEGUNDOS DESDE A MEIA NOITE ANO MS DIA DO MS TRIMESTRE SEMESTRE SEMANA DO MS DIA DA SEMANA DIA DO ANO

O preenchimento do comando COMPUTE dever ser feito conforme demonstrado na figura abaixo.

Conforme demonstrado acima, tnhamos um arquivo com uma varivel data preenchida com o valor 22/02/2002 (22 de fevereiro de 2002) e executando o comando XDATE.YEAR retiramos o ano, criando uma nova varivel ano com o valor 2002.

Centro de Estudos de Criminalidade e Segurana Pblica

28

2.2. - Recodificao de Variveis


A necessidade de recodificao de variveis envolve basicamente duas situaes: a agregao de categorias de maneira a construir novas categorias mais apropriadas para a anlise estatstica desejada e a transformao de variveis do tipo ordinal em variveis categricas. Por cautela, recomenda-se que as variveis originais a serem recodificadas nunca sejam excludas aps a sua recodificao. Deve-se salientar, que para a execuo de uma boa recodificao essencial termos um conhecimento claro da distribuio de valores da varivel original. As etapas para se chegar a este conhecimento sero explicadas posteriormente na seo ANLISE DESCRITIVA. Tendo selecionado os parmetros para a nova recodificao, deve-se seguir o seguinte caminho: na barra de ferramentas selecione TRANSFORM e depois RECODE. Em seguida, as seguintes opes para a realizao da recodificao aparecero: into same variables / into different variables. A primeira opo realiza a recodificao da varivel sobre ela mesma, apagando o contedo da varivel original. A segunda opo realiza a recodificao em uma varivel diferente, permitindo que se mantenha a varivel original intocada. Descreveremos a seguir o funcionamento das duas opes. Na tabela abaixo sugerimos um exemplo tpico de recodificao para permitir uma melhor compreenso do comando. Quando aplicamos questionrios, muito comum colhermos a informao idade na forma de valores absolutos. Na hora da anlise, surge a necessidade de criar faixas etrias, pois para uma srie de aspectos a anlise por faixa facilita o trabalho. Surge, ento, a seguinte situao:
IDADE EM VALOR ABSOLUTO 2 9 15 20 25 26 COMANDO DE RECODIFICA O 0 5 10 15 20 25 at at at at at at 41 92 14 3 19 4 24 5 29 6 NOVA VARIVEL RECODIFICADA 1 2 4 5 6 6

No comando definio da varivel, todos estes valores da nova varivel devem ser definidos como categorias (value labels). Assim, as anlises sero reproduzidas pelo computador de uma forma que todos sabero qual faixa etria corresponde cada um destes valores. Deixamos de ter uma varivel com valor absoluto para termos uma varivel com categorias e com um significado especfico para cada uma delas. O 1 corresponder faixa de 0 at 4 anos, o 2 faixa de 5 at 9 anos e assim por diante. Apesar de perdermos um pouco de preciso na informao, ganhamos em agilidade para a anlise dos dados. 2.2.1. - Como Recodificar uma Varivel substituindo a Varivel Original

Centro de Estudos de Criminalidade e Segurana Pblica

29

Para fazermos uma recodificao substituindo a varivel original sobre a qual foi feita a recodificao dos valores, devemos na barra de ferramentas selecionar a opo TRANSFORM, depois RECODE e depois INTO SAME VARIABLE. Aparecer a seguinte tela:

Devemos inicialmente selecionar no retngulo esquerda a varivel da matriz de dados a ser recodificada. Se existirem variveis com mesmo padro de recodificao, estas podero ser feitas de uma s vez, selecionando todas ao mesmo tempo. Feita a seleo, clicamos na seta direita deste retngulo para que a varivel seja introduzida no campo NUMERIC VARIABLE. Assim como para o comando COMPUTE, podemos selecionar atravs do IF os casos onde esta recodificao ser realizada. O funcionamento desta opo idntica encontrada para o comando COMPUTE, por isso volte a este comando para obter qualquer esclarecimento sobre esta opo. O passo seguinte da recodificao ser indicar os valores novos que substituiro os valores a serem recodificados. Selecionamos, para tal, a opo Old and New Values. Com esta seleo, encontraremos a seguinte figura:

O retngulo Old Value dever ser preenchido com os valores a serem recodificados, enquanto que o retngulo New Value dever ser preenchido com os valores que substituiro estes valores a serem recodificados. No campo Old Value, os valores podem ser preenchidos na

Centro de Estudos de Criminalidade e Segurana Pblica

30

forma de valores absolutos ou intervalos. No campo New Value, os valores s podem ser preenchidos na forma de valores absolutos.3 A cada par de Old Value & New Value deve-se clicar no campo ADD para inserir este par na lista de recodificaes planejadas. Qualquer alterao neste par de valores a ser recodificado poder ser realizada utilizando os recursos disponibilizados pelos campos: CHANGE e REMOVE. Aps escolher todos os pares de valores a serem recodificados, basta apenas selecionar o campo CONTINUE. Por fim, bom deixar explcito o significado dos termos system missing e user missing. Ao preenchermos a nossa matriz de dados, os campos deixados sem informao (em branco) so preenchidos automaticamente pelo computador - system missing - com o seguinte smbolo ' . Os valores denominados de user missing so definidos pelo prprio usurio atravs da definio de missing values no ato de definio das variveis. 2.2.2. - Como Recodificar uma Varivel Criando Nova Varivel Para fazermos uma recodificao criando uma nova varivel a partir da varivel recodificada, devemos na barra de ferramentas selecionar a opo TRANSFORM, depois RECODE e depois INTO DIFFERENT VARIABLE. Aparecer a seguinte tela:

Para a opo Recode into Different Variables, devemos inicialmente selecionar no retngulo esquerda a varivel da matriz de dados a ser recodificada. Feita a seleo, clicamos na seta direita deste retngulo para que a varivel seja introduzida no campo NUMERIC VARIABLE OUTPUT VARIABLE. Como estamos tratando de uma recodificao em diferentes variveis, devemos em seguida preencher o campo OUTPUT VARIABLE com o nome da nova varivel (NAME) e sua descrio (LABEL). Tendo preenchido estas duas informaes, basta clicar no campo CHANGE para que a nova varivel seja tambm includa no campo NUMERIC VARIABLE OUTPUT VARIABLE.
3

Estas limitaes de preenchimento dos campos indica de maneira clara a utilidade do comando. Podemos construir, por exemplo, faixas etrias de modo que cada intervalo etrio ser substitudo por uma nica categoria ( 0 9 anos 1 , 10 19 anos 2 , .... )

Centro de Estudos de Criminalidade e Segurana Pblica

31

Os comandos IF (seleo dos casos para recodificao) e Old and New Value (indicao dos valores a serem substitudos e dos valores novos) seguem as mesmas regras descritas para a opo Recode into Same Variable (Recodificao sobre a mesma Varivel).

Centro de Estudos de Criminalidade e Segurana Pblica

32

3. - Relatrios de Anlise de Matrizes de Dados 3.1. - Manipulao de Arquivos de Relatrios de Anlise


A seo do SPSS onde feita a criao, manipulao, excluso e impresso dos resultados das anlises estatsticas feitas pelo SPSS denominada SPSS Viewer. Como podemos observar na figura abaixo, a tela se divide entre duas partes: a da esquerda apresenta em tpicos todas as tabelas e grficos produzidos durante a anlise e a da direita expe a tabela ou grfico selecionado na parte da esquerda. Podemos ver, a seguir, um exemplo da estrutura desta seo.

As anlises contm sempre a mesma estrutura: ttulo, anotaes, um campo denominado statistics e a tabela ou grfico produzida. Aquele item selecionado no campo da esquerda (marcado pela seta vermelha ) aparecer no campo da direita em evidncia. Toda vez que pedimos ao programa SPSS para gerar alguma tabela, grfico, medidas estatsticas, etc, e que no existe nenhum arquivo de anlise aberto, ele criar um novo arquivo dentro do SPSS Viewer. Devemos perceber que no se trata de uma arquivo de tipo (*.sav) como foi definido anteriormente para a guarda de matrizes de dados. Este novo arquivo ter a terminao (*.spo) e servir apenas para guardar estas anlises. 3.1.1. - Como Guardar Arquivos Contendo Relatrios de Anlises O SPSS gera automaticamente arquivos de relatrios com o nome OUTPUT seguido por um nmero (1, 2, 3, etc) de acordo com o nmero de arquivos de relatrios de anlises j abertos. Se desejarmos alterar este nome ou direcionar a localizao para o arquivo ser guardado, devemos seguir as mesmas instrues da opo Como Guardar uma Matriz de Dados na Forma de um Arquivo. 3.1.2. - Como Abrir Arquivos Contendo Relatrios de Anlises Se desejarmos abrir arquivos de relatrios de anlise j guardados anteriormente, devemos seguir as instrues da opo Como Abrir uma Matriz de Dados j Existente.

Centro de Estudos de Criminalidade e Segurana Pblica

33

3.2. - Edio de Relatrios de Anlise


Uma vez produzido o relatrio e anlise, este pode ser alterado em alguns itens como ttulo, texto dentro da tabela, formatao do grfico, etc. Se selecionarmos o item Title no espao da esquerda, seu contedo ser mostrado no espao da direita. O ttulo poder, ento, ser editado, se clicarmos duas vezes repetidas sobre ele no campo da direita. Se selecionarmos o item Notes no espao da esquerda, uma srie de caractersticas da anlise pedida ser mostrada no espao da direita: data em que foi criado o relatrio, nome e localizao do arquivo que contm a matriz de dados utilizada para elaborar o relatrio, se foi utilizado algum filtro para selecionar os casos para a anlise ou peso para atribuir importncia diferente aos casos, nmero total de casos analisados, existncia de missing values, o comando utilizado para gerar o relatrio e o tempo total que o computador levou para fazer o relatrio. Tais informaes podero ser editadas se clicarmos duas vezes repetidas sobre o quadro.
Notes Output Created Comments Input 11 May 00 17:14:44 Data Filter Weight Split File N of Rows in Working Data File Definition of Missing Cases Used Syntax C:\apostilaspss\apostila\DELEGACI A REGIONAL.sav <none> <none> <none> 42 User-defined missing values are treated as missing. Statistics are based on all cases with valid data. FREQUENCIES VARIABLES=iddeleg /ORDER ANALYSIS . 18724 0:00:00,06

Missing Value Handling

Resources

Total Values Allowed Elapsed Time

Se selecionarmos o item Statistics ou Case Processing no espao da esquerda, seu contedo ser mostrado no espao da direita: o nmero total de casos considerados vlidos para a anlise e o nmero total de casos caracterizados como missing values e que por isso no foram computados na anlise. Tal tabela poder ser editada se clicarmos duas vezes com o mouse sobre ela no campo da direita. Por fim, o ltimo item nos mostrar o relatrio final da anlise. Neste caso, a tabela de freqncia ou o grfico BOX PLOT. Tal tabela poder ser editada se clicarmos duas vezes com o mouse sobre ela no campo da direita.

Centro de Estudos de Criminalidade e Segurana Pblica

34

3.3. Seleo de Casos para Anlise


O recurso de seleo de casos para anlise muito utilizado, principalmente quando queremos restringir nossa anlise a um grupo social especfico dentre todos os presentes no conjunto total da amostra. Seu uso no desenvolvimento de anlises comparativas limitado pelo fato de que o software j traz uma srie de recursos que possibilitam a efetivao desse uso de anlise de uma maneira mais simplificada. Para fazermos uma seleo de dados, devemos selecionar na barra de ferramentas DATA e depois SELECT CASES. O campo Select nos mostra 5 opes para seleo dos casos: All Cases (Todos os Casos), If Condition is Satisfied (Se Condio for Satisfeita), Random Sample of Cases (Amostragem Aleatria dos Casos), Based on Case Range (Baseado em Intervalo de Casos) e User Filter Variable (Uso de Varivel Filtro). A primeira opo - All Cases - nos permite trabalhar com todos os casos da amostra e automaticamente definida pelo SPSS.

A segunda opo - If Condition is Satisfied - nos permite estabelecer uma condio em funo de uma expresso matemtica que deve ser satisfeita para que cada caso especfico entre no grupo dos que sero analisados.

Esta tela bastante semelhante quela encontrada no comando COMPUTE na opo IF (condio). O retngulo direita dever ser

Centro de Estudos de Criminalidade e Segurana Pblica

35

preenchido com alguma expresso matemtica que contenha pelo menos uma das variveis presentes na lista esquerda. Esta expresso agir como um condicionante para que o caso seja inserido no grupo dos que sero analisados. Como exemplo de condio temos por exemplo: idade > 5 (a anlise se restringir s pessoas com mais de cinco anos de idade) A terceira opo - Random Sample of Cases - nos permite escolher o nmero de casos a serem analisados em funo de uma seleo aleatria simples. Poderemos indicar aproximadamente a porcentagem de casos a serem selecionados no total de casos ou o nmero exato de casos dentro de um nmero especfico de primeiros casos; por exemplo: cinco casos dentro dos 100 primeiros.

A quarta opo - Based on Case Range - nos permite escolher os casos dentro de uma faixa especfica de ordem de codificao.

Com base no cdigo do caso - nmero do caso presente na margem esquerda da tabela de matriz de dados - indicaremos o intervalo de casos a serem selecionados. A quinta e ltima opo - User Filter Variable - nos permite selecionar os casos em funo de uma varivel filtro definida previamente. Esta opo exige uma varivel de tipo especial (dummy) composta apenas de valores 0 e 1, onde os valores 1 sero selecionados e os valores 0 no sero selecionados.

Centro de Estudos de Criminalidade e Segurana Pblica

36

3.4. - Anlise Descritiva dos Dados


3.4.1. - Como Fazer uma Anlise Descritiva Baseada em Medidas de Tendncia Central e Disperso (moda, mdia, mediana, desvio padro, etc) As anlises de tendncia central so muito importantes quando estamos trabalhando com variveis ordinais. Os indicadores de tendncia central so capazes de nos mostrar como uma certa varivel ou caracterstica do grupo estudado se distribui utilizando apenas um nmero. De um modo geral, dois fatores so importantes nas anlises deste tipo: a avaliao da tendncia central da distribuio e a avaliao da disperso dos valores em torno desta tendncia central. Mostraremos aqui apenas um dos possveis caminhos para se chegar a estas medidas de tendncia central. Na barra de ferramentas selecione STATISTICS, depois SUMMARIZE e depois FREQUENCIES. Chegaremos, ento, a seguinte figura:

Este comando permite trabalharmos com a descrio da distribuio de valores de variveis ordinais e categricas. Seu padro est direcionado para a anlise de variveis categricas. Para conseguirmos indicadores de tendncia central devemos selecionar no campo STATISTICS aqueles indicadores que consideramos importantes e desabilitar a opo DISPLAY FREQUENCY TABLE clicando sobre o campo. Ao clicarmos sobre o campo STATISTICS chegaremos a seguinte figura:

Centro de Estudos de Criminalidade e Segurana Pblica

37

Tendo chegado a esta figura, basta selecionarmos entre as diversas opes existentes aquelas que desejamos. Entre as medidas de tendncia central temos as seguintes opes: mdia, moda, mediana e soma; entre as medidas de disperso dos valores temos as seguintes opes: desvio padro, varincia, intervalo, valor mximo e mnimo e mdia do erro padro; em relao aos valores percentuais poderemos obter os quartis, os diversos percentis desejados e os valores que dividem a amostra no nmero de partes iguais desejadas4. Tendo feito a seleo das medidas desejadas, basta clicar em CONTINUE. A opo CHART relaciona uma srie de recursos para a visualizao grfica da distribuio de dados de variveis. Dentre estas, a nica apropriada para a visualizao de variveis ordinais o histograma. Todas as outras opes so mais apropriadas para a anlise de variveis categricas. Ao clicarmos na opo CHART chegaremos na figura abaixo, onde poderemos selecionar histogramas. Existir ainda a alternativa de produzir a curva normal do grfico, se selecionarmos a opo With normal curve.

A opo FORMAT relaciona uma srie de recursos para a construo das tabelas de frequncia, que como j foi dito antes se restringe a
4

Os pontos de corte so obtidos a partir da partio da sequncia, formada pelos valores ordenados da varivel, no nmero de partes desejadas. Os valores obtidos como Cut Points so os valores que esto justamente no ponto em que essas partes so divididas.

Centro de Estudos de Criminalidade e Segurana Pblica

38

anlise de variveis categricas. Estas duas opes sero descritas posteriormente quando tratarmos da anlise da distribuio de variveis categricas. Tendo selecionado as opes de medidas centrais presentes no campo STATISTICS basta retornar a tel FREQUENCIES e selecionar as variveis a serem analisadas, introduzindo-as no campo VARIABLES. 3.4.2. - Alternativa de Construo de Grficos para Anlises de Tendncia Central Alm da opo HISTOGRAMA na tela FREQUENCIES , existe um segundo modo de chegarmos a uma representao grfica de medidas de tendncia central. Na barra de ferramentas escolheremos GRAPHS, depois BOX PLOT e chegaremos na seguinte figura:

Este grfico nos permite fazer uma anlise descritiva comparativa de distribuies de dados entre grupos de casos separados. Seus resultados so baseados na distribuio dos quartis e mediana. A definio do parmetro de repartio da amostra dado em funo das categorias de uma segunda varivel. Seria til, como podemos ver abaixo, na comparao do nvel de criminalidade em trs delegacias diferentes.
80
12

60

40

20
31 30

42

PESSFOGO

-20
N= 12 19 11

Uberlndia

Uberaba

Curvelo

Delegacias Regionais

Estamos separando a anlise da distribuio dos dados entre trs delegacias: Uberaba, Uberlndia e Curvelo. O eixo Y do grfico mostra os valores da varivel PESSFOGO (Crimes contra pessoa utilizando arma de

Centro de Estudos de Criminalidade e Segurana Pblica

39

fogo). Dentro deste grfico, a linha preta no interior do retngulo vermelho corresponde a mediana da distribuio em cada categoria de delegacia, os retngulos vermelhos compreendem a distribuio de 50 % dos casos e os traos pretos acima a abaixo deste retngulo compreendem os 50% restantes dos casos. Os pontos pretos acima e abaixo destes traos pretos so denominados out liers e podem ser definidos como os valores dos casos que se diferenciaram muito da distribuio central dos dados (esto fora da distribuio principal). Como podemos ver, temos neste grfico no s uma idia da tendncia central da distribuio da varivel, mas tambm, uma idia da disperso desta distribuio. No menu para definio deste grfico, poderemos escolher entre trabalhar com apenas uma varivel no eixo X (simple) ou trabalhar com duas variveis agregadas (Clustered). Poderemos, ainda, selecionar por trabalhar com a separao por grupos de casos (groups of cases) ou por variveis (separate variables). 3.4.3. - Summaries for Groups of Cases Se selecionarmos a opo SIMPLE e Summaries for Groups of Cases, chegaremos a seguinte tela:

Os campos Variable, Category Axis e Label Cases By devem ser preenchidos com as variveis selecionadas presentes no retngulo da esquerda. Na construo do BOX PLOT, o campo VARIABLE deve ser preenchido com a varivel em funo da qual se deseja fazer a anlise de tendncia central comparando os diversos sub-grupos de casos e o campo CATEGORY AXIS deve ser preenchido com a varivel em funo da qual sero estabelecidos os sub-grupos de casos a serem comparados, por exemplo, Uberaba, Uberlndia e Curvelo. O preenchimento do campo Label Cases By no obrigatrio e a varivel presente neste campo ser usada para caracterizao dos outliers. Se continuarmos com a opo Summaries for Groups of Cases e selecionarmos a opo Clustered, alm de preenchermos os campos indicados acima para a opo Simple, passaremos a ter que preencher o campo: DEFINE CLUSTERS BY. Este campo dever ser preenchido com a varivel em funo da qual definiremos uma nova diviso dos casos

Centro de Estudos de Criminalidade e Segurana Pblica

40

dentro dos subgrupos j criados. Trabalharemos, deste modo, com grupos distintos dentro dos subgrupos j criados anteriormente. 3.4.4. - Summaries of Separate Variables

Se selecionarmos a opo SIMPLE e Summaries of Separate Variables, chegaremos a uma figura como a abaixo. Deveremos preencher o campo BOXES REPRESENT com as variveis a serem analisadas no grfico. A anlise passar a ser feita, ento, para todo o conjunto de casos e para cada varivel separadamente. Enquanto que a anlise anterior era feita por grupos de casos diferentes e para apenas uma varivel por vez. O campo LABEL CASES BY dever ser preenchido como designado acima no caso do BOX PLOT por grupos de casos. Se continuarmos com a opo Summaries of Separate Variables e selecionarmos a opo Clustered, alm de preenchermos os campos indicados acima para a opo Simple, passaremos a ter que preencher o campo: CATEGORY AXIS. Este campo dever ser preenchido com a varivel em funo da qual definiremos uma diviso dos casos dentro da anlise das variveis. 3.4.5. - Como Fazer uma Distribuio de Frequncia Anlise Descritiva Baseada na

Anlises descritivas baseadas na distribuio de frequncia so usadas para variveis categricas. Neste caso conseguimos saber a participao numrica e percentual de cada categoria no total de casos analisados por varivel. Na barra de ferramentas devemos selecionar STATISTICS, depois SUMMARIZE e depois FREQUENCIES. O padro do SPSS conformar este comando para a anlise de variveis categricas. Chegaremos a seguinte figura:

Centro de Estudos de Criminalidade e Segurana Pblica

41

Aps escolhermos a varivel sobre a qual queremos construir a tabela de freqncia e inseri-la no campo VARIABLE(S), poderemos escolher no campo FORMAT algumas opes em relao ao formato desta tabela. Chegaremos a seguinte figura:

Poderemos escolher a ordem com que as categorias das variveis sero mostradas na tabela: ascending values: categorias aparecem em ordem crescente do valor da categoria descending values: categorias aparecem em ordem decrescente do valor da categoria ascending counts: categorias aparecem em ordem crescente do valor do nmero total de casos por categoria descending counts: categorias aparecem em ordem decrescente do valor do nmero total de casos por categoria Na opo MULTIPLE VARIABLE poderemos escolher entre incluir os resultados das anlises de todas as variveis trabalhadas em um mesmo relatrio (compare variable) ou produzir um relatrio por varivel (organize output by variable). Na opo SUPRESS TABLES WITH MORE THAN poderemos escolher por excluir do relatrio aquelas tabelas que tenham um certo nmero definido de categorias. Aps escolhermos o formato de construo da tabela, poderemos tambm escolher por dar uma forma grfica a estes resultados. Clicando na opo CHART chegaremos na figura abaixo, onde poderemos escolher por trabalhar com grfico de barras, grfico de Pizza ou histogramas. Poderemos ainda selecionar se os valores que aparecero no grfico sero os valores absolutos de casos das categorias (frequencies) ou os percentuais destes valores em relao ao nmero total de casos

Centro de Estudos de Criminalidade e Segurana Pblica

42

(percentages). Por fim, no caso de trabalharmos com o histograma, poderemos selecionar se queremos que aparea a curva da normalidade do grfico (With Normal Curve).

3.4.6. - Como Elaborar Anlises Utilizando Grficos de Controle de Processo A anlise de grficos de controle de processo constitui um exemplo prtico da utilizao de medidas de tendncia central e disperso. Devido ao carter introdutrio desta apostila, vamos trabalhar apenas com a opo de anlise: X-Bar, R, S. Na barra de ferramentas devemos selecionar GRAPHS e depois CONTROL. Chegaremos, ento, tela apresentada abaixo. Selecionando a opo DEFINE, chegaremos seguinte tela. Essta tela dever ser preenchida da seguinte forma: o campo PROCESS MEASUREMENT dever ser preenchido com o nome da varivel que estaremos acompanhando no processo de evoluo e o campo SUBGROUPS DEFINED BY dever ser preenchido com o nome da varivel que utilizaremos para separar os instantes de observao dos nossos casos.

Na opo CHART, definiremos o tipo de grfico que desejamos que seja apresentado pelo SPSS. Podemos seguir duas opes: X-Bar and Range e X-Bar and Standard Deviation.

Centro de Estudos de Criminalidade e Segurana Pblica

43

Por fim, a opo TITLES nos permite editar os ttulos a serem colocados no grfico e a opo OPTIONS nos permitir definir o intervalo mximo e mnimo esperado. Estes valores podero ser esstabelecidos atravs da definio do nmero de sigmas ou manualmente. Poderemos, ainda, definir o nmero de casos presentes em cada instante de observao atravs do MINIMUM SUBGROUP SSIZE SAMPLE. Por fim, poderemos utilizar os valores contendo missing para definir um dos instantes de observao.

Centro de Estudos de Criminalidade e Segurana Pblica

44

3.5. - Anlise de Associao entre Variveis


A anlise de associao entre duas variveis um caso bastante simples de anlise de associao entre variveis, pois de um modo geral este fenmeno se estende por mais de duas variveis. Para uma anlise mais completa, levando vrias variveis em considerao ao mesmo tempo, devemos trabalhar com anlises de regresso. 3.5.1. - Como construir uma tabela para verificar a relao entre variveis Um passo inicial para as anlises de associao a construo de tabelas de contingncia, que tem o formato de (x) linhas por (y) colunas. O nmero de linhas e colunas resultado do nmero de categorias das variveis trabalhadas. S se constri tabelas que relacionem variveis categricas. No recomendado trabalhar com um nmero exagerado de linhas ou colunas, pois isso dificulta a anlise da tabela. Para realizar a construo da tabela devemos ir a barra de ferramentas e escolher a opo STATISTICS, depois SUMMARIZE e em seguida CROSSTABS. Chegaremos a uma figura como a abaixo. O campo ROW dever ser preenchido com a varivel a ser colocada na linha da tabela. O SPSS tem como padro colocar sempre a varivel independente neste campo. O campo COLUMN dever ser preenchido com a varivel a ser colocada na coluna da tabela. O SPSS tem como padro colocar sempre a varivel dependente neste campo. Note que estes campos podero ser preenchidos com mais de uma varivel. Neste caso, sero construdas, ento, quantas tabelas forem necessrias envolvendo 2 variveis para cumprir com as alternativas possveis de cruzamento entre as variveis indicadas. Por exemplo, se colocarmos a varivel idade e educao na linha e sexo na coluna, chegaremos a duas tabelas: idade X sexo e educao X sexo.

O retngulo abaixo do campo COLUMN poder ser preenchido com uma nova varivel que ser utilizada na construo de uma tabela envolvendo trs variveis. Tambm este campo poder ser preenchido com mais de uma varivel.

Centro de Estudos de Criminalidade e Segurana Pblica

45

Se a opo Display Clustered Bar Charts estiver selecionada, o relatrio fornecido pelo SPSS fornecer, alm da tabela de cruzamento das variveis, um grfico de barras com o contedo da tabela. Ao selecionarmos o campo CELLS chegaremos a figura abaixo, onde poderemos escolher se desejamos que a tabela mostre os valores absolutos observados no cruzamentos, os valores esperados em funo da distribuio das marginais e os diversos percentuais de distribuio dos casos em funo dos totais da linha, coluna ou da tabela e ainda os valores de resduos padronizados e no padronizados.

Se selecionarmos o campo FORMAT chegaremos a figura abaixo, onde poderemos selecionar a ordem de apresentao das categorias presentes na linha.

3.5.2. - Como construir anlises de associao entre variveis em funo de coeficientes de correlao A construo desta anlise exige que se tenha um conhecimento mais aprofundado de estatstica para que possamos selecionar de maneira mais adequada os coeficientes de correlao a serem analisados. Cada tipo de associao, dependendo do tipo de varivel trabalhada, exige que se trabalhe com um coeficiente diferente. Toda anlise desse tipo envolve, em geral, uma anlise da dependncia entre as variveis e depois uma anlise da intensidade da correlao. A anlise da dependncia lhe permite averiguar se a relao encontrada entre as variveis decorre de uma simples coincidncia dos casos analisados, ou seja, do processo de chance associado aos resultados. J a anlise da intensidade da correlao lhe indica a intensidade desta associao. Para realizarmos este tipo de anlise por coeficiente de correlao devemos selecionar a opo STATISTICS na barra de ferramentas,

Centro de Estudos de Criminalidade e Segurana Pblica

46

depois SUMMARIZE e depois CROSSTABS. Chegaremos na seguinte tela:

Se quisermos ver apenas os coeficientes de correlao, deveremos selecionar o campo SUPPRESS TABLES, o que far com que a tabela de cruzamento das variveis no seja produzida. Em seguida, deveremos selecionar o campo STATISTICS para podermos escolher o coeficientes com que queremos trabalhar. Surgir, ento, a seguinte figura:

A anlise do Chi-square nos permite, como foi indicado acima, levantar em que medida a associao encontrada acima decorre do simples processo de chance relacionado aos resultados. O valor mostrado pelo programa para a associao investigada dever, ento, ser analisado dentro de uma tabela de Chi-square (presente em qualquer livro de estatstica)para que possamos chegar a alguma concluso a respeito da probabilidade do resultado ser decorrente de um processo de chance ou no. Deveremos, ento, selecionar os coeficientes de correlao desejados. No se esquea que cada um deles tem uma utilidade especfica e os resultados de coeficientes diferentes no podem ser comparados entre si sem nenhum critrio sistemtico. recomendvel que se faa toda a anlise em funo de apenas um coeficiente, para que seus valores sejam comparveis com facilidade. O prprio SPSS trs na tabela acima, como podemos ver, algumas indicaes para a escolha. Para

Centro de Estudos de Criminalidade e Segurana Pblica

47

trabalhar com variveis nominais foram indicados os seguintes coeficientes: coeficiente de contingncia, Phi, V de Cramer, coeficiente de incerteza e Lambda. Para trabalhar com variveis ordinais foram indicados os seguintes coeficientes: Gamma, Somers e Kendall. Os campos ROW, COLUMN e o retngulo abaixo do campo COLUMN devero ser preenchido como especificado no item Como construir uma tabela para verificar a relao entre variveis. Enquanto as tabelas de cruzamento so restritas para a anlise de variveis categricas, o uso de coeficientes de correlao pode ser desenvolvido para a anlise de variveis categricas e variveis ordinais. Existindo, at mesmo, coeficientes prprios para a anlise de um e outro tipo de varivel. 3.5.3. - Como Construir Anlises de Regresso Linear Anlises de regresso so utilizadas em anlises multivariadas. Existe uma srie de pr-requisitos que devem ser observados antes da utilizao desta tcnica de anlise. Nesta apostila temos como objetivo nico apresentar os passos para elaborao da regresso atravs do SPSS. O desenvolvimento de anlises de regresso permite verificar a associao de mais de uma varivel ao mesmo tempo com uma varivel dependente final. A anlise de regresso permite, assim, averiguar qual o grau de explicao que um certo conjunto de variveis tem sobre um fenmeno estudado e o efeito separado de cada uma destas variveis no acontecimento deste fenmeno. Existem duas formas bsicas para o desenvolvimento de regresses, uma adequada para situaes onde as variveis so escalares (Regresso Linear) e outra adequada para situaes onde as variveis so categricas (Regresso Logstica). No menu ANALYZE devemos selecionar o menu REGRESSION e em seguida a opo LINEAR.

Centro de Estudos de Criminalidade e Segurana Pblica

48

No campo DEPENDENT devemos indicar a varivel a ser considerada como dependente (varivel resposta) no modelo de regresso. No campo INDEPENDENTS devemos indicar as variveis independentes no modelo de regresso. No campo SELECTION VARIABLE iremos indicar uma condio relacionada a uma varivel para a seleo dos casos que sero avaliados para a realizao da regresso. No campo CASE LABELS iremos selecionar o rtulo para ser atribudo aos casos destacados em todos os grficos elaborados no relatrio de anlise. No campo METHOD devemos selecionar o mtodo de incluso das variveis independentes na anlise de regresso. O mtodo ENTER faz a anlise de apenas um modelo contendo todas as variveis independentes de uma s vez. O mtodo FORWARD comea pela elaborao da anlise com um modelo que tem apenas 1 varivel e o mais explicativo e segue elaborando anlises com modelos adicionando uma varivel para cada modelo at incluir todas as variveis independentes num modelo final. So tantos modelos, quantas variveis existirem. O mtodo BACKWARD faz o mesmo que o modelo FORWARD mas em sentido inverso, comea com um modelo completo at chegar a um modelo com apenas uma varivel. O boto WLS ir ativar a possibilidade de selecionarmos uma varivel peso para ser inserida no processo de clculo da regresso. O boto STATISTIC permitir a seleo de uma srie de atributos a serem includos no relatrio de anlise relacionados anlise de resduos, coeficientes de regresso e ajustes do modelo.

O boto PLOTS nos permitir selecionar grficos que sero includos no relatrio estatstico da anlise de regresso resduos, resduos padronizados, valores preditos, varivel dependente, etc.

Centro de Estudos de Criminalidade e Segurana Pblica

49

O boto SAVE nos permitir incluir na anlise de regresso a gerao de variveis contendo os resduos, valores preditos, distncias, etc.

Por fim, o boto OPTIONS nos permitir mudar os parmetros de anlise. Os valores de incluso e excluso em termos da estatstica F, incluso da constante na anlise e opes para excluso de casos em funo da existncia de missing values ou preenchimento com o valor da mdia dos outros casos.

Centro de Estudos de Criminalidade e Segurana Pblica

50

Potrebbero piacerti anche