Sei sulla pagina 1di 122

SPSS 12

Mdulo Base Conceitos e Recursos

Cora Maria Bender de Santana e Maria das Graas Moreira Lisboa

Sumrio
I Introduo.....................................................................................................................................4 1. Passos de uma anlise estatstica........................................................................................4 2. A famlia SPSS for Windows.............................................................................................5 3. Viso Geral do SPSS for Windows....................................................................................5 II Sobre o Banco de Dados .............................................................................................................12 1. Como criar seu prprio banco de dados .............................................................................13 2. Criando vrias variveis com as mesmas caractersticas ...................................................17 3. Definindo propriedades de variveis categricas...............................................................19 4. Formas de importao e exportao de dados....................................................................22 5. Importao de arquivos tipo Excel ou Ltus......................................................................23 6. Lendo banco de dados usando ODBC................................................................................25 III- Transformao de Dados .............................................................................................................29 1. Compute ...............................................................................................................................29 2. Visual Bander.......................................................................................................................30 4. Recode into different variables .......................................................................................33 5. Recode into same variables.............................................................................................35 6. Automatic Recode..............................................................................................................36 7. Count..................................................................................................................................37 IV- Um pouco de Estatstica Descritiva ............................................................................................37 1. Nvel de medida das variveis............................................................................................37 2. Distribuio de freqncia .................................................................................................38 3. Medidas de posio ............................................................................................................39 4. Medidas de variabilidade ...................................................................................................40 V- Comandos do SPSS para Anlise Estatstica ...............................................................................42 1. Olap Cubes .........................................................................................................................43 2. Frequencies ........................................................................................................................44 3. Descriptives........................................................................................................................47 4. Crosstabs ............................................................................................................................48 VI- Tabelas ........................................................................................................................................51 1. Usando os cones de organizao.......................................................................................53 2. Modificando as clulas.......................................................................................................54 3. Propriedades da tabela........................................................................................................55 4. Tablelooks ..........................................................................................................................58 5. Criando um grfico a partir de uma tabela.........................................................................58 VII Manipulao de Dados .............................................................................................................60 1. Ordenao de casos ..............................................................................................................60 2. Seleo de casos ...................................................................................................................61 3. Split File ...............................................................................................................................64 4. Aggregate .............................................................................................................................65 5. Restructure ...........................................................................................................................66 6. Transpose .............................................................................................................................69 2

VIII- Arquivos e Janelas Produzidas em uma sesso SPSS ..............................................................70 1. Janela de dados.....................................................................................................................70 2. Janela de sadas ....................................................................................................................71 3. Janela de sintaxe...................................................................................................................72 4. Copiando o contedo da janela de sadas.............................................................................76 5. Formas de exportao...........................................................................................................79 IX Utilizando os Scripts do SPSS...................................................................................................80 1. Modificando um script .......................................................................................................81 X Customizao das barras de ferramentas ....................................................................................83 XI Controlando o ambiente ............................................................................................................85 1. Guia General ......................................................................................................................85 2. Guia Viewer .......................................................................................................................86 3. Guia Draft Viewer..............................................................................................................87 4. Guia Output Labels ............................................................................................................87 5. Guia Charts ........................................................................................................................88 6. Guia Interactive ..................................................................................................................89 7. Guia Pivot Tables...............................................................................................................89 8. Guia Data ...........................................................................................................................90 9. Guia Currency ....................................................................................................................91 10. Guia Scripts........................................................................................................................91 XII Unio de dois bancos de dados ................................................................................................92 1. Adicionando casos .............................................................................................................92 2. Adicionando variveis........................................................................................................94 XIII Mltipla Resposta ...................................................................................................................97 XIV Grficos no-interativos.......................................................................................................101 XV - Grficos interativos................................................................................................................107 Alguns tipos de arquivos importantes ...................................................................................122

I. Introduo
1. Passos de uma anlise estatstica Em nosso dia a dia, vivemos constantemente rodeados por potenciais fontes de dados, que podem ser funcionrios de uma empresa (se estivermos interessados em avaliar seu desempenho antes e aps um treinamento), pacientes de uma clnica (se quisermos estudar tempo de reao a uma determinada droga), objetos em uma linha de produo (se quisermos avaliar quantidades de peas defeituosas produzidas), ou ndices da bolsa de valores (se nosso alvo so as projees econmicas). Por hora, vamos supor que estamos interessados em estimar a altura mdia dos brasileiros do sexo masculino com mais de 25 anos. Em geral no temos recursos financeiros ou mesmo tempo suficiente para entrevistar cada pessoa e, por isso, preciso selecionar um grupo ou uma amostra de pessoas. Esta etapa chamada de coleta de dados que seguida do devido armazenamento dos mesmos. Uma vez reunidas as informaes, frequentemente esses dados precisam passar por algum tipo de transformao. Se a altura das pessoas tivesse sido tomada em ps e polegadas, seria conveniente transform-la para centmetros. Esta a etapa de transformao de dados, que poderia se estender a clculos bem mais complexos. Finalmente os dados esto prontos para a anlise, a qual ser dividida em duas fases. A primeira chamada de descritiva, na qual, como o prprio nome diz, descreveremos os dados. Alguns procedimentos utilizados nessa etapa so: construo de tabelas e grficos, clculo de medidas como mdia, varincia, etc. No estudo sobre a altura dos brasileiros, por exemplo, poderamos ter como primeiros resultados: a altura mdia na amostra entrevistada de 168 cm com um desvio padro de 12 cm. Mas da a dizer que esta a altura mdia do brasileiro do sexo masculino com mais do que 25 anos um grande passo, que deve ser dado com muito cuidado. ento que entra a segunda parte da anlise, a anlise inferencial. Com a ajuda de testes estatsticos, poderemos mais do que simplesmente dizer qual a altura mdia do brasileiro, mas tambm associar uma certa confiabilidade a tal concluso. Depois de tanto trabalho hora de relatar as concluses do estudo. Agora toda informao, seja ela numrica ou grfica, bem-vinda para que algum que no participou do processo de anlise possa compreender as concluses sobre o estudo, atravs do relatrio. Mas afinal, por que devemos realizar uma anlise estatstica? Simplesmente porque precisamos da confiabilidade que esta anlise oferece em um momento de tomada de deciso. A figura I-1 apresenta um esquema com os passos de uma anlise estatstica. O SPSS tem sido considerado um dos melhores softwares estatsticos do mercado, justamente porque participa de grande parte do processo que engloba uma anlise estatstica. Logo na primeira etapa possvel armazenar dados de forma rpida e prtica no prprio SPSS. Durante o processo de transformao e anlise de dados, o SPSS tem recursos considerados dos mais poderosos. At mesmo em um dos momentos mais delicados da anlise, a elaborao de relatrios, o SPSS tem recursos excelentes para ajud-lo. Mas, e na hora de tomar decises? Mesmo nesse momento crtico da sua anlise, voc pode contar com os recursos do SPSS, como por exemplo, um tcnico de resultados que lhe ensina como analisar os resultados apresentados em alguma tabela.

Figura I-1: Passos de uma anlise estatstica de dados

Coleta e Armazenagem de Dados Transformao Anlise Descritiva Anlise Inferencial Apresentao dos Resultados Confiabilidade na Tomada de Deciso

2. A Famlia SPSS for Windows A famlia SPSS for Windows formada por onze mdulos: Base, Regression, Models, Tables, Advanced Models, Trends, Exact Tests, Categories, Conjoint, Missing Values, Maps e Complex Samples. O mdulo Base o mdulo central, com o qual todos os demais interagem. Ele o responsvel pela importao e exportao de arquivos, toda etapa de manipulao e transformao de dados, anlise descritiva, anlise no paramtrica, anlise inferencial bsica, e toda a produo grfica. Ao adicionar outros mdulos ao mdulo Base, estaremos apenas acrescentando novos procedimentos estatsticos, ganhando em termos de opes e complexidade; porm o acrscimo de outros mdulos no altera o aspecto geral do SPSS. Dessa forma, os mdulos podem ser adquiridos levando em conta a rea de atuao e o trabalho a ser desenvolvido.

3. Viso geral do SPSS for Windows A janela Untitled SPSS Data Editor (ver figura I-2) carregada automaticamente quando se inicia o SPSS. Esta janela aberta para que comecemos a trabalhar com os nossos dados. Ela permite a digitao, edio, transformao e anlise de dados. O formato de uma planilha, onde cada linha corresponde a um caso e cada coluna a uma varivel. Figura I-2: Aspecto inicial do SPSS

O menu File (ver figura I-2) permite que voc tenha controle sobre tudo que se refere ao gerenciamento de arquivos, como importao, exportao, impresso e salvamento. O primeiro bloco desse menu destina-se abertura de arquivos, seja ele um banco de dados, uma janela de sada produzida anteriormente ou uma janela de sintaxe. Os tipos de bancos de dados que podem ser lidos pelo SPSS so os mais diversos, desde do formato ASCII (texto) at bancos em formato Lotus 123, Excel, Dbase, entre outros e, claro, arquivos produzidos pelo prprio SPSS nas suas diferentes verses. A opo New inicializa um novo banco de dados ou outro tipo de janela, a opo Open abre um arquivo diretamente, a opo Open Database... serve para voc ler arquivos de vrios bancos de dados diferentes atravs de ODBC, e a opo Read Text Data abre um assistente para auxili-lo na leitura de arquivo em formato texto. O segundo bloco do menu File tem por funo salvar qualquer janela do SPSS. Assim se estivermos na janela Sadas, podemos salvar os resultados obtidos em uma anlise estatstica atravs da opo Save, etc. Permite ainda salvar um banco de dados criado no SPSS em outro formato, assim como no prprio SPSS. A opo Mark File Read Only serve para evitar que um arquivo original seja modificado ou apagado acidentalmente, com essa opo selecionada o seu arquivo fica marcado como somente leitura. Caso essa opo esteja selecionada, para salvar o arquivo ser necessrio escolher outro nome ou entrar novamente no menu File e escolher a opo Mark File Read Write. No terceiro bloco do menu File, voc pode obter informaes sobre o contedo do seu banco de dados usando a opo Display Data File Information, forar a criao de um arquivo de dados temporrio atravs de Cache Date, parar o processador do SPSS atravas de Stop Processor ou conectar-se a um servidor para executar anlises em bancos de dados maiores (desde que voc tenha um mdulo servidor do SPSS) atravs de Switch Server. No quarto bloco do menu File esta localizada a opo Print para impresso de qualquer janela que esteja ativa e no quinto bloco do menu File temos a lista dos arquivos recentemente utilizados e a opo Exit para voc fechar/sair do SPSS. Figura I-3: O menu File

O menu Edit (ver figura I-4) traz comandos relacionados edio, que podem ser diferentes de acordo com a janela que estiver ativa. Se estivermos na janela de dados, podemos utilizar os recursos Cut, Copy e Paste para copiar, recortar e colar, respectivamente, um conjunto de dados de um lugar para outro. No ltimo bloco do menu Edit, temos o comando Options..., onde podemos definir os principais parmetros do SPSS, como o padro para o tipo da varivel (o padro do SPSS Numeric 8.2, i.e., varivel numrica com 8 dgitos, sendo que os dois ltimos so casas decimais), 6

ou ainda o tamanho e fonte dos ttulos na janela de sadas, entre muitas outras. Todas as opes do comando Options... sero estudas detalhadamente mais adiante. Figura I-4: O menu Edit

Pelo menu View (ver figura I-5) voc escolhe como sero mostrados os dados na janela Data Editor (usando as opes Fonts..., Grid Lines e Value Labels). Por esse menu tambm possvel disponibilizar ou no atravs da opo Status Bar, a barra inferior, chamada de barra de status, que contm algumas mensagens importantes sobre o SPSS. E finalmente, atravs da opo Toolbars... voc pode customizar a(s) barra(s) de ferramentas, podendo inclusive, criar uma barra totalmente nova. Figura I-5: O menu View

O menu Data (ver figura I-6) traz funes relacionadas manipulao dos dados. Comandos como definio de datas, ordenao do banco de dados, juno de arquivos em formato SPSS, 7

seleo de casos do arquivo de dados para trabalho, ponderao de valores, etc, fazem parte das opes desse menu. Figura I-6: O menu Data

A etapa de transformao dos dados concentra-se basicamente no menu Transform. Recursos como criao de novas variveis a partir das j existentes, recodificao de valores do banco de dados e at mesmo interpolao de valores ausentes em uma srie temporal so algumas das opes desse menu (ver figura I-7). Figura I-7: O menu Transform

O menu Analyze (ver figura I-8) rene todos os procedimentos estatsticos disponveis no SPSS. Este o principal menu que sofre alteraes com a incluso de outros mdulos. medida que so includos mdulos opcionais, o nmero de opes (linhas) existentes nesse menu vai aumentando, ou seja, a quantidade de recursos estatsticos vai se tornando cada vez maior e o seu SPSS cada vez mais poderoso. Figura I-8: O menu Analyze

O menu Graphs (ver figura I-9) contm todos os tipos de grficos que o SPSS oferece. Grficos de sequncia, barras, pizza, boxplot, pareto e cartas de controle so apenas alguns deles. Nesse menu temos a opo de construir grficos interativos e caso voc tenha o mdulo Maps, possvel a construo de mapas no SPSS. Figura I-9: O menu Graphs

O menu Utilities (ver figura I-10) oferece recursos que no so imprescindveis, mas certamente quebram alguns galhos. O comando Variables abre uma janela com informaes sobre as variveis do seu arquivo. Clicando no comando Menu Editor... voc pode customizar os menus do SPSS, criando at mesmo um menu totalmente novo. O principal comando nesse menu o Run Script..., onde podemos escolher algum script do SPSS para ser executado (scripts so programas em Visual Basic que veremos adiante). Figura I-10: O menu Utilities

Atravs do menu Window (ver figura I-11) voc pode navegar pelas janelas criadas pelo SPSS, bastando escolher a janela desejada e clicar em seu nome. Voc tambm pode minimizar o SPSS com todas as suas janelas atravs do comando Minimize All Windows. Figura I-11: O menu Window

O ltimo menu que aparece o Help (ver figura I-12). A ajuda no SPSS um dos pontos fortes desse programa, j que ela muito mais do que uma cpia do manual. Quando clicamos em Help, o comando Topics lhe d a chance de escolher entre esclarecimentos do significado de algum termo tcnico ou de algum comando e um ndice remissivo. 10

Um tutorial do SPSS est disponvel atravs do comando Tutorial. Com ele voc pode obter detalhadamente informaes bsicas do uso do SPSS. O comando SPSS Home Page abre automaticamente a pgina da SPSS norte-americana na Internet. O comando Statistics Coach funciona como um tcnico estatstico. Ele ir fazer a voc algumas perguntas sobre seus dados e o tipo de anlise que voc gostaria de obter, e ento, baseado nas suas respostas, ele indicar o procedimento do SPSS mais apropriado para o seu caso. Figura I-12: O menu Help

Exemplo de Questionrio de Entrada de Dados


Este um exemplo de um questionrio que facilita a entrada de dados pelo digitador, pois, nos campos ao lado, ele possui todas as informaes necessrias a serem digitadas. Depois do questionrio preenchido por todos os entrevistados, inicia-se a entrada dos dados.

11

II. Sobre o Banco de Dados


1. Como criar seu prprio banco de dados O SPSS tem por regra geral trabalhar com as variveis (campos) definidas em colunas e casos (registros) em linhas. O SPSS identifica/representa as variveis de trs formas diferentes: Numricas: so variveis cujos dados utilizam nmeros. As variveis com formato data e hora so tambm consideradas numricas, por serem armazenadas internamente em nmero de segundos. As variveis so identificadas pelo smbolo . Ex: Varivel string curta: uma varivel com dados alfanumricos com at 8 caracteres. As variveis so identificadas pelo smbolo . Ex: Varivel string longa: seus dados contm mais de 8 caracteres. Nem todos os procedimentos se aplicam a este tipo de varivel. As variveis so identificadas pelo smbolo . Ex: Para definir uma varivel, clique duas vezes no nome da varivel no topo da coluna ou na parte inferior da janela de dados clique em Variable View. Dessa maneira o modo de definio de variveis ser exibido na janela de dados. Nesse modo temos a opo de definir todas as caractersticas que fazem parte de uma varivel: nome, tipo, rtulos, valores ausentes, formato da coluna e o nvel de medida (ver figura II-1). Figura II-1: Modo de definio de variveis

Para dar nome varivel, basta digit-lo no espao designado por Name. O nome da varivel pode ter no mximo 64 caracteres e deve ser iniciado com uma letra. No pode ter espao em branco e nem caracteres especiais, como!, ? , *, &, \, etc. Porm podemos acentuar. O nome da varivel no pode ser repetido dentro do mesmo banco de dados.

12

Tomemos como exemplo o questionrio mostrado como Exemplo de Questionrio de Entrada de Dados. Neste questionrio temos uma pergunta sobre a cidade em que mora o entrevistado. No nosso caso daremos o nome Cidade para esta varivel (ver figura II-2). Figura II-2: Definio de variveis: Nome

Para alterarmos o tipo de uma varivel, basta clicar em Type, onde podemos definir a varivel como numrica (numeric), moeda (dollar), data (date), alfanumrica (string), entre outros tipos. No questionrio exemplo, a varivel cidade assume os seguintes valores: 1 que corresponde cidade do Rio de Janeiro, 2 a So Paulo e 3 a Bahia. Portanto a varivel Cidade ser definida como numrica. Nessa janela ainda podemos especificar quantos caracteres a varivel ocupa (em Width) e o nmero de casas decimais (em Decimals Places). Para a varivel Cidade, vamos deixar 8 em Width e 0 em Decimals Places (dado que s usamos os nmeros 1, 2 e 3 e no precisamos usar casas decimais) e clicar em OK (ver figura II-3). Figura II-3: Definio de variveis: Tipo, Tamanho e Casas Decimais

Voc pode estar se perguntando: por que no definir a varivel cidade como alfanumrica (string) e digitar Rio de Janeiro, So Paulo e Bahia, ao invs dos nmeros 1, 2 e 3? A resposta simples, muitos dos procedimentos estatsticos no conseguem trabalhar com variveis do tipo string, diminui-se o tempo e a ocorrncia de erros durante a digitao e tambm economizamos espao e conseqentemente o tempo no processamento dos dados. Um recurso muito til no SPSS a possibilidade de relacionarmos um texto (rtulo) ao nome das variveis. Basta selecionar a coluna Label e digitar o texto desejado. Vamos colocar Cidade em que mora o entrevistado como rtulo da varivel cidade. 13

Podemos tambm definir rtulos para os valores que uma determinada varivel pode assumir. A coluna Values reservada para esse tipo de definio. Clique no boto que aparece ao selecionarmos essa coluna e no espao Value digitamos o valor que a varivel assume e em Value Label o rtulo (texto) para aquele valor. Feito isso basta clicar Add para armazenar o rtulo do primeiro valor e passar para a segunda definio. No caso da varivel cidade definimos Rio de Janeiro como rtulo para o valor 1, So Paulo para o valor 2 e Bahia para o valor 3 (ver figura II-4). Figura II-4: Definio de variveis: Rtulos para os valores

A vantagem de definirmos rtulos para variveis ou para os valores que uma varivel pode assumir que toda vez, que pedimos qualquer estatstica envolvendo essas variveis, eles aparecero junto com os resultados na janela de sadas (ver figura II-5). Dessa maneira poderemos identificar qual a cidade referente a cada nmero (cdigo). Figura II-5: Frequncia para a varivel cidade

Quando no h resposta para uma determinada questo, considera-se este dado um valor missing. Geralmente no temos condies de obter um banco de dados totalmente completo. Vamos supor que uma das perguntas da pesquisa a idade do respondente e algumas pessoas no gostam de mencionar a idade. Se nada for informado ao SPSS, como padro, a opo No missing values usada. Nesse caso basta deixar em branco o espao reservado informao que falta e o SPSS coloca o separador decimal (. ou ,) no local e interpreta todos os pontos (ou vrgulas) como valores ausentes (missing). Podemos, porm, querer definir valores especficos como valores ausentes. Nesse caso basta selecionar a coluna Missing, clicar no boto que aparecer e escolher a opo mais conveniente (ver figura II-6). Por exemplo, se escolhermos a opo Discrete missing values podemos definir o nmero 9 como valor missing e cada vez que o SPSS encontrar o nmero 9 no meio de uma anlise estatstica que envolve essa varivel ele saber que aquele valor se refere a um valor ausente.

14

Figura II-6: Definio de variveis: Missing Values

Em resumo, para o SPSS existem dois tipos de valores missing: missing do sistema: so as clulas no preenchidas no arquivo de dados, representadas por um ponto ou uma vrgula. missing definidas pelo usurio: pode-se definir qualquer tipo de valor como missing em uma determinada varivel. Na varivel do nosso exemplo, o valor 9.

Na questo Qual a marca de cigarro de sua preferncia?, do nosso questionrio exemplo, aparece dois tipos diferentes de valores que sero considerados missing: No Respondeu (NR) e o No se Aplica (NA), pois o entrevistado poderia ser no fumante e, portanto no necessitava responder a questo (NA) ou ter deixado a questo sem resposta (NR). Para os procedimentos estatsticos do SPSS, os missing so tratados de forma diferenciada, como no exemplo da tabela de freqncia abaixo:
Marca de cigarro de sua preferncia Valid Percent 25,0 25,0 12,5 18,8 18,8 100,0 Cumulativ e Percent 25,0 50,0 62,5 81,3 100,0

Valid

Missing

Marca A Marca B Marca C Outras marcas Nenhuma marca Total NA NR Total

Total

Frequency 4 4 2 3 3 16 7 2 9 25

Percent 16,0 16,0 8,0 12,0 12,0 64,0 28,0 8,0 36,0 100,0

A definio do formato da coluna um aspecto meramente esttico. Atravs da coluna Columns voc poder determinar a largura da coluna e na coluna Align o alinhamento do texto que pode ser: esquerda (Left), direita (Right) ou centralizado (Center). No caso da varivel cidade definiremos a largura da coluna como 12 e o alinhamento direita (ver figura II-7).

15

Figura II-7: Definio de variveis: Formato da Coluna

E finalmente na coluna Measure, devemos escolher o nvel de medida da varivel. As possveis escolhas so: Escalar (Scale): usa essa opo quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, renda, peso, altura). Devem ser numricos. Ordinal: quando os dados representam categorias com uma ordem intrnseca (ex: concordo totalmente, concordo, discordo, discordo totalmente). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=pequeno, 2=mdio, 3=grande). Nominal: quando os dados representam categorias sem ordem intrnseca (ex: as categorias de estado civil, ocupao, nacionalidade). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=masculino, 2=feminino). No nosso caso escolhemos a opo Nominal, pois no existe ordem nas categorias de cidade. Pronto! Agora s voltar para o modo de exibio dos dados (selecionar Data View na parte inferior da janela de dados) e digitar os valores coletados, lembrando que cada caso (registro) deve ser digitado em uma linha (ver figura II-8). Desse modo o primeiro respondente de So Paulo, o segundo do Rio de Janeiro, o terceiro de So Paulo, o quarto da Bahia e assim por diante. Figura II-8: Janela de dados aps definio de uma varivel

16

Observe que no banco de dados aparecem apenas os nmeros 1, 2, 3 e 9 e no os rtulos . A Figura II-9 mostra a janela de dados (nome das cidades). Para ativ-los basta clicar no cone agora com os rtulos ativos. Para desativ-los basta clicar novamente no mesmo cone. Figura II-9: Janela de dados aps a ativao dos rtulos

2. Criando vrias variveis com as mesmas caractersticas Suponha que agora voc tenha que definir as perguntas abaixo, que esto no questionrio exemplo, no SPSS. Note que elas tm as mesmas opes de resposta: 1) Qual a marca de cigarro de sua preferncia? 2) Qual a marca de cigarro que mais chama sua ateno? 3) Que marca de cigarro produz o comercial que mais lhe atrai? Respostas possveis: 1 - Marca A 2 - Marca B 3 - Marca C 4 - Outras Marcas 5 - Nenhuma 8 - NA 9 - NR Usando os conhecimentos adquiridos at agora definiremos trs variveis, uma para cada pergunta. Para cada uma delas ser definido tipo, rtulos, valores ausentes, formato da coluna e nvel de medida. Todas as definies sero exatamente iguais nas trs variveis. Portanto seria desejvel definir apenas uma vez as caractersticas das variveis e atravs de algum mecanismo poder relacion-las a todas as variveis de uma s vez. Podemos fazer isso no modo de definio de variveis usando os comandos Copy e Paste Variables. Para comear vamos definir uma das variveis. Para a primeira pergunta daremos varivel o nome Cigarro1. Vamos defini-la como: numrica de tamanho 8 e sem nenhuma casa decimal; rtulos dos valores sendo 1 - Marca A, 2 - Marca B, 3 - Marca C, 4 - Outras Marcas, 5 Nenhuma, 8 - NA, 9 - NR; dados ausentes 9; largura da coluna 10 e o nvel de medida nominal (ver figura II-10).

17

Figura II-10: Definio da varivel cigarro1

O prximo passo simples: selecione a varivel Cigarro1 na janela de dados (modo de definio de variveis) clicando no nmero da varivel (2 no nosso caso), selecione o comando Copy no menu Edit, depois selecione uma linha vazia (3 no nosso caso) e selecione o comando Paste Variables do menu Edit. Na janela aberta (ver figura II-11) voc escolhe quantas variveis sero criadas a partir da varivel copiada e nome delas. No nosso caso escolha 2 para a opo Number of new variables, pois queremos criar as variveis Cigarro2 e Cigarro3. Na opo New variables names digite cigarro e escolha 2 (lembre-se que j existe uma varivel chamada cigarro1) e clique em OK. Figura II-11: Criando novas variveis a partir de uma j existente

A figura II-12 mostra a janela de definio de variveis (Variable View) com as variveis criadas. Figura II-12: Criando novas variveis a partir de uma j existente

18

Para colocar ttulos nas variveis criadas basta clicar no campo da coluna Label onde est a varivel e digitar o ttulo que desejar. No nosso caso os ttulos seriam: cigarro1 - Qual a marca de cigarro da sua preferncia?, cigarro2 - Qual a marca de cigarro que mais chama a sua ateno? e cigarro3 Que marca de cigarro produz o comercial que mais lhe atrai? Os dados podem ser armazenados sob diversos formatos, tenha sido gerado atravs do SPSS ou de qualquer outro aplicativo. Para isso basta abrir o menu File e escolher o comando Save ou Save As.... Aparece ento uma tela (ver figura II-13) onde no quadro Salvar em especificamos o disco e o subdiretrio, no quadro Nome do arquivo especificamos o nome do arquivo e no quadro Salvar como tipo especificamos a forma sob a qual o arquivo deve ser salvo. O padro o formato SPSS (extenso .sav). Figura II-13: Janela para salvar arquivos de dados

3. Definindo propriedades de variveis categricas No menu Data temos a opo Define Variables Properties que facilitar a definio dos rtulos dos valores e outras propriedades das variveis categricas (nominais e ordinais). Esse comando faz a leitura dos valores atuais dos dados e lista todos os nicos valores para cada varivel selecionada; identifica valores que esto sem rtulo e promove uma rotulao automtica e ainda pode copiar os rtulos dos valores de uma varivel para uma ou mais variveis selecionadas. Abra o menu Data e selecione o comando Define Variable Properties, ser aberta uma janela (ver figura II-14) onde no quadro Variables so mostradas as variveis do banco de dados. Selecione as variveis que queremos definir algum rtulo e/ou outras propriedades e clique na seta ao lado para coloc-las no quadro Variables to Scan. Em banco de dados com uma grande quantidade de casos podemos selecionar a opo Limit number of cases scanned to para limitar em n casos o nmero de casos que sero lidos em cada varivel, reduzindo assim o tempo de processamento. A opo Limit number of values displayed to ser usada para limitar em n respostas o nmero de valores que sero mostrados para cada varivel evitando a presena de muitos valores principalmente no caso de variveis escalares. Clique em Continue. 19

Figura II-14: Janela para a escolha das variveis que sero lidas

Na nova janela aberta (ver figura II-15) teremos todas as variveis que foram escolhidas e suas respectivas propriedades. Figura II-15: Janela para definir as propriedades das variveis

Na lista de variveis mostradas no quadro Scanned Variables List selecione a varivel trabalha. O nvel de medida para essa varivel escalar, ns podemos mudar esse nvel de medida selecionando uma das opes (nominal, ordinal, escalar) presentes no quadro Measurement Level ou clicando na opo Suggest (ver figura II-16), onde podemos alterar o nvel de medida da varivel selecionada segunda a sugesto apresentada pelo SPSS de acordo com os valores encontrados na varivel. Clique em Suggest, escolha a opo Ordinal e em seguida clique em Continue. O nvel de medida agora para a varivel ordinal. 20

Figura II-16: Janela para sugerir o nvel de medida

No quadro Value Label Grid da janela Define Variable Properties (ver figura II-17) podemos adicionar novos valores e rtulos ou alterar os j existentes, visualizar a frequncia de cada valor e definir qual valor ser missing. Qualquer valor que sofra alguma alterao nessa janela ficar marcado como Changed. Ainda com a varivel trabalha selecionada vamos fazer algumas alteraes para o valor 9. No item Label (rtulo) escreveremos NR e no item Missing clicaremos no quadrado referente ao valor 9. Dessa maneira estamos definindo que sempre que o SPSS encontrar o valor 9 na varivel trabalha ele ser tratado como um valor ausente ou valor missing. Figura II-17: Janela para definir as propriedades das variveis

Podemos aplicar as mesmas definies da varivel trabalha para as outras variveis listadas. Para isso basta clicar na opo To Other Variables do quadro Copy Properties que a janela Apply Labels and Level to ser aberta (ver II-18). No quadro Variables selecione as variveis que desejar e clique na opo Copy.

21

Figura II-18: Janela Apply Labels and Level to

Uma outra opo muito til para ajud-lo na definio das caractersticas de suas variveis o comando Copy Data Properties do menu Data. Ao escolher esse comando ser aberta uma janela para voc escolher um arquivo no formato SPSS (.sav), chamado de arquivo modelo. Aps a escolha, o SPSS compara os nomes das variveis do arquivo ativo com as do arquivo modelo e para aquelas variveis que tiverem o mesmo nome, ele copia todas as definies dessas variveis (como tipo, rtulo, valores ausentes, etc) do arquivo modelo para o arquivo ativo. Esse comando substitui o antigo comando Apply Data Dictionary. 4. Formas de importao e exportao de dados O SPSS tem capacidade para importar bancos de dados gerados nos mais diversos formatos, entre eles Lotus 123, Excel, Dbase e ASCII. Para ter acesso aos diferentes formatos de banco de dados basta abrir o menu File, clicar no comando Open... e escolher a opo Data. Aparece ento uma tela (ver figura II-19) onde no quadro Examinar especificamos o disco e o subdiretrio, no quadro Nome do arquivo especificamos o nome do arquivo e no quadro Arquivos do tipo especificamos a forma sob a qual o arquivo foi gerado. O padro o formato SPSS (extenso .sav). Figura II-19: Janela para abertura de banco de dados

22

5. Importao de arquivos de dados do tipo Excel ou Lotus Antes de iniciar a importao de um arquivo precisamos observar como os dados se encontram no original do Excel (ver figura II-20). Figura II-20: Arquivo cigarros.xls no Excel

Notamos que o banco de dados contm no apenas nmeros, mas tambm ttulo, linhas em branco e o nome das variveis. Precisamos ento ter um certo cuidado na importao, pois, o SPSS s consegue ler o nome das variveis e os valores das mesmas. Ttulos, comentrios, grficos ou frmulas presentes no arquivo no podem ser importados. Uma possvel soluo anotarmos as coordenadas dos cantos superior esquerdo e inferior direito da matriz onde o nome das variveis e os dados esto efetivamente situados. No exemplo da figura II-15, teramos como coordenadas A4 e L16. Para importar esse arquivo de dados no SPSS, basta abrir o menu File, clicar no comando Open... e escolher a opo Data. Aparece ento uma tela (ver figura II-21) onde no quadro Examinar especificamos o disco e o subdiretrio onde est o arquivo excel. No quadro Arquivos do tipo especificamos o tipo do arquivo, que no nosso caso Excel (*.xls). E no quadro Nome do arquivo digitamos o nome do arquivo a ser importado, que no nosso caso Cigarros.xls. Nota: o arquivo excel, a ser importado, tem que estar fechado. Figura II-21: Janela para importao do arquivo excel Cigarros.xls

23

Ao clicar em Abrir, ser aberta uma janela de nome Open Excel Data Source (ver figura II - 22). No quadro Worksheet devemos especificar a planilha (arquivo excel) a ser lida. Alm disso, como o nosso arquivo excel contm o nome das variveis, devemos selecionar a opo Read variable names from the first row of data e no quadro Range devemos especificar a faixa de valores que deve ser lida, no nosso caso A4:L16. Agora s clicar OK e pronto! Figura II-22: Opes para abertura de arquivos em formato Excel

Observaes: 1 Caso o arquivo Excel estivesse limpo, isto , com os dados comeando na clula A1, no seria necessrio entrar com as coordenadas em Range e precisaramos apenas especificar se a primeira linha contm ou no o nome das variveis (em Read variable names from the first row of data). 2 Para leitura no formato Lotus o procedimento exatamente o mesmo com duas excees: no quadro Arquivos do tipo escolhemos a opo Lotus (*.w*) e no quadro Range ao invs da especificao A4:L16, usaramos A4..L16. Quando o arquivo importado do Excel ou Lotus aparece na tela de dados do SPSS, observe que o seu ttulo continua sendo Untitled (ver figura II-23). Somente a partir do momento em que salvamos no formato SPSS que o ttulo da janela de dados passa a ser o nome escolhido para o arquivo. Figura II-23: Janela de dados do SPSS aps importao do arquivo Excel

24

6. Lendo Bancos de Dados Usando ODBC J vimos anteriormente como ler arquivos de dados do Excel e usamos vrios arquivos no formato do SPSS (*.sav). Porm, muitas vezes nossos dados esto localizados em bases com as quais o SPSS no consegue se comunicar diretamente. Assim, para que possamos trabalhar com esses dados, o SPSS usa ODBC. Vamos capturar os dados de um banco do Access para exemplificar o uso de ODBC no SPSS. Para iniciar, voc deve escolher, no menu File, o comando Open Database e a opo New Query, uma janela ser aberta (ver figura II-24). Figura II-24: Janela para escolher o tipo de banco de dados a ser aberto

Nessa janela sero mostrados todos os bancos de dados configurados no seu computador (dica: voc pode configurar um novo banco de dados clicando na opo Add Data Source). Escolha a opo e clique em Avanar ou Next. O passo seguinte localizar o arquivo, para isso clique na opo Browse. Aps localizar o arquivo clique em OK.

No nosso exemplo, vamos escolher um banco de dados do Ms Access. Na janela aberta (ver figura II-25), selecionar a(s) tabela(s) a ser(em) lida(s) e arrast-la(s) para o quadro Retrieve Fields in This Order. Se voc clicar no + do lado do nome da a tabela, voc poder selecionar apenas um conjunto de variveis (campos) originais da(s) sua(s) tabela(s).

25

Figura II-25: Selecionando as tabelas a serem lidas

Caso voc escolha mais de uma tabela, o prximo passo selecionar a relao entre essas tabelas. A figura II - 26 mostra nosso exemplo onde a varivel nquest especificada como varivel chave (ou seja, aquela que identificar os casos para que eles possam ser corretamente unidos). Para especificar uma relao entre as tabelas, basta arrastar com o mouse uma varivel de uma tabela at a varivel correspondente (que no precisa, necessariamente ter o mesmo nome) na outra tabela. Voc pode ter mais de uma relao entre as tabelas. Figura II-26: Especificando relaes entre as tabelas

Clicando em Avanar, chega-se no quadro onde podemos limitar os casos a serem lidos. A limitao geralmente consiste em preencher o quadro Criteria com dois ou mais critrios. Um critrio consiste de duas expresses e uma relao entre elas. As limitaes podem retornar um dos valores: verdadeiro, falso ou ausente para cada caso. Se o resultado verdadeiro, o caso selecionado. Se for falso ou ausente, o caso no selecionado. 26

A maioria dos critrios usa um ou mais dos seis operadores relacionados (<,>,<=,>=,= e <>). As expresses podem incluir nomes de campos, constantes, operadores aritmticos, funes e variveis lgicas. Nessas expresses, voc pode usar campos que no pretende importar como varivel. A figura II-27 mostra um exemplo para o nosso arquivo onde importaramos apenas os casos do sexo masculino e que estudassem. Figura II-27: Selecionando casos a serem importados

Pode-se utilizar a opo Prompt For Value para criar uma caixa de dilogo que solicite informaes ao usurio cada vez que voc rodar a consulta. Ele til quando quiser usar a mesma fonte de dados usando diferentes critrios. A figura II-28 mostra um exemplo onde a cada vez que a consulta fosse rodada, o SPSS perguntaria qual o estado civil que voc quer utilizar. Vamos preencher o quadro Promp For Value para que aparea a pergunta Qual estado civil voc quer analisar? e para limitar as possveis respostas a 1, 2, 3, 4, 5 e 6 (que so os cdigos vlidos das categorias de estado civil no banco de dados). Na opo Use random sampling podemos selecionar uma amostra baseada no percentual aproximado ou no nmero exato de casos. Figura II-28: Usando a opo Prompt For Value

27

Aps clicar em Avanar, entraremos na janela de definies de nomes (ver figura II-29). O nome completo do campo ser usado como rtulo da varivel e na coluna Result Variable Name pode-se especificar o nome da varivel no SPSS. Na coluna Value Labels, pode-se optar por transformar automaticamente uma varivel string em varivel numrica. Figura II-29: Definindo os nomes das variveis

O ltimo passo aps clicar em Avanar escolher se o SPSS deve ler os dados selecionados (Retrieve the data I have selected) ou copiar a sintaxe criada em uma janela de programao (Paste it into the syntax editor for further modification). Note que nessa janela (ver figura II-30) voc pode escolher salvar essa consulta para uso futuro, preenchendo o quadro Save query to file (use a opo Browse para escolher um diretrio). Vamos escolher a opo de ler os dados selecionados e escolher um arquivo para salvar a consulta e clicar em Concluir. Figura II-30: Gravando a consulta para uso futuro

28

Ao clicarmos em Concluir, o resultado da leitura dos dados colocado em uma janela de dados nova do SPSS DATA EDITOR e dever ser salvo (ver figura II-31). Note que poderamos ter clicado em Concluir na janela da figura II-26, caso no houvesse a necessidade de modificar nenhuma das janelas seguintes. Figura II-31: Resultado da leitura de um banco de dados via ODBC

No comando Open Data Base temos mais duas opes: Edit Query permite que voc edite uma consulta j salva anteriormente e execute-a ou salve-a com as modificaes. Run Query permite que voc execute uma consulta j salva (muito til em conjunto com a opo de solicitar um valor para o usurio preencher). Experimente executar novamente nossa consulta criada acima, escolhendo um novo estado civil a ser analisado.

III.

Transformao de Dados

1. Clculo de novas variveis usando o procedimento Compute Vamos agora estudar um recurso de transformao de dados: a criao de uma nova varivel como funo de variveis j existentes. Para isso basta entrar no menu Transform e escolher o comando Compute. A janela Compute Variable aberta (ver figura III-1). No canto esquerdo, dessa janela, temos uma lista com todas as variveis existentes no banco de dados que podem ser usadas para o clculo da nova varivel. No quadro Target Variable, digitamos o nome da varivel a ser criada. No quadro Numeric Expression devemos escrever a funo (envolvendo as variveis j existentes no arquivo) que permitir o clculo da nova varivel. Para enviar uma varivel existente na lista para o quadro Numeric Expression, basta selecion-la e clicar na seta ao lado. Na rea central existe uma srie de botes que contm desde funes matemticas (+, -, *, /, etc) at funes lgicas (&, ~, etc). No quadro Functions, existe um vasto conjunto de funes, desde soma, multiplicao, arco-tangente, logaritmo neperiano, entre outras, que tambm podem ser usadas na construo da expresso numrica. 29

No nosso caso temos a varivel Anonasc e o nosso interesse investigar qual a idade dos entrevistados. Atravs da expresso: 2005 Anonasc, criaremos a varivel Idade, a qual conter a informao desejada. possvel, ainda, aplicar esta transformao somente a um subconjunto de dados especificados atravs da expresso condicional criada com a opo IF. Depois de tudo pronto, clicamos em OK e a nova varivel ser adicionada janela de dados do SPSS. Figura III-1: Criao da varivel Idade atravs do Comando Compute

2. Recodificao usando o procedimento Visual Bander Nem sempre os dados da forma como foram digitados, atendem s nossas necessidades. s vezes necessrio transformar esses dados, criando novas variveis a partir de variveis antigas, alterando os rtulos de seus itens, etc. Para estas transformaes, diversos procedimentos esto disponveis no SPSS. Utilizaremos aqui um recurso muitas vezes necessrio que antecede a anlise estatstica propriamente dita. A recodificao de variveis pode ser usada, entre outras coisas, para criar faixas de valores baseados em variveis j existentes. Um exemplo tpico ter interesse em estudar a faixa etria das pessoas em um estudo onde a informao disponvel originalmente a idade. No nosso exemplo criaremos uma varivel representando a faixa etria a partir da varivel idade. Nossa idia construir tal varivel de acordo com a seguinte diviso de faixas: Valores atuais (Idade) Valores Futuros (Faixa Etria) <= 25 anos ...................................................................................... 1 De 26 at 35 anos ............................................................................ 2 De 36 at 45 anos ............................................................................ 3 Acima de 45 anos ............................................................................ 4 Para fazer uma recodificao no SPSS entramos no meu Transform e escolhemos o comando Visual Bander (ver figura III-2). O comando Visual Bander foi criado com o objetivo de 30

auxiliar o processo de criao de novas variveis em categorias (faixa de valores) baseadas no agrupamento de variveis j existentes. No primeiro passo do Visual Bander devemos informar uma varivel numrica (escalar ou ordinal) a ser recodificada (no caso Idade). Para isso basta clicar em Idade, que o nome da varivel que se deseja recodificar e clicar na seta ao lado para mov-la para o quadro Variables to Band (ver figura III-3). Opcionalmente podemos limitar a quantidade de casos que sero lidos pelo SPSS utilizando a opo Limit number of cases scanned to.... Figura III-2: Transformao de dados (recodificao) Comando Visual Bander

Figura III-3: Seleo de variveis para recodificao

Devemos, tambm, dar um nome para a nova varivel que ser criada atravs do quadro Banded Variable no canto superior direito. No espao reservado ao nome da nova varivel (Name) digitamos Faixaetaria. Podemos ainda criar um rtulo para a nova varivel Faixaetaria (por exemplo, Faixa Etria), preenchendo o quadro Label ao lado do nome da varivel (ver figura III-4).

31

Figura III-4: Recodificao da varivel Idade

Falta agora informar ao SPSS as condies de recodificao. No quadro Grid temos que especificar os valores da antiga varivel que determinaro os valores da nova varivel, para isso digitamos os valores finais de cada faixa (ponto de corte) no campo Value (como padro o campo de corte High automaticamente includo). A opo Upper Endpoints dever ser utilizada em conjunto com o Value para determinar a faixa que o ponto de corte ser colocado. Ex: se colocarmos o ponto de corte 25 na primeira faixa e escolhermos a opo Included (<=) a primeira faixa conter todos os casos menores ou iguais a 25. Caso escolhssemos a opo Excluded (<) a primeira faixa corresponderia a todos os casos menores do que 25, e o valor 25 seria includo na prxima faixa. No nosso caso entraremos com os valores (ponto de corte) logo abaixo do valor padro High (que corresponde a todos os valores acima do ltimo ponto de corte inserido). Certifique-se que a opo Included (<=) esteja selecionada. Na posio 2 da coluna Value (quadro Grid) digitamos o valor 25, na posio 3 digitamos o valor 35 e na posio 4 digitamos o valor 45. Repare que a resposta High, a cada novo valor que inserido, colocado na ltima posio. Aps a digitao dos valores (ponto de corte) de cada faixa, podemos clicar em Make Labels para que o SPSS insira os rtulos de cada faixa de valores automaticamente (ver figura III-5). Mesmo utilizando os rtulos automticos, os mesmos podero ser editados a qualquer momento, bastando para isso editar a coluna label com os rtulos de sua preferncia.

32

Figura III-5: Rtulos inseridos automaticamente atravs da opo Make Labels

Dessa maneira a definio da nova varivel Faixaetaria est encerrada. Clicando em OK o SPSS exibir um aviso que indica a quantidade de variveis que sero criadas pelo Visual Bander, basta clicar em OK para que o comando seja concludo. A nova varivel passa a existir e aparece na ltima coluna do arquivo. Ela assume os valores 1, 2, 3 e 4 com os respectivos rtulos associados a esses valores. Caso voc prefira a recodificao de variveis pelo mtodo tradicional, basta utilizar o comando Recode que est presente no menu Transform. 3. Recodificao usando o procedimento Recode - Into Different Variables Para este procedimento usaremos o mesmo exemplo do procedimento Visual Bander, isto , criaremos, a partir da varivel Idade, a varivel Faixaetaria utilizando a mesma diviso de faixas. Para usar este procedimento de recodificao no SPSS entramos no meu Transform e escolhemos o comando Recode e depois a opo Into Different Variables. Primeiro devemos informar qual a varivel que ser recodificada (no caso Idade). Para isso basta clicar em Idade e depois clicar na seta ao lado para mov-la para o quadro Input Variable -> Output Variable. Devemos, tambm, dar um nome para a nova varivel que ser criada atravs do quadro Output Variable no canto superior direito. No espao reservado ao nome da nova varivel (Name) digitamos Faixaetaria. Podemos ainda criar um rtulo para a nova varivel Faixaetaria (por exemplo, Faixa Etria dos entrevistados), preenchendo o quadro Label embaixo do nome da varivel. Agora basta clicar em Change para que a nova varivel seja criada (ver figura III-6).

33

Figura III-6: Transformao de dados (recodificao) Recode - Into Different Variables

Falta agora informar ao SPSS as condies de recodificao. Clicando no boto Old and New Values... uma nova janela ser aberta, onde no quadro Old Value especificaremos os valores da antiga varivel Idade e no quadro New Value especificaremos os valores que vo determinar a nova varivel Faixaetaria (ver figura III-7). No quadro Range __ through __, podemos especificar uma faixa de valores que recebero um novo valor. No quadro Range __ lowest through __, do menor valor da varivel at o nmero especificado. No quadro Range __ through highest __, do nmero especificado at o maior valor da varivel. No quadro New Value determinamos o valor que a nova varivel deve assumir para cada faixa etria definida. O boto ADD adiciona, no quadro Old -> New, cada novo valor definido no quadro New Value. Aps definir todos os valores e faixas da nova varivel, clique no boto Continue para fechar a janela Recode Into Different Variables: Old and New Values e depois em clique em OK na janela Recode Into Different Variables para que o comando seja concludo. Figura III-7: Recodificao da varivel Idade

Para definir os rtulos da nova varivel Faixaetaria basta entrar no modo de definio de variveis Variables View, na janela de dados do SPSS. 34

4. Recodificao usando o procedimento Recode - Into Same Variables Para recodificar os dados na mesma varivel, usa-se o procedimento Recode - Into Same Variable do menu Transform, onde necessrio especificar uma varivel ou uma lista de variveis que tero seus antigos valores alterados para os novos valores especificados na janela. Se for especificada uma lista de variveis, elas devero ser do mesmo tipo: ou todas numricas, ou todas string. A informao recodificada armazenada na mesma coluna perdendo, dessa maneira a informao da antiga varivel. O preenchimento de suas janelas igual ao procedimento descrito na recodificao usando o comando Recode - Into Different Variables.

5. Recodificao automtica de variveis alfanumricas (string) Outro recurso para recodificao presente no SPSS o Automatic Recode. Atravs desse procedimento podemos transformar variveis do tipo alfanumricas (string) ou numricas em variveis numricas consecutivas j codificadas (com rtulos associados). O SPSS ordena em ordem alfabtica (crescente ou decrescente) os valores da varivel selecionada relacionando o nmero 1 ao primeiro valor e assim por diante at o ltimo valor. A nova varivel ser numrica assumindo desde o valor 1 at o nmero de valores (ou cadeia de caracteres) existentes, alm de assumir os antigos valores (alfanumricos ou numricos originais) como rtulos da nova varivel numrica. Por exemplo, suponha que queiramos transformar a varivel Sexo (M=Masculino e F=Feminino), que alfanumrica, numa varivel numrica. Para isso basta usar o comando Automatic Recode presente no menu Transform. Uma janela aberta e a primeira coisa a fazer mover a varivel a ser recodificada para o quadro Variable -> New Name. No nosso caso moveremos a varivel Sexo, clicando na seta ao lado. Como uma outra coluna ser criada para armazenar a nova varivel preciso dar um nome para essa coluna. No quadro New Name digitamos o nome para a nova varivel e depois clicamos no boto Add New Name para que a nova varivel seja criada. Por fim, no quadro Recode Starting from podemos escolher a ordem da recodificao atravs das opes Lowest Value (ordem crescente) ou Highest Value (ordem decrescente) e depois clicar OK para que o comando seja concludo. Feito isso o resultado da recodificao mostrado na janela de sadas (ver figura III-8). Note que antes da recodificao a varivel Sexo assumia os valores Masculino e Feminino. Aps a recodificao a nova varivel criada, Sexo2, assume os valores 1 e 2 j com os rtulos relacionados. Figura III-8: Recurso Automatic Recode - Recodificao de variveis do tipo String

35

Figura III-9: Resultado da Recodificao Automtica

6. Procedimento Count Este procedimento serve para calcular o total de ocorrncias do mesmo valor entre uma lista de variveis dentro de cada caso. Para execut-lo basta entrar no menu Transform e escolher o comando Count. Uma janela ser aberta e no quadro Target Variable digita-se o nome da nova varivel, no quadro Target Label digita-se o rtulo da nova varivel e no quadro Numeric Variables coloca-se as variveis que sero contadas a partir de um valor ou intervalo de valores, definidos no boto Define Values. Figura III-10: Usando o comando Count

No nosso exemplo, vamos supor que temos outra varivel Idade, chamada Idade2, com valores diferentes. Usaremos o Count para contar quantos, em cada caso, possuem idade maior que 25 anos. Figura III-11: Contando valores maior que 25

O resultado a criao de uma nova varivel (Idade25), com o resultado da contagem solicitada.

36

Figura III-12: Resultado do uso do procedimento Count

IV. Um Pouco de Estatstica Descritiva


Nesta seo vamos definir alguns conceitos bsicos que nos ajudaro a entender melhor a linguagem estatstica do SPSS. Populao - conjunto de todos os elementos sobre os quais temos interesse em estudar, por exemplo, se estamos interessados em investigar qual ser o prximo presidente do Brasil nossa populao o colgio eleitoral do pas. Na maioria das vezes no temos condies de pesquisar todos os elementos de uma populao, por razes como tempo e dinheiro. Portanto uma alternativa para podermos realizar o estudo pesquisar apenas parte dos elementos da populao, ou seja, uma amostra. Amostra - constituda por qualquer subconjunto de elementos de uma populao. Varivel - qualquer caracterstica de interesse dos elementos da populao. Exemplos: idade, sexo, altura, inteno de voto presidente, etc. A varivel, ou seja, a caracterstica de interesse dos elementos da populao, pode ser classificada da seguinte forma: Varivel Qualitativa refere-se a qualidades ou categorias do elemento em estudo. Pode ser: 1. Nominal - a categoria no apresenta uma ordem natural. Ex: pas de origem, sexo, etc. 2. Ordinal a categoria apresenta uma ordem natural. Ex: escolaridade, faixa etria, etc. Varivel Quantitativa - apresenta nmeros como resposta. Pode ser: 1. Discreta - o conjunto de valores enumervel (geralmente valores inteiros). Ex: nmero de filhos, nmero de carros, etc. 2. Contnua - o conjunto de valores no enumervel. Ex: altura, peso, etc. O tipo de anlise descritiva depender do tipo de varivel. 1. Nvel de medidas das variveis As variveis podem ser classificadas em trs tipos no SPSS de acordo com o seu nvel de medida: 37

Escalar (scale) - quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, peso, altura, renda). Ordinal - quando os dados representam categorias com uma ordem intrnseca (ex: pequeno, mdio, grande; concordo totalmente, concordo, discordo). Nominal - quando os dados representam categorias sem uma ordem intrnseca (ex: estado civil, ocupao, nacionalidade). A importncia de se conhecer os tipos de variveis existentes est ligada forma que a varivel dever assumir no banco de dados, bem como ao tipo de anlise descritiva e inferencial que a mesma dever ser submetida. No momento de definio de variveis categricas, a maneira mais natural seria defini-las como alfanumricas (string). Entretanto, muitos procedimentos estatsticos no SPSS no podem ser realizados com variveis desse tipo. Assim, uma sugesto seria defini-las como numricas e codific-las. Por exemplo: Naturalidade: 1 = Bahia; 2 = Rio de Janeiro; 3 = So Paulo; etc Sexo: 1 = Masculino; 2 = Feminino. 2. Distribuio de Frequncia Para entendermos melhor o comportamento de uma varivel qualitativa, uma das medidas resumo que pode ser usada a tabela de frequncia. Atravs dessa tabela podemos descobrir o nmero (ou porcentagem) de ocorrncias de cada uma das categorias da varivel. Tabelas de frequncia tambm podem ser construdas para variveis no categricas que assumam um nmero pequeno de valores. Por exemplo, o nmero de filhos, que geralmente assume os valores 0, 1, 2, 3, 4 e 5. Figura IV-1: Tabela de frequncia para a varivel estado civil

Devemos ressaltar que para variveis escalares que apresentam muitos valores diferentes a construo de tabelas de frequncia no nos traz nenhuma informao relevante na descrio dos dados. Nesse caso uma alternativa seria criar categorias baseadas nos valores da varivel, ou seja, categorizar essa varivel, e contar o nmero de ocorrncias em cada categoria. O procedimento Recode pode ser usado para criar a varivel categrica (ver figura IV-2).

38

Figura IV-2: Tabela de frequncia da idade em faixas etrias

Quando trabalhamos com variveis escalares algumas medidas resumo podem ser usadas para obteremos uma descrio mais apurada dos dados. Essas medidas so divididas basicamente em duas classes: as medidas de posio e as medidas de variabilidade, que servem para resumir variveis quantitativas. Faremos a seguir um resumo desses grupos e apresentaremos as medidas mais conhecidas e importantes. 3. Medidas de posio As medidas de posio so muito importantes para a descrio dos dados. Geralmente usadas para as variveis escalares (pois muitas vezes no acrescentam nenhuma informao no estudo de variveis categricas) essas medidas nos do uma boa idia da magnitude dos dados. Suponha, por exemplo, que voc est interessado em descrever as horas gastas semanalmente com trabalho de um grupo de 31 pessoas. Um opo seria imprimir uma listagem dos 31 valores ordenados e estud-los um a um. Quanto maior for a amostra mais complicado ser analisar a varivel dessa maneira. Imagine o trabalho que voc teria com uma amostra de 1500 pessoas! Precisamos, portanto encontrar uma maneira de condensar a informao atravs da construo de ndices ou medidas que facilitem nossa anlise. Podemos apresentar os valores Mnimo e Mximo que a varivel assume na amostra. Esse par de valores determina o intervalo de variao da varivel em estudo. Vamos pensar na listagem dos valores ordenados do menor para o maior. Sabemos que esta lista no nos ajuda muito. Mas, se ao invs de olharmos a lista toda, escolhermos alguns valores de maneira conveniente, poderemos tirar proveito da informao. Os valores Mnimo e Mximo so um exemplo. Uma outra medida de interesse o valor que divide os dados ao meio, ou seja, o valor que deixa pelo menos 50% das observaes ordenadas esquerda. Esse valor denominado do 50 percentil. Um determinado percentil o valor da varivel de estudo que divide os dados ordenados em grupos de modo que um certo percentual est acima desse valor e o restante abaixo. O 25, 50 e o 75 percentis so denominados respectivamente de 1, 2 e 3 quartis, pois dividem o conjunto de dados em quatro grupos. O 10, 20 30, ..., 90 percentis so denominados respectivamente de 1, 2, 3, ... 9 decis, pois dividem os dados em 10 grupos. Vamos agora estudar um pouco sobre algumas medidas que nos trazem informaes sobre o valor central da distribuio dos nossos dados.

39

A mais famosa dentre todas as medidas de posio certamente a mdia aritmtica. Fcil de ser calculada a mdia aritmtica simplesmente a soma de todas as observaes dividida pelo nmero delas. Apesar das caractersticas descritas acima, a mdia uma medida muito influenciada por valores extremos. Observe o valor da mdia para os dois conjuntos de dados abaixo: Conjunto 1: 2 3 4 4 6 6 Mdia = 4.00 Conjunto 2: 2 3 4 4 6 30 Mdia = 7.43 Notamos que nos dois conjuntos os valores so idnticos a no ser pelo ltimo valor que no primeiro conjunto 6 e no segundo conjunto 30. O valor da mdia passou de 4 para 7.43. Nesse caso, como alternativa podemos calcular uma outra medida que no influenciada por valores extremos. Essa medida conhecida como mediana. A mediana nada mais do que o 2 quartil, que j foi discutido. Relembrando, essa medida o valor que deixa pelo menos 50% das observaes sua esquerda. Para os dois conjuntos de dados apresentados acima: Conjunto 1: 2 3 3 4 4 6 6 Mediana = 4.00 Conjunto 2: 2 3 3 4 4 6 30 Mediana = 4.00 Note que, apesar da alterao do ltimo valor no segundo conjunto de dados, a mediana permanece inalterada. Uma outra medida de centralidade no muito utilizada a moda. A moda nada mais do que o valor mais frequente do conjunto de dados. Para variveis que apresentam muitos valores diferentes, a moda no traz nenhuma informao relevante. Porm, para variveis categricas, numricas que assumem um nmero pequeno de valores ou escalares categorizadas, a moda nos d a informao da categoria mais frequente. 4. Medidas de variabilidade Analisando os dois conjuntos de dados abaixo notamos que apesar das medidas serem iguais, o conjunto tm uma diferena grande com relao homogeneidade dos valores. Conjunto 1: 2 2 2 2 2 2 2 Mdia = 2 Conjunto 2: 0 1 1 2 3 3 4 Mdia = 2 No primeiro conjunto todos os valores so iguais a dois e portanto iguais mdia (dados totalmente homogneos). J no segundo conjunto os valores no so todos iguais (dados heterogneos) embora a mdia continue sendo 2. Seria importante agora, expressar a variabilidade dos dados atravs de alguma medida numrica. Para que essa medida fosse coerente ela deveria assumir o valor zero apenas se todos os dados fossem iguais (ex: conjunto 1). Alm disso, quanto maior fosse a variabilidade do conjunto de dados, maior seria o valor da medida. Uma medida bastante fcil e simples de ser calculada a amplitude. A amplitude nada mais do que o valor mximo menos o valor mnimo de um conjunto de dados. No caso dos conjunto 1 e 2, a amplitude igual 0 e 4, respectivamente. Uma desvantagem dessa medida que ela muito influenciada por valores extremos. Alm disso ela no leva em conta a variabilidade entre todas as observaes do conjunto de dados. Observe no conjunto abaixo que apesar da a amplitude ser a mesma para os dois conjuntos, o primeiro aparenta ser mais homogneo. Conjunto 1: 0 2 2 2 3 3 20 Amplitude = 20 Conjunto 2: 0 1 8 12 15 19 20 Amplitude = 20 40

A prxima medida que apresentaremos tenta corrigir esse defeito da amplitude. Em primeiro lugar iremos considerar as distncias de todas as observaes a um valor central, a mdia. Aps o clculo de todas as distncias (diferenas), faremos a sua soma. Para refinar um pouco a medida podemos dividir a soma pelo nmero total de observaes. Acompanhe o clculo da medida proposta no exemplo a seguir: Conjunto 1: 0 1 2 3 4 Mdia = 2 Medida = (0-2) + (1-2) + (2-2) + (3-2) + (4-2) = 0 5 Deixamos para voc verificar que para qualquer conjunto de dados a medida apresentada acima sempre zero. Dessa maneira impossvel trabalhar com essa medida para estudar a variabilidade dos dados. Fazendo, porm, uma pequena mudana na medida acima obteremos a famosa varincia. A varincia nada mais do que a soma das diferenas das observaes em relao mdia elevada ao quadrado, dividida pelo nmero total de observaes. Dessa maneira a varincia ser sempre positiva e s assumir o valor zero se todas as observaes do conjunto de dados forem iguais. Para o conjunto de dados acima a varincia dada por: Varincia = (0-2) + (1-2) + (2-2) + (3-2) + (4-2) = 2 5 Devemos porm tomar cuidado ao analisar essa medida, pois ao elevarmos as diferenas ao quadrado estamos mudando a unidade de medida dos dados. Por exemplo, se os nmeros do conjunto 1 esto expressos em metros a varincia estar expressa em metros quadrados. Para contornar esse problema foi criado o desvio padro, que nada mais do que a raiz quadrada da varincia (voltamos portanto unidade de medida original). Para o conjunto de dados acima o desvio padro dado por: Desvio Padro = (0-2) + (1-2) + (2-2) + (3-2) + (4-2) 5
2 2 2 2 2 2 2 2 2 2

= 1,414

Ainda baseada no desvio padro existe uma medida que tenta expressar a variabilidade da mdia e no a variabilidade dos dados como um todo. Essa medida chamada de erro padro da mdia, ou simplesmente erro padro, e obtido pela diviso do desvio padro pela raiz quadrada do nmero de observaes. Para o conjunto de dados acima o erro padro : Erro Padro = desvio - padro n de observaes = 0,632

Conforme j foi mencionado anteriormente, existem vrios tipos de variveis e razovel pensar que cada tipo deva receber um tratamento especfico. Se estivermos trabalhando com variveis categricas nominais (ex: estado civil), no faz sentido calcularmos medidas como mdia ou varincia j que no existe uma ordem natural das possveis respostas. Podemos, por exemplo, pedir uma tabela de frequncia e calcular a moda. Para as variveis ordinais surgem algumas novas opes, j que agora as respostas assumem uma ordem natural. Temos como exemplo o grau de instruo, onde a ordem natural 1 grau incompleto, 1 grau completo, 2 grau incompleto, 2 grau completo, e assim por diante. Nesse caso, 41

alm da distribuio de frequncias e da moda, podemos calcular medidas como mediana, mnimo e mximo. As variveis escalares so as que apresentam mais opes para anlise descritiva. Temos como exemplo a idade, onde alm de mediana, quartis e percentis, podemos tambm calcular mdia, desvio padro, valores mnimo e mximo, medidas de assimetria e curtose (relacionadas distribuio da varivel), etc. Alm disso, se quisermos uma distribuio de frequncias e moda podemos faz-lo transformando a Idade em varivel qualitativa ordinal, digamos faixa etria. Como veremos a seguir, o SPSS apresenta procedimentos para o clculo de todas as medidas descritas acima e algumas outras. importante ressaltar que o SPSS no saber decidir qual o tipo de medida adequada para as variveis existentes no seu estudo. Cabe a voc decidir.

V. Comandos do SPSS para Anlise Descritiva


Os procedimentos relacionados anlise descritiva encontram-se nos comandos Reports e Descriptive Statistics do menu Analyze. A figura V-1 apresenta as opes do comando Descriptive Statistics. Estudaremos as opes mais usadas. Figura V-1: Opes do comando Descriptive Statistics do menu Analyze

1. OLAP Cubes O procedimento OLAP Cubes utilizado para a construo de relatrios e estes podem se tornar bem flexveis graas ao uso dos cones de organizao. A construo dos relatrios simples, basta preencher os quadros da janela mostrada na figura V-2 com as variveis desejadas.

42

Figura V-2: Comando OLAP Cubes

No quadro Summary Variable(s) coloque as variveis para as quais voc deseja que ele calcule medidas descritivas como mdias, somas, percentuais, mnimos, mximos, etc. Geralmente as variveis nesse quadro so quantitativas. No quadro Grouping Variable(s), coloque variveis para as quais voc gostaria que fossem criados subgrupos. Clicando na opo Statistics voc escolhe quais as caractersticas que sero calculadas. Como padro temos: soma, nmero de casos, mdia, desvio-padro, percentual sobre a soma total, percentual sobre o N total. Vrias outras estatsticas como mediana, mnimo, mximo e varincia, podem ser escolhidas (ver figura V-3). No nosso exemplo removeremos a soma (sum) e o percentual sobre a soma total (percent of total sum). Depois basta clicarmos em Continue. Figura V-3: Opes de estatsticas para OLAP Cubes

Finalmente ao clicar na opo Title (ver figura V-4), voc pode escolher um ttulo e uma legenda para a tabela, que podero ser modificados posteriormente. Aps a digitao do ttulo e da legenda clique em Continue. Agora basta clicar no boto OK e teremos nosso relatrio como na figura V-5.

43

Figura V-4: Escolha de ttulo e legenda para o OLAP Cubes

Inicialmente, temos o nmero de casos, a mdia, desvio e o percentual sobre o nmero de casos para a varivel idade considerando todos os casos, independentemente do sexo e estado civil. Temos, que 9 pessoas responderam a idade e a idade mdia foi 44,89 anos. Figura V-5: Resultado gerado pelo comando OLAP Cubes

Podemos editar esta tabela e mostrar subgrupos baseados em sexo e estado civil, clicando com o boto direito do mouse na tabela e escolhendo o comando SPSS Pivot Table Object e depois a opo Open. Usando os cones de organizao podemos mostrar apenas uma estatstica por vez, todos os grupos de uma ou mais variveis na mesma tabela, etc. Lembre-se que, com os identificadores Bookmarks podemos guardar as configuraes que mais interessam. 2. Frequencies No menu Analyze escolha o comando Descriptive Statistics e depois o procedimento Frequencies. Uma janela ser aberta onde podemos colocar no quadro Variable(s) as variveis para as quais desejamos ter a distribuio de frequncias (ver figura V-6).

44

Figura V-6: Comando Frequencies

Clicando no boto Statistics vrias opes de medidas estatsticas sero apresentadas (ver figura V-7). Devemos tomar cuidado, pois nem todas as medidas apresentadas trazem informaes relevantes para o estudo das variveis em questo. As medidas esto divididas em quatro grupos: Percentile Values essa opo possibilita o clculo dos quartis (Quartiles), decis (Cut points for 10 equal groups voc pode mudar o nmero 10 para qualquer diviso que desejar) e quaisquer percentis (Percentile(s) de interesse). Central Tendency essa opo possibilita o clculo da mdia (Mean), mediana (Median), moda (Mode) e soma (Sum). Disperson essa opo possibilita o clculo do desvio padro (Std. Deviation), varincia (Variance), amplitude (Range), valor mnimo (Minimum), valor mximo (Maximum) e erro padro da mdia (S.E. mean). Distribution essa opo possibilita o clculo de duas medidas de distribuio: Kurtosis e Skewness. A Kurtosis uma medida do achatamento da distribuio e skewness um ndice que reflete a simetria da distribuio em torno de um valor central. Devemos decidir, dentre todas essas medidas, aquelas que so adequadas para as nossas varveis. No nosso exemplo, como a varivel nominal, apenas a moda (Mode) trar alguma informao relevante. Figura V-7: Opes de medidas estatsticas do comando Frequencies

Clicando no boto Charts, quatro opes de grficos sero apresentadas (ver figura V-8): histograma com ou sem curva normal (Histograms marcando ou no a opo With normal curve), 45

grfico de barras (Bar charts) e grfico de pizza (Pies). Note que apesar de apresentar um menu exclusivamente para grficos (menu Graphs) o SPSS tambm possibilita a construo de grficos dentro de procedimentos estatsticos. Figura V-8: Opes de grficos para o comando Frequencies

Clicando no boto Format, apresentam-se opes meramente estticas (ver figura V-9). No quadro Order by controlamos a ordem em que as categorias da varivel so apresentadas na janela de sadas. As opes disponveis so por ordem crescente (ou decrescente) dos valores que a varivel assume e crescente (ou decrescente) de frequncias. Se voc marcar a opo Suppress tables with more than n categories, o SPSS no ir fazer nenhuma tabela de varivel que tiver mais do que um certo nmero de categorias, sendo que o padro 10. No quadro Multiple Variables, caso voc tenha pedido estatsticas para suas variveis, voc pode escolher que estas estatsticas saiam numa s tabela (Compare variables) ou uma tabela para cada varivel separadamente (Organize output by variables). Figura V-9: Opo Format para o comando Frequencies

Escolhidas todas as opes podemos clicar em OK. Feito isso o SPSS ativa a janela de sadas e apresenta o resultado da frequncia (ver figura V-10). A tabela de distribuio de frequncias apresenta os rtulos dos valores, o nmero de observaes em cada categoria (Frequency), a porcentagem que a frequncia representa no total de observaes desconsiderando os valores ausentes (Valid Percent) e o percentual vlido acumulado (Cum Percent). Acima da tabela de distribuio de frequncias, apresentado o quadro statistics que contm a moda (lembre-se que escolhemos a opo mode no quadro statistics).

46

Figura V-10: Resultado obtido a partir do comando Frequencies

fcil perceber que a informao contida em um grfico muito mais simples de ser interpretada do que a informao numrica (tabela de frequncia). por esse motivo que os grficos so to importantes na etapa de anlise exploratria de dados. 3. Descriptives No menu Analyze escolha o comando Descriptive Statistics e depois o procedimento Descriptives. Uma janela ser aberta onde voc pode colocar no quadro Variable(s) as variveis para as quais deseja ter as descritivas (ver figura V-11). Essa opo geralmente usada quando temos interesse em estudar variveis escalares de maneira rpida. Figura V-11: Comando Descriptives

47

Clicando na opo Options sero apresentadas as medidas estatsticas que podem ser usadas para descrio dos dados (ver figura V-12). Existem dois grupos de medidas idnticos aos j discutidos anteriormente na opo Statistics do procedimento Frequencies, so eles Dispersion e Distribution. Alm dessas medidas podemos pedir para o SPSS apresentar a mdia (Mean) e a soma (Sum) das variveis em estudo. No quadro Display Order podemos escolher a ordem com que os resultados sero apresentados na janela de sadas: ordem em que as variveis se apresentam na lista (Variable list), ordem alfabtica das variveis (Alphabetic), ordem crescente de mdias (Ascending means) e ordem decrescente de mdias (Descending means). Este quadro til quando estamos estudando mais do que uma varivel. Agora basta clicar em Continue e depois em OK na janela principal e analisar os resultados que so apresentados na janela de sadas (ver figura V-13) Figura V-12: Opes do comando Descriptives

Figura V-13: Resultado obtido a partir do comando Descriptives

4. Crosstabs No menu Analyze escolha o comando Descriptive Statistics e depois o procedimento Crosstabs que usado para construo de tabelas simples (geralmente de dupla entrada). Imagine que temos duas variveis qualitativas e estamos interessados em observar a distribuio de frequncias de ambas em conjunto. Para isso, construmos uma tabela onde uma varivel entra com suas categorias em linhas e a outra em colunas. Podemos ento fazer um estudo descritivo sobre o comportamento conjunto das variveis. Porm, muitas vezes queremos mais do que simplesmente observar. Queremos, tambm, verificar se existe efetivamente associao entre tais variveis. Ento precisamos utilizar testes estatsticos (anlise inferencial). Vrios testes estatsticos esto disponveis no procedimento Crosstabs. A figura V-14 mostra as opes do procedimento Crosstabs. No quadro do canto esquerdo esto disponveis todas as variveis do banco de dados. Para construo da tabela basta movermos a varivel em que as categorias ficaro dispostas nas linhas para o quadro Row(s) e a varivel em que 48

as categorias ficaro dispostas nas colunas para o quadro Column(s). Note que podemos colocar mais do que uma varivel nos quadros Column(s) e Rown(s). Entretanto, atravs do comando Crosstabs sero construdas vrias tabelas de dupla entrada a partir de combinao das variveis duas a duas. Se voc deseja construir uma tabela com mais de duas entradas (envolvendo trs variveis ou mais) voc pode usar o quadro Layer, porm voc ter opes limitadas de estatsticas e customizao. Neste caso o mdulo Tables indicado, j que ele possui recursos avanados para a customizao e criao de tabelas. Se voc marcar a opo Display clustered bar charts sero feitos grficos de barras com as variveis pedidas e a opo Suppress tables faz com que nenhuma tabela seja feita, apenas as estatsticas, teste e grficos pedidos sero mostrados na janela de sadas. Figura V-14: Comando Crosstabs

Na janela Crosstabs temos ainda quatro botes (ou trs, caso voc no tenha o mdulo SPSS Exact Tests instalado). Exact esta opo s estar disponvel se o mdulo Exact Test for instalado. Indicado para estudos onde as suposies dos testes assintticos no esto satisfeitas (por exemplo, uma amostra pequena). Apresenta dois procedimentos para clculo do nvel descritivo: mtodo Monte Carlo (baseado em simulaes) e o mtodo Exato. Statistics deve ser usado para selecionar os testes estatsticos que sero realizados. Note que so apresentados nesse quadro quatorze testes estatsticos diferentes. Cada um deles apropriado para verificarmos suposies diferentes sobre as variveis em questo (ver figura V15). Vamos selecionar a estatstica Chi-square que usada para testar a hiptese de que as variveis que definem as linhas e as colunas so independentes. Cells usada para escolha das medidas que sero apresentadas em cada uma das clulas da tabela (ver figura V-16). No quadro Counts podemos pedir as frequncias ou valores observados (Counts Observed) e os valores esperados, isto , frequncias calculadas assumindo que as variveis so independentes (Counts Expected). No quadro Percentages podemos pedir as porcentagens por linha (Row), por coluna (Column) e por total (Total). No quadro Residuals podemos pedir vrios tipos de resduos, que so a diferena entre o valor observado e 49

o esperado. No quadro Noninteger Weights, podemos pedir como os valores no-inteiros sero apresentados na tabela. Format usada apenas para escolher a ordem em que as categorias (valores) da varivel apresentada nas linhas da tabela sero apresentadas (Row Order), que pode ser crescente ou decrescente (Ascending ou Descending). Figura V-15: Opo Statistics do comando Crosstabs

Figura V-16: Opo Cells do comando Crosstabs

O passo mais importante agora saber interpretar todos os resultados presentes na janela de sadas, seno todo o trabalho que tivemos at agora foi apenas perda de tempo. A figura V-17 apresenta o resultado da tabela de dupla entrada feita atravs do comando Crosstabs. Note que dentro de cada clula so apresentados os dois valores pedidos: Count que representa a frequncia e % within representando a porcentagem sobre o total de casos. Essa disposio pode ser facilmente modificada usando os cones de organizao como j visto.

50

Figura V-17: Sada gerada pelo procedimento Crosstabs

J que foi solicitado a estatstica Chi-Square (qui-quadrdo), ento na tabela de sadas, alm tabela de cruzamentos tambm ser mostrada a tabela do qui-quadrado (ver figura V-18). Atravs dos valores apresentados saberemos se existe alguma evidncia para concluir que as variveis so estatisticamente relacionadas (dependentes). Valores das estatsticas de qui-quadrado de Pearson (Pearson Chi-square) e da razo de verossimilhana (Asymp. Sig.) so apresentados. Quando o nvel de significncia (Asymp. Sig.) muito baixo (menor que 0.05) temos evidncia suficiente para afirmar que as variveis so relacionadas. Na terceira linha da tabela nos mostra a estatstica Linear-by-Linear Association que mede a associao linear entre as variveis da linha e da coluna. Esta estatstica no deve ser usada para variveis nominais. Ela tambm chamada de teste de qui-qaudrado de Mantel-Haenszel. Figura V-18: Teste de qui-quadrado para o cruzamento Estado Civil x Sexo

Voc deve ter percebido que os procedimentos disponveis nos comandos Reports e Descriptive Statistics so usados para obter diferentes informaes sobre os dados. importante lembrar que, embora o SPSS seja um software muito fcil de operar, o bom senso do usurio fundamental. Em outras palavras, a cada passo que pretendemos dar, preciso pensar antes se a anlise faz sentido ou no, pois, se pedirmos ao SPSS que calcule a mdia para a varivel estcivil, ele o far, mas a resposta obtida certamente no far sentido algum.

VI. Tabelas
Nem sempre as tabelas feitas pelo SPSS esto prontas para apresentao da maneira que voc gostaria ou, por exemplo, a visualizao dos resultados no est satisfatria. Porm, o SPSS tem recursos poderosos para deixar sua tabela da maneira que voc quiser e o que melhor, de uma maneira muito fcil e rpida. Nesta seo iremos manipular tabelas, trabalhar com estratos e identificadores e mudar caractersticas como fonte, cor, etc. 51

Comearemos criando uma tabela pelo procedimento Crosstabs, com as variveis sexo, estado civil e cidade que mora (ver figura VI-1). Figura VI-1: Criando uma tabela no SPSS

A figura VI-2 mostra a tabela criada pelo SPSS. Para edit-la, clique duas vezes sobre a tabela ou ento clique apenas uma vez com o boto direito do mouse e selecione o comando SPSS Pivot Table Object e escolha a opo Open. Escolhendo a segunda maneira o SPSS abre uma janela prpria para editar a tabela selecionada. Esta maneira melhor que a primeira especialmente quando voc tem uma tabela muito grande. Figura VI-2: Tabela original criada pelo SPSS

Vamos supor que voc queira dividir a tabela primeiro pelo nmero de filhos e depois pelas categorias de sexo, ou ento mostrar apenas um subgrupo das pessoas estudadas (por exemplo, s as mulheres), ou ainda passar a informao do nmero de filhos para as colunas e do estado civil para as linhas. Tudo isso pode ser feito usando os cones de organizao. 1. Usando os cones de organizao Para acionar os cones de organizao, caso no estejam ativados, abra o menu Pivot e escolha o comando Pivoting Trays (ver figura VI-3). A regio cinza Row representa os elementos que esto nas linhas que no nosso caso so as variveis sexo e cidade. Coloque o mouse sobre um dos dois cones e ser mostrado o que ele representa. A regio cinza Column representa os elementos das colunas, que no nosso caso a varivel estcivil e finalmente a regio cinza Layer que representa as camadas de tabelas que podemos ter. A tabela pode ser pensada como se estivesse armazenada em camadas (layers), onde apenas a camada de cima est visvel. Por exemplo, se voc 52

colocar a varivel sexo na parte Layer, o SPSS divide a tabela em duas camadas, uma para o sexo masculino e outra para o sexo feminino. Figura VI-3: Usando os cones de organizao

Note que os cones dessa regio possuem duas setas, que servem para voc mudar a categoria (camada) que apresentada na janela de sadas, sendo que voc pode depois mandar o SPSS imprimir apenas a tabela mostrada na janela ou todas as tabelas. Vamos, por exemplo, dividir a tabela em duas camadas de acordo com o sexo, arrastando seu cone da regio Row para a regio Layer. Dessa maneira, voc pode mudar a disposio da sua tabela vontade. No momento a tabela deve estar mostrando apenas as mulheres (que a primeira categoria de sexo), para mudar para os homens clique nas setas pretas ao lado do cone sexo da janela Pivoting Trays1 at voc achar a categoria desejada ou clique na seta ao lado da categoria da varivel sexo mostrada na prpria tabela (ver figura VI-4). Figura VI-4: Selecionando a categoria a ser mostrada numa tabela

Voc pode transpor as linhas e colunas de sua tabela escolhendo o comando Transpose Rows and Columns do menu Pivot. Isto tem o mesmo efeito de arrastar todos os cones da regio Column para a regio Row e vice-versa. E para recuperar a tabela inicial basta clicar no comando Reset Pivots to Default do menu Pivot. Para guardar uma ou mais configuraes para uma posterior reviso ou apresentao, basta utilizarmos os identificadores Bookmarks do menu Pivot. Na janela aberta escolhemos um nome para o identificador, clicamos em Add e depois em Close. Posteriormente para acessar qualquer 53

identificador basta acessar novamente a opo Bookmark do menu Pivot, escolher o identificador e clicar em GO TO. 2. Modificando as clulas Para modificar a formatao das clulas basta selecionar as clulas que voc gostaria de editar e escolher o comando Cell Properties do menu Format (ver figura VI-5), onde voc poder modificar o formato dos valores para nmero, data, tempo ou monetrio, e ajustar o nmero de dgitos decimais mostrados clicando na guia Value. Na guia Alignment voc ajusta o alinhamento vertical e horizontal e direo do texto para a(s) clula(s). Na guia Margins voc modifica a distncia dos valores a cada uma das margens, porm no esquea de levar em conta o alinhamento que voc deu clula. Na guia Shading voc pode mudar a porcentagem de sombreamento baseado nas cores de frente (Foreground colors) e fundo (Background colors). Isto no muda a cor do texto. Para mudar a cor e o tipo de fonte do texto basta selecionar o comando Font do menu Format (ver figura VI-6) ou ativar a barra de ferramentas de formatao Formatting toolbar atravs do comando Toolbar do menu View. Figura VI-5: Janela para mudana das propriedades das clulas

Figura VI-6: Opes para modificaes das fontes

54

Voc pode ainda ajustar o comprimento das clulas movendo o mouse pelos rtulos da categoria at a borda direita da coluna que voc gostaria de mudar. O cursor mudar para uma flecha com duas pontas, depois deixe o boto do mouse apertado at arrastar a borda para a sua nova posio. A figura VI-7 mostra uma tabela editada. Figura VI-7: Tabela editada no SPSS

3. Propriedades da tabela Conhecendo-se as propriedades de tabela, podemos tornar a edio de tabelas uma ferramenta ainda mais poderosa. Para modificar as propriedades de uma tabela basta entrar no menu Format e escolher o comando Table Properties, onde uma janela ser aberta (ver figura VI-8). Na guia General podemos, no quadro General, opo Hide empty rows and columns, pedir para mostrar ou no linhas ou colunas vazias (sem dados). No quadro Row Dimension Label, podemos controlar a localizao dos rtulos das linhas atravs das opes In Corner que posicionar os rtulos no canto superior esquerdo da tabela e da opo Nested que far com que os rtulos fiquem no canto esquerdo da tabela. No quadro Column Widths podemos controlar a largura mnima e mxima dos rtulos das colunas e das linhas atravs das opes Minimum/Maximum width for column/row labels. Figura VI-8: Janela para mudana das propriedades da tabela guia General

55

Na guia Footnotes podemos definir o formato da nota de rodap, se nmero ou letra e se sua posio sobrescrito ou subscrito (ver figura VI-9). Figura VI-9: Janela para mudana das propriedades da tabela guia Footnotes

Na guia Cell Formats (ver figura VI-10), podemos escolher uma rea (e no um grupo de clulas) para modificar o formato. Uma tabela, para formatao, dividida em oito reas: ttulo, camadas, rtulos do canto superior esquerdo, das linhas e das colunas, dados, legendas e notas de rodap. Podemos selecionar uma rea atravs do quadro Area ou clicando com o mouse na rea desejada da tabela no quadro Sample. Pode-se mudar a fonte, alinhamento, sombreamento, etc, como j foi visto em Cell Properties. Figura VI-10: Janela para mudana das propriedades da tabela guia Cell Formats

Na guia Borders (ver figura VI-11), podemos selecionar, para cada lugar da borda numa tabela, um estilo e cor para a linha. Para selecionar uma borda, basta clicar em um nome da lista no quadro Border ou clique na borda (linha) desejada na pequena tabela que aparece no quadro Borders. Agora s selecionar um estilo e uma cor.

56

Figura VI-11: Janela para mudana das propriedades da tabela guia Borders

Na guia Printing (ver figura VI-12), podemos controlar as propriedades da tabela em relao a impresso. Atravs da opo Print all layers podemos imprimir todas as camadas (layer) ou apenas a camada que est sendo mostrada. Atravs da opo Print each layer on separate page podemos imprimir cada camada numa pgina separada. Atravs da opo Rescale wide/long table to fit page podemos reduzir uma tabela horizontal ou verticalmente para caber em uma nica pgina. Atravs da opo Widow/Orphan lines podemos controlar nmero de linhas rfs/vivas, caso a tabela seja quebrada. Atravs da opo Continuation Text podemos escolher o texto que indicar que a tabela foi quebrada. No quadro Position of Continuation Text podemos escolher, atravs das opes At bottom/At top a posio que desejamos que o texto aparea. Figura VI-12: Janela para mudana das propriedades da tabela guia Printing

57

4. TableLooks Um Tablelook um conjunto de propriedades que definem a aparncia de uma tabela. Pode-se selecionar um Tablelook previamente definido ou criar o seu prprio. Para aplicar um Tablelook basta entrar no menu Format e escolher o comando TableLooks. Uma janela ser aberta (ver figura VI-13). Na lista de formatos apresentada no quadro Tablelook Files podemos escolher o formato que mais nos agradar. Caso voc tenha criado um padro em outro diretrio, basta clicar na opo Browse para selecion-lo. Para criar o seu prprio padro basta definir uma srie de propriedades dentro do comando Table Properties, entrar no comando Tablelooks e clicar na opo Save Look. O arquivo ser armazenado, caso voc no mude, no diretrio Looks localizado dentro do diretrio do SPSS. O arquivo criado atravs do Tablelooks do tipo Tablelooks(*.tlo). O formato de clulas individuais definidas atravs do comando Cell Properties permanece, mesmo que antes ou depois se aplique um Tablelook. Figura VI-13: Escolhendo o tablelook a ser aplicado tabela

5. Criando um grfico a partir de uma tabela Podemos criar, automaticamente, um grfico interativo a partir de uma tabela no SPSS sem recorrer ao menu Graphs. Para isso, basta selecionar as clulas dos dados que iro compor o grfico (no necessrio selecionar os ttulos das linhas ou colunas), entrar no menu Edit e escolher o comando Create Graph ou clicar com o boto direito do mouse sobre a rea selecionada e escolher o comando Create Graph e depois selecionar o tipo de grfico que deseja construir. Ver figura VI-14 e figura VI-15.

58

Figura VI-14: Seleo do cruzamento n de cigarros X estado civil para os homens

Figura VI-15: Grfico de Barra criado a partir da tabela acima


N Cigarros Fuma por Dia * Estado Civil * Sexo Crosstabulation Statistics : Count Sexo : Masculino

59

VII. Manipulao de Dados

1. Ordenao de casos Antes de realizarmos qualquer anlise comum termos que preparar os dados para que possamos obter a informao desejada. Uma das necessidades na hora da manipulao dos dados em nosso dia a dia a ordenao dos casos segundo uma ou mais variveis. Para fazer isso no SPSS basta entrar no menu Data e escolher o comando Sort Cases, uma janela ser aberta (ver janela VII-1). Movemos para o quadro Sort by a varivel segundo a qual o arquivo deve ser ordenado. Podemos mover para esse quadro mais do que uma varivel. Nesse caso o arquivo ordenado, em primeiro lugar, pelos valores da primeira varivel presente no quadro Sort by e em segundo lugar pela segunda varivel presente no quadro Sort by. A segunda ordenao feita para os valores comuns da primeira varivel e assim por diante. No quadro Sort Order podemos escolher entre ordem crescente (Ascending) ou decrescente (Descending) de ordenao para cada uma das variveis. Vamos fazer uma ordenao segundo o sexo (ordem crescente) e idade (ordem decrescente). Para isso movemos a varivel sexo para o quadro Sort by e escolhemos a opo Ascending no quadro no quadro Sort Order. Movemos em seguida a varivel idade para o quadro Sort by e escolhemos a opo Descending no quadro no quadro Sort Order. Agora basta clicar em OK para validar a ordenao. Figura VII-1: Comando Sort Cases

Voc pode notar que aparece a letra A (ou a palavra Ascending) na frente da varivel sexo e a letra D (ou a palavra Descending) na frente da varivel idade. Isso indica a ordem pela qual ser feita a ordenao para cada uma das variveis. A figura VII-2 mostra a janela de dados aps ordenao. Note que as sete primeiras linhas contm informaes referentes a pessoas do sexo feminino (sexo = F), alm disso, a primeira linha contm informaes da mulher mais velha e a linha sete da mais jovem. As demais linhas contm as informaes dos homens (sexo = M) tambm ordenadas por idade.

60

Figura VII-2: Janela de dados aps ordenao

Dica sobre ordenao: Voc pode ordenar os dados sem entrar no comando Sort Cases do menu Data. Para isso, basta selecionar as variveis que definem a ordenao (voc pode usar as teclas CTRL ou SHIFT para selecionar vrias variveis), clicar com o boto direito do mouse no nome de qualquer uma das variveis selecionadas e escolher o comando Sort Ascending ou Sort Descending. 2. Seleo de casos Outra grande necessidade a seleo (temporria ou permanente) de parte do arquivo de dados. Digamos que estamos interessados em estudar um segmento especfico da amostra. O SPSS possui vrias formas de seleo de dados. Para fazer qualquer tipo de seleo devemos entrar no menu Data e escolher o comando Select Cases ou clicar no cone janela ser aberta (ver figura VII-3). Figura VII-3: Comando Select Cases da barra de ferramentas. Uma

61

No quadro Select esto presentes cinco opes diferentes para seleo. Faremos, a seguir, uma breve descrio de cada uma delas. All Cases opo usada como padro, utiliza todas as observaes do banco de dados. If condition is satisfied atravs dessa opo podemos definir expresses condicionais para a seleo de casos. Random sample of cases podemos selecionar um porcentagem aproximada ou um nmero exato de casos dos n primeiros casos. A seleo feita aleatoriamente. Based om time or case range usamos essa opo quando estamos interessados em selecionar uma faixa especfica de valores, por exemplo os casos de nmero 100 at 200. Tambm utilizado para fazer selees baseadas em datas (por exemplo, selecione todos os dados do ms de fevereiro at outubro). User filter variable escolhemos uma varivel no banco de dados e usamos com filtro. Todos os casos para os quais a varivel filtro assume o valor 0 ou ausente no sero selecionados. No quadro Unselected Cases Are podemos escolher o tratamento que ser dado aos casos que no sero selecionados. Filtered os casos (linhas) que no so selecionados no sero includos nas anlises posteriores, porm permanecem na janela de dados. Caso voc mude de idia e queira usar os casos no selecionados na mesma sesso do SPSS basta desligar o filtro usando a opo All Cases no quadro Select. Deleted os casos (linhas) que no so selecionados so apagados da janela de dados. Caso voc mude de idia e queira usar os casos no selecionados voc dever ler novamente o arquivo de dados original. Suponha que estamos interessados em selecionar apenas as pessoas que fumam e com idade menor do que 25. A funo condicional para seleo nesse caso dada por: Fumante = 1 AND Idade <= 35 Portanto o tipo de seleo de dados que faremos deve possibilitar a criao de sentenas matemticas lgicas para a seleo dos casos. Por isso vamos escolher a opo If condition is satisfied, e depois vamos clicar na opo If, uma janela ser aberta (ver figura VII-4). No quadro superior escrevemos uma funo lgica na qual a seleo vai ser baseada. Para a construo da funo podemos usar todas as variveis que esto no quadro esquerda e todas as funes disponveis no quadro inferior direito.

62

Figura VII-4: Opo If condition is satisfied do comando Select Cases

Uma vez escrita a funo que determina a regra de seleo dos casos, clique em Continue, e voc voltar janela principal (Select Cases). No quadro Unselect cases are, vamos optar pelo modo Filtered ou seja, os casos no selecionados permanecem na tela de dados, porm no sero utilizados ema anlises futuras. Depois clique em OK. Depois de feita a seleo, a janela de dados sofre algumas alteraes (ver figura VII-5). As linhas (casos) que no foram selecionadas apresentam um lista no canto esquerdo da janela de dados. A barra de status, localizada na parte inferior da janela, apresenta a mensagem Filter On. Alm disso, uma varivel de nome filter_$ adicionada no final da janela de dados. Essa nova varivel apresenta valor 0 para as linhas que no foram selecionadas e valor 1 para as linhas que foram selecionadas. Apesar de voc ver os casos que no foram selecionados qualquer anlise efetuada da pra frente no levar em conta esses casos. Figura VII-5: Janela de dados com seleo de casos ativa

Podemos mudar de idia e querer usar todas as observaes para o clculo das estatsticas. Temos duas maneiras de cancelar a seleo de casos se a opo Filtered foi usada para efetuar a seleo. A primeira delas ativar a opo All Cases da janela Select Cases e clicar em OK. A Segunda maneira apagar a varivel filter$ do banco de dados. 63

3. Procedimento Split File Vamos supor que aps uma srie de anlise chegamos concluso de que o comportamento dos homens e das mulheres completamente diferente com relao s preferncias da marca de cigarro. No faz sentido, portanto, apresentar anlise com os homens e as mulheres juntos. Pretendemos fazer, daqui pra frente, duas anlises idnticas, uma para cada sexo. Para isso vamos usar o comando Split File do menu Data ou clicar no cone da barra de ferramentas, uma janela ser aberta (ver figura VII-6). Como padro sempre analisamos todos os casos juntos, sem separao por grupos. Por esse motivo, na janela Split File, a opo padro selecionada a Analyze all cases, do not create groups. Porm, podemos separar a anlise de acordo com as categorias da varivel escolhida (ou combinao das categorias de vrias variveis, se for o caso) atravs das opes Compare groups ou Organize output by groups. A opo Compare groups faz com que os grupos sejam apresentados juntos para comparao e a opo Organize output by groups mostra os resultados de cada procedimento do SPSS organizados separadamente para cada grupo. Esta diferena s vale para as tabelas Pivot Tables, para os outros tipos de sada essas duas opes so idnticas. No quadro Groups based on colocamos a varivel (ou variveis) que definiro os grupos para os quais a anlise dever ser repetida. Se mais do que uma varivel for selecionada, os grupos sero definidos pela combinao das categorias de todas as variveis. Podemos, atravs da opo Sort the file by grouping variables, escolher se o banco de dados deve ser ordenado pela varivel que definir os grupos ou se nenhuma ordenao deve ser feita, atravs da opo File is already sorted. Tenha em mente que se, o arquivo no estiver ordenado por essas variveis, o comando Split File no funcionar corretamente. Figura VII-6: Comando Split File

A figura VII-7 apresenta o resultado de uma anlise descritiva para a varivel Idade usando a opo Organize output by groups da janela Split File. Note que os resultados so apresentados separadamente para cada categoria da varivel sexo.

64

Figura VII-7: Resultado da anlise descritiva para a varivel Idade aps o Split File

4. Procedimento Aggregate O procedimento Aggregate combina grupos de casos em um nico caso e cria um novo banco de dados agregados. Os casos so agregados baseados nos valores de uma ou mais variveis. O novo arquivo conter um caso para cada grupo. Por exemplo, suponha que voc tenha um banco de dados onde cada caso representa um municpio do Brasil. Voc poderia agregar esses dados criando um novo arquivo com uma linha para cada estado. No menu Data e escolhemos o comando Aggregate, uma janela ser aberta (ver figura VII8). No quadro Break Variable(s) colocamos uma ou mais variveis que definiro os grupos. No quadro Aggregate Variable(s) colocamos as variveis que queremos no novo arquivo. Note que a funo padro usada para agregar os dados para as variveis a mdia, mas clicando na opo Function podemos mudar essa funo para qualquer varivel. Voc pode colocar a mesma varivel vrias vezes no quadro Aggregate Variable(s), o que significa que voc pode ter no novo arquivo vrias colunas representando funes diferentes de uma mesma varivel. Figura VII-8: Janela para definio do comando Aggregate

65

Atravs da opo Save number of cases in break group as variable podemos criar uma varivel no novo arquivo que contenha o nmero de casos que foram agregados por grupo. No nosso exemplo a nova varivel se chamar N_itens. Se quisermos que o resultado do comando Aggregate seja salvo em um novo arquivo de dados basta clicar na opo Create new data file. O novo arquivo ser criado, no diretrio corrente com o nome aggr.sav. Se quisermos que o SPSS feche o arquivo atual e mostre o resultado do comando Aggregate numa nova janela de dados basta clicar na opo Replace working data file, sendo que voc deve salvar esse arquivo posteriormente. O resultado do comando Aggregate pode ser visualizado na figura VII-9. Figura VII-9: Resultado do comando Aggregate

5. Procedimento Restructure O procedimento Restructure utilizado para reorganizar seus dados. Atravs dele voc pode transformar as variveis selecionadas em casos, os casos selecionados em variveis ou transpor todos os dados (as linhas viram colunas e as colunas viram linhas). No menu Data escolhemos o comando Restructure, uma janela ser aberta (ver figura VII10). No quadro What do want to do? podemos escolher o que queremos fazer. Para transformar as variveis selecionadas em casos basta clicar na opo Restructure select variables into cases. Para transformar os casos selecionados em variveis basta clicar na opo Restructure select cases into variables. Para transpor todos os dados basta clicar na opo Transpose all data. Feito a escolha, clique na opo Avanar.

66

Figura VII-10: Janela inicial do comando Restructure

No quadro Variables in the Current File, da nova janela aberta (ver figura VII-11), podemos definir como as variveis do arquivo atual podero ser utilizadas no novo arquivo. No quadro Identifier Variable(s) colocamos uma ou mais variveis que definiro os grupos. No quadro Index Variable(s), quando necessrio, podemos escolher um varivel ndice. Aps escolher as opes desejadas, clicar em Avanar. Figura VII-11: Passo 2 do comando Restructure Select Variables

67

Para utilizar o comando Restructure devemos ter o banco ordenado pelas variveis que definiro os grupos (Identifier Variable(s)). Se o banco de dados j estiver ordenado por essas variveis podemos escolher no quadro Sort the current data? a opo No use the data as currently sorted. Caso voc no tenha certeza que o arquivo esteja ordenado escolha a opo Yes data will be sorted by the Identifier and Index variables para o comando fazer essa ordenao (ver figura VII-12). Clique em Avanar. Figura VII-12: Passo 3 do comando Restructure Sorting Data

Na nova janela aberta (ver figura VII-13), podemos estabelecer algumas opes que sero aplicadas ao arquivo reestruturado, tais como a ordem que ficaro os novos grupos de variveis (Order of new variable Groups), uma varivel frequncia que indicar o nmero de linhas do arquivo original que foram utilizadas para criar uma linha do arquivo reestruturado (Case Count Variable) e uma varivel indicadora (Indicator Variables). Deixaremos esse passo como padro. Clique em Avanar. Figura VII-13: Passo 4 do comando Restructure Options

68

Finalmente chegamos ao ltimo passo do comando Restructure. Nessa janela (ver figura VII-14) devemos definir o que faremos com os dados, se vamos reestruturar os dados imediatamente (Restructure the data now) ou se queremos criar um sintaxe com as opes que foram escolhidas no wizard do comando Restrcture (Paste the sintax generated by the wizard into a sintax window). Aps escolher a melhor opo, clicamos em Concluir. O novo arquivo aparecer na janela de dados do SPSS. Figura VII-14: Janela final do comando Restructure

Figura VII-15: Banco de dados criado atravs do comando Restructure

6. Procedimento Transpose O SPSS assume uma estrutura de dados onde os casos so representados por linhas e as variveis, por colunas. Porm, pode-se tornar necessrio inverter esta estrutura e para tal fim, utiliza-se o comando Transpose, do menu Data. As variveis selecionadas se transformaro em casos (linhas) e todos os casos em variveis (colunas). Os valores definidos como ausentes, tornamse Missing de Sistema. 69

O comando Transpose cria uma novo banco de dados, onde a primeira coluna identifica o nome da varivel que deu origem quele caso. Veja o nosso exemplo abaixo.

VIII. Arquivos e Janelas Produzidas em uma Sesso SPSS


Sempre que inicializamos o SPSS, uma janela para entrada, digitao ou edio de dados aberta (ver figura VIII-1). Essa janela chamada Data Editor tem o formato de uma planilha, onde cada linha corresponde a um caso e cada coluna a uma varivel. Esta janela no pode ser fechada, a no ser que outra do mesmo tipo seja aberta em seu lugar. Note que se a janela de dados estiver ativa, a opo Close do menu File no estar disponvel. Voc deve ter percebido que alm desse tipo de janela, vrias outras podem ser abertas. Quando salvamos os dados dessa janela um arquivo com a extenso .sav criado. Figura VIII-1: Aspecto inicial do SPSS

70

1. Janela de dados A janela Data Editor (ou simplesmente janela de dados) destinada a armazenar os dados que sero usados para efetuar as anlises. Uma caracterstica dessa janela que apenas uma pode ser aberta em cada sesso do SPSS e apesar de ser possvel abrir mais de uma sesso, isso no significa que se voc quiser analisar dados de dois arquivos diferentes basta abrir uma janela de dados para cada arquivo e pronto. Para isso ser possvel, os arquivos precisam estar presentes na mesma sesso e por isso, o SPSS apresenta a opo Merge File no menu Data. Como j mencionamos anteriormente, o SPSS faz importao de arquivos de dados no formato Excel, Lotus, Dbase, Sylk e ASCII, alm claro do prprio formato SPSS (verses DOS, Windows e portable) e atravs de ODBC. Para abrir um arquivo no SPSS basta clicar no menu File, escolher o comando Open e depois a opo Data. Uma janela ser aberta (ver figura VIII-2), no quadro Arquivos do tipo escolher o formato em que o arquivo foi criado. Figura VIII-2: Abertura de arquivo de dados

Atravs da digitao dos resultados de seus estudos na janela de dados, voc pode criar seu banco de dados dentro do prprio SPSS. O arquivo criado pode ser exportado em todos os formatos nos quais pode ser importado diretamente (sem uso de ODBC). O formato de exportao padro o prprio formato SPSS for Windows (extenso .sav). Para salvar a janela de dados basta clicar no menu File, escolher o comando Save as. Uma janela ser aberta (ver figura VIII-3), no quadro Salvar como tipo escolha um dos formatos de exportao disponveis, o formato padro o SPSS (*.sav). No quadro Nome do arquivo digite o nome com o qual o arquivo ser salvo e clique em OK.

71

Figura VIII-3: Salvando a janela de dados

2. Janela de sadas Quando voc pedir uma anlise estatstica, um grfico, etc o SPSS automaticamente abre uma janela de sadas chamada Output 1 - SPSS Viewer. Os resultados so armazenados de maneira sequencial na ordem em que os mesmos so gerados, porm voc pode usar as facilidades da janela de sadas para: procurar sadas, mostrar ou esconder sadas, mudar a ordem de visualizao das sadas movendo os itens dentro da prpria janela e entre o SPSS e outros programas. A janela de sadas est dividida em dois painis (ver figura VIII-4): Painel Geral: o painel da esquerda que contm uma viso geral do contedo das sadas. Pode-se clicar e arrastar a borda direita deste painel para mudar a sua largura, clicar no cone em formato de livro para mostrar ou esconder um item e mudar a ordem de visualizao das sadas arrastando-se os itens para o local desejado. Painel dos contedos: o painel da direita que contm as tabelas, grficos e sadas de texto. Voc pode usar as barras de rolagem (scrool bars) para procurar as sadas ou pode clicar no item correspondente no painel geral para ir diretamente sada procurada.

72

Figura VIII-4: A janela de sadas e seus painis

3. Janela de sintaxe Alm das janelas de dados e sadas, uma janela de programao pode ser aberta, esta janela chamada de SYNTAX1 SPSS Sintax Editor. Ela aberta atravs do menu File, comando New e opo Sintaxe ou quando se usa o comando Paste das caixas de dilogo dos comandos. Todos os procedimentos feitos dentro dos menus do SPSS podem ser salvos na forma de comandos dentro de uma janela de programao (sintaxe). A vantagem de procedermos dessa maneira que os procedimentos armazenados nessa janela podem ser rodados novamente sem que precisemos entrar nos menus. Por exemplo, se voc precisa rodar uma mesma anlise todo ms com um arquivo atualizado voc pode tirar proveito dessa facilidade. bom lembrar que o SPSS possui uma linguagem de programao prpria e aqueles que a conhecem podem escrever os comandos sem a necessidade de usar o recurso Paste. Atravs desse recurso voc no precisa digitar o cdigo referente ao procedimento desejado. O prprio SPSS escreve o cdigo para voc. Vamos comear com um exemplo simples: a criao de uma janela de programao com a sintaxe referente criao de uma tabela de frequncia. No comando Analyze, escolher o comando Descriptive Statistics e depois a opo Frequencies (ver figura VIII-5).

73

Figura VIII-5: Janela de definio de uma tabela de frequncias

Aps as escolhas feitas clicar em Paste ao invs de OK. O resultado desse procedimento a criao de uma janela chamada Syntax1 SPSS Sintax Editor, j com o cdigo referente criao de tabelas de frequncia (ver figura VIII-6). Figura VIII-6: Comando Frequencies na janela de programao (sintaxe)

Para saber quais so as demais especificaes disponveis para o comando FREQUENCIES, selecionamos qualquer parte do comando FREQUENCIES e clicando no cone (Syntax Help) da Barra de Ferramentas obtemos a informao desejada (ver figura VIII-7).

74

Figura VIII-7: Ajuda para definio de comandos na janela de sintaxe

Para um procedimento simples como o FREQUENCIES, o SPSS at que apresenta um nmero grande de opes. Todos os cdigos entre colchetes so opcionais e os entre chaves indicam opes que podem ser escolhidas. Ressaltamos que essa janela parte do sistema de ajuda do SPSS e embora mostre todas as opes existentes para cada comando, no apresenta nenhuma explicao sobre o que cada uma faz. Para informaes mais detalhadas sobre os comandos do SPSS o leitor pode consultar o manual SPSS 12.0 Command Syntax Reference, disponvel no menu Help e comando Command Syntax Reference. O comando FREQUENCIES presente na janela de sintaxe vai produzir exatamente a mesma tabela de frequncia feita atravs do menu Frequencies. At agora apenas o cdigo foi gerado, para (Run Current) da rodar o procedimento basta selecionar o comando desejado e clicar no cone Barra de Ferramentas ou entrar no menu Run ou da combinao das teclas CTRL+R. Note que no menu Run temos vrias opes para rodar os comandos. A opo All executa todos os comandos sem que seja preciso selecion-los. A opo Select executa apenas os comandos selecionados, se nada estiver selecionado ele executa o comando sobre o qual o ponto de insero (cursor/ponteiro) est posicionado. A opo Current CTRL+R executa o comando sobre o qual o ponto de insero (cursor/ponteiro) est posicionado. A opo To End executa os comandos a partir da posio do ponto de insero (cursor/ponteiro) at o final. Cada janela de sintaxe aberta um arquivo em potencial que pode ser salvo em formato texto. Para salvar uma janela de sintaxe basta abrir o menu File, escolher o comando Save ou Save as, uma janela ser aberta (ver figura VIII-8). J conhecemos esse tipo de janela. Nela escolhemos o drive e o diretrio no qual queremos armazenar o arquivo e digitamos o nome com o qual queremos que o arquivo seja armazenado. O arquivo ser criado no formato SPSS Syntax Files (*.sps). Note que a extenso usada para as janelas de sintaxe .sps. Como esses arquivos so gerados como formato texto podemos edit-los em qualquer editor de textos. 75

Figura VIII-8: Salvando uma janela de sintaxe

Um arquivo do tipo sintaxe (.sps), pode ser aberto dentro de qualquer sesso do SPSS, modificado, se necessrio e executado. Para abrir um arquivo desse tipo basta abrir o comando File, escolher o comando Open e escolher a opo Syntax, uma janela ser aberta (ver figura VIII-9). Figura VIII-9: Abrindo uma janela de sintaxe

Alm das janelas apresentadas aqui, o SPSS possui tambm uma janela para edio de scripts (SPSS Script Editor) que serve para voc criar scripts a partir de modelos padres ou totalmente novos. IMPORTANTE: 1. A alternncia entre as diversas janelas criadas pode ser feita atravs do menu Window ou atravs da Barra de Tarefas. 2. Quando mais de uma janela (sadas ou sintaxe) esto abertas, pode-se definir qual ser a janela da barra de ferramentas. ativa clicando no boto 4. Copiando o contedo da janela de sadas Com frequncia ser necessrio copiar os resultados de alguma anlise feita no SPSS em algum outro aplicativo, especialmente editores de texto e planilhas eletrnicas. 76

Para copiar um grfico para a rea de transferncia voc pode, atravs do painel de contedos ou atravs do painel geral, clicar nele com o boto direito do mouse e escolher o comando Copy ou com o boto esquerdo do mouse e escolher, no menu Edit, o comando Copy. Em seguida abrir o programa Word e selecionar, no menu Editar ou Edit, o comando Colar ou Paste, dependendo do idioma de seu Word. Voc pode tambm escolher, no Word, o comando Colar especial ou Paste Special, onde voc pode escolher ou figura (picture) ou bitmap. Em nenhum dos casos voc poder editar o grfico como se estivesse no SPSS, porm a opo figura permite que voc tenha opes simples do Word para edio da figura (ver figura VIII-10). Figura VIII-10: Grfico copiado para o Word

Para copiar uma tabela para a rea de transferncia voc dever proceder da mesma maneira que foi feita com o grfico, porm aps copiar a tabela voc dever acessar no Word a opo Colar especial ou Paste Special do menu Editar ou Edit, para que apaream todas as opes disponveis para colar a tabela no Word. A figura VIII-11 mostra essas opes. Figura VIII-11: As opes para colar uma tabela no Word

77

A opo SPSS Pivot Table Control faz com que as tabelas sejam coladas no Word como objetos do tipo Active-X (tambm chamado de OLE2) de modo que elas podem ser editadas de dentro do Word como se voc estivesse no SPSS (ou seja, usando os cones de organizao e os formatos de tabela), mas sem abrir o SPSS. Porm como essa tecnologia relativamente nova, muitos softwares ainda no a suportam, por isso, se essa opo no estiver disponvel execute o programa chamado OBJS-ON.BAT que est localizado no diretrio do SPSS. A opo Texto formato (RTF) ou Formatted Text - RTF copia a tabela como texto j formatado, o que resultar como uma tabela do Word (ver figura VIII-12). A opo Texto no formatado ou Unformatted Text, colocar a tabela como texto no formatado, mas usando a opo do Word de transformar texto em tabela, podemos facilmente edit-la. A opo Figura ou Picture cola a tabela como uma figura, semelhante maneira que so colados os grficos (ver figura VIII-13). Figura VIII-12: Tabela do SPSS colada no Word como texto formatado

Figura VIII-13: Tabela do SPSS colada no Word como figura

Para colar tabelas no Excel, aps copiar a tabela no SPSS, abrir o programa Excel e no menu Edit escolher o comando Colar Especial ou Paste Special e escolher as opes de colagem para a tabela. As vrias opes so mostradas na Figura VIII-14. A primeira e a segunda opo j foram vistas anteriormente. A opo Texto ou Text cola o contedo da tabela nas clulas da planilha, porm a preciso do nmero copiado para o Excel a mesma preciso exibida no SPSS. Usando a opo Biff, os nmeros tero toda a preciso numrica que poderamos mostrar na tabela no SPSS (o que pode ser muito importante para futuros clculos feitos na planilha), por isso, essa opo melhor do que a opo Texto.

78

Figura VIII-14: As opes para voc colar uma tabela do SPSS no Excel

5. Formas de exportao importante lembrar que o SPSS permite que voc abra quantas janelas de sadas quiser. Cada janela de sadas aberta um arquivo em potencial que pode ser salvo no formato Viewer Files (*.spo), que o formato prprio do SPSS para suas janelas de sadas. Para salvar uma janela de sadas basta clicar no menu File e escolher o comando Save ou Save as, uma janela ser aberta (ver figura VIII-15). No quadro Salvar em, escolhemos o drive e o diretrio onde queremos armazenar o arquivo, no quadro Nome do arquivo digitamos o nome com o qual o arquivo ser armazenado e no quadro Salvar como tipo aparece o formato Viewer Files (*.spo), que o formato prprio do SPSS para arquivos de sadas. Figura VIII-15: Salvando uma janela de sadas

Alm de abrir um arquivo do tipo Viewer Files (*.spo) no SPSS, voc tambm pode abri-lo em outros trs softwares da SPSS: Viewer uma espcie de janela de sadas do SPSS sem o mesmo. Permite que voc veja as sadas, mas no permite a edio ou cpia das mesmas. gratuito e j vem no CD do SPSS.

79

SmartViewer semelhante ao Viewer, porm permite que as sadas sejam editadas (usando cones de organizao, etc) e copiadas. J vem com o SPSS, mas no gratuito, voc precisa de uma licena para poder acess-lo. SmartViewer Web Server uma espcie de verso para a Internet do SmartViewer. Permite que os arquivos em formato de sadas do SPSS sejam acessados atravs dos browsers mais utilizados Iinternet Explorer e Netscape Navigator). Sendo que para quem estiver acessando a pgina que contenha as sadas deve ter instalado apenas um plug-in Java. Voc pode exportar as sadas como formato HTML, TXT, XLS, ou DOC usando o comando Export do menu File, uma janela ser aberta (ver figura VIII-16). Figura VIII-16: Exportando uma janela de sadas

No quadro Export podemos escolher o que queremos exportar. Escolhendo a opo Output Document podemos exportar qualquer combinao de tabelas, grficos e textos. Escolhendo a opo Output Document (No Charts) podemos exportar qualquer combinao de tabelas e textos, mas no podemos exportar grficos. Escolhendo a opo Charts Only podemos exportar apenas os grficos. No quadro Export File File Name digitamos o nome com que o arquivo ser exportado. Clicando na opo Browse podemos escolher em que drive e diretrio o arquivo ser armazenado. No quadro Export What escolhendo a opo All Objects exportamos todos os objetos possveis, escolhendo a opo All Visible Objects exportamos apenas os objetos visveis ou aqueles cujo cone no painel geral um livro aberto, e escolhendo a opo Select Objects exportamos apenas os objetos selecionados. No quadro Export Format File Type, escolhemos em que formato queremos fazer a exportao.

IX. Utilizando os Scripts do SPSS


A utilizao de scripts lhe permite automatizar muitas tarefas no SPSS, como: Automaticamente customizar sadas na janela de sadas. Abrir e gravar arquivos de dados. Mostrar e manipular caixas de dilogo do SPSS. 80

Rodar transformaes de dados e procedimentos estatsticos usando sintaxe. Exportar grficos como arquivos escolhendo entre uma srie de formatos.

O SPSS j vem com alguns scripts, incluindo autoscripts que rodam automaticamente toda vez que um tipo especfico de sada produzida. Voc pode usar esses scripts como esto ou customiz-los de acordo com sua necessidade. Se voc deseja criar seus prprios scripts, voc pode comear escolhendo um de uma srie de scripts iniciais ou comear um totalmente novo. Para rodar um script, entre no menu Utilities e escolha o comando Run Script (ver figura XII-1). Na janela aberta voc escolhe o script a ser rodado. No quadro Examinar voc define o diretrio onde est o script. O padro o diretrio Scripts que fica dentro do diretrio SPSS. No quadro Description mostrado uma descrio do que o script escolhido faz e quais os requerimentos para que ele possa ser rodado. Por exemplo, o script Make totals bold aplica o formato negrito e cor azul para qualquer linha, coluna ou camada que tenha como rtulo a palavra Total. Como requerimento, voc deve selecionar a tabela que vai ser editada, antes de rodar o script. Figura XII-1: Janela para a escolha do script a ser rodado.

Note que quando a tabela foi colocada na janela de sadas, tambm foi criado, no painel geral, um cone chamado Notes. Ele tem informaes sobre a data que a sada foi criada, o tempo usado para rodar o procedimento, informaes sobre o arquivo, etc. Vamos supor que voc v gravar a janela de sadas e no queira gravar nenhum cone Notes. Para apagar todos os Notes da sua janela de sadas, basta rodar o script Clean Viewer que tem com nico requerimento ter como janela designada aquela que voc quer limpar. Este um exemplo da versatilidade dos scripts. 1. Modificando um script Mesmo no tendo conhecimentos sobre Visual Basic possvel editar os scripts que j vem com o SPSS de modo a automatizar tarefas simples. Isso porque o SPSS vem com um subdiretrio de Starter Scripts que so scripts semi-prontos. Basta ler e seguir as instrues nos comentrios do script a fim de edit-lo a seu gosto. Porm mesmo os outros scripts que vem com o SPSS podem ser facilmente editados graas sua documentao. Tomemos como exemplo o script utilizado anteriormente: Make Totals Bold. Vamos abri-lo na janela de edio de scripts. Abra o menu File, escolha o comando Open e a opo Script, uma janela ser aberta (ver figura IX-2). Se o script que voc deseja no aparece na lista apresentada, lembre-se que ele est do diretrio Scripts que fica dentro do diretrio SPSS. Um arquivo Script do tipo SPSS Script (*.sbs). 81

Figura IX-2: Editando o script Make Totals Bold

Veja, na figura IX-2, a linha strTargetText = cTOTAL e o comentrio acima dela. fcil deduzir que precisamos apenas trocar a palavra Total para fazermos com que o script procure uma linha ou coluna com algum outro rtulo desejado. Mais abaixo no programa temos a parte responsvel pela edio da linha ou coluna que contiver a palavra Total (ver figura IX-3). Veja um exemplo de como fcil modificar o programa para editar a linha ou coluna deixando-a, por exemplo, em itlico e/ou vermelho. Para colocar as palavras em itlico basta mudar a linha .TextStyle = 2 para .TextStyle = 1 e para mudar a cor para vermelho basta trocar a linha .TextColor = RGB (0, 0, 255) para .TextColor = RGB (255, 0, 0). Figura IX-3: Parte responsvel do script pela formatao das clulas

Por ltimo, caso voc queira incluir comandos de sintaxe do SPSS, basta escolher a opo Paste das caixas de dilogo abertas no SPSS. Caso voc faa esse procedimento de dentro de uma 82

janela de edio de scripts, o SPSS copia os comandos para essa janela e no para a de sintaxe como seria feito normalmente.

X. Customizao das barras de ferramentas


Cada janela do SPSS tem sua prpria barra de ferramentas que lhe d um acesso fcil e rpido a tarefas comuns. Algumas janelas tm mais de uma barra de ferramentas e voc pode control-las de vrias maneiras: Mostrar ou esconder barras, Mostrar as barras vertical ou horizontalmente, fixadas esquerda, direita, em cima ou em baixo da janela. Mostrar as barras como palhetas flutuantes em qualquer lugar dentro ou fora da janela Customizar as barras de modo que contenham as ferramentas que voc mais usa, incluindo programas em sintaxe ou script. Para mostrar ou esconder uma barra de ferramentas, abra o menu View e escolha o comando Toolbars, uma janela ser aberta (ver figura X-1). No quadro Document Type escolha a barra de ferramentas que voc deseja mostrar ou esconder. Para que todas as barras de ferramentas sejam exibidas no quadro Toolbars, escolha o item All. Para mover uma barra de ferramentas, basta clicar em qualquer lugar da barra, mas fora de qualquer cone, e arrast-la para a localizao desejada. Figura X-1: Caixa de dilogo Show Toolbars

Aps escolher a barra de ferramentas clique na opo Customize, uma janela ser aberta (ver figura X-2). No quadro Categories selecione um item da lista de categorias apresentadas. No quadro Items ser mostrada todas as ferramentas disponveis para a categoria escolhida. Arraste as ferramentas que voc quer para a barra de ferramentas que aparece no quadro Customizing Toolbar. Para remover um item, simplesmente arraste-o para fora desta barra.

83

Figura X-2: Caixa de dilogo Customize Toolbar

Para criar uma nova barra de ferramentas clique na opo New Toolbar, uma janela ser aberta (ver figura X-3). Na caixa Toolbar Name digite o nome com o qual voc quer que a sua barra de ferramentas seja criada. No quadro Display on the following Windows selecione as janelas nas quais voc quer que a sua barra de ferramentas aparea e depois clique na opo Customize e proceda da forma j vista anteriormente. Figura X-3: Caixa de dilogo Toolbar Properties

Voc pode tambm criar uma ferramenta para as barras de ferramentas que seja capaz de executar as seguintes aes: lanar uma aplicao mandando (ou no) os dados do SPSS e rodar um script ou um programa de sintaxe. Para isso, abra o menu View e escolha o comando Toolbars. Na janela Show Toolbars, clique na opo Customize. Na janela Customize Toolbar, clique na opo New Tool, uma janela ser aberta (ver figura X-4). No quadro Label entre com um rtulo descritivo para a nova ferramenta. No quadro Action, selecione a ao que voc quer para a ferramenta. No quadro Filename, clique na opo Browse para selecionar o arquivo que vai ser associado ferramenta a qual ser mostrada posteriormente na categoria User-Defined. Clique em OK para retornar janela Customize Toolbar (veja que sua ferramenta (Rode me!) j est dentro da categoria User-Defined), clique na opo Properties e selecione em quais tipos de janela do SPSS voc quer que a sua ferramenta aparea. Verifique que a mesma janela da figura X-4.

84

Figura X-4: Criando uma ferramenta na barra de ferramentas

XI. Controlando o Ambiente


O SPSS foi desenvolvido com algumas caractersticas gerais predeterminados, como por exemplo, qualquer nova varivel criada tem o formato inicial numrico de tamanho 8 e 2 casas decimais. Algumas dessas caractersticas podem ser modificadas atravs do menu Edit e do comando Options, uma janela ser aberta (ver figura XI-1) e atravs dela que faremos as modificaes desejadas. 1. Guia General Figura XI-1: Janela de definio do ambiente guia GENERAL

No quadro Variable Lists podemos definir como as variveis sero apresentadas nas janelas de definio de todos os procedimentos: mostrando os rtulos (Display labels) ou apenas os nomes 85

(Display names) e se em ordem alfabtica (Alphabetical) ou pela ordem em que elas aparecem na janela de dados (File). No quadro Session Journal, se a opo Record syntax in journal estiver marcada, todos os comandos executados no SPSS estaro sendo armazenados em um arquivo, cujo nome padro spss.jnl. localizado no diretrio C:\Windows\TEMP. Clicando na opo Browse, podemos alterar o nome e o diretrio desse arquivo. Se selecionarmos a opo Append, os comandos executados nessa sesso SPSS sero acumulados aos executados nas sesses SPSS anteriores. A desvantagem que esse arquivo torna-se cada vez mais extenso, ocupando muito espao em seu disco. Se selecionarmos a opo Overwrite, os comandos executados nessa sesso SPSS sero sobrepostos aos executados na sesso SPSS anterior e assim por diante, isto , s permanecem os comandos executados na ltima sesso SPSS. A desvantagem que o comando que gostaramos de relembrar quase nunca executado na ltima sesso SPSS. No quadro Temporary directory podemos controlar a localizao dos arquivos temporrios criados durante uma sesso SPSS. Dependendo do modo como voc trabalha com os arquivos (ou seja, criando cpias ou no), do tamanho desses arquivos e operaes realizadas, o espao para arquivos temporrios pode se tornar muito grande. Por exemplo, um arquivo de 200Mb pode precisar de 400Mb para arquivos temporrios. No quadro Recently used file list, podemos modificar a quantidade de arquivos que aparecero na lista de arquivos recentemente usados. Esta lista aparece no menu File, atravs dos comandos Recently used data (arquivos de dados) ou Recently used file (outros arquivos), e serve para abrir rapidamente qualquer um deles sem precisar especificar disco, diretrio, etc. O nmero de arquivos que a lista pode variar entre 0 e 9. Marcando a opo Open syntax window at start-up, uma janela de sintaxe aberta toda vez que uma sesso SPSS inicializada, alm da janela de dados, claro. No quadro Output, atravs da opo No scientific notation for small numbers in tables, podemos escolher se queremos omitir, nas tabelas de output (sadas), a notao cientfica para os valores decimais muito pequenos. Esses nmeros sero mostrados com 0 ou .000. No quadro Viewer Type at Startup, podemos escolher o tipo de janela de sadas. Se marcarmos a opo Regular a janela ser do tipo padro. Se marcarmos a opo Draft todas as tabelas do SPSS sairo em formato texto e os grficos no podero ser editados. No quadro Measurement System, podemos escolher o sistema de medidas usado (ponto, polegadas ou centmetros) para especificar atributos como margens de tabelas, largura de clulas, espao entre tabelas para impresso, etc. No quadro Language, podemos escolher a linguagem que o texto sair nas janelas de output (sadas). No quadro Notification, podemos controlar a maneira como o SPSS que ele terminou de rodar um procedimento e que os resultados esto na janela de output (sadas). 2. Guia Viewer Nessa guia (ver figura XI-2), podemos controlar as caractersticas da janela de sadas. No quadro Initial Output State, podemos definir quais os itens que sero automaticamente mostrados ou no, cada vez que executamos um procedimento e como os itens sero alinhados (para impresso apenas). Na opo Title Font (ou Page Title Font, temos duas opes), podemos controlar o estilo, tamanho e cor da fonte para novos ttulos de procedimentos e pginas da janela de sadas. 86

No quadro Text Output Page Size, podemos controlar a largura (Width) e comprimento (Length) da pgina. No quadro Text Output Font, podemos selecionar as caractersticas da fonte usada nessas sadas. Evite usar fontes que no sejam mono-espaadas (Monospaced fonts). Figura XI-2: Janela de definio do ambiente guia VIEWER

3. Guia Draft Viewer Nessa guia (ver figura XI-3), podemos controlar a formatao de sada no modo Draft Viewer, como a largura das colunas, a fonte e seu tamanho, etc. Figura XI-3: Janela de definio do ambiente guia DRAFT VIEWER

4. Guia Output Labels Nessa guia (ver figura XI-4), podemos controlar como o SPSS mostra as informaes das variveis e valores no painel geral da janela de sada e nas tabelas: mostrar o nome da variavel e/ou o seu rtulo e os valores reais dos dados e/ou seus rtulos. Figura XI-4: Janela de definio do ambiente guia OUTPUT LABELS

87

5. Guia Charts Nessa guia (ver figura XI-5), podemos alterar os padres da produo de grficos nointerativos. No quadro Chart Template, podemos especificar um template grfico que ser aplicado a todos os grficos feitos posteriormente. No quadro Chart Aspect Ratio, podemos especificar a razo, largura/altura, da moldura externa de novos grficos (especificando um valor entre 0,1 e 10). Por exemplo, o valor 1 produziria um grfico quadrado. No quadro Current Settings, atravs da opo Font podemos utilizar, nos grficos, todas as fontes que estiverem disponveis no Windows. Atravs da opo Frame, podemos definir se os grficos devem vir ou no com borda externa (Outer) e/ou com borda interna (Inner). Figura XI-5: Janela de definio do ambiente guia CHARTS

88

6. Guia Interactive As opes dessa guia (ver figura XI-6), lidam com os grficos interativos. No quadro ChartLook, podemos escolher o chartlook padro dos seus novos grficos interativos. No quadro Data Saved with Chart, podemos escolher se os dados sero salvos juntos com o grfico (primeira opo) ou no (segunda opo). Ao escolher uma das duas opes voc sempre dever levar em conta os recursos de memria e processamento do seu computador. No quadro Print Resolution, podemos escolher a resoluo de impresso. Na maioria dos casos, a opo Vector metafile ir imprimir mais rpido e com melhores resultados. Com relao s opes de bitmaps temos que grficos em resoluo mais baixa imprimem mais rpido, mas em resoluo mais alta imprimem melhor. No quadro Measurement Units, podemos escolher o sistema de medidas (pontos, polegadas ou centmetros) usado para especificar o tamanho de atributos como o tamanho da regio dos dados num grfico. No quadro Reading Pre-8.0 Data Files, podemos especificar o nmero mnimo de valores numa varivel numrica usado para classific-la como escalar ou categrica. Variveis com menos valores que o nmero especificado sero classificadas como categricas e o restante como escalar. Porm, qualquer varivel com rtulos definidos para valores ser classificada como categrica, independente do nmero de valores que ela assume. Figura XI-6: Janela de definio do ambiente guia INTERACTIVE

7. Guia Pivot Tables Nessa guia (ver figura XI-7), podemos controlar o formato de tabelas usado para as novas tabelas. No quadro TableLook, podemos escolher um dos tablelooks da lista ou podemos criar o nosso prprio na janela de edio de tabelas. No quadro Adjust Column Widths for, podemos controlar o ajuste automtico das larguras das colunas em tabelas. Marcando a opo Labels only, ajusta a largura da coluna de acordo com o rtulo da coluna e marcando Labels and data, ajusta de acordo com o que for maior, o rtulo da coluna ou o maior valor da coluna de dados. No quadro Default Editing Mode, especificamos onde uma tabela vai ser editada quando clicarmos duas vezes nela. Por exemplo, podemos escolher que quando clicarmos duas vezes numa 89

tabela, apenas as pequenas sero editadas dentro da janela de sadas, todas as outras sero editadas numa janela prpria. Figura XI-7: Janela de definio do ambiente guia PIVOT TABLES

8. Guia Data Nessa guia (ver figura XI-8), no quadro Tranformation and Merge Optios, voc determina se algumas transformaes de dados (Compute, Recode, etc) ou arquivos (adicionar variveis ou casos) sero calculados imediatamente (Calcule values immediately) ou apenas antes de serem usadas (Calculet values before used). A opo Calculet values before used usada geralmente quando se est trabalhando com arquivos muito grandes. No quadro Display Format for New Numeric Variables voc muda o padro da largura e nmero de casas decimais para as novas variveis numricas. Voc j deve ter notado que sempre que criamos uma varivel nova ela do tipo numrica com 8 dgitos, tendo 2 casa decimais. Esse padro pode ser alterado nesse quadro. No quadro Set Century Range for 2-Digit Years, voc escolhe como o SPSS ir interpretar um ano que for digitado com apenas dois algarismos. Figura XI-8: Janela de definio do ambiente guia DATA

90

9. Guia Currency Nessa guia (ver figura XI-9), voc pode criar at cinco tipos de formatos especiais de variveis que incluem caracteres de prefixo e/ou sufixo especiais e tratamento especial para valores negativos. Voc no pode mudar os nomes ou adicionar novos. Para modificar um formato especial, selecione o nome na lista do quadro Custom Output Formats e faa as mudanas desejadas. Figura XI-9: Janela de definio do ambiente guia CURRENCY

10. Guia Script Usa-se esta guia (ver figura XI-10), para especificar o arquivo de procedimento global e o arquivo de autoscript e selecionar as sub-rotinas de autoscript que se quer usar. Quadro Global Procedures: um arquivo de procedimentos global uma biblioteca de sub-rotinas e funes que podem ser chamadas por scrpts, incluindo autoscripts. No aconselhvel mudar esse arquivo (global.sbs), j que vrios scripts que vm com o SPSS usam funes e sub-rotinas desse arquivo e no iro funcionar se voc especificar outro arquivo de procedimentos global. Quadro Autoscripts: um arquivo de autoscripts uma coleo de sub-rotinas que rodam automaticamente toda vez que voc executar procedimentos que criem certos tipos de objetos na janela de sadas (por exemplo, grficos, tabelas cruzadas, etc).

91

Figura XI-10: Janela de definio do ambiente guia SCRIPTS

XII. Unio de Dois Banco de Dados


Muitas vezes queremos usar informaes, para realizao de uma anlise, que esto armazenadas em arquivos diferentes. O SPSS no consegue trabalhar com mais do que uma janela de dados aberta ao mesmo tempo. A alternativa usada pelo SPSS quando queremos trabalhar com mais de um arquivo de dados unir os arquivos. A condio essencial para que a unio possa ser efetuada que todos os arquivos estejam no formato do SPSS (.sav). Dessa maneira o arquivo resultante da unio conter toda a informao dos vrios grupos. O comando Merge Files, presente no menu Data, apresenta duas opes para unio: Add Cases, unio de linhas/casos e a opo Add Variables, unio de colunas/variveis. 1. Adicionando casos Essa opo adequada quando os dois arquivos que desejamos unir contm as mesmas variveis (ou pelo menos um grupo de variveis em comum) e diferentes casos. As variveis devem ser as mesmas, mas no necessariamente na mesma ordem. No nosso exemplo, temos um arquivo de dados com 12 casos (So Paulo, Rio de Janeiro e Bahia) que ser unido a um outro arquivo de dados que contm os mesmos dados da pesquisa, mas aplicados na cidade de Braslia, com 5 casos, resultando em um arquivo nico com 17 casos. Primeiro vamos abrir um dos arquivos, por exemplo, o de 12 casos. Em seguida devemos abrir o menu Data, escolher o comando Merge Files e depois a opo Add Cases, uma janela ser aberta (ver figura XII-1).

92

Figura XII-1: Comando Merge File Adicionando Casos

Agora devemos selecionar o nome do arquivo a ser unido e clicar em Abrir ou Open, uma nova janela ser aberta (ver figura XII-2). No quadro Variables in New Working Data File, esto listadas as variveis comuns aos dois arquivos (variveis pareadas). Como padro todas elas sero includas no novo arquivo que ser criado aps a unio. No quadro Unpaired Variables esto listadas as variveis que no so comuns aos dois arquivos (variveis no-pareadas). Nesse quadro as variveis do arquivo de trabalho (arquivo atual) so representadas por um (*) e as variveis do arquivo externo so representadas por (+). Veja a legenda no canto inferior esquerdo da janela: (*) = Working Data File (arquivo de trabalho) e (+) = C:\Curso SPSS\Cigarros_Brasilis.sav (arquivo externo). A princpio todas as variveis listadas nesse quadro no sero includas no novo arquivo. Pode-se incluir ou excluir qualquer varivel do novo arquivo, movendo-as entre as janelas. Para excluir elas devem ficar no quadro Unpaired, para incluir elas devem ficar no Variables in New Working Data File. Se quiser incluir uma mesma varivel com nomes diferentes nos dois arquivos (Ex.: estcivil e est_civil), selecione as duas varveis e use o boto Pair, assim as duas variveis iro passar para o quadro Variables in New Working Data File como uma s. No canto inferior direito da janela, podemos marcar a opo Indicate case source as variable, para incluir, no novo arquivo, uma varivel que receber o valor 0 quando o caso pertence ao arquivo ativo (veio de So Paulo, Bahia ou Rio de Janeiro) e 1, quando o caso pertence ao arquivo que est sendo unido (Braslia). O nome padro dessa varivel Source01, para mud-lo basta colocar o ponto de insero no quadro que contm o nome da varivel e digitar o novo nome. Tudo pronto, ento clique em OK. Figura XII-2: Janela de definio para unio de casos

93

O arquivo resultante foi um arquivo com as variveis comuns, mais a varivel, que s existia no arquivo externo. Nos casos em que ela no existia, ela foi transformada em missing de sistema.

importante ressaltar que quando queremos unir mais do que dois arquivos o procedimento idntico ao j descrito aqui. Unimos os dois primeiros arquivos, e depois, ao arquivo resultante, unimos o terceiro e assim por diante. Casos de mais de dois arquivos tambm podem ser unidos atravs da janela de sintaxe com o comando ADD FILES.

2. Adicionado Variveis Essa opo adequada quando os dois arquivos contm os mesmos casos (ou pelo menos parte deles em comum), mas no as mesmas variveis. O arquivo resultante ter as variveis provenientes dos dois arquivos. Nesse tipo de unio necessrio que os arquivos a serem unidos estejam no formato SPSS (.sav) e aconselhvel que contenham uma varivel chave. A varivel chave (Key Variable), aquela que identifica a correspondncia dos casos nos dois arquivos. Essa varivel deve ter o mesmo valor nos dois arquivos para casos equivalentes e o arquivo deve estar ordenado por essa varivel antes que a unio seja efetuada. Voc pode adicionar variveis sem usar uma varivel chave, porm para que o resultado da unio seja correto, os dois arquivos tero que conter os mesmos casos e exatamente na mesma ordem. No nosso exemplo, vamos unir os Cigarros.sav e Cores.sav. Esses arquivos tm uma varivel em comum nquest, que ser usada como varivel chave na unio. Os dois arquivos devem estar ordenados por esta varivel.

94

Casos do arquivo = Cigarros.sav


nquest nome 1 Milton Nascimento 2 Guilherme Arantes 3 Gilberto Gil 4 Caetano Veloso 5 Nana Caymmi 6 Gal Costa 7 Maria Betnia 8 Geraldo Azevedo 9 Adriana Calcanhoto 10 Zizi Possi 11 Marisa Monte 12 Marina anonasc 1.982 1.955 1.945 1.975 1.932 1.939 1.981 1.986 1.966 1.961 1.979 1.962 sexo estcivil fumante marca numcigar M 9 1 1 20 M 1 1 1 10 M 2 2 8 88 M 2 2 8 88 F 1 1 2 8 F 1 1 2 20 F 4 1 3 22 M 6 2 8 88 F 1 9 9 99 F 9 1 4 10 F 9 1 5 15 F 1 1 3 40

Casos do arquivo = Cores.sav


nquest 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 vermelho 1 2 1 2 1 1 1 2 1 2 1 2 1 1 1 azul 1 1 1 2 2 2 2 2 1 1 1 2 2 2 2 verde 1 1 2 2 2 2 1 1 2 2 2 2 2 2 1 amarelo 1 1 1 2 2 2 1 2 1 1 1 2 2 2 1

Devemos abrir um dos dois arquivos, por exemplo, cigarros.sav. Em seguida vamos abrir o menu Data, escolher o comando Merge Files e depois a opo Add Variables. Uma janela aberta (ver figura XII-3), e nela devemos selecionar o nome do arquivo a ser unido e depois clicar em Abrir ou Open. Figura XII-3: Comando Merge File Adicionando Variveis

O quadro New Working Data File, da nova janela aberta (ver figura XII-4), contm a lista de todas as variveis que faro parte do novo arquivo. Voc pode notar que ao lado de cada varivel existe um smbolo, esse smbolo usado para indicar a procedncia de cada uma das variveis (*) para o arquivo ativo e (+) para o arquivo que est sendo unido, como descrito na legenda que fica no canto esquerdo inferior dessa janela. Pode-se excluir qualquer varivel do arquivo final. Para isso basta mov-las para o quadro Excluded Variables. Caso tenhamos uma ou mais variveis chaves para a unio devemos marcar a opo Match cases on key variables in sorted files e especific-la(s) (no nosso caso nquest), movendo-a(s) para o quadro Key Variables. Quando usamos uma varivel chave, temos trs opes para a seleo dos casos que faro parte do arquivo resultante da unio: Both files provide cases: marque essa opo se voc deseja que os casos que aparecem no primeiro e no segundo arquivo sejam includos na unio. External file is keyed table(*): marque essa opo se voc deseja que s os casos que aparecem no primeiro arquivo faam parte da unio. 95


(*)

Working Data file is keyed table: marque essa opo se voc deseja que s os casos que aparecem no segundo arquivo faam parte da unio.

Keyed Table => contribui apenas com as variveis para o novo arquivo, os casos so ignorados Figura XII-4: Janela de definio para unio de variveis

Caso voc escolha Both files provides cases, voc pode marcar a opo Indicate case source as variable, que faz com que seja criada uma varivel no arquivo resultante contendo o valor 0 para os casos que s aparecem no primeiro arquivo e o valor 1 para os demais casos, inclusive para os que s aparecem no segundo arquivo. Agora basta clicar em OK para que o arquivo resultante da unio seja colocado na janela de dados (ver figura XII-5). Uma mensagem ser apresentada antes que a unio seja efetuada. Essa mensagem apenas alerta voc ao fato de que a unio vai falhar se os arquivos no estiverem ordenados pela varivel chave. Figura XII-5: Janela de dados com o arquivo resultante da unio

96

XIII. Mltipla Resposta


Todas as variveis do SPSS s podem assumir uma resposta, mas, s vezes, na pesquisa existem questes do tipo mltiplas, onde mais de uma resposta possvel. Vamos supor que na pesquisa em estudo, existisse a seguinte questo: 1) Quais so as suas cores preferidas? 1 - vermelho 2 - azul 3 - verde 4 - amarelo Vrias so as alternativas possveis, mas para efeitos da anlise, como cada varivel s pode assumir um valor vlido, teremos que considerar todas as opes de resposta como variveis. Nesse caso, o conjunto de variveis de mltipla resposta, ser do tipo dicotmica, podendo assumir apenas dois valores: resposta ou no resposta. No nosso exemplo, teremos quatro variveis (vermelho, azul, verde e amarelo) que assumem os seguintes valores: 1 - positivo (essa opo foi marcada) e 2 negativo (essa opo no foi marcada). Para criar uma varivel do tipo Multipla Resposta, basta entrar no menu Analyze, escolher o comando Multiple Response e clicar na opo Define Set, uma janela ser aberta (ver figura XIII1). Aqui se define o conjunto de variveis mltiplas (set), dando-se um nome para esta nova varivel, define-se tambm o valor que ser contado e o tipo de codificao dos dados (dicotmica ou em categoria). No nosso caso, teremos uma varivel cores, tipo dicotmica, cujos valores positivos (1) sero contados. Figura XIII-1: Janela de definio de variveis mltiplas dicotmicas

Aps definir o conjunto de variveis de mltipla resposta, s falta definir o procedimento estatstico desejado: Frequencies ou Crosstabs, presentes no prprio comando Multiple Response (ver figuras XIII-2 e XIII-3). No procedimento Frequencies, especifica-se as variveis mltiplas que sero tabuladas. 97

Figura XIII-2: Janela de Frequencies para variveis mltiplas

A tabela resultante gravada na janela de sadas, com o seguinte formato:

No procedimento Crosstabs, define-se qual ser a varivel de linha e qual a varivel de coluna. Figura XIII-3: Janela de Crosstabs para variveis mltiplas

98

Para Crosstabs entre variveis mltiplas e variveis no mltiplas, necessrio definir o intervalo de valores para a varivel no mltipla. Para isso, selecione a varivel e clique na opo Define Ranges. Na nova janela aberta (ver figura XIII-4) digitar o valor mnimo e o valor mximo que ela assume. No nosso exemplo, estamos cruzando a varivel estado civil (no mltipla), que assume o intervalo de valores entre 1 e 6 com a varivel $cores (mltipla). Figura XIII-4: Definido intervalo de valores para variveis no mltiplas

Pode-se tambm selecionar algumas opes inerentes ao procedimento Crosstabs.

Uma parte do relatrio de sada mostrado na tela abaixo:

O mtodo de mltiplas categorias uma outra forma de codificar uma varivel de mltipla resposta, alm da dicotmica vista acima. Nesse caso, repete-se a questo, com todas as suas alternativas, n vezes. Esse n estimado pelo usurio e o nmero mximo de possveis respostas para a questo. 99

No nosso exemplo, poderamos acreditar que no mximo duas cores foram marcadas como opes de preferncia, ento, ao invs de termos quatro variveis, poderamos definir apenas duas, com quatro alternativas em cada. Teramos as variveis cor1 e cor2 com as seguintes alternativas: 1 = vermelho, 2 = azul, 3 = verde e 4 = amarelo. A definio do SET (conjunto) semelhante ao visto no modelo acima, mas a opo selecionada passa a ser Categories, com intervalo de 1 a 4 (ver figura XIII-5). Figura XIII-5: Janela de definio de variveis mltiplas categricas

Escolhe-se novamente o procedimento estatstico desejado: Frequencies ou Crosstabs. Abaixo temos o exemplo do relatrio de sada da frequncia. Observe que nesse caso a varivel assume os rtulos dos valores das variveis originais Cor1 e Cor2.

100

XIV. Grficos A maneira com que a informao apresentada nos grficos permite uma interpretao mais fcil e intuitiva dos dados. Isso faz com que eles sejam uma ferramenta muito importante para a anlise exploratria dos dados. Existem vrios tipos de grficos disponveis no SPSS, e muitos deles esto disponveis em dois formatos: Grficos No-Interativos (grfico padro criado a partir do menu Graphs ou atravs dos procedimentos estatsticos) e Grficos Interativos (grfico criado a partir do comando Interactive do menu Graphs e atravs das tabelas no output (janela de sadas)). As principais diferenas entre os dois tipos de grficos so as opes para edio. 1. Grficos No-Interativos Como j foi mencionado, no menu Graphs que encontramos todos os tipos de grficos gerados pelo SPSS. A deciso sobre qual grfico utilizar depende do tipo de variveis e da informao que se quer obter sobre elas. Devemos ter alguns cuidados para no produzir grficos que no trazem informao relevante ao nosso estudo, como por exemplo, um grfico de barras (Bar) para uma varivel que contenha o valor da altura das pessoas. Grfico de Pizza Para se obter um grfico de Pizza, seleciona-se o comando Pie do menu Graphs. Vamos criar um grfico de pizza para a marca de cigarro de preferncia do entrevistado (varivel Marca). Devemos decidir entre as trs opes que so apresentadas na tela abaixo:

Summaries for groups of cases as categorias de uma mesma varivel so apresentadas em forma de pedaos de uma pizza; o tamanho de cada pedao determinado por uma funo escolhida. Summaries of separate variables vrias variveis so usadas; cada pedao da pizza representar uma varivel diferente. Values of individual cases uma nica varivel usada; cada pedao da pizza representa o valor dos casos individuais da varivel escolhida.

101

Depois de escolhida a opo a ser usada, no nosso exemplo, a primeira, basta clicar na opo Define e uma janela de definio do grfico aberta.

Devemos mover para o quadro Define Slices by a varivel cujas categorias definiro os pedaos da pizza, no nosso caso Marca. A largura de cada pedao determinada pela funo escolhida no quadro Slices Represent, como o nmero de casos em cada categoria (N of Cases) ou o percentual de casos em cada categoria (% of Cases). Em Other summary function uma outra varivel pode ser usada e o tamanho de cada pedao ser definido pelo valor que a funo resumo escolhida assumir na referida categoria. Esto disponveis funes como mdia, varincia, valor mnimo, entre outras. Alm disso, pode-se tambm atribuir um ttulo atravs da opo Titles ou escolher como os valores ausentes sero tratados atravs da opo Options. Depois de clicar em OK, o grfico ser apresentado na janela de sadas.

102

Ao clicarmos duas vezes sobre o grfico, a janela Chart Editor aberta. Nessa janela uma nova barra de ferramentas e de menus apresentada permitindo a edio do grfico. Para adicionar um ttulo ao grfico, escolhe-se a opo Add Chart Element Text box do menu Chart. Ele cria uma caixa, onde se digita o ttulo desejado. Para esconder/mostrar a legenda do grfico devemos entrar no menu Chart e escolher o comando Hide Legend. Para destacar um ou mais pedaos do grfico, voc pode explodi-lo. Para isso, basta selecionar o pedao desejado e clicar no cone da barra de ferramentas ou entrar no menu Chart escolher o comando Explode Slice. Pode-se omitir pedaos da pizza, sem que seja necessrio redefini-lo. No menu Edit escolhemos o comando Properties. No quadro Order da guia Categories, aparecem todas as categorias que so mostradas no grfico. Para omitir alguma dessas categorias basta selecionar a para mov-la para o quadro Excluded. Nessa janela categoria desejada e clicar no boto tambm possvel alterar a ordem das categorias, bastando para isso clicar na categoria escolhida e em seguida clicar em uma das setas, direcionando a categoria para cima ou para baixo. Depois clique em Apply ou Close.

Na guia Chart Size podemos modificar o tamanho do grfico. Na guia Fill & Border podemos alterar o padro das bordas e do fundo do grfico, Na guia Depth Angle podemos alterar a rotao, efeito e posicionamento das categorias do grfico. Na guia Data Value Labels podemos mostrar/alterar os rtulos das categorias, o percentual ou os valores que originaram cada pedao.

103

Aps as alteraes acima, o grfico ficou da seguinte forma:

Grfico de Barras Para criar um grfico de barras, selecione o comando Bar do menu Graphs. A opo Simple envolve apenas uma varivel e a opo Clustered envolve mais de uma varivel. Nesse caso a informao obtida no grfico (se as barras representarem o nmero de casos) equivalente obtida a partir de uma tabela de dupla entrada. O quadro Data in Chart Are apresenta as mesmas opes vistas no grfico de Pizza.

Aps clicar no boto Define, a janela de definio do grfico de barras aparece, onde se definem os ttulos, as opes com os valores ausentes e quais as variveis que iro compor o grfico. Para isso dois quadros foram reservados: Category Axis - a varivel escolhida definir as categorias presentes no eixo horizontal do grfico. Define Cluster by - as categorias da varivel escolhida determinaro o nmero de barras que sero apresentadas para cada categoria da varivel usada como Category Axis. Cada uma das barras definidas pelas categorias dessa varivel receber uma cor diferente. No nosso exemplo, usaremos a varivel sexo como Category Axis e cidade como varivel de definio de Cluster. 104

Aps todas as definies, basta clicar em OK e o SPSS desenha o grfico na janela de sadas. Para edit-lo, basta clicar duas vezes sobre ele.

Alterando o grfico Para modificar a cor de algum objeto, como o fundo do grfico, uma barra especfica, todas as barras, etc, selecione-o e clique no cone de cor - Fill Color presente na janela do editor de grficos. Essa mesma mudana de cor e outras alteraes, como tamanho do grfico, ordem das barras, etc. podem ser feitas no menu Edit-Properties.

105

Templates grficos Como vimos anteriormente a produo de grficos no SPSS feita de maneira muito simples atravs do menu Graphs. Escolhemos, dentre as muitas opes, o tipo de grfico adequado e especificamos a(s) varivel(eis) juntamente com o tipo de resumo desejado. Vamos supor que desejamos produzir uma srie de grficos similares. Algumas caractersticas como ttulo, subttulo, tipo de letra, cor e padro podem ser aplicados a vrios grficos ao mesmo tempo, sem a necessidade de especific-las novamente para cada um dos grficos separadamente. Isso pode ser feito no SPSS atravs da criao de Templates Grficos. A construo de um Template Grfico se baseia em trs idias muito simples: 1. O template ele prprio um grfico e armazenado nesse formato, portanto muito simples criar e modific-lo. 2. Apenas os aspectos relevantes do template so aplicados ao grfico alvo, por exemplo, um ttulo pode ser aplicado a qualquer grfico, mas o efeito 3D s vale para o grfico de Barras. 3. Um template grfico no ir modificar uma caracterstica definida explicitamente no grfico alvo, por exemplo, um ttulo no template no ir substituir o ttulo definido na janela de definio do grfico alvo. Para construir um template grfico, basta editar um grfico e salv-lo com template grfico, escolhendo o comando Save Chart Template do menu File da janela de edio de grficos (Chart Editor), o SPSS abrir uma janela para voc escolher quais as propriedades voc gostaria de salvar no seu template grfico. Aps escolher as propriedades basta clicar em Continue, escolher o nome do seu template e o diretrio que ele ser salvo e em seguida clicar em OK. O arquivo salvo ter a terminao .sgt.

106

Quando voc for utilizar um template, voc ter trs opes para aplic-lo no seu grfico: 1. Na janela de criao do grfico (janela Define: menu Graphs + grfico a ser criado), marcar a opo Use chart specifications from, clicar em File e escolher algum arquivo de template grfico. 2. Na janela de edio do grfico (Chart Editor), escolher a opo Apply Chart Template do menu File, escolher algum arquivo de template grfico e clicar em Open. 3. Defini-lo como padro no menu Edit, comando Options, opo Chart. Observao: Os templates grficos criados em verses anteriores verso 12 do SPSS no funcionaro na verso atual. Voc dever criar um novo template. Os templates antigos possuem a extenso .sct e os atuais a extenso .sqt.

2. Grficos Interativos Um grfico interativo dinmico, pode-se mudar alm de sua aparncia, a designao das variveis que esto sendo utilizadas no grfico. As variveis podem ser movidas entre eixos, legendas e painis. As mudanas so evidentes na janela de sadas to logo as novas designaes so feitas. Os grficos interativos podem mudar de 2D para 3D ou vice-versa com alguns cliques do 107

mouse. Arrastar objetos e clicar com o boto direito do mouse so tarefas para a fcil manipulao dos grficos. Neste captulo veremos com criar um grfico de barras interativo e logo a seguir vamos edit-lo. Fica a cargo do leitor verificar os outros tipos de grficos, embora todas as noes bsicas para criar e editar um grfico interativo sero vistas aqui. Clique no menu Graphs e escolha o comando Interactive e depois a opo Bar. Na janela aberta, escolhe-se as opes iniciais do grfico.

Primeiro vamos entender os smbolos que representam as variveis na lista que aparece na parte esquerda da janela:

Tipo
Escalar Categrica Especial Especial criada pelo usurio

cone

Descrio
Representa as variveis definidas como escalares no banco de dados. Representa as variveis definidas como Nominais ou ordinais (categricas) no banco de dados. Representam designaes especiais como frequncias, percentuais e casos. Representam combinaes de variveis, criadas pelo usurio. Apenas variveis do mesmo tipo podem ser combinadas entre si.

Voc pode mudar a maneira como uma varivel tratada no grfico, ou seja, passar de categrica para escalar ou vice-versa, clicando com o boto direito do mouse na lista de variveis e escolher Scale ou Categorical. Essa mudana vale apenas para o grfico e no ser refletida no banco de dados. Na guia Assign Variables, da janela de definio de um grfico de barras interativo, temos as seguintes opes: Nmero de dimenses (canto superior direito) - pode-se ter trs opes: 2D Coordinate (especifica que o grfico ter duas dimenses), 3D Coordinate (especifica que o grfico ter duas dimenses) e 3D Effect (cria grfico com duas dimenses, mas, com efeito 3D). 108

Orientao - caso o nmero de dimenses seja dois e sem efeito 3D, o grfico pode ter orientao vertical ( ) ou horizontal ( ). Eixo Y - arrasta-se uma varivel da lista esquerda para preencher o espao do eixo Y. No caso do grfico de barras, ele preenche automaticamente esse espao com a varivel especial Count, ou seja, as barras representaro as frequncias das variveis especificadas. Mas, pode-se mudar para a varivel especial Percent ou para uma varivel escalar (nesse caso a barra representaria uma funo dessa varivel, como mdia, mediana, desvio-padro, etc) ou uma varivel categrica (mas a nica funo disponvel seria a moda) Eixo X - pode-se arrastar qualquer varivel escalar, categrica ou a varivel especial Case (onde cada barra representaria um caso). Legend Variables Color e Style - se for especificado uma varivel categrica, o grfico ser dividido pelas categorias dessa varivel. As cores ou estilos sero designados de acordo com as categorias. Por exemplo, se Sexo for designado como Legend Variable Color, ento as barras para masculino e feminino sero de cores diferentes. Style far com que os estilos sejam diferentes. Caso se coloque uma varivel escalar (vlido apenas para Color), voc ter no grfico cores aplicadas s barras de acordo com algum valor resumo (como por exemplo, a mdia) dessa varivel. Ao lado das especificaes das variveis, voc escolhe como ficaro as barras: lado a lado (Clustered) ou empilhadas (Stack). Panel Variables - dividem o grfico em pequenos painis, cada um representando um diferente grupo de casos. Apenas variveis categricas podem ser escolhidas aqui. Na guia Bars Charts Option existem as seguintes opes: Bar Shape - exibe as barras como retngulos, pirmides ou monumentos. Para barras 3-D ou Efeito 3-D, a forma da base pode ser circular (Circulat base) ou quadrada (Square base). Bar Labels - exibe rtulos nas barras mostrando as frequncias (Count nmero de casos em cada barra) ou o valor representado pelo comprimento da barra (Value); Bar Baseline - ajusta a localizao da linha de onde as barras iro comear.

109

No entraremos na guia Errors Bars porque s pode incluir o intervalo de confiana para a mdia ou um intervalo baseado num nmero de desvio-padro quando a varivel do eixo Y escalar e as barras (ou linhas caso o grfico fosse de linhas) representam a mdia dessa varivel. Nessa ficha voc poderia modificar o nvel do intervalo de confiana/nmero de desvios-padro, a direo e a forma, assim como a aparncia das barras de erros. Como especificamos que as barras representam frequncias, ento essa opo no faz sentido para o nosso exemplo e passamos assim para a guia ficha. Na guia Titles escolhe-se um ttulo, um subttulo e uma legenda para o grfico. Mais adiante, editando o grfico, voc poder mudar as fontes, posies, estilos, etc, desses elementos.

Na guia Options, no quadro Categorical Order voc pode especificar a ordem das barras, no seu grfico, de acordo com o critrio desejado. Por exemplo, podemos ordenar as categorias do estado civil de acordo com as frequncias de suas categorias. Para isso, escolha estado civil em Variable e a opo Count em Order by (voc pode, inclusive, ordenar de acordo com alguma funo de uma outra varivel). No quadro Sort, voc escolhe como ser a ordenao (crescente ou decrescente) e se categorias vazias da varivel sero exibidas ou no (Exclude empty categories). No quadro Scale Range, voc pode definir para cada varivel qual o valor mximo e mnimo da escala ou deixar o SPSS calcul-los para voc (Auto). No quadro Chart Look voc escolhe um chartlook a ser aplicado ao seu grfico. Um Chart Look controla as propriedades visuais iniciais do grfico, como cores, smbolos, texturas, etc (semelhante ao que um tablelook faz com uma tabela). No quadro Axes, determinados o tamanho do grfico ajustando cada eixo (podermos modificar esse tamanho depois, editando o grfico).

110

Agora basta clicar em OK, para produzir o grfico e exibi-lo na janela de sadas.

Depois do grfico pronto, podemos edit-lo, modificando inclusive as variveis e estatsticas apresentadas, afinal por isso que ele interativo. Editando o grfico Para editar um grfico interativo basta clicar duas vezes sobre o grfico. Aparecero acima e ao lado do grfico, duas barras de ferramentas que permitiro essa edio. Vamos comear com o Chart Manager ou gerenciador de grfico, que uma das ferramentas mais importantes, clicando no cone . Nesse gerenciador tem-se todos os componentes do grfico numa lista onde podemos escolher, esconder, mostrar, editar ou apag-los.

111

Tem-se os seguintes componentes: Plot Area - contm a regio do grfico em geral, os eixos da varivel categrica e da varivel escalar. Text - todos os textos adicionais, como o ttulo. Legend - pode-se controlar as variveis que definem a legenda (no exemplo, sexo) Elements - controla-se os elementos do grfico (no exemplo, as barras). Nessa janela controla-se os componentes do grfico em geral. Se quisermos mudar a textura ou a cor de uma barra em particular (e no de todas as barras), deve-se clicar, com o boto direito do mouse, na respectiva barra. Primeiro vamos mudar o fundo do grfico clicando em Chart e depois Edit. Veja a janela abaixo.

No quadro Data Region Fill podemos escolher um novo estilo e/ou uma nova cor para o fundo da regio dos dados. No quadro Size podemos modificar o tamanho do grfico. Essa rea (grficos em 2D) ou volume (grficos em 3D) no inclui rtulos de eixos ou ttulos (ou seja, o tamanho desses textos no ser modificado). Se a opo Maintain aspect ratio estiver marcada, a modificao da altura, largura ou comprimento automaticamente far com que os outros dois sejam modificados para que a razo seja mantida. No quadro Axis Labels e Axis Titles (opo disponvel 112

apenas em grfico 3D), escolhe-se a posio dos rtulos e ttulos dos eixos: na frente do grfico ou no mesmo plano dos eixos. Aps escolher suas edies clique em OK. Clicando em Categorical Axis e no boto Edit, uma nova janela ser aberta (ver figura abaixo), onde na guia Categories, temos as opes para modificar quais as categorias exibidas e sua ordenao. Na guia Appearance, temos as opes para modificar a aparncia do eixo. Na guia Labels, temos as opes para mudar a orientao e frequncia dos rtulos. Na guia Title, podemos escolher entre mostrar ou no o ttulo do eixo e sua orientao. Na guia Grid Lines, podemos escolher entre mostrar ou no as linhas de grade, como tambm modificar as suas configuraes e na guia Reference Lines, temos as opes para incluso e edio de linhas de referncia.

Clicando-se em Scale Axis e depois no boto Edit, temos opes para modificar a escala, a aparncia do eixo, orientao, formato e frequncia dos rtulos, mostrar ou no o ttulo do eixo e sua orientao, etc.

Clicando na opo Color Legend e depois no boto Edit, podemos escolher a cor das barras associadas ao sexo masculino e feminino; no possvel alterar a cor de apenas uma barra, j que uma varivel est sendo usada como legenda para as cores. Em grficos onde no h esse tipo de elo voc pode mudar as cores de cada uma das barras livremente. Nas outras guias desse quadro, temos as opes para mostrar ou no o ttulo da legenda e sua orientao (Title), o formato da exibio dos itens dentro da legenda (Options) e quais as categorias da varivel (no nosso caso, sexo) sero exibidas e sua ordenao no grfico (Categories). 113

Selecionando a opo Bars e clicando no boto Edit, podemos, no quadro Bar Shape, da guia Bar Options, modificar os aspectos de todas as barras como a forma e base. No quadro Bar Labels podemos modificar os rtulos. No quadro Bar Border, podemos modificar as bordas e no quadro Bar Fill, podemos modificar as cores e estilos de preenchimento. possvel tambm escolher a largura das barras. Na guia Summary Function, podemos mudar a funo representada pelas barras (caso voc tenha alguma varivel escalar no eixo Y) e na guia Bar Width, podemos escolher a largura e profundidade (grfico em 3-D) das barras.

114

Aps algumas modificaes, o grfico ficou da seguinte forma:

Como nosso grfico interativo, podemos mudar as variveis que o definem, porm nem sempre isso possvel. A seguir veremos os diferentes estados que um grfico interativo pode ter em relao mudana das variveis. Grficos interativos, interativos desvinculados e estticos Um grfico interativo tem acesso s variveis usadas para cri-lo. Usando a caixa de dilogo Assign Graph Variables, voc pode modificar as variveis designadas sempre que o grfico for ativado. Porm: Se o arquivo usado para criar o grfico ainda est aberto e nada foi modificado na janela de dados desde que o grfico foi criado, ele rotulado como Interactive (interativo) na barra de status da janela de sadas, e voc pode mudar qualquer elemento do grfico, usando todas as variveis disponveis no banco de dados ativo. Estes grficos usam o editor de grficos interativo. Se a opo Save data with the chart foi selecionada na guia Interactive do menu Edit, comando Otions e se o arquivo foi modificado ou um novo arquivo de dados foi aberto, o grfico desvinculado do arquivo e rotulado como Interactive (detached), ou seja, interativo desvinculado, na barra de status da janela de sadas. Para um grfico desvinculado, voc ainda pode mudar as variveis, entretanto, apenas variveis usadas enquanto o grfico estava ativamente conectado ao arquivo de dados estaro disponveis agora. A caixa de dilogo Assign Graph Variables ir conter uma mensagem sobre as variveis disponveis. Um grfico interativo se torna esttico se a opo Save only summarized data selecionada na guia Interactive, do menu Edit, comando Otions Num grfico esttico (rotulado como Static na barra de status da janela de sadas), apenas os dados resumidos so salvos, e voc no pode mudar variveis, embora voc possa mudar atributos como cor, preenchimento, tamanho dos smbolos, etc. Voc pode tornar um grfico interativo em esttico clicando com o boto direito do mouse e selecionando o comando Save only summarized data do menu que ir aparecer. Um grfico esttico no ser transformado em interativo. 115

Alterando as variveis que compem o grfico Se o grfico for interativo ou interativo desvinculado, poderemos modificar as variveis e funes que o compem utilizando a caixa de dilogo de controle de variveis do grfico (Assign Graph Variables). Para acessar essa caixa de dilogo basta clicar no cone e a janela aberta praticamente idntica quela usada para construir o grfico original, ou seja, voc j sabe como preench-la.

No grfico abaixo, transformamos o grfico em 2D, colocamos a varivel sexo como divisor em painis (Panel Variables) e acrescentamos a varivel cidade como legenda por cores.

No grfico abaixo, a varivel estado civil foi usada como legenda mudando estilo (e no cores) e a varivel idade foi colocada no eixo Y (representando a mdia).

116

Esses so s dois exemplos de como voc pode mudar seu grfico interativo completamente. Porm, no s. Voc pode incluir novos elementos ao grfico, como por exemplo, um diagrama de disperso ou boxplots, clicando no cone (chamado Insert Element). As opes disponveis aprecem na figura abaixo.

117

Meu Primeiro Grfico Interativo!

Selees e edies individuais Todas as edies que vimos at agora foram feitas em grupos de elementos. Por exemplo: todas as barras, os eixos, a regio dos dados, etc. Porm, pode ser que voc queira mudar algum elemento em particular como, por exemplo, apenas uma barra. Para isso, cria-se um grfico, depois clica duas vezes sobre ele para entrar na janela de edio, escolha o(s) elemento(s) que voc queira editar e clique com o boto direito do mouse sobre ele(s). Vrias opes iro aparecer. Para selecionar apenas a barra que voc escolheu, clique na opo Select Bar. Para selecionar todos os elementos (barras, pontos linhas, etc) do grfico, ligados ao estado civil representado pela barra, clique na opo Select This estcivil (esta opo seria til tambm se voc tivesse mais variveis, pois, com ela voc poderia selecionar o grupo de barras desse estado civil). Para selecionar todas as barras de uma vez clique na opo Select All Bars. Clicando na opo Bars, abre-se a janela do gerenciador do grfico para edio de todas as barras (no importando quantas ou quais voc selecionou). Porm clicando na opo Properties voc ter opes para edio apenas da(s) barra(s) selecionada(s).

O procedimento de clicar com o boto direito do mouse muito importante para a edio de um grfico interativo, especialmente quando o grfico tem muitos elementos e/ou voc deseja editar 118

um ou mais itens especficos e no todos de uma vez. Alm disso, para realizar edies em objetos especficos do seu grfico, voc pode simplesmente selecion-los e usar os cones em torno do grfico. Chart Properties e chartlooks J vimos anteriormente a utilizao de templates grficos para facilitar a edio dos grficos no-interativos. De maneira semelhante, os grficos interativos usam duas ferramentas poderosas para a automatizao da edio de suas caractersticas: Chart Properties e Chartlooks. Voc pode escolher as propriedades dos grficos interativos na opo Chart Properties do menu Format e salvar suas escolhas num Chartlook. Usando as opes dessa caixa de dilogo, pode-se ajustar: A sequencia de cores para uma legenda categrica ou faixa de cores para uma legenda escalar (guia Colors). A sequencia de preenchimentos, smbolos e linhas para legendas categricas (guia Styles). Tamanhos de smbolos e linhas para legendas categricas e escalares (guia Sizes). Propriedades de texto para objetos como ttulos e rtulos (guia Text). Preenchimento e bordas para objetos grficos como barras e pedas de pizza (guia Filled Objects). A aparncia dos eixos e marcadores ao longo dos eixos (guia Axes). Propriedades de linhas, smbolos e conectores (guia Lines & Symbols). Propriedades das linhas de grade para os eixos X, Y, Z (Grid Lines). Tudo que se modificar poder ser salvo como um chartlook. Para salvar ou aplicar seu formato (ou algum j pronto), abra o menu Format e clique no comando Chartlooks.

Nessa janela, podemos: Salvar seu formato clicando em Save As. Editar qualquer formato existente clicando em Edit Look. Aplicar algum formato existente escolhendo da lista de chartlooks esquerda da janela (que mostra os formatos do diretrio padro de charlotlooks) ou clicando em Browse para procurar em outro diretrio e depois clicar em Apply para aplic-lo.

119

Colocando mais de uma varivel nos eixos Voc deve ter percebido que h espao, na janela de definio de um grfico interativo, para apenas uma varivel em cada eixo. Porm, a partir da verso 9.0, o SPSS permite mais de uma varivel. Nas verses anteriores a 9.0, essa opo j existia apenas para os grficos no-interativos. Inicialmente suponha que queiramos mostrar no mesmo grfico, a mdia das variveis nmero de cigarros (numcigar) e idade (idade). No menu Graphs, escolhemos o comando Interactive e a opo Bar. Agora devemos selecionar as duas variveis ao mesmo tempo, para isso, selecione uma das variveis, aperte e mantenha pressionada a tecla CTRL e selecione a segunda varivel. Agora, clique com o boto direito do mouse e escolha a ltima opo da lista aberta Combine. Na janela aberta (ver figura abaixo), devemos especificar os rtulos que sero dados s duas novas variveis especiais que aparecero na lista. A primeira delas representa os valores usados nos clculos e a segunda representa uma nova varivel categrica, onde cada varivel passa a varivel passa a ser categoria. Vamos escolher nossos rtulos e clicar em OK.

Preencheremos agora a janela de definies do grfico (ver figura abaixo). Escolha a varivel especial variveis medidas em quantidade no eixo X e valores no eixo Y. Abaixo podemos escolher a estatstica calculada para nossas variveis. Porm como estamos interessados na mdia, no h necessidade de modifica-la.

120

Veja, na figura abaixo, o grfico resultante.

121

XV. Alguns Tipos de Arquivos Importantes


Tipos de arquivos indicados por sua extenso .clo - Arquivo de ChartLook do SPSS (grficos no interativos) .html- Do ingls hyperttext markup language, linguagem usada na Internet .jpg - Tipo de arquivo grfico (figura) .mdb - Banco de dadosa do Access .sav - Arquivo de dados do SPSS .sbs - Arquivo de script em SaxBasic do SPSS .sct - Template grfico do SPSS (at a verso 11.5.1) .sgt - Template grfico do SPSS (a partir da verso 12.0) .spo - Arquivo de sadas do SPSS .spq - Consulta a banco de dados criada no SPSS .sps - Arquivo de sintaxe do SPSS .tlo - Arquivo de TableLook do SPSS .tpf - Formato pr-definido para leitura de arquivos texto usado pelo Wizard do SPSS .txt .xls .rtf - Arquivo texto padro - Arquivo do Excel - Arquivo texto

Bibliografia
SPSS Base 12.0 - Users Guide SPSS verso 9.0 SPSS Mdulo Base - Tcnicas Bsicas e Avanadas - Volume I e II

122

Potrebbero piacerti anche