Sei sulla pagina 1di 108

Noes de Epidemiologia e Bioestatstica aplicada

Tpicos: a Natureza da Estatstica; Medicina: Cincia e Arte .

Medicina: Cincia e Arte


A prtica da Medicina uma complexa combinao de Cincia e Arte. Esta uma profisso que engloba a Cincia Biomdica em estreita relao com atributos pessoais, humansticos e profissionais.

A grande evoluo da Medicina nos ltimos sculos, e a continuidade deste processo de constante melhoramento da Medicina virada para a pessoa doente e, cada vez mais, da Medicina virada para a pessoa saudvel, esto diretamente relacionados com os avanos da Cincia Biomdica. Esta um elemento fundamental para a compreenso da doena; o estudo da sua distribuio e dos fatores que com ela esto relacionados; o estabelecimento do diagnstico; a avaliao e utilizao de novos tratamentos e medidas preventivas; a predio da evoluo da doena; a aplicao de novas tecnologias na prtica clnica; entre muitos outros aspectos. O mdico, hoje em dia, est num constante processo de aprendizagem e atualizao que o obriga a ter uma forte base de conhecimentos de e sobre a Cincia. Esta base deve-lhe permitir, no s, adquirir, avaliar e criticar o novo conhecimento, mas tambm, encontrar maneiras de o aplicar aos seus doentes. Apesar disto, a Medicina vai muito alm da Cincia Biomdica. Estabelecer uma Relao Mdico-Doente (baseada na compreenso, confiana e disponibilidade); compreender o indivduo em toda a sua dimenso (o indivduo como unidade biopsico-socio-cultural); ter a capacidade de extrair a informao til de um emaranhado de sinais, sintomas e resultados de exames auxiliares de diagnstico; tomar decises em relao ao tratamento e fazer avaliaes de risco-benefcio, tendo em conta a realidade individual de cada doente so questes que ultrapassam largamente o mbito da Cincia Biomdica e que fazem parte do diaa-dia de um mdico. esta combinao de conhecimento, intuio, sensibilidade, compreenso e capacidade de deciso que define a Arte da Medicina e to ou mais importante quanto uma forte base cientfica.

O Mtodo Cientfico Tendo em conta o papel fundamental da Cincia na Medicina torna-se indispensvel, ao aluno de Medicina, estar familiarizado com o Mtodo Cientfico.

Pgina 1 de 108

Este conhecimento essencial ao desenvolvimento de uma atitude crtica na avaliao da cincia tal como lhe apresentada.

O termo "Mtodo" refere-se a um processo ordenado e padronizado de execuo de uma determinada atividade e, no presente contexto, implica um conjunto de regras que especificam o modo como o conhecimento deve ser adquirido e apresentado e o modo de avaliao da verdade ou falsidade do mesmo.

Antes de iniciar a discusso sobre o Mtodo Cientfico ser til, a ttulo de contraste, descrever sumariamente outros mtodos de conhecimento usados em Medicina: 1. Autoridade: de acordo com este mtodo, o conhecimento considerado verdadeiro tendo em conta a tradio e/ou a opinio de clnicos distintos e experientes. Este um mtodo muito usado e til, por exemplo, durante o perodo de aprendizagem de um Mdico. Tem, no entanto, inmeros problemas. baseado em opinies pessoais e, muitas vezes, subjetiva; no tem em conta as posies de outros profissionais distintos e experientes que podem, mesmo, ser contraditrias; resguarda-se, muitas vezes, na tradio sem ter em conta a evidncia emprica e objetiva. 2. Racionalismo: a razo e a lgica so usadas para avaliar a verdade do conhecimento. Claramente, a limitao da lgica formal que s funciona na prtica se tivermos os meios para estabelecer a verdade factual das premissas de onde o raciocnio parte. evidente que a lgica e a matemtica so fundamentais cincia, no entanto, para alm destas, necessrio uma forte base de evidncia emprica, no sendo suficiente o simples raciocnio lgico. 3. Intuio: o conhecimento surge, por vezes, atravs de um sbito e inesperado "insight", na ausncia de raciocnio consciente. A verdade julgada pela claridade da experincia e pelo seu contedo emocional (a experincia da "Eureka!"). Lamentavelmente, mesmo as mais fortes intuies podem revelar-se falsas quando postas perante a prova emprica. A intuio , por vezes, um momento de grande brilhantismo mas um mtodo muito pouco fivel a longo prazo. Autoridade, lgica e intuio tm todos o seu devido lugar na prtica mdica, porm, o Mtodo Cientfico tem grandes vantagens sobre eles. De um modo geral, o mtodo cientfico contrasta com esses outros mtodos pela nfase que d necessidade da evidncia emprica.

Pgina 2 de 108

O Mtodo Cientfico e a viso positivista O mtodo Cientfico evoluiu ao longo de vrios sculos, concomitantemente com o crescimento da prpria investigao cientfica. As origens da Moderna Cincia Ocidental remontam Europa do sculo XVI, um tempo marcado por profundas mudanas sociais, econmicas e culturais. Essas mudanas permitiram, ento, que filsofos como Descartes e Francis Bacon desafiassem os dogmas do pensamento medieval, e que cientistas como Galileu, Newton e Harvey propusessem novos modelos e teorias de explicao do real. Os mtodos utilizados por esses pensadores e cientistas tinham trs idias elementares que constituem a base do Mtodo Cientfico. O cepticismo, isto , a noo de que qualquer proposio ou afirmao, mesmo quando proferida por grandes autoridades, est sujeita dvida e anlise; O determinismo, ou seja, a noo de que a realidade est dependente de leis e causas regulares e constantes e no dos caprichos ou desejos dos "demnios" ou "bruxas"; e o empirismo segundo o qual a investigao cientfica deve ser conduzida pela observao e verificao atravs da experincia.

A induo uma outra noo chave, provavelmente a mais importante e controversa, do Mtodo Cientfico e ser focada mais adiante.O indutivismo , geralmente, atribudo a Francis Bacon (no seu livro Novum Organum de 1620), apesar de haver, antes deste, outros filsofos que se aproximam dessa idia. O Mtodo Cientfico est representado de modo simplificado e esquemtico na figura 1.

Observao, descrio e medio:

Pgina 3 de 108

A descrio dos fenmenos naturais, envolvendo o registo preciso e vlido de observaes sobre pessoas, objetos ou acontecimentos, constitui a base emprica de todos os ramos da Cincia. As observaes podem ser na forma de descries nominais ou conjuntos de medies. As percepes pessoais e subjetiva tm que dar lugar s formulaes descritivas e medies que possam ser entendidas e replicadas por outros investigadores. Muitos dos avanos da Cincia, ao longo dos ltimos sculos, devem-se diretamente ao desenvolvimento de instrumentos de auxlio observao cada vez mais potentes. No deve ser esquecido, no entanto, que o uso de instrumentao complexa no indispensvel realizao de observaes cientficas. As caractersticas essenciais para uma observao poder ser considerada cientfica so a preciso, validade e reprodutibilidade. As observaes, quando adequadamente sintetizadas e confirmadas por outros, constituem a base factual, emprica, do conhecimento cientfico. Generalizao e Induo:

Afirmaes e medies representando observaes so integradas em sistemas interpretativos designados Hipteses e Teorias. A lgica subjacente generalizao inerente ao mtodo cientfico designada Induo. A induo permite o estabelecimento de proposies gerais sobre uma classe de fenmenos com base na anlise de um nmero limitado de observaes de elementos selecionados. Por exemplo, tendo verificado que a penicilina til na cura da pneumonia num nmero limitado de doentes, prope-se a generalizao - "A administrao de penicilina cura a pneumonia (em todos os doentes)". Hipteses: A proposio "A administrao de penicilina cura a pneumonia" uma hiptese. Hipteses cientficas so proposies que especificam a natureza da relao entre dois ou mais conjuntos de observaes. No exemplo exposto, o primeiro conjunto de observaes relaciona-se com a administrao de penicilina, e o segundo, relaciona-se com as modificaes das observaes ou medies do estado clnico dos doentes no que se refere pneumonia. Uma hiptese cientfica deve ser apresentada usando referncias claras e observveis, no podendo depender de interpretaes subjetivas. Teorias: Teorias cientficas so, essencialmente, conjecturas que representam o nosso atual estado de conhecimento sobre o mundo real. As hipteses so integradas em sistemas interpretativos mais abrangentes, designados teorias. A teoria tenta explicar as relaes existentes entre diversos tipos de observaes e hipteses. Por exemplo, uma teoria que pretenda explicar porque certos frmacos Pgina 4 de 108

designados antibiticos so eficazes na cura de certas doenas infecciosas ter que integrar evidncias de variadas fontes, tais como a microbiologia, a farmacologia, a fisiologia celular e a medicina clnica. Outros exemplos de teorias so a teoria heliocntrica do sistema solar, a teoria gentica da hereditariedade baseada no DNA e a teoria neuronal de organizao do sistema nervoso central. Algumas teorias esto ligadas ou podem ser representadas por um modelo, que uma representao matemtica ou fsica da prpria teoria. Deste modo, as teorias identificam as causas dos acontecimentos, e proporcionam meios conceptuais de predio e influncia sobre esses mesmos acontecimentos. Deduo: As teorias cientficas devem levar formulao de um conjunto de proposies empiricamente verificveis, ou seja, hipteses. As hipteses so deduzidas, obedecendo lgica formal, das proposies e/ou modelos matemticos que especificam a relao causal postulada pela teoria. Por exemplo, se aceitarmos a teoria de que um conjunto de neurnios, anatomicamente adjacentes, do lobo occipital so responsveis pela viso nos seres humanos, ento, a hiptese que pode ser deduzida a de que a ativao desses neurnios (por exemplo, atravs de estimulao por eltrodo) provocar o aparecimento de certas sensaes visuais. O teste das hipteses atravs da observao deve ser levada a cabo, preferencialmente, em condies controladas. A observao deve ser controlada de modo a permitir o afastamento de hipteses alternativas na explicao dos fenmenos sobre os quais se fez a predio. Por exemplo, se quisermos demonstrar que a estimulao do lobo occipital provoca sensaes visuais, temos que mostrar que estamos a controlar a observao para outro tipo de estimulao cerebral que possa estar a provocar tais sensaes. Inversamente, teramos, tambm, que demonstrar que a estimulao do lobo occipital no leva a uma srie de outras sensaes que no as visuais. Verificao e falsificao:

Depois da evidncia ter sido colhida, o investigador decide se os achados so consistentes ou no com as predies da hiptese. Se a hiptese confirmada pela evidncia, ento, a teoria de onde proveio a hiptese fortalecida ou verificada. Porm, quando os dados no confirmam a hiptese, a teoria subjacente falsificada. Se uma teoria no continua a conseguir predizer ou explicar as observaes torna-se menos til, e normalmente substituda por novas teorias mais fortes e consistentes. Assim, as teorias cientficas no devem ser entendidas como verdades absolutas e finais, mas meras explicaes provisrias da evidncia existente at ao momento. Foi a aplicao do processo acima descrito que permitiu o espetacular crescimento do conhecimento cientfico a que temos assistido nos ltimos sculos e, em especial, nos ltimos cem anos. desta forma que o mtodo cientfico Pgina 5 de 108

contribui para a concretizao dos nossos objetivos, ajudando-nos a descrever, explicar, predizer e, por vezes, controlar o mundo em que vivemos

Controvrsias em Relao ao Mtodo Cientfico Seria falso defender que a descrio feita acima a nica maneira de interpretar o mtodo cientfico. De fato, esta matria , ainda hoje, fonte de enormes controvrsias. Em primeiro lugar, metodologia deve ser aplicada a mesma lgica que o mtodo defende. Assim, o mtodo cientfico no uma verdade eterna e absoluta, mas antes, est aberto crtica, ao debate e mudana. Em segundo lugar, a interpretao do Mtodo Cientfico uma afetividade a que se dedica a filosofia da cincia e a epistemologia. Ao adaptarem diferentes enquadramentos tericos (Realismo, Idealismo, etc.) sobre a natureza da realidade e do conhecimento os filsofos geram, indefinidamente, controvrsias sobre a natureza do Mtodo Cientfico. Como Cientistas ou Profissionais da Sade, no nos podemos dar ao luxo de estar sentados e aguardar que os filsofos decidam qual o melhor mtodo para adquirir conhecimento. No entanto, tal como ser exemplificado abaixo, seria muito perigoso no ter em conta algumas das mais importantes ideias da histria e filosofia da cincia. A observao dependente da teoria Alguns crticos, como Chalmers (1976), argumentam que simplista acreditar que as observaes so feitas independentemente das noes tericas do observador. O observador seletivo em relao quilo que registra como evidncia. As nossas observaes e facos so influenciadas pela teoria dominante, isto , a prpria teoria especifica que observaes so importantes e que aspectos devem ser registrados ou ignorados. Assim, ao utilizar o Mtodo Cientfico, existe, partida, um vis em favor da teoria dominante e da sua veracidade que necessrio ter em conta. A validade da induo As primeiras crticas srias base indutivista do Mtodo Cientfico surgiram no sculo XVIII na voz de David Hume. Segundo este autor, um argumento indutivo no possua qualquer fora lgica; pelo contrrio, no era mais que uma suposio sobre o fato de certos acontecimentos no futuro seguirem o mesmo padro que apresentaram no passado. Hume sublinha que, por muito razoveis e evidentes que estas suposies sejam, no existe a fora da lgica nem da necessidade por trs delas. Para Hume, assumia um papel central a questo da inferncia causal e da incapacidade do indutivismo ser o alicerce lgico desta. Pgina 6 de 108

Por outras palavras, no interessa quantas vezes uma determinada seqncia de eventos se repete da mesma forma, pois isso nunca ser uma prova lgica de que existe uma relao causal entre os eventos. A inferncia causal, baseada na mera coincidncia dos acontecimentos, constitui a falcia conhecida como "pos hoc ergo propter hoc" (depois disto, logo por causa disto). Essa falcia um caso especial de uma outra falcia lgica mais abrangente e que conhecida como a falcia da afirmao do conseqente. Essa falcia toma a seguinte forma geral: "Sabe-se que se H verdadeira, ento B tem que ser verdadeira; e sabemos que B verdadeira; ento, H tem que ser verdadeira". Esta falcia utilizada, por rotina, pelos cientistas na interpretao de dados. Bertrand Russell (1945) resume esta falcia nas seguintes palavras: "if p, then q; now q is true; therefore p is true.' E.g., 'If pigs have wings, then some winged animals are good to eat; now some winged animals are good to eat; therefore pigs have wings.'This form of inference is called 'scientific method". O refutacinismo Russell e Hume no foram os nicos a lamentar a falta de coerncia lgica do raciocnio cientfico como ele usado normalmente. Muitos outros pensadores, desde os tempos de Hume, tentaram estabelecer uma firme base lgica para o raciocnio cientfico. Um dos autores a quem se tem dado mais ateno o filosofo Karl Popper. Popper (1959) abordou o problema levantado por Hume estabelecendo que as hipteses cientficas no podem nunca ser provadas ou afirmadas como verdadeiras num sentido lgico estrito. Pelo contrrio, defendeu que as hipteses cientficas s podem ser ou no consistentes com as observaes. Uma vez que possvel que as observaes sejam consistentes com mais do que uma hiptese, que podem elas mesmas ser mutuamente inconsistentes, a consistncia entre uma observao e uma hiptese no prova da veracidade da hiptese. Porm, uma observao vlida que seja inconsistente com uma hiptese implica que a hiptese, tal como enunciada, seja falsa, logo, refuta a hiptese. Por exemplo, o fato de todos os dias o sol nascer no nos permite concluir que o sol nasce todos os dias; no entanto, bastaria um dia em que o sol no nascesse para podermos afirmar que falso dizer que o sol nasce todos os dias. Segundo Popper, a Cincia avana atravs de um processo de eliminao a que d o nome de "Conjectura e Refutao". Os cientistas constroem hipteses baseadas na intuio, conjectura e experincia anterior. Os "bons" cientistas usam a lgica dedutiva para fazer predies a partir da hiptese e comparam, depois, as observaes com as predies. As hipteses cujas predies so concordantes com as observaes so confirmadas s no sentido em que podem continuar a ser usadas como explicaes dos fenmenos naturais. A qualquer momento, no entanto, podem ser refutadas por novas observaes e substitudas por outras hipteses que expliquem melhor as observaes.

A esta maneira de encarar a inferncia cientfica dado o nome de refutacionismo ou falcificacionismo. Os refutacionistas consideram a induo como uma simples Pgina 7 de 108

muleta psicolgica: observaes repetidas no induzem a formulao de uma lei natural, mas antes a crena de que tal lei foi encontrada. Para um refutacionista s o conforto psicolgico dado pela induo pode explicar o fato de continuarem a existir defensores da mesma. O refutacionismo tem profundas implicaes em relao ao Mtodo Cientfico. Este processo encoraja uma abordagem que considere mltiplas hipteses e a procura de testes que permitam decidir entre hipteses concorrentes atravs da falsificao de uma delas. Uma vez que a falsificao o objectivo, este processo tende a despersonalizar as teorias. Isto positivo por evitar os vises inerentes afectividade do cientista em relao s suas prprias teorias. Outros autores importantes Muitos outros autores se dedicaram a esta questo na procura incessante de dar um enquadramento lgico cincia e ao Mtodo Cientfico. Destacam-se as idias de Thomas Khun (1962) sobre o papel da comunidade cientfica na determinao da validade das teorias cientficas e a sua descrio da evoluo da cincia, atravs do confronto entre paradigmas, e a existncia de quebras epistemolgicas entre dois paradigmas concorrentes. De grande importncia so, tambm, as ideias propostas por Thomas Bayes (1764), que, tal como o refutacionismo, v o conhecimento como intrinsecamente incerto, mas foca a sua ateno, no na verdade deste, mas no conhecimento em si. De modo muito simplificado, Bayes defende que se conseguirmos atribuir um determinado grau de certeza s premissas de onde parte o argumento vlido (prior probability, probabilidade antecedente ou probabilidade pr-teste), ento poderemos usar a teoria das probabilidades para atribuir uma probabilidade de certeza para a concluso assim obtida (posterior probability, probabilidade posterior ou probabilidade ps-teste), e esta certeza ser uma consequncia lgica das certezas originais. A proposta de Bayes constitui uma tentativa construtiva de lidar com o dilema da incerteza inerente cincia e consegue, mesmo, propr uma maneira de quantificar os limites dessa incerteza. A Cincia como um Processo A investigao cientfica, utilizando o mtodo cientfico, procura, de uma forma sistemtica e controlada, descrever a realidade de modo preciso e vlido, recorrendo a mtodos de estatstica descritiva e inferncia e, num patamar mais elevado de evidncia, estabelecer relaes de causalidade (p. ex., verificando critrios de causalidade comumente aceites) que permitam, a partir de condies conhecidas, prever o acontecimento de determinados resultados. Esta descrio do Mtodo Cientfico que, por uma questo pedaggica, ser apresentado como um processo constitudo por oito fases, ser feita com base no paradigma da Investigao Mdica.

Pgina 8 de 108

1. Formulao da questo A investigao inicia-se pela identificao de lacunas em determinadas reas do conhecimento, ou seja, pela formulao da questo. Muitos so os meios usados para identificar as lacunas de conhecimento: problemas encontrados na prtica clnica, leitura de bibliografia cientfica, problemas focados em congressos e reunies, entre muitos outros. Aps esta formulao faz-se, geralmente, uma reviso do conhecimento (reviso bibliogrfica) existente sobre o assunto a ser tratado. A reviso bibliogrfica importante para identificar as questes que se mantm em aberto, os mtodos geralmente usados no estudo das questes em causa e os erros e limitaes de outros trabalhos. A formulao da questo, sendo a primeira e, talvez, mais importante fase para a execuo de um bom trabalho de investigao, dever identificar o objetivo e explicitar o objeto do trabalho de investigao. 2. Concepo do desenho do estudo A principal funo de desenho do estudo explicitar o modo como suposto serem encontradas as respostas questo formulada. Ao conceber o desenho do estudo definem-se certas caractersticas bsicas do estudo, como sejam, a populao a ser estudada, a unidade de anlise, a existncia ou no de interveno direta sobre a exposio, a existncia e tipo de seguimento dos indivduos, entre outras. Num trabalho de investigao, a seleo de um desenho apropriado essencial para a obteno de resultados e concluses vlidos. A escolha inadequada do desenho do estudo leva obteno de resultados incorretos e ao desperdcio de recursos humanos e financeiros. Ao selecionar determinado desenho importante assegurar-se da sua validade e exeqibilidade. Na comunidade cientfica, a importncia de um determinado trabalho de investigao primariamente avaliada luz do desenho de estudo adaptado. Existe uma enorme variedade de desenhos de estudos e necessrio ter conhecimentos bsicos sobre, pelo menos, os mais freqentemente utilizados. O investigador deve ser capaz de escolher e desenvolver o desenho mais apropriado para responder questo formulada. Deve ainda ser capaz de justificar essa seleco e conhecer as vantagens, desvantagens e limitaes da escolha que foi feita. 3. Seleco das fontes de dados A validade e preciso das concluses de um trabalho de investigao dependem, em grande medida, da criao de instrumentos adequados para a colheita de dados. Se pensa fazer a colheita de dados especificamente para o estudo, isto , utilizar dados primrios, necessrio construir instrumentos ou selecionar instrumentos j Pgina 9 de 108

construdos por outros investigadores que permitam a colheita dos mesmos. Se pensa utilizar dados secundrios (informao previamente colhida com outros propsitos) devem desenvolver-se instrumentos que permitam a extrao dos dados pretendidos a partir das suas fontes originais. importante, neste contexto, ter os conhecimentos necessrios ao desenvolvimento de instrumentos, assim como conhecer os conceitos de validade e preciso aplicados aos mesmos. O uso dos instrumentos para colheita de dados num estudo piloto uma das mais importantes partes da construo destes. O estudo piloto, por regra, deve ser levado a cabo, no na amostra escolhida para o estudo a realizar, mas sim numa amostra, normalmente mais pequena, proveniente da mesma populao. 4. Seleo dos participantes A seleo dos participantes envolve a definio dos critrios de incluso e excluso, tendo em conta a populao que se pretende estudar, e a seleo de um grupo restrito de indivduos dessa populao - amostragem - que iro ser estudados. O objetivo principal de qualquer mtodo de seleo de participantes diminuir, tanto quanto possvel, tendo em conta as limitaes existentes, as discrepncias entre os resultados obtidos a partir da amostra escolhida e as verdadeiras caractersticas da populao em estudo. O mtodo de amostragem baseia-se na premissa de que um nmero relativamente pequeno de indivduos de uma populao, quando selecionadas adequadamente, podem fornecer resultados que se aproximam, com um determinado grau de certeza, daqueles que se encontrariam se estudasse a populao de onde a amostra proveio na sua totalidade. A teoria da amostragem guiada por dois princpios essenciais: 1. evitar o enviesamento na escolha da amostra; 2. atingir a mxima preciso possvel com os recursos disponveis. Existem trs mtodos principais de amostragem:

amostragem aleatria (simples, sistemtica, estratificada, de grupo); amostragem no aleatria (consecutiva, convenincia, de juzo); amostragem mista.

necessrio conhecer e saber utilizar estes mtodos de amostragem, assim como, conhecer as vantagens e desvantagens de cada um e as situaes especficas em que podem ou no ser usados, de modo a poder escolher o mais apropriado para o estudo a ser realizado. O tipo de amostragem usada vai determinar a capacidade de generalizao dos resultados do estudo realizado, para a populao estudada, e determinar o tipo de anlise estatstica que deve ser levada a cabo.

Pgina 10 de 108

5. Elaborao do protocolo At ao momento, foi sendo desenvolvido todo o trabalho preparatrio do estudo. O prximo passo ser conjugar todos os vrios elementos de modo a poder apresentar a descrio e estruturao do estudo a ser realizado. O protocolo um plano geral que informa quem o l sobre o problema em questo e do modo como se tenta resolv-lo. As vrias instituies podem ter diferentes padres, tanto para a forma, como para o contedo dos protocolos, mas a maioria delas requer aquilo que aqui se define, sendo as diretrizes apresentadas aceitveis para a maioria delas. A principal funo do protocolo a de tornar possvel a comunicao clara, detalhada e estruturada, do seguinte:

Problema que se pretende abordar e a sua relevncia; Objetivo que se pretende atingir; Desenho do estudo; Amostra e tcnica de amostragem; Instrumentos para colheita de dados; Mtodos de processamento e anlise dos dados; Listagem e calendarizao das tarefas que sero levadas a cabo.

6. Colheita de dados Tendo definido o desenho do estudo e os outros passos preliminares do trabalho de investigao, chegado o momento de iniciar a realizao do estudo propriamente dito. A primeira fase ser a obteno dos dados. O desenho do estudo j deve ter definido, partida, os procedimentos a adaptar para a obteno dos dados e o protocolo do estudo j deve conter a estruturao e calendarizao das tarefas necessrias obteno dos dados. A partir dos dados vo fazer-se generalizaes e tirar-se concluses; eles vo ser o suporte de todo o estudo, logo, deve ter-se grande ateno a esta fase, pois nela que, muitas vezes, surgem problemas que inviabilizam ou diminuem grandemente a validade do estudo. Existe uma grande variedade de mtodos e estratgias que podem ser utilizados para a colheita dos dados e que convm conhecer e saber utilizar apropriadamente. 7. Processamento e anlise de dados O processamento e a anlise estatstica dos dados so, tambm, fases essenciais na realizao do trabalho de investigao propriamente dito. O processamento compreende a introduo, edio, limpeza e a manipulao (ex: categorizao de variveis contnuas) dos dados em bruto, fases importantes para

Pgina 11 de 108

a preparao da anlise estatstica. A anlise dos dados consiste na aplicao de tcnicas de estatstica descritiva e inferncia, com o objetivo de retirar informao til das observaes realizadas. Ao longo da disciplina de Introduo Medicina sero focados os aspectos bsicos relacionados com a anlise estatstica de dados. 8. Divulgao de resultados A divulgao de resultados o passo final de todo o processo de investigao, e vai constituir o meio pelo qual vo ser comunicados ao mundo os resultados e concluses resultantes do trabalho de investigao realizado. A deciso sobre a maneira como os resultados vo ser comunicados j deve ter sido tomada inicialmente, na altura da elaborao do protocolo.

Resta, agora, pr as mos obra e escrever. Antes de comear, porm, deve criar um esquema, que deve ser includo no protocolo e que ajuda a organizar os temas e ideias. Os moldes em que a divulgao dos resultados ser feita derivam, necessariamente, do tipo de investigao realizada, dos fins a que se destina e das preferncias pessoais. Basicamente, os resultados podem ser apresentados em trs formatos diferentes: 1. Apresentao oral; 2. Pster; 3. Publicao - em papel ou on-line.

A publicao dos resultados pode tomar vrias formas:

1) sumrio; 2) comunicao curta; 3) artigo original; 4) relatrio de investigao; 5) tese ou dissertao. Cada um destes meios de comunicao tem as suas regras prprias, mas alm destas devem ser, ainda, seguidos alguns princpios bsicos, tais como a necessidade de clareza e brevidade. O texto deve ser apresentado na terceira

Pgina 12 de 108

pessoa, de maneira lgica e com linguagem precisa. Uma vez concludo o texto, qualquer outro investigador dever ser capaz de reproduzir, se o desejar, integralmente, todos os passos do trabalho de investigao.

O Mtodo Clnico Nesta aula apresentar-se-, somente, uma curta discusso sobre o Mtodo Clnico, uma vez que ele ser apresentado de uma forma mais aprofundada, juntamente com a sua componente prtica, que a maneira mais adequada de o aprender/ensinar, em fases mais avanadas do curso de Medicina. O Mdico, ao praticar Medicina, tem, de modo semelhante ao que acontece com o Mtodo Cientfico, necessidade de colher, analisar e sintetizar dados ou observaes, assim como formular e testar hipteses, com o intuito de obter informao til que ser, depois, usada no processo de deciso aplicado a cada indivduo. A todo esse processo, desde a colheita da informao at deciso e discusso desta com o doente e o estabelecimento de um plano teraputico, d-se o nome de Mtodo Clnico. Este, tal como o Mtodo Cientfico, tem evoluido ao longo do tempo e tem sido alvo de algumas controvrsias. O raciocnio clnico um processo, ainda hoje, no totalmente compreendido. Sabe-se, porm, que ele tem por base mltiplos fatores, como a experincia e a aprendizagem, o raciocnio dedutivo e indutivo, a interpretao de evidncia cientfica, que varivel em reprodutibilidade e validade, e a intuio que um aspecto difcil de definir. Com o objetivo de melhorar o raciocnio clnico, vrias tentativas de anlise quantitativa dos vrios fatores nele envolvidos tm sido feitas (ex: estudo dos processos cognitivos envolvidos no raciocnio clnico, criao de sistemas de apoio deciso, etc). Embora estas tentativas tenham sido teis no avano da compreenso do raciocnio clnico, todas elas tm problemas tericos ou prticos que limitam a sua aplicabilidade prtica clnica diria. Estas tentativas de aplicao do rigor e lgica inerentes ao mtodo quantitativo tm, no entanto, proporcionado grandes avanos na compreenso do raciocnio clnico, e permitiram identificar modos de melhorar este processo, tornando-o mais eficaz e eficiente. Usando um modelo simplificado, pode descrever-se o Mtodo Clnico como um processo dividido em cinco fases. Histria Clnica e Exame Fsico A primeira fase consiste na colheita da Histria Clnica, atravs de entrevista. A Histria Clnica deve incluir a seguinte informao: identificao do doente, motivo Pgina 13 de 108

da consulta, histria da doena atual, antecedentes pessoais, histria social e ocupacional, antecedentes familiares e a reviso de sintomas por aparelhos e sistemas. Esta colheita de informao avana em funo de um processo iterativo de formulao e refutao de hipteses diagnsticas, que levam, na maior parte dos casos, a um diagnstico carreto, j nesta fase. Ainda nesta primeira fase tem lugar a realizao do Exame Fsico, com especial nfase nos rgos provavelmente envolvidos na doena atual. Este exame deve ser completo e sistematizado e guiado pelas hipteses formuladas na colheita da Histria Clnica. Esta primeira fase muito importante por duas razes: primeiro, porque nesta fase que se devem obter, de forma rigorosa, completa, vlida e precisa, os dados ou observaes que estaro na base do raciocnio que levar formulao do diagnstico. Esta colheita de dados ou observaes deve ser feita com "o rigor cientfico". Segundo, porque no decorrer desta fase que se estabelece e desenvolve a relao Mdico-Doente, que ser a base do restante do processo e que d "um toque de arte" ao mesmo. Exames Auxiliares de Diagnstico Numa segunda fase, o clnico pode requisitar um conjunto de exames auxiliares do diagnstico que julgue necessrios confirmao das possibilidades diagnsticas levantadas na fase anterior. O clnico deve conhecer, pormenorizadamente, as caractersticas operacionais de cada exame (sensibilidade, especificidade, valores preceptivos e exatido), as suas indicaes especficas e os potenciais riscos e benefcios que a sua utilizao tem. Claro que, tendo em conta os riscos e benefcios dos exames, estes s devero ser requisitados quando necessrio e quando a histria clnica e o exame fsico se mostrarem insuficientes para estabelecer o diagnstico com a preciso adequada. Integrao dos Dados Clnicos e dos Exames Auxiliares de Diagnstico Numa terceira fase faz-se a integrao da informao proveniente das vrias fontes disponveis (histria clnica, exame fsico e exames auxiliares de diagnstico), com o intuito de estabelecer o diagnstico e o prognstico (tendo em conta as caractersticas especficas do indivduo). Uma das formas de fazer esta integrao da informao usando um mtodo quantitativo designado Anlise Bayesiana. Este mtodo permite, a partir do conhecimento da probabilidade de um indivduo ter uma doena antes de um qualquer exame ser realizado (probabilidade pr-teste ou probabilidade antecedente), e tendo conhecimento sobre as caractersticas do exame (sensibilidade e especificidade), calcular a probabilidade de existncia de doena aps o conhecimento do resultado desse exame (probabilidade ps-teste ou probabilidade posterior). Uma discusso mais ampla sobre este mtodo est fora do mbito desta aula, mas chama-se a ateno para a sua importncia na compreenso do raciocnio clnico, pois este , provavelmente, o modelo matemtico que mais se lhe assemelha. Pgina 14 de 108

Comparao de Riscos e Benefcios: Anlise de Deciso Os riscos e benefcios de subseqentes opes diagnsticas ou teraputicas devem ser avaliados. Aps esta avaliao deve ser tomada a deciso sobre o que ser recomendado ao doente. Um mtodo quantitativo, designado Anlise de Deciso, foi proposto para, atravs da anlise de riscos e benefcios das intervenes e das probabilidades dos diferentes resultados possveis, se obter a melhor deciso para cada doente. A sua utilizao na prtica clnica tem, no entanto, vrias limitaes. A discusso deste mtodo est fora do mbito desta aula. Recomendao e Incio do Plano Teraputico Na quinta e ltima fase, a recomendao que foi produto da deciso anterior, aps anlise de riscos e benefcios das vrias opes, ser apresentada ao doente. A apresentao da recomendao do mdico deve ser acompanhada de uma discusso sobre as vrias opes que se apresentam ao doente, de um modo simples e conciso, que lhe permitam perceber, claramente, o que est em causa. Por ltimo, aps a deciso final, deve ser iniciado o plano teraputico escolhido e feita a programao do seguimento do indivduo, quando apropriado.

Instrumentos de recolha de dados e seleo de participantes Introduo Leia atentamente os seguintes textos:

Case-control studies of antenatal drug exposure and birth defects often rely on maternal recall of drug use in pregnancy. Differential recall among mothers of cases and controls can lead to information bias ("maternal recall bias"), and the opportunity for such bias increases as ascertainment of drug exposure diminishes. The effect of questionnaire design on the ascertainment of drug use in pregnancy was examined in two studies. In a pilot interview study of 532 women in Obstetric/gynecologic practices, information on drug use in the past year was obtained by means of three questions asked in sequence: The first question was open-ended, the second asked about drug use for selected indications, and the third asked about use of specifically named drugs. Among obstetric patients who reported use of any of five drugs, less than 50% did so in response to the openended question, and approximately 20-40% reported use only when the specific drug name was asked. In a case-control Birth Defects Study of 5,435 mothers of malformed children, information on drug use in pregnancy was obtained by asking questions in sequence about indications and specifically named drugs. Among the women who reported use of any of 11 drugs, 6-40% did so only when asked about the specific drug by name. These findings suggest that completeness of ascertainment of antenatal drug exposure varies according to how the mother is Pgina 15 de 108

questioned and is directly related to the specificity of the questions asked. (Effect of questionnaire design on recall of drug exposure in pregnancy. Mitchell AA, Cottler LB, Shapiro S. Am J Epidemiol 1986 Apr;123(4):670-6) "The first persons in whom the cytomegalovirus infection was diagnosed were those with severe disease, this virus was initially thought to be highly virulent. As more people were tested for the virus, it became clear that the virus is widespread and only rarely leads to serious illness." (Biomedical Bestiary. Michael III, Max; W. Thomas Boyce, Allen J. Wilcox; Little, Brown and Company. 1984.) 1. O primeiro texto mostra como o tipo de questo (aberta ou fechada) influncia a resposta. Que vantagens e desvantagens tem o uso de questes de resposta aberta? 2. Qual a razo da concluso errada tirada inicialmente no estudo descrito no segundo texto? Instrumentos de recolha de dados Todo e qualquer instrumento que seja utilizado com o intuito de colher informao para o estudo cabe dentro da definio de instrumento para a recolha de dados, sendo assim includos dentro desta designao, por exemplo, os registros de observaes, os questionrios, a calendarizao das entrevistas ou os guias do entrevistador. A criao de instrumentos para a colheita de dados a primeira tarefa prtica a ser executada num estudo. necessrio decidir o modo como se ir fazer a colheita de dados e construir, ento, os instrumentos necessrios sua execuo. Se pensa fazer a colheita de dados especificamente para o estudo, isto , utilizar dados primrios, necessrio construir instrumentos ou seleccionar instrumentos j construdos por outros investigadores que permitam a colheita dos mesmos. importante, neste contexto, ter os conhecimentos necessrios ao desenvolvimento de instrumentos, assim como, conhecer os conceitos de validade e preciso aplicados aos mesmos. Se pensa utilizar dados secundrios (informao previamente colhida com outros propsitos) devem desenvolver-se instrumentos que permitam a extrao dos dados pretendidos a partir das suas fontes originais. Questionrios O instrumento de colheita de dados mais usado o questionrio. Um questionrio um documento escrito usado para guiar uma ou mais pessoas a responder a uma ou mais perguntas.

Pgina 16 de 108

Tipos de questionrios: Auto resposta (via correio) A maior parte das pessoas associa um questionrio ao questionrio via correio. J quase todos ns recebemos, pelo menos uma vez, um questionrio por correio. Este tipo de questionrio tem muitas vantagens, pois pode ser enviado a um grande nmero de pessoas, de uma forma no muito dispendiosa e a pessoa que responde pode faz-lo quando lhe for mais conveniente. Contudo, os questionrios enviados via correio tm, tambm, as suas desvantagens, uma delas a baixa taxa de resposta que so obtidas, este tipo de questionrios tambm no o melhor veculo para perguntas que exigem respostas muito detalhadas. Auto resposta (em grupo) Um grupo de pessoas so reunidas e as perguntas so-lhes feitas em simultneo, contudo, cada pessoa responde individualmente ao seu questionrio. Os grupos so reunidos consoante algum critrio de convenincia (aqueles que esto presentes e que muito provavelmente vo ter uma boa taxa de resposta). Se as pessoas que esto a ser questionadas no entenderem o significado de alguma pergunta podem pedir ajuda ou esclarecer o propsito do estudo. Este tipo de questionrio , muitas vezes, usado em empresas ou escolas. Auto resposta (porta a porta) Este tipo de questionrio menos habitual. O investigador, neste caso, desloca-se a casa ou ao emprego dos questionados, entrega e explica o questionrio e depois volta para recebe-lo ou pede que o devolvam por correio. Este tipo de questionrio tem a vantagem de poder ser feito quando mais conveniente ao questionado tal como nos questionrios via correio e tem a vantagem de ser possvel um contacto com o investigador com o fim de esclarecer dvidas na interpretao das respostas ou no objetivo do estudo. A grande desvantagem deste tipo de questionrios so os custos financeiros associados. Entrevista (pessoal) Atravs de uma entrevista, o investigador preenche o questionrio com as respostas s perguntas que vai fazendo ao questionado. H um contato pessoal e direto entre o investigador e o questionado. Ao contrario dos outros tipos de questionrio, o entrevistador tem a Pgina 17 de 108

oportunidade de se certificar que o questionado quer dizer mesmo o que disse. As entrevistas facilitam, tambm, as respostas a perguntas que pedem opinies. O questionrio por entrevista consome muito tempo e, conseqentemente, muito dispendioso O entrevistador considerado parte do instrumento de recolha de dados e precisa de um treino prvio para aprender a conduzir uma entrevista e como ultrapassar as dificuldade. Entrevista (telefnica) Este tipo de entrevista possibilita ao investigado ter a informao rapidamente. Tal como as entrevistas pessoais, este tipo de entrevistas possibilita ao investigador o contacto pessoal e direto com o questionado, desta forma, facilitam as respostas a perguntas que pedem opinies, a questes de folow up e do ao entrevistador a oportunidade de se certificar que o que o questionado respondeu era exatamente aquilo que queria dizer. Contudo, tambm tm desvantagens. Muita gente no gosta que lhe telefonem para casa, outras no tm telefone que conste nas listas telefnicas. Este tipo de entrevistas no podem ser muito compridas. Construo de questionrios: Construir um questionrio uma arte. H inmeras decises que tm que ser tomadas, decises relacionadas com a linguagem, com o formato e com o tipo de questo. Estas decises podem ter conseqncias muito importantes para o estudo e podem at compromete-lo. No h uma forma perfeita de fazer um questionrio, contudo, h uma srie de conselhos que podem ajudar a obter um produto final melhor. Problemas de linguagem A linguagem deve ser clara e objetiva. Por exemplo, a questo "Quanto costuma beber?" no clara nem objetiva, pois no diz a que tipo de bebida se refere e se a resposta fosse, por exemplo, 3 ficaramos sem saber se a pessoa em questo bebia 3 copos por ms ou 3 garrafes por dia. Uma alternativa seria "Quantos copos de vinho bebe, em mdia, por dia?" A linguagem deve ser simples, evitando perguntas longas, com palavras difceis ou de estrutura gramatical complexa. Por exemplo, a pergunta "Tem casos de trissomia 21 na famlia?" poderia ser substituda por "Tem casos de mongolismo na famlia?", pois a palavra mongolismo mais comum e fcil de entender que trissomia 21.

Pgina 18 de 108

A linguagem deve tambm ser neutra, de forma a que no influencie o questionado. Por exemplo a pergunta "Concorda que as futuras mes possam matar os babes quando eles ainda esto dentro da sua barriga at 7 semana de gravidez?" no neutra e influencia o questionado a responder negativamente. Uma alternativa a esta pergunta seria "Concorda com a interrupo voluntria da gravidez at 7 semana?" A unicidade uma questo de linguagem que, tambm, deve ser levada em conta. Por exemplo, a pergunta "Alguma vez teve tonturas e dores de cabea ao acordar?" A resposta a esta pergunta pode ser mais complexa do que sim ou no, pois, pode j ter tido apenas uma das situaes, desta forma a resposta pode ser duvidosa se o questionado no especificar, exatamente, a que se refere. A pergunta anterior deveria ser dividida em duas: "Alguma vez teve tonturas ao acordar?" e "Alguma vez teve dores de cabea ao acordar?", assim, no haver dvidas ao interpretar a resposta. A linguagem deve ser temporal, estabelecendo, claramente, o perodo a que se refere. Por exemplo, pergunta "Ultimamente tem tido dores de cabea?" duas pessoas que tiveram dores de cabea no ms passado, podem responder sim e no consoante o seu conceito de "ultimamente". Sendo assim, a pergunta poderia ser substituda por "Nos ltimos 3 meses tem tido dores de cabea?".

Problemas de formato

Um questionrio deve sempre comear com uma introduo que deve descrever os seus objetivo e o uso que vai ser dado informao. O questionado tem o direito de saber porque est a responder s perguntas e o que vai ser feito com a informao que est a dar. Um questionrio deve, tambm, ter instrues claras de preenchimento. Deve ainda, assegurar a confidencialidade dos dados recolhidos, apresentar as questes de uma forma seqencialmente lgica e

Pgina 19 de 108

com um tempo de resposta o mais curto possvel.

Tipos de Questo A escolha do tipo de questo a usar deve ser apropriada. As questes de resposta aberta, isto , respostas pelas palavras do inquirido, tem algumas vantagens, pois estimulam o pensamento livre, ajudam a clarificar posies e so mesmo indispensveis para estudos explanatrios, como por exemplo o desenvolvimento de novas questes de resposta fechada para futuros estudos. Porm, para responder a este tipo de questes, necessrio encontrar e organizar os termos necessrios o que pode tornar a resposta mais complicada, podem ser dadas respostas incompletas ou mesmo irrelevantes. Este tipo de questes tornam tambm mais complicada anlise estatstica. As questes de resposta fechada, isto , o questionado assinala a opo que pretende responder dentro de uma possvel lista de respostas, facilitam a resposta ao questionado assim como a codificao e anlise, porm limitam as possibilidades de resposta correndo o risco de omitir respostas importantes. Neste tipo de questo, as respostas potenciais devem ser exaustivas e mutuamente exclusivas.

Escalas e codificao. As respostas devem ser codificadas com vista sua anlise.

Pgina 20 de 108

Para variveis nominais o cdigo apenas substitui a resposta, os nmeros associados a cada resposta no tm nenhum significado, a no ser substituir a resposta por extenso. Na questo I, por exemplo, 1 tanto pode corresponder a "Medicina", 2 a "Medicina Dentria" e 3 a "Cincias da nutrio", como tambm pode 1 corresponder a "Medicina Dentria", 2 a "Cincias da nutrio" e 3 a "Medicina". As respostas no obedecem a nenhuma ordem. Para variveis ordinais o cdigo tem um significado inerente que reflete uma ordem. A questo II pode ser codificada da seguinte forma 1="nenhum", 2="1 ou 2 anos" e 3="mais de 2 anos". Cada nmero de 1 a 3 reflete um grau diferente insucesso no ensino secundrio. Muitas vezes, a resposta a uma questo dada numa escala que tenta medir uma caracterstica abstracta. As escalas deste tipo mais usadas so as escalas de Likert (sumativas) e escalas de Guttman (cumulativas). III. Assinele com uma cruz a resposta que mais se aproxima da sua opinio: discordo concordo discordo neutro concordo totalmente totalmente a) o computador muito til para o estudo dos alunos de Medicina b) o computador muito til no exerccio da Medicina actual c) deve haver uma disciplina de Informtica Mdica no curso de Medicina

Pgina 21 de 108

Escalas de Likert: so, geralmente, usadas para quantificar uma opinio ou atitude. Por exemplo, na questo III para avaliao da utilidade do computador na Medicina, pedido a quem responde ao inqurito que assinale a resposta que mais se aproxima da sua opinio usando uma escala de 1 (discordo totalmente) a 5 (concordo totalmente). O investigador pode obter a pontuao geral desta pergunta sumando as pontuaes de cada alnea. Escalas de Guttman: contm uma srie de opes de resposta que expressam um crescimento de intensidade de uma determinada caracterstica. Na questo IV pedido a quem responde que assinale todas as frases com que concorda. Idealmente, as respostas devem ser consistentes, por exemplo, se uma pessoa concorda com a segunda opo, necessariamente, tem que concordar com a primeira. Se as respostas forem consistentes o grau de concordncia da pessoa que respondeu ser o nmero de frases assinaladas.

Algumas respostas podem influenciar a resposta pergunta seguinte obrigando, ao uso de questes de filtro (exemplo: Se respondeu no pergunta 1 passe para a pergunta 3). As questes deste tipo podem tornar-se muito complexas, portanto, devem explicar muito claramente e de uma forma intuitiva que perguntas no devem ser respondidas e em que circunstncias. Fases de desenho de questionrios escolher o tipo de questionrio elaborar uma lista de variveis consultar questionrio previamente testados

Pgina 22 de 108

preparar o questionrio testar o questionrio fazer a verso final do questionrio pr-codificar Seleo de participantes A seleo dos participantes envolve a definio dos critrios de incluso e excluso, tendo em conta a populao que se pretende estudar, e, a seleo de um grupo restrito de indivduos dessa populao amostragem que iro ser estudados. O objetivo principal de qualquer mtodo de seleo de participantes diminuir, tanto quanto possvel, tendo em conta as limitaes financeiras, a discrepncia entre os resultados obtidos, a partir da amostra escolhida e as verdadeiras caractersticas da populao em estudo. Podemos dividir o processo de seleo de participantes num estudo, nas seguintes fases: Fase 1: Conceptualizao da populao alvo. A populao alvo o grupo ao qual se pretende generalizar os resultados do estudo. A conceptualizao da populao alvo envolve a especificao de critrios de incluso, como por exemplo, caractersticas demogrficas, profissionais, clnicas, etc ... deste grupo que ns gostaramos de colher a nossa amostra pois este o grupo para o qual queremos generalizar. Contudo, imaginemos que queremos generalizar o nosso estudo aos homens Portugueses que vivem na cidade e com idades compreendidas entre os 30 e o 50. Com esta populao alvo iramos levar muito tempo a desenvolver um plano razovel de amostragem. Provavelmente iro ser encontradas dificuldades em obter uma lista atualizada desta populao e mesmo que isso acontecesse iram ser muito dispendioso percorrer todas as cidades de Portugal. Ser ento necessrio identificar a populao disponvel representativa. Fase 2: Identificao de uma populao disponvel representativa da populao alvo. A populao disponvel representativa a parte da populao alvo a que temos acesso e da qual iremos tirar a amostra. A identificao desta amostar pode envolver a especificao de novos critrios de incluso e de excluso Fase 3: Desenho de um mtodo de amostragem da populao disponvel. O mtodo de amostragem baseia-se na premissa de que um nmero

Pgina 23 de 108

relativamente pequeno de indivduos de uma populao, quando selecionados adequadamente, podem fornecer resultados que se aproximam, com um determinado grau de certeza, daqueles que se encontrariam se se estuda-se a populao de onde a amostra proveio, na sua totalidade. Mtodos de amostragem: Existem trs mtodos principais de amostragem, amostragem aleatria, no aleatria e mista. necessrio conhecer e saber utilizar estes mtodos de amostragem, assim como, conhecer as vantagens e desvantagens de cada um e as situaes especficas em que podem ou no ser usados, de modo a poder escolher o mais apropriado para o estudo a ser realizado. O mtodo de amostragem usado vai determinar a capacidade de generalizao dos resultados do estudo realizado para a populao estudada e determinar o tipo de anlise estatstica que deve ser levada a cabo. (1) Amostragem aleatria: simples: todos os indivduos tm probabilidades independentes de serem selecionados.

iguais

estratificada: a populao dividida em estratos, por uma varivel de interesse, e dentro desses estratos so escolhidos, aleatoriamente, indivduos. por grupos: h dois ou mais estgios no processo de amostragem. Em primeiro lugar, grupos de unidades so escolhidos, aleatoriamente, em seguida, dentro desses grupos so escolhidos todos os indivduos ou so selecionados, aleatoriamente, apenas alguns. (2) Amostragem no aleatria: quotas: a amostra escolhida num local que convenha ao investigador e quando aparece uma pessoa que preencha determinada caracterstica lhe sugerido que participe no estudo.

Pgina 24 de 108

acidental: a amostra escolhida num local que convenha ao investigador, que sugere a quem aparece que participe no estudo (sem ter que preencher determinada caracterstica). bola de neve: alguns indivduos, de um determinado grupo so escolhidos, depois, lhes pedido que identifiquem outras pessoas desse grupo e que as juntem amostra e assim sucessivamente at atingir o tamanho de amostra requerido. juzo: o investigador seleciona, apenas, as pessoas que ele pensa serem as mais indicadas para o estudo. (3) Amostragem mista: sistemtica: so escolhidos intervalos, no primeiro intervalo escolhido um elemento, aleatoriamente. Nos outros intervalos escolhido o elemento que tem a mesma ordem do elemento que foi escolhido no primeiro intervalo. Fase 4: Recrutamento. Ao fazer o recrutamento devemos esclarecer e incentivar os participantes, tentar precaver erros tcnicos recorrendo a estudos piloto e ter em conta o tamanho de amostra apropriado. Tamanho da amostra Em geral um estudo pode ter dois objetivos: estimar um efeito ou testar a significncia de um efeito. Quando se pretende estimar um efeito da populao, as estatsticas obtidas tm um determinado erro padro e, como o erro padro est relacionado com o tamanho da amostra possvel calcular o tamanho de amostra necessrio para obter um determinado erro padro. Quando se pretende testar uma hiptese o tamanho da amostra depende de outros critrio: que certeza temos ao dizer que a hiptese falsa (erro tipo I), a mnima diferena detectvel e o poder do teste.

Pgina 25 de 108

Reprodutibilidade e validade de medidas Introduo Leia atentamente os seguintes textos: Thirty-four consecutive women undergoing endometrial laser ablation, as a treatment of menorrhagia, were recruited to assess the validity of fluid absorption monitoring by a new continuous automated system (AquaSens). The same group of women also had monitoring of fluid absorption carried out by our standard technique of weighing. The intra-class correlation coefficient for the fluid deficit estimated by AquaSens compared to our standard technique of manually weighing the irrigation bags was 0.98 (95% CI 0.96-0.99). Aquasens therefore provides a valid and non-invasive method of continuously monitoring fluid deficit amongst patients undergoing operative hysteroscopy procedures, thereby reducing the risk of unexpected fluid absorption and its potentially fatal sequelae. (The validity of continuous automated fluid monitoring during endometrial surgery: luxury or necessity? Hawe JA, Chien PF, Martin D, Phillips AG, Garry R. Br J Obstet Gynaecol 1998 Jul;105(7):797801) OBJECTIVE: To evaluate interobserver agreement in visual analysis of each cardiotocographic event. METHODS: Three experts independently divided 16 antepartum and 17 intrapartum cardiotocograms into baseline segments, accelerations and decelerations, according to the FIGO guidelines. Baseline segments were further classified as having normal, reduced or increased variability and decelerations as early, late and variable. Uterine activity was divided into tonus and contractions. Agreement was assessed by the proportions of agreement (pa) with 95% confidence intervals. RESULTS: Reproducibility in assessment of baseline segments with normal variability, accelerations and uterine activity was acceptable (pa = 0.56-0.71) whereas that of other segments was not (pa = 0.14-0.45). CONCLUSIONS: Analysis of most cardiotocographic events is poorly reproducible, even when experts use the FIGO guidelines. This may be explained by some still ambiguous guidelines, by eyeball limitations in evaluation of subtle events, and by the incapacity of busy clinicians to assess complex and multiple cardiotocographic events in a systematic and disciplined fashion. (Evaluation of interobserver agreement of cardiotocograms. Bernardes J, Costa-Pereira A, Ayres-de-Campos D, van Geijn HP, Pereira-Leite L. nt J Gynaecol Obstet 1997 Apr;57(1):33-7)

Pgina 26 de 108

1. Que concluiu o estudo do primeiro texto quanto validade do novo sistema para a monitorizaro contnua do dficit de fluido em procedimento cirrgicos por histeroscopia? Que benefcios trouxe este novo sistema em relao aos anteriores. Que Gold Standard foi usado neste estudo de validade? 2. Que concluiu o estudo do segundo texto quanto reprodutibilidade (concordncia inter-observador) da anlise visual do cardiotocograma?

Estudos de reprodutibilidade: Idealmente, num estudo a nica fonte de variabilidade existente deveria ser a variabilidade biolgica intrnseca aos sujeitos em estudo, contudo muitas vezes existe tambm variabilidade que est dependente da medio do observador ou do instrumento que mede. Os estudos de reprodutibilidade pretendem medir o grau de concordncia entre a observaes feitas nas mesmas circunstncias pelo mesmo observador/instrumento (concordncia intra-observador/instrumento) ou por observadores diferentes (concordncia inter-observador/instrumento). A variabilidade intra-observador predominantemente aleatria, a variabilidade inter-observador pode ser aleatria ou sistemtica. Diz-se que uma medida reprodutvel se provm de um procedimento reprodutvel ou seja se repetido nas mesmas condies obtm as mesmas medidas. Conseqncias da falta de reprodutibilidade: A falta de reprodutibilidade nas medidas pode levar a importantes conseqncias a nvel cientfico, clnico e mdico-legal. Conseqncias a nvel cientfico: Se num estudo cientfico for usado um procedimento no reprodutvel ao repetir o mesmo estudo nas mesmas circunstncias vamos obter diferentes medidas e conseqentemente diferentes resultados e concluses. Desta forma sem ter feito um estudo prvio de reprodutibilidade e sem ter a certeza que os procedimentos usados so reprodutveis no faz sentido realizar um estudo cientfico. Conseqncias a nvel clnico: A utilizao de meios no reprodutveis pode levar a resultados inesperadamente opostos. Por exemplo usando um teste de Pgina 27 de 108

diagnstico no reprodutvel um paciente pode obter um resultado positivo e negativo em duas vezes que submetido ao teste nas mesmas circunstncias. Desta forma o paciente corre o risco de obter um resultado positivo sendo este negativo ou vice versa. Conseqncias a nvel mdico legal: Tambm a nvel legal no pode haver igualdade perante a lei se os processos mdico-legais se basearem em piratagens no reprodutveis.

Como melhorar procedimentos pouco reprodutveis: Por vezes, possvel melhorar procedimento pouco reprodutveis. Seguem-se alguns exemplos de formas de melhorar a reprodutibilidade na medio da presso arterial. Treino do observador: O treino do observador pode aumentar a reprodutibilidade de um procedimento especialmente na concordncia inter-observador. Um observador mais experiente pode obter resultados diferentes de um menos experiente na prtica do procedimento. Por exemplo, a medio presso arterial pode resultar em valores diferentes nas mesmas circunstncias, quando medida por dois observadores diferentes, um mais e outro menos experiente. Uma forma de aumentar a reprodutibilidade inter-observador, neste caso, pode passar pelo treino dos observadores na medio da presso arterial. Normas: A falta de normas simples e objetiva podem tambm ser uma causa da falta de reprodutibilidade de um procedimento. Por exemplo, a variao na medio da presso arterial pode ser influenciada pela definio da velocidade de desinsuflao do cuff. Uma forma de aumentar a reprodutibilidade inter-observador, neste caso, pode passar pela definio da norma objectiva: A velocidade de desinsuflao do cufff ser de taxa de 2 mmHg/seg. Automatizao: A automatizao ou informatizao dos procedimentos pode aumentar a sua reprodutibilidade. Por exemplo, alguns observadores podem ter preferncia por alguns dgitos e inconscientemente arredondar os valores que vo observando. Neste caso, a falta de reprodutibilidade pode ser ultrapassada usando um aparelho que esconde o resultado at que lhe seja solicitado, mostrando o valor exato apenas nesse momento. Mltiplas opinies: Pgina 28 de 108

Por vezes a falta de reprodutibilidade na obteno de algumas medidas s se consegue melhorar baseando a deciso em mltiplas opinies independentes, arbitradas ou consensualizadas. Por exemplo, usando a mdia de vrias medies da presso arterial feitas por diferentes observadores independentes

Estudos de validade: Os estudos de validade pretendem medir o impacto dos erros (sistemticos) de validade introduzidos e recorrem a amostras onde so feitos os dois procedimentos, o que se pretende testar e o de referncia, que est j validado (gold standard). Um dos grandes problemas deste tipo de estudo exatamente o fato de, por vezes, no existir um gold standard, usando-se, nestes casos, o melhor procedimento disponvel como procedimento de referncia. Uma medida vlida se provm de um procedimento vlido ou seja se mede aquilo que era suposto medir. importante verificar que um procedimento no reprodutvel no pode ser vlido, desta forma no faz sentido fazer um teste de validade a um procedimento no reprodutvel.

Conseqncias da falta de validade: Tambm a falta de validade nas medidas pode levar a importantes conseqncias a nvel cientfico, clnico e mdico-legal. Conseqncias a nvel cientfico: A validade especialmente importante em estudos onde se pretendem estimar parmetros. Usando por exemplo uma balana que pesa sistematicamente mais 10 kg do que o verdadeiro peso do indivduo, num estudo que pretende estimar o peso mdio da populao Portuguesa vamos obter um resultado enviesado. J num estudo que pretenda testar se os homens Portugueses adultos so em mdia mais ou menos pesados que as mulheres, e se as medidas obtidas pela balana forem reprodutveis, ento a sua falta de validade no ter conseqncias to graves na concluso do

Pgina 29 de 108

estudo. Conseqncias a nvel clnico: A utilizao de meios no validos pode levar a concluses erradas e conseqentes procedimentos prejudiciais. Por exemplo, se um aparelho automtico de medio da presso arterial no vlido medir sistematicamente um valor de presso arterial superior ao verdadeiro, poder levar o mdico prescrio de medicamentos anti-hipertensores no indicados para o paciente em causa. Conseqncias a nvel mdico legal: Tambm a nvel legal pode no ser feita justia se os processos mdico-legais se basearem em piratagens no vlidas. Como melhorar procedimentos no vlidos: Por vezes possvel melhorar procedimento no vlidos. Seguem-se alguns exemplos de formas de melhorar a validade. Treino do observador: Tal como no caso da falta de reprodutibilidade o treino do observador pode aumentar a validade de um procedimento. Por exemplo, um observador pouco experiente pode cometer um erro que o leve a obter resultados sistematicamente mais baixos. Normas: Tambm a falta de normas simples e objetivas podem ser uma causa da falta de validade de um procedimento. Da mesma forma, por no estar definida uma norma simples de utilizao de um aparelho pode levar a uma medida sistematicamente diferente da real (mais alta ou mais baixa).

Automatizao: Tambm a automatizao ou informatizao dos procedimentos pode aumentar a sua validade. Por exemplo, o observador podem ter a tendncia para exagerar na leitura dos resultados obtendo sistematicamente resultados mais graves o que pode ser ultrapassado pela leitura computorizada. Ocultamento: Por vezes a falta de validade na obteno de algumas medidas est

Pgina 30 de 108

relacionada com a sugesto do observador. Por exemplo, quando num ensaio clnico o investigador encontra sistematicamente resultados mais graves em pacientes sujeitos a um placebo e menos graves nos pacientes que testam um novo medicamento. Neste caso, o fato de se ocultar do investigador a provenincia (grupo de controlo ou grupo experimental) do indivduo pode aumentar a validade dos resultados. Mtodos de quantificao da concordncia: Os mtodos usados para quantificar a concordncia, tanto em estudos de reprodutibilidade como em estudos de validade, dependem da escala das variveis em estudo ( Contnuas ou Categricas: ordinais, nominais, dicotmicas).

Pgina 31 de 108

Concordncia em: Estudos Reprodutibilidade Escala Sensibilidade e Especificidade de Estudos de Validade Escala do em estudo Categrica dicotmica Categrica dicotmica Continua teste Escala do teste de referncia Categrica dicotmica Categrica dicotmica Categrica dicotmica Categrica dicotmica

Valores preditivos rea sob a curva ROC Likelihood ratios

Continua

Propores de concordncia Estatstica Kappa Estatstica Kappa ponderada

Categrica Categrica dicotmica Categrica ordinal

A mesma escala Categrica A mesma escala categrica dicotmica A mesma escala categrica ordinal

Pgina 32 de 108

Limites de (Bland & Altman)

concordncia

Continua Continua

A mesma escala contnua A mesma escala contnua

Coeficiente de Correlao Intraclasse

Pgina 33 de 108

Estatstica Descritiva Introduo Numa anlise estatstica de uma amostra podemos distinguir duas etapas: A descrio dos dados amostrais - estatstica descritiva - e a extrapolao destes resultados para a populao - estatstica inferncias. Neste captulo estudaremos as tcnicas de sumariar e apresentar dados quer atravs de medidas apropriadas (medidas de sumrio), quer atravs de tabelas e grficos. Estatstica descritiva Classificao de variveis Apesar de haver vrios formas de classificar variveis, vo ser apresentados apenas os tipos de de variveis que mais condicionam a anlise estatstica. Contnuas (ex: tenso arterial, idade, altura,...) Categricas nominais (ex:sexo, grupo sanguneo,...) ordinais (ex:escala qualitativa - ..., suf, bom, mto bom; Apagar; estadiamento de cancro,;...)

Variveis

As variveis contnuas so variveis que podem assumir qualquer valor num intervalo. Por exemplo o peso uma varivel contnua pois pode assumir qualquer valor (78,453437.... Kg). J o nmero de filhos s pode assumir determinados valores (1,2,3...); a estas variveis d-se o nome de categricas pois os valores que assumem podem ser considerados categorias. No faz sentido falar na categoria 78,453437...Kg mas j faz sentido falar na categoria "casal com 2 filhos". As variveis categricas por sua vez ainda se dividem em ordinais e nominais. Se as categorias da varivel tm uma ordem, isto , se pode dizer que uma categoria est antes da outra, a varivel diz-se ordinal; se as categorias no tm ordem (por exemplo as categorias do sexo, feminino e masculino, no tm uma ordenao prpria) as variveis designam-se de nominais. Muitas vezes, por convenincia da anlise "categorizam-se" variveis contnuas. Por exemplo a idade (varivel contnua) pode ser "categorizada" em grupos etrios (varivel categrica), assim um indivduo que tenha 24,4 anos pertence, por exemplo, categoria [20 a 30 anos]. A seguir veremos como se pode sumariar a informao dos diferentes tipos de variveis

Pgina 34 de 108

Estatstica descritiva Variveis categricas Variveis nominais Uma forma simples de sumariar variveis nominais contar o nmero de indivduos em cada categoria. Esta contagem designada por freqncia de uma categoria. A varivel pode ento ser descrita numa tabela de freqncias, onde so indicadas as categorias da varivel e as respectivas freqncias. Pode ser ainda acrescentada na tabela as freqncias expressas em forma de percentagem. A tabela 1, refere-se Tabela 1 - Distribuio de 489 nascimentos por distribuio de 489 recm hospital nascidos por Hospital. Da tabela observa-se, por exemplo, que 195 dos recm nascidos nasceram no Hospital B e que 33% nasceram no Hospital C.

Figura 1

Outra forma de apresentar as freqncias usar um grfico de barras como na figura 1. Cada barra representa a freqncia de cada categoria. No caso das variveis nominais as categorias podem ser apresentadas por qualquer ordem. No grfico da figura 1, referente tabela 1, optou-se por apresentar as categorias por ordem decrescente de freqncia.

Pgina 35 de 108

Figura 2
Para este tipo de variveis tambm se costuma usar um grfico circular. O crculo representa os 100% dos indivduos e cada 'fatia' proporcional freqncia de cada categoria. Na figura 2 pode-se observar que o Hospital B tem mais recm nascidos que o Hospital A e C.

Variveis ordinais A forma de sumariar variveis ordinais semelhante das variveis nominais, ainda que no se possa alterar a ordem das categorias uma vez que estas tm uma ordem prpria. A tabela de freqncias em baixo (tabela 2) apresenta a escolaridade das mes dos 489 recm-nascidos. Nesta tabela inclui-se tambm uma coluna com a percentagem acumulada, que indica soma da percentagem da

Tabela 2 - Distribuio do grau de escolaridade das mes de 489 recm nascidos

categoria respectiva com as percentagens das categorias anteriores.

Pgina 36 de 108

Da tabela 2 pode-se ento observar que 6% das mes (28 mes) no tiveram educao formal e que 63% tiveram menos que a escola secundria, isto , 6% sem educao formal mais 57% com a escola primria. Variveis contnuas

Figura 1 Para descrever ou sumariar variveis contnuas uma tabela de freqncias no , normalmente, muito til, pois grande parte dos valores tero freqncia 1 e desta forma a tabela de freqncias seria uma grande lista de valores pouco menos complexa que a totalidade dos dados da varivel. Da mesma forma um grfico de barras para dados contnuos seria composto por uma sria de pequenas barras. Uma melhor opo a este grfico o histograma. O histograma semelhante ao grfico de barras com a diferena que cada barra representa a freqncia de um intervalo de valores. Cada intervalo de valores tem a continuao no intervalo da barra seguinte. Por isso as barras so representadas todas juntas. Na figura 1 o histograma refere-se ao peso nascena de 462 recm nascidos. A barra mais escura representa o nmero de recm nascidos (setenta e trs) com peso entre os 3300gr e 3500gr. As variveis contnuas podem tambm ser sumariadas usando medidas de sumrio. A mdia um exemplo bem conhecido destas medidas (a mdia em particular uma medida de posio e, dentro destas, uma medida de tendncia central). Uma forma de sumariar os peso dos 462 recm nascidos apresentar o peso mdio, 3263gr. Este valor calculado somando os 462 pesos e dividindo por 462. Outra medida de tendncia central a mediana. A mediana indica o centro da distribuio da varivel, ou seja, o valor acima do qual esto 50% dos valores da varivel e abaixo os restantes 50%. Uma forma simples de calcular a mediana ordenando todos os valores sendo a mediana o valor central. Por exemplo, para calcular oa mediana do conjunto 4, 2, 3, 2, 7 vamos primeiro orden-lo: 2, 2, 3, 4, 7. O valor do meio o 3, ento 3 a mediana do conjunto.

Pgina 37 de 108

Figura 2: Peso mediano dos recm nascidos. Na figura 2 est representada a distribuio do peso de 462 recm nascidos. A mediana neste caso 3300gr, o que quer dizer que 50% dos recm nascidos (231 recm nascidos) tm um peso inferior a 3300gr e os restantes 50% tm um peso superior a 3300gr. O conceito da mediana pode ser generalizado para outras percentagens alm dos 50%. Por exemplo, podemos querer saber qual o valor abaixo do qual esto 10% dos indivduos. A esta medida de posio d-se o nome de percentil 10. A mediana portanto, o percentil 50. Alguns percentis tm uma designao especial. Por exemplo o percentil 25 e o percentil 75 so referidos como o 1 quartil e o 3 quartil, respectivamente.

Pgina 38 de 108

Figura 3: Percentil 5 e percentil 95 do peso dos recm nascidos No exemplo dos 462 recm nascidos os percentis 5 e 95 so respectivamente 2303gr e 4097gr. Isto quer dizer que 90% dos recm nascidos tm o peso compreendido entre as 2303gr e 4097gr como est indicado na figura 3 . Outro tipo de medidas de sumrio so usadas para indicar o grau de disperso dos dados; estas medidas designam-se por medidas de disperso. O desvio padro um exemplo destas medidas e indica a variao dos dados volta da mdia. A tabela 1 apresenta alguns exemplos dos desvio mdia dos pesos nascena dos 462 recm nascidos

Pgina 39 de 108

Peso - mdia 3920 - 3263 3020 - 3263 3290 - 3263 : : :

diferena 657 243 27 : : :

Tabela 1 - Desvios (diferenas) mdia dos pesos dos recm nascidos O desvio padro uma medida que resume todos estes desvios a um nico valor, neste caso 553.5gr.

Figura 4: Duas distribuies com a mesma mdia e desvios padres diferentes. Os dois histogramas da figura 4 referem-se a dados com a mesma mdia mas com diferentes disperses volta dos mesmos. Os dados referentes ao histograma A tm uma maior disperso do que os do histograma B, assim o desvio padro do A maior do que o B. A diferena entre dois percentis pode tambm ser usada para descrever a variao dos dados. A esta medida d-se o nome de mbito (range). Por exemplo o mbito dos percentis 5 e 95 do peso dos 463 recm nascidos 1794 gr. (4097gr 2303gr). Um dos mbitos mais usados o mbito interquartil, ou seja, a diferena entre o percentil 75 e 25.

A escolha das medidas de posio e disperso apropriadas

Pgina 40 de 108

Um dos fatores que se deve ter em conta na escolha das medidas a usar o tipo de distribuio da varivel. A mdia mais informativa do que a mediana pois no seu clculo so utilizados os valores da varivel, enquanto no clculo da mediana apenas se usa a posio relativa de cada valor. Consideremos o seguinte conjunto de valores como exemplo, 2, 4, 5, 6, 8 A mdia (2+4+5+6+8)/5 = 5 e a mediana tambm 5. Mas se alterarmos o ltimo valor para 23, isto 2, 4, 5, 6, 23 a mediana continua a ser 5 mas a mdia foi alterada para 8. Neste exemplo pode-se observar que a mdia mais afetada por valores extremos do que a mediana. Em situaes em que a varivel apresenta valores muito extremos, deve-se optar pela mediana dando assim uma indicao mais corretas da zona central da distribuio. Uma regra geral muitas vezes utilizada apresentar a mdia em distribuies simtricas e a mediana em distribuies assimtricas. Relativamente s medidas de disperso, estas dever ser escolhidas em funo da medida de tendncia central. O desvio padro s dever ser apresentado se estiver associado mdia, uma vez que esta medida se refere aos desvios mdia. No caso de se apresentar a mediana poder-se- optar por indicar o mbito, por exemplo interquartil, ou apresentar dois pecentis. Os pares de percentis mais freqentemente usados so o (percentil 5, percentil 95) e o (percentil 25, percentil 75). Comunicao de Resultados Comunicao de resultados "Brilliance has an obligation not only to create but also to communicate" J. R. Platt A disseminao dos conhecimentos e observaes teve sempre um papel essencial na evoluo da cincia, poder-se-ia dizer que mesmo um dever do cientista comunicar as suas descobertas ao mundo e, assim, alimentar o progresso da cincia. Hoje em dia, a disseminao de informao faz-se a uma velocidade espantosa, graas comunicao eletrnica e digital. A publicao de artigos na Internet uma realidade, mas ainda no substituiu a publicao em papel, nem provvel que o venha a fazer a curto prazo. Isto tem tanto a ver com uma resistncia por parte de alguns cientistas, baseada em medos, alguns bem

Pgina 41 de 108

reais outros infundados, como com razes editoriais e critrios de verificao de qualidade. Paradoxalmente, e enquanto a comunicao entre investigadores se torna cada vez mais fcil, rpida e completa, graas s novas tecnologias, observa-se em algumas reas, como a gentica e as novas cincias da bioengenharia, a no divulgao de certos resultados, devido a questes relacionadas com o registro de patentes e potenciais lucros de novos mtodos e produtos, j que, alm de dar a conhecer comunidade cientfica os resultados de uma investigao, uma comunicao serve, tambm, outros objetivos, nomeadamente, no estabelecimento de patentes e como certificado de primazia de uma determinada descoberta. A investigao cientfica em Medicina em si mesma um fim e um meio, pois alm de prover novos e importantes conhecimentos para toda a comunidade, obriga aqueles que a fazem a uma atualizao constante de nvel superior, que permite dispensar os melhores tratamentos e mtodos de diagnstico. Para dar a conhecer os resultados de uma investigao existem vrios mtodos, mas nenhum tem o impacto de um bom artigo publicado numa revista de topo como o New England Journal of Medicine ou a Nature.

Antes de comear 1. Determinar o objetivo da apresentao; 2. Anlise da audincia/pblico alvo, isto , qual o seu grau de instruo, quais as suas atitudes e experincias : a. grau e homogeneidade da audincia a nvel educacional e de conhecimentos; b. nvel de exigncia tcnica da audincia (se ou no necessrio apresentar todos os detalhes tcnicos); c. capacidade de interpretao de grficos, figuras e tabelas nmero, estilo e contedo das imagens, uso de equaes e frmulas, etc.; 3. Seleo do nvel da apresentao viso superficial e global ou abordagem aprofundada; 4. Escolha do formato da apresentao - tendo em conta os objetivos da comunicao, o pblico alvo e a quantidade de informao se quer fornecer; 5. Seleo do material relevante limites de tempo ou de n de palavras; 6. Construo de componentes tabelas, grficos, diagramas, fotografias; 7. Equilibrar os componentes material de apoio, linguagem, estrutura global; Pgina 42 de 108

8. Ajustar s exigncias editoriais ou de tempo. Uma apresentao efetiva deve combinar uma escolha apropriada da quantidade e nvel do material, com uma audincia receptiva a esse mesmo material.

Uso carreto da linguagem A redao de trabalhos cientficos no um exerccio de estilo ou de capacidades literrias, sim uma apresentao do trabalho realizado, sendo executada segundo uma srie de regras precisas. Embora o talento individual v, sem dvida, influenciar a qualidade do trabalho, a prtica e o estudo das tcnicas e mtodos de redao que vai influenciar mais fortemente o resultado final. O texto deve ser breve, a linguagem, qualquer que seja o meio de comunicao escolhido, deve ser simples, concisa e clara. Qualquer que seja a lngua escolhida os autores devem domin-la. Se a no dominam completamente, devem recorrer ajuda de um tradutor familiarizado com o tema e que conhea o calo tcnico apropriado, alis, em relao a este calo tcnico ou jargo, importante referir que deve ser usado o menos possvel, de modo a simplificar a mensagem, pois, quanto mais simples esta for, melhor ser compreendida. Se decidir escrever em Ingls existem uma grande variedade de livros disponiveis na nossa biblioteca que o podem ajudar, como o "How to write and publish papers in the Medical sciences" ou o "Medical writing a prescription for clarity". O livro "Redaco e apresentao de trabalhos cientficos" tem alguns bons conselhos para escrever correctamente em Portugus assim como algumas referncias teis. Para escrever segundo as regras de estilo, convm estar familiarizado os Uniform Requirements for Manuscripts Submitted to Biomedical Journals. A chave para uma comunicao clara e sem rudo a existncia de um contexto partilhado, isto , que tanto o autor como a sua audincia atribuam o mesmo significado s mesmas palavras e smbolos, ainda que, haja sempre um componente subjetivo devido s experincias nicas de cada um. Por esse motivo, importante que use poucas abreviaturas e siglas, indicando sempre a que expresso completa correspondem, quando as usar pela primeira vez, pois, por exemplo, VCI tanto pode querer dizer Via de Cintura Interna como Veia Cava Inferior. A maneira correta de usar uma sigla : primeiro, s usar siglas se a expresso aparecer no texto um nmero significativo de vezes; segundo, a primeira vez que a expresso aparecer, por exemplo, Sndrome de Imunodeficincia Adquirida, escreva a sigla frente entre parnteses (SIDA), em maisculas e sem pontos.A capacidade de comunicar eficazmente algo que se aprende, essencialmente, com a prtica, quantos mais artigos e comunicaes orais fizer, melhores sero os resultados.

Pgina 43 de 108

Antes de comear a escrever a sua comunicao, existem alguns exerccios que o podero ajudar:

Pense; Discuta o assunto; Crie uma estrutura; Comece pelo meio, ou pela seco que seja mais fcil, geralmente os resultados.

Existem, ainda, algumas regras que o podem ajudar, conhecidas com regras de Ransom:

Se ambguo errado; Conhea a audincia Assunto e propsito; Se no se lembra de uma razo para por uma vrgula no a ponha; Escrita correta, clara e concisa; Se resulta faa-o.

Depois de criar um rascunho, edite-o profusamente, corrija a gramtica e erros datilogrficos, depois, reveja o artigo, d-o a algum para ler e edite-o novamente, repita o processo at estar satisfeito. Por fim, tenha sempre em mente uma atitude de cuidadoso auto-escrutnio e controlo cientfico, tenha confiana nos seus achados cientficos, e uma pitada de humildade e criatividade. Tipos de Comunicao cientifica Basicamente, existem 3 tipos de comunicao: oral, pster e publicaes. Cada uma destas tem mtodos prprios. A escolha do tipo de comunicao depende de vrios fatores, entre os quais se destacam o tipo de investigao, os resultados obtidos, a quem devem ser comunicados, e o objectivo que se pretende atingir (persuaso, instruo/educao, informao). Por sua vez, os resultados a serem publicados podem s-lo como:

1.artigo original ou de investigao (em papel ou em formato eletrnico); 2. relatrio de investigao; 3. tese / dissertao; 4. cartas ao editor;

Pgina 44 de 108

5. artigo de reviso; 6. anlise de sries de casos; 7. monografias e relatrios tcnicos; 8. livro de texto.

Estatstica Descritiva
Introduo Numa anlise estatstica de uma amostra podemos distinguir duas etapas: A descrio dos dados amostrais - estatstica descritiva - e a extrapolao destes resultados para a populao - estatstica inferencial. Neste captulo estudaremos as tcnicas de sumariar e apresentar dados quer atravs de medidas apropriadas (medidas de sumrio), quer atravs de tabelas e grficos. Intervalo de confiana para a mdia Introduo

Vimos no captulo do erro padro como se comporta a distribuio de mdias de amostras de uma populao. Quando efetuamos uma amostra, a mdia desta estar situada algures na distribuio das mdias de amostras da populao (figura 1 e figura 2).

Pgina 45 de 108

Figura 1: Vrias amostras da populao e respectivas mdias

Figura 2: Distribuio das mdias de amostras feitas numa populao O intervalo,

de

Pgina 46 de 108

inclui 95% das possveis mdias de amostras da populao(figura 3). Pode-se ento afirmar que com 95% de confiana a mdia da amostra observada encontrase nesse intervalo .

Figura 3: 95% das no intervalo sombreado

mdias

de

amostras

da

populao

esto

Mas dizer que a mdia da amostra se encontra no intervalo referido equivalente a afirmar, com 95% de certeza, que mdia da populao se encontra no intervalo ( , )

Princpio dos Testes de Hiptese

Quando se determinam parmetros da amostra (por exemplo a mdia) por vezes necessrio saber se esse est de acordo com o valor previsto para a populao. A este procedimento chamamos teste de hiptese. Consideremos o seguinte exemplo: Queremos saber se uma determinada moeda equilibrada, ou seja, quando atirada ao ar a probabilidade de sair caras ou coroas igual a 1/2. Inicialmente, no temos nada que nos indique o contrrio. Assim, a nossa hiptese inicial chamada Hiptese Nula - que a moeda equilibrada. Para testarmos essa

Pgina 47 de 108

hiptese, decidimos fazer uma amostra de 100 lanamentos e com base no resultado decidimos se aceitamos ou rejeitamos a Hiptese Nula. Suponhamos que o resultado dos lanamentos foi 48 coroas e 52 caras. Ser este resultado suficientemente forte para rejeitarmos a Hiptese Nula? Ou seja, ser que este resultado compatvel com a hiptese da moeda ser equilibrada? Efetivamente, a probabilidade de obter 48 ou menos coroas em 100 lanamentos, com uma moeda equilibrada, de aproximadamente 0.38. Este valor demasiado elevado para rejeitar esta hiptese, isto , a probabilidade de obter este resultado (ou um resultado mais extremo) com uma moeda equilibrada alta. Assim devemos aceitar a Hiptese Nula (HN). Note-se que a afirmao aceitar e no provar a Hiptese Nula (HN), pois a moeda pode eventualmente estar viciada. O fato que nos nossos lanamentos no observamos nado que nos fizesse suspeitar disso. O resultado apenas no foi suficientemente forte para rejeitar a HN. Suponhamos agora, que o resultado do lanamento foi 30 coroas e 70 caras. A probabilidade de se obter um resultado, to ou mais extremo do que este, com uma moeda equilibrada de 0.002. Podemos dizer que esta situao pouco provvel de acontecer com uma moeda equilibrada. Duas decises podem ser tomadas mediante este resultado: 1) aceitar que ocorreu uma situao rara e continuar a acreditar na Hiptese Nula, 2) ou, por ser demasiado raro observar o resultado com uma moeda equilibrada, rejeitar a Hiptese Nula

Pode experimentar numa simulao, alguns resultados de lanamentos de uma moeda.

A situao de comparar duas mdias algo semelhante ao exemplo anterior do teste a uma moeda. Comparao de duas mdias O exemplo refere-se a desitometrias sseas (medio da densidade mineral ssea) de indivduos com e sem fratura do colo do fmur. Na tabela 1 esto indicadas as mdias de densidade mineral ssea (BMD) para os dois grupos.

Pgina 48 de 108

Tabela 1 - Mdias da densidade mineral ssea de indivduos com e sem fratura do colo do fmur.

Perante este resultado poderemos afirmar que os indivduos que fraturam o colo do fmur tm um BMD mais baixo do que os indivduos sem fraturam? Efetivamente verificou-se uma diferena na amostra (0.26 = 0.96 - 0.70). Mas ser esta diferena devida a erros aleatrios do processo da amostragem ou devida a uma diferena na populao? Da mesma forma que no espervamos que 100 lanamentos de uma moeda equilibrada tivesse um resultado exato de 50 caras e coroas; ainda que no haja diferenas entre o BMD dos dois grupos, no seria de esperar que as duas mdias da amostra fossem exatamente iguais. Vamos ento calcular a probabilidade de, numa populao onde no existe diferena entre os dois grupos, ocorrer uma amostra com uma diferena de 0.26, ou uma diferena maior. Hiptese nula (HN): mdiano fracturados = mdiafracturados HN: mdiano fracturados - mdiafracturados=0 Na amostra observamos que:
no fraturados

, ou de outra forma,

fraturados

= 0.26

Utilizando um teste para comparao de mdias, obtm-se que a probabilidade de se observar esta diferena na amostra, ou uma superior, se a hiptese nula for verdadeira, menor do que 0.001. Este teste de comparao de duas mdias designa-se de t-student, ou simplesmente teste t. A razo do nome vem da utilizao da distribuio com o mesmo nome, que substitui a distribuio normal no caso de no se conhecer o desvio padro da populao e em vez deste utilizar-se o desvio padro da amostra. Para utilizar este teste necessrio fazer duas assunes. A primeira que os dois grupos tm distribuies normais e a segunda que o desvio padro dos dois grupos semelhante. Este apresente primeiro um teste de comparao dos desvios padres (Teste de Levene). Tipos de Erros

Pgina 49 de 108

Quando se rejeita ou aceita uma hiptese usando um teste estatstico baseado numa probabilidade, dois erros podem acontecer:

Rejeitar a Hiptese Nula e esta ser verdadeira - Erro Tipo I (alfa) Aceitar (no rejeitar) a Hiptese Nula e esta ser falsa - Erro Tipo II (beta).

Como normalmente a Hiptese Nula contrria hiptese de investigao, h tendncia para uma maior preocupao com o erro tipo I. Para ilustrar isto, imagine a situao de uma investigao sobre efeito de um novo frmaco (a Hiptese Nula seria o frmaco no tem efeito) e que erradamente se rejeita a Hiptese Nula com a conseqente afirmao de que o frmaco tem efeito... Por tradio (e sem mais nenhuma razo) costuma-se limitar o Erro Tipo I a 0.05. Isto equivale a dizer que se a probabilidade observada do teste de hiptese for inferior a 0.05, rejeita-se a hiptese nula, caso contrrio diz-se que no h evidncia suficiente para rejeitar a Hiptese Nula (ou seja aceita-se). Apesar desta comparao da probabilidade com o erro tipo I, no se deve confundir a probabilidade com o erro. No exemplo anterior do peso nascena, seguindo a regra apresentada deveramos rejeitar a Hiptese de que no h diferena entre o BMD dos fraturados e no fraturados, ou seja, afirmar que indivduos com fratura do colo do fmur tm BMD diferente dos sem fratura.

Tabelas de contingncia e Qui-quadrado

Tabela 1 - Distribuio do consumo de lcool por grupo etrio

Tabelas de contingncia As tabelas de contingncia so utilizadas para estudar a relao entre duas variveis categricas descrevendo a freqncias das categorias de uma das variveis relativamente s categorias de outra.

Pgina 50 de 108

Na base de dados,vamos observar qual o consumo de tabaco no incio da gravidez, em funo do grupo etrio da me . A Tabela (de contingncia) 1 apresenta o consumo de tabaco por grupo etrio (ambas as variveis so categricas). Podemos ler na tabela que 252 mes tm idade entre 21 e 30 anos e no fumaram no incio da gravidez.

Conforme o problema a estudar, a tabela pode ser completada com as percentagens referentes ao total da linha, coluna ou ao valor total. No exemplo da Tabela 1, far sentido acrescentar as percentagens por para se comparar em cada grupo etrio qual a percentagem de mes que fumaram (Tabela 2). Tabela 2- Distribuio do consumo de lcool por grupo etrio

Na Tabela 2 podemos ento observar que h mais mes fumadoras no grupo etrio do 13 aos 20 anos (35%) do que no grupo etrio dos 36 aos 55 anos (5%). Qui-quadrado

Podemos observar na tabela 1 que parece haver uma relao entre a idade das mes e o consumo do tabaco, ou seja, parece que h mais fumadadoras entre as mes mais jovens do que entre as mais velhas.

Pgina 51 de 108

Tabela 1- Distribuio do consumo de lcool por grupo etrio

A questo agora, saber se esta relao encontrada na amostra significativa, ou seja, se h evidncia suficiente para considerarmos que existe uma relao entre consumo de tabaco e a idade das mes. Pode-se observar que no total, 12% das mes fumaram no incio da gravidez. Se no existisse relao com o grupo etrio, seria de esperar que esta percentagem de mantivesse em todos os grupos. Por exemplo, existem 297 mes no grupo etrio dos 21ao 30 anos, portanto seria de esperar que 36 mes fossem fumadoras (297x12%=36 mes). Este clculo pode ser generalizado para obter o valor esperado para cada clula da tabela, multiplicado o total da linha pelo total da coluna e dividir pelo total (figura 1). Para testar a hiptese nula de que no existe relao entre as duas variveis, usamos a seguinte estatstica designada de qui-quadrado ( ).

Pgina 52 de 108

Figura 1 - Clculo do valor esperado para a situao da hiptese nula ser verdadeira

No exemplo anterior o valor do qui-quadrado :

O qui-quadrado no mais do que uma comparao dos valores observados na tabela com os valores esperados se no existisse relao entre as duas variveis, ou seja se a hiptese nula fosse verdadeira. A partir do qui-quadrado pode-se ento calcular a probabilidade de se obter a diferena entre os valores observados e esperados, ou uma diferena superior, se a Hiptese Nula fosse verdadeira (valor p). Como em todos os testes de hiptese, com base nesta probabilidade que decidimos se rejeitamos ou aceitamos a Hiptese Nula. No caso da relao do consumo de tabaco e grupo etrio das mes, o valor p associado ao qui-quadrado encontrado (17,6) 0.001, ou seja, podemos dizer que existe uma relao (estatstica) entre o consumo de tabaco e a idade das mes.

Pgina 53 de 108

Correlao e regresso linear simples Introduo Leia atentamente o seguinte abstract: Diet and gastric cancer in Portugal-a multivariate model. Azevedo LF, Salgueiro LF, Claro R, Teixeira-Pinto A, Costa-Pereira A Servio de Bioestatstica e Informtica Mdica, Faculdade de Medicina da Universidade do Porto, Portugal. Eur J Cancer Prev 1999 Feb;8(1):41-8 Diet and gastric cancer mortality in Portugal was studied using a multivariate ecological model. The factors investigated over 18 districts were the relationship between gastric cancer mortality (1994-96), dietary habits, and socio-economic factors (1980-81). Mortality geographical pattern was established using agestandardized mortality rates, per capita dietary consumption of foodstuffs and nutrients was obtained from the National limentary Survey (1980-81), and data on socio-economic factors from the 1981 National Census. Pearson correlation coefficients and simple and multiple linear regression models were used. The mortality geographical pattern resembled a north-south gradient, and dietary habits and socio-economic factors had great variability throughout the country. The highest negative correlation coefficients between dietary consumption and gastric cancer mortality were obtained for vegetables, fruit, vitamin A and carotene consumption, and the highest positive coefficients were for rice, wine and carbohydrate consumption. No significant correlations were obtained for socioeconomic factors. In multiple regression analysis, vegetable and rice consumption could account for 79% of the gastric cancer mortality variability for males, and vegetable and meat consumption could account for 69% of this variability for females. Interestingly, meat consumption was found to be protective. A mean increase of 100 g/person/day in vegetable consumption would imply a mean predicted decrease of 10 (95% CI 6-14) and 5 (95% CI 3-7) gastric cancer deaths per 100,000 persons/year, for males and females respectively, in simple regression analysis. Such a decrease represents about one-third of the mean national gastric cancer mortality rate. Therefore, an increase in vegetable consumption is strongly recommended. Consideremos o exemplo do estudo referente ao abstract apresentado anteriormente. Nesse estudo analisou-se a relao entre o consumo de vrios alimentos pelos 18 distritos de Portugal com a mortalidade por cancro do estmago (gastric cancer) feminino e masculino nessas mesmas regies.

Pgina 54 de 108

Os dados apresentados na Tabela 1 referem-se ao consumo mdio de vegetais por dia e s respectivas taxas de mortalidade do sexo masculino e feminino em cada um dos distritos. (Pode fazer Figura 1 - Diagrama de disperso do consumo mdio dirio de vegetais e da taxa de mortalidade feminina. Os valores para o distrito do Porto esto assinalados a ttulo de exemplo.

Uma forma simples de visualizar uma possvel relao entre a quantidade de vegetais consumida e a taxa de mortalidade utilizar um diagrama de disperso para estas duas variveis. Podem-se observar na figura 1 e figura 2, os diagrama de disperso para cada sexo, relativos ao consumo mdio dirio de vegetais e taxas de mortalidade.

Pgina 55 de 108

Figura 2 - Diagrama de disperso do consumo mdio dirio de vegetais e a taxa de mortalidade masculina. Cada ponto do diagrama refere-se a um determinado distrito de Portugal, indicando o consumo mdio de vegetais e a respectiva taxa de mortalidade. Na figura 1 est assinalado o ponto correspondente ao distrito do Porto. Figura 3 - Diagrama de disperso do consumo mdio dirio de vegetais e a taxa de mortalidade feminina com a reta que melhor aproxima a relao entre as duas variveis.

Uma observao dos grficos da figura 1 e figura 2 sugere que com o aumento consumo de vegetais a taxa de mortalidade diminui.

Pgina 56 de 108

Esta relao pode ser aproximada pela reta indicada na figura 3 e figura 4.

Figura 4 - Diagrama de disperso do consumo mdio dirio de vegetais e a taxa de mortalidade masculina com a recta que melhor aproxima a relao entre as duas variveis A recta apenas aproxima a sugestionada relao entre as duas variveis. Se esta fosse usada para estimar a taxa de mortalidade para um determinado consumo de vegetais teria, como se observa na figura 4, um erro associado. Correlao e Regresso linear simples Correlao Antes de continuarmos com o exemplo anterior, observemos os diagramas de disperso da figura 5.

Pgina 57 de 108

Figura 5 - Quatro diagramas de disperso com diferentes relaes entre X e Y e a reta que aproxima estas relaes. No grfico D est a ponteado uma curva que melhor aproxima a relao quadrtica das variveis Os diagramas apresentam quatro situaes distintas:
A A reta representa a relao perfeita entre X e Y. A relao entre as duas variveis negativa, i.e., quando X aumenta Y diminui. B - A reta uma boa aproximao da relao entre X e Y. A relao entre as duas variveis positiva, i.e., quando X aumenta Y tambm aumenta. C - A reta no uma boa aproximao pois no h relao entre X e Y. D - A reta no uma boa aproximao da relao entre X e Y. A relao entre X e Y no linear, i.e., no representada por uma reta. Na figura sugerida, a tracejado, uma relao quadrtica.

Para avaliar se a reta , ou no, uma boa aproximao da relao entre duas variveis utiliza-se uma estatstica designada coeficiente de correlao de Pearson, ou simplesmente, correlao. Este coeficiente normalmente representada pela letra r. A correlao, ento, uma medida da 'qualidade' da aproximao da relao entre duas variveis por uma reta, ou seja, a correlao mede a 'fora' da associao linear entre duas variveis.

Pgina 58 de 108

Nota: A frmula de clculo do coeficiente de correlao no faz parte do programa deste mdulo, mas pode ser consultada aqui.

O coeficiente de correlao varia entre -1 e 1. O valor 0 (zero) significa que no h relao linear, o valor 1 indica uma relao linear perfeita e o valor -1 tambm indica uma relao linear perfeita mas inversa, ou seja quando uma das variveis aumenta a outra diminui. Quanto mais prximo estiver de 1 ou -1, mais forte a associao linear entre as duas variveis.
Nota: Uma correlao 0, ou prxima de 0, no implica obrigatoriamente, que as duas variveis no esto relacionadas mas apenas que as duas variveis no esto relacionadas de uma forma linear. No caso do diagrama D da figura 5 as duas variveis esto relacionadas mas no linearmente.

Nos diagramas de disperso apresentados (figura 5) os coeficientes de correlao so respectivamente, A:-1,B: 0.91, C: 0 e D: 0.

Figura 6 - Matriz de correlao das variveis VEGETAIS, MORTM e MORTF No estudo da relao entre o consumo de vegetais e taxa de mortalidade, obtmse uma correlao de -0.743 e -0.814 para o sexo feminino e masculino respectivamente (figura 6). Outra vantagem do uso da correlao como medida de associao linear de duas variveis que o quadrado deste coeficiente (r2) interpretado como a percentagem de variao explicada por uma das variveis em relao outra. No caso estudado, pode-se dizer que o consumo de vegetais explica 55% (=0.7432) da variao da taxa de mortalidade feminina e 66% (=0.8142) da masculina.
Pgina 59 de 108

Avaliao de Testes Diagnsticos Problema Leia atentamente o seguinte "Abstract": Does this patient have abdominal aortic aneurysm? Lederle FA, Simel DL JAMA 1999 Jan 6;281(1):77-82 Department of Medicine, Minneapolis Veterans Affairs Medical Center, University of Minnesota, 55417, USA. vhaminlederf@med.va.gov In the physical examination of abdominal aortic aneurysm (AAA), the only maneuver of demonstrated value is abdominal palpation to detect abnormal widening of the aortic pulsation. Palpation of AAA appears to be safe and has not been reported to precipitate rupture. The best evidence on the accuracy of abdominal palpation comes from 15 studies of patients not previously known to have AAA who were screened with both abdominal palpation and ultrasound. When results from these studies are pooled, the sensitivity of abdominal palpation increases significantly with AAA diameter (P<.001), ranging from 29% for AAAs of 3.0 to 3.9 cm to 50% for AAAs of 4.0 to 4.9 cm and 76% for AAAs of 5.0 cm or greater. The positive predictive value of palpation for AAA of 3.0 cm or greater in these studies was 43%. Limited data suggest that abdominal obesity decreases the sensitivity of palpation. Abdominal palpation specifically directed at measuring aortic width has moderate sensitivity for detecting an AAA that would be large enough to be referred for surgery but cannot be relied on to exclude AAA, especially if rupture is a possibility.

Partindo do pressuposto de que os resultados deste trabalho so vlidos e podem ser aplicados populao de doentes que se apresentam no Servio de Urgncia do HSJ, responda s seguintes questes: 1. Qual a probabilidade de um doente que aparece no SU do HSJ com um aneurisma da aorta abdominal de 3.5 cm ter uma palpao abdominal positiva? 2. Qual a probabilidade de um doente que aparece no SU do HSJ com um aneurisma da aorta abdominal de 4.5 cm ter uma palpao abdominal positiva? 3. Qual a probabilidade de um doente que aparece no SU do HSJ com um aneurisma da aorta abdominal de 5.5 cm ter uma palpao abdominal positiva? 4. Qual a probabilidade de um doente que aparece no SU do HSJ e tem uma palpao abdominal positiva ter um aneurisma da aorta abdominal maior que 3 cm?
Pgina 60 de 108

Testes diagnsticos O diagnstico um dos mais importantes atos em medicina. Fazer um diagnstico um processo probabilstico de deciso que visa classificar o doente dentro de uma determinada entidade nosolgica a que corresponder um determinado tratamento e um determinado prognstico. Para levar a cabo um diagnstico teremos ento que utilizar mtodos que permitam discriminar entre populaes de doentes e de no doentes, sendo essa a definio de teste diagnstico. O termo testes diagnsticos, geralmente, aplica-se aos exames complementares de diagnstico, no entanto, ele deve ser entendido num sentido mais amplo, abrangendo no s os exames complementares de diagnstico como tambm todos os dados provenientes da histria clnica e exame fsico. A avaliao da exatido de um qualquer teste diagnstico est dependente da comparao dos resultados a partir dele obtidos com o verdadeiro estado de cada individuo. Assim, para determinar o verdadeiro diagnstico, preciso que exista um teste, ou conjunto de testes, que dem uma grande certeza sobre o mesmo. Ao teste que, em determinado momento, tem a maior exatido na determinao de um diagnstico d-se o nome de "gold standard". No entanto, o "gold standard" raramente tem uma exatido de 100%, tornando-se, assim, difcil utiliz-lo como padro para comparao com testes alternativos de que se desconhece a exatido. Na tabela 1 sumariza-se a relao entre o resultado de um teste diagnstico e o verdadeiro diagnstico:

Doena Presente Positivo Teste Negativo Falso Negativo Verdadeiro Negativo Ausente

Verdadeiro Positivo Falso Positivo

Tabela 1: Relao entre o resultado de um teste diagnstico de o verdadeiro diagnstico.

Os testes diagnsticos podem ser classificados em dois grandes grupos:

Pgina 61 de 108

Testes qualitativos: o resultado do teste, positivo ou negativo, dado tendo em conta a presena ou ausncia de uma determinada caracterstica. o Testes quantitativos: o resultado do teste estabelecido numa escala contnua e classificado como positivo ou negativo tendo em conta um determinado "cutoff point" arbitrariamente selecionado.
o

Caractersticas dos testes diagnsticos

Doena Presente Ausente Teste Positivo a Negativo c a+c b d b+d


a+b c+d

Figura 1 - Caractersticas dos testes diagnsticos: Se - sensibilidade; Es especificidade; VPP - valor predicativo positivo;VPN - valor predicativo negativo; P - prevalncia; Ex - exatido

Sensibilidade: proporo de indivduos doentes que tm um teste positivo ou a probabilidade de, estando doente, ter um teste positivo. Especificidade: proporo de indivduos no doentes que tm um teste negativo ou a probabilidade de, no estando doente, ter um teste negativo. Valor preditivo positivo: proporo de indivduos com o teste positivo que so doentes ou a probabilidade de, tendo um teste positivo, estar doente (probabilidade ps-teste). Valor preditivo negativo: proporo de indivduos com o teste negativo que no so doentes ou a probabilidade de, tendo um teste negativo, no estar doente. Exatido: proporo de indivduos que tiveram um resultado verdadeiro ou probabilidade de obter um resultado verdadeiro com o teste em causa. Prevalncia: proporo de indivduos doentes ou probabilidade de estar doente, independentemente do resultado do teste (probabilidade pr-teste).

Pgina 62 de 108

Testes Sensveis Um teste muito sensvel aquele que, geralmente, positivo quando a doena est presente. Este tipo de testes so teis nas seguintes situaes:

Quando existe uma penalizao importante para a omisso do diagnstico; Em programas de rastreio; No incio da avaliao de um doente, quando esto a ser consideradas muitas possibilidades de diagnstico, de modo a pr de parte, com grande confiana, alguns diagnsticos, e assim, reduzir as possibilidades de diagnstico.

Conclui-se que um teste muito sensvel mais til quando o resultado negativo. Testes Especficos Um teste muito especfico aquele que, geralmente, negativo quando a doena est ausente. Este tipo de testes so teis nas seguintes situaes:

Quando se pretende confirmar um diagnstico que sugerido por testes menos especficos; Quando a existncia de um resultado falso positivo tem importantes implicaes fsicas, emocionais ou financeiras para o doente.

Conclui-se que um teste muito especfico mais til quando o resultado positivo.

Curvas ROC Geralmente, a sensibilidade e a especificidade so caractersticas difceis de conciliar, isto , complicado aumentar a sensibilidade e a especificidade de um teste ao mesmo tempo. As curvas ROC (receiver operator characteristic curve) so uma forma de representar a relao, normalmente antagnica, entre a sensibilidade e a especificidade de um teste diagnstico quantitativo, ao longo de um contnuo de valores de "cutoff point". Para construir uma curva ROC traa-se um diagrama que represente a sensibilidade em funo da proporo de falsos positivos (1- Especificidade) para um conjunto de valores de "cutoff point".

Pgina 63 de 108

Figura 3: Curvas ROC. A, B e C representam a sensibilidade em funo de (1especificidade) para trs "cutoff point" diferentes. O ponto para o qual se consegue uma melhor sensibilidade e especificidade, na curva 2, B. O teste correspondente curva 1 tem uma exatido superior ao correspondente curva 2. Quando se tem uma varivel contnua, resultado da aplicao de um teste diagnstico quantitativo, e se pretende transforma-la numa varivel dicotmica, do tipo doente / no doente, temos que utilizar um determinado valor na escala contnua que discrimine entre essas duas classes. A esse valor d-se o nome de "cutoff point". O valor escolhido como "cutoff point" vai influenciar as caractersticas do teste, como exemplificado na figura 3 (curva 2). No exemplo da figura 3, quanto maior o "cutoff point" maior a especificidade do teste mas menor a sensibilidade (ponto C da curva 2); e quanto menor o "cutoff point" maior a sensibilidade mas menor a especificidade (ponto A da curva 2).

Pgina 64 de 108

Assim, a inteno com que se utilizar o teste diagnstico vai influenciar a escolha do "cutoff point", logo, das caractersticas do teste. No exemplo da curva 2 da figura 3, se pretendemos um teste muito sensvel e menos especfico, escolhe-se um "cutoff point" menor (ponto A), obtendo-se uma maior proporo de falsos positivos; se pretendemos um teste muito especfico e menos sensvel, escolhe-se um "cutoff point" maior (ponto C), obtendo-se uma menor proporo de falsos negativos. As curvas ROC descrevem a capacidade discriminativa de um teste diagnstico para um determinado nmero de valores "cutoff point". Isto permite pr em evidncia os valores para os quais existe maior optimizao da sensibilidade em funo da especificidade. O ponto, numa curva ROC, onde isto acontece aquele que se encontra mais prximo do canto superior esquerdo do diagrama (ver figura 3, ponto B da curva 2). Por outro lado, as curvas ROC permitem quantificar a exatido de um teste diagnstico, j que, esta proporcional rea sob a curva ROC, isto , tanto maior quanto mais a curva se aproxima do canto superior esquerdo do diagrama. Sabendo isto, a curva ser til, tambm, na comparao de testes diagnsticos, tendo um teste uma exatido tanto maior, quanto maior for a rea sob a curva ROC (ver figura 3). Valores preceptivos e seus determinantes Na clnica, e uma vez pedido um teste diagnstico, a sensibilidade e a especificidade do teste deixa de ser importante, passando a interessar s os valores preditivos do teste, isto , a probabilidade de, perante um resultado positivo ou negativo, existir ou no doena (rever conceitos de valores preditivos positivos e negativos). Os valores preditivos de um teste diagnstico dependem, essencialmente, de trs fatores: sensibilidade e especificidade do teste e a prevalncia da doena. A sensibilidade e especificidade, pelo contrrio, no dependem da prevalncia da doena. Os valores preceptivos so, assim, definidos pelas seguintes formulas:

Pgina 65 de 108

Se sensibilidade; Es especificidade VPP - valor preditivo positivo VPN - valor preditivo negativo P - prevalncia.

As relaes entre estas variveis so:

Quanto maior a sensibilidade, maior ser o valor preditivo negativo, isto , maior ser a probabilidade de, perante um resultado negativo, no haver doena. Quanto maior a especificidade, maior ser o valor preditivo positivo, isto , maior ser a probabilidade de, perante um resultado positivo, haver doena. Quanto maior a prevalncia da doena, maior ser o valor preditivo positivo e menor ser o valor preditivo negativo, isto , quanto mais freqente uma doena mais provvel encontrar verdadeiros positivos (aumentando o valor preditivo positivo), mas tambm mais provvel encontrar falsos negativos (diminuindo o valor preditivo negativo).

Concluso Nesta altura o aluno dever ter percebido que as respostas s questes do problema apresentado no incio desta aula advm, diretamente, dos resultados encontrados no artigo. Assim, as respostas s questes sero:

In the physical examination of abdominal aortic aneurysm (AAA), the only maneuver of demonstrated value is abdominal palpation to detect abnormal widening of the aortic pulsation. Palpation of AAA appears to be safe and has not been reported to precipitate rupture. The best evidence on the accuracy of abdominal palpation comes from 15 studies of patients not previously known to have AAA who were screened with both abdominal palpation and ultrasound. When results from these studies are pooled, the sensitivity of abdominal palpation increases significantly with AAA diameter (P<.001), ranging from 29% for AAAs of 3.0 to 3.9 cm to 50% for AAAs of 4.0 to 4.9 cm and 76% for AAAs of 5.0 cm or greater. The positive predictive value of palpation for AAA of 3.0 cm or greater in these studies was 43%. Limited data suggest that abdominal obesity decreases the sensitivity of palpation. Abdominal palpation specifically directed at measuring aortic width has moderate sensitivity for detecting an AAA that would be large

Pgina 66 de 108

enough to be referred for surgery but cannot be relied on to exclude AAA, especially if rupture is a possibility. 1. Qual a probabilidade de um doente que aparece no SU do HSJ com um aneurisma da aorta abdominal de 3.5 cm ter uma palpao abdominal positiva? R: 29 % 2. Qual a probabilidade de um doente que aparece no SU do HSJ com um aneurisma da aorta abdominal de 4.5 cm ter uma palpao abdominal positiva? R: 50% 3. Qual a probabilidade de um doente que aparece no SU do HSJ com um aneurisma da aorta abdominal de 5.5 cm ter uma palpao abdominal positiva? R: 76% 4. Qual a probabilidade de um doente que aparece no SU do HSJ e tem uma palpao abdominal positiva ter um aneurisma da aorta abdominal maior que 3 cm? R: 43% O aluno dever perceber, ainda, a importncia de que se reveste a matria apresentada nesta aula, em especial, na sua futura vida clnica, e saber aplicar os conhecimentos e aptides que durante esta aula lhe foram transmitidos.

Leituras recomendadas

Cecil Textbook of Medicine. 21st edition. Recomenda-se a leitura dos captulos 1 a 4 e 22 a 25. Harrisons Principles of Internal Medicine. 14th edition. Captulos 1 a 3. Rothman KJ, Greenland S. Modern Epidemiology. 2nd edition. Philadelphia: Lippincott-Raven Publishers; 1998. Captulos 1 e 2. Trochim, William M. The Research Methods Knowledge Base, 2nd Edition. Internet WWW page, at URL: http://trochim.human.cornell.edu/kb/index.htm (version current as of August 02, 2000). Goodman, Albert. SCI 101: Introduction to Data Colection and Analysis. Internet WWW page, at URL: http://www.deakin.edu.au/~agoodman/sci101/index.html (version current as of November 07, 1999). Bibliografia

Goldman L, Plum F, Bennett JC. Medicine as a Learned and Humane Profession. In: Cecil Textbook of Medicine. 21st edition. p 1-4.

Pgina 67 de 108

The Editors. The Practice of Medicine. In: Harrisons Principles of Internal Medicine. 14th edition. p 1-9. Rothman KJ, Greenland S. Modern Epidemiology. 2nd edition. Philadelphia: Lippincott-Raven Publishers; 1998. Hulley SB, Cummings SR. Designing Clinical Research. Baltimore: Wlliams and Wilkins; 1988.Trochim: Philosophy of Research. Kumar R. Research Methodology A step-by-step guide for beginners. London: SAGE Publications; 1996. Fletcher SW. Clinical Decision Making: Approach to the patient. In: Cecil Textbook of Medicine. 21st edition. p 77-79. Lee TH. Interpretation of data for clinical decisions. In: Cecil Textbook of Medicine. 21st edition. p 79-84. Goldman L. Quantitative aspects of clinical reasoning. In: Harrisons Principles of Internal Medicine. 14th edition. p Polgar S, Thomas SA. Introduction to Research in the Health Sciences. 3rd edition. Melbourne: Churchill Livingstone; 1995. Goodman, Albert. SCI 101: Introduction to Data Colection and Analysis. Internet WWW page, at URL: http://www.deakin.edu.au/~agoodman/sci101/index.html (version current as of November 07, 1999). Desenvolvimento por: Servio de Bioestatstica e Informtica Mdica Faculdade de Medicina da Universidade do Porto - Coordenador: Altamiro da Costa Pereira , MD, PhD (1995-) Coordenador. Concepo e avaliao educacional.

.-2--A NATUREZA DA ESTATSTICA

.
.INTRODUO ESTATSTICA: ramo da matemtica aplicada. ANTIGUIDADE: os povos j registravam o nmero de habitantes, nascimentos, bitos. Faziam "estatsticas". IDADE MDIA: as informaes eram tabuladas com finalidades tributrias e blicas. SEC. XVI : surgem as primeiras anlises sistemticas, as primeiras tabelas e os nmeros relativos. SEC. XVIII : a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representaes grficas e os clculos de probabilidades. A estatstica deixa de ser uma simples tabulao de dados numricos para se tornar " O estudo de como se chegar a concluso sobre uma populao, partindo da observao de partes dessa populao (amostra)". . MTODO ESTATSTICO MTODO: um meio mais eficaz para atingir determidada meta.

Pgina 68 de 108

MTODOS CIENTFICOS: destacamos o mtodo experimental e o mtodo estatstico. MTODO EXPERIMENTAL: consiste em manter constante todas as causas, menos uma, que sofre variao para se observar seus efeitos, caso existam. Ex: Estudos da Qumica, Fsica, etc. MTODO ESTATSTICO: diante da impossibilidade de manter as causas constantes(nas cincias sociais), admitem todas essas causas presentes variando-as, registrando essas variaes e procurando determinar, no resultado final, que influncias cabem a cada uma delas. Ex: Quais as causas que definem o preo de uma mercadoria quando a sua oferta diminui? Seria impossvel, no momento da pesquisa, manter constantes a uniformidade dos salrios, o gosto dos consumidores, nvel geral de preos de outros produtos, etc. A ESTATSTICA uma parte da matemtica aplicada que fornece mtodos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, a organizao ,a descrio dos dados, o cculo e a interpretao de coeficientes pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a interpretao dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATSTICA INDUTIVA ou INFERENCIAL, tambm chamada como a medida da incerteza ou mtodos que se fundamentam na teoria da probabilidade. . FASES DO MTODO ESTATSTICO 1 - DEFINIO DO PROBLEMA : Saber exatamente aquilo que se pretende pesquisar o mesmo que definir corretamente o problema. 2 - PLANEJAMENTO : Como levantar informaes ? Que dados devero ser obtidos ? Qual levantamento a ser utilizado ? Censitrio ? Por amostragem ? E o cronograma de atividades ? Os custos envolvidos ? etc. 3 - COLETA DE DADOS : Fase operacional. o registro sistemtico de dados, com um objetivo determinado. Dados primrios: quando so publicados pela prpria pessoa ou organizao que os haja recolhido. Ex: tabelas do censo demogrfico do IBGE. Dados secundrios: quando so publicados pro outra organizao. Ex: quando determinado jornal publica estatsticas referentes ao censo demogrfico extradas do IBGE. OBS: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande risco de erros de transcrio. Coleta Direta: quando obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferncia dos consumidores pela sua marca. A coleta direta pode ser : contnua (registros de nascimento, bitos, casamentos, etc.), peridica (recenseamento demogrfico, censo industrial) e ocasional (registro de casos de dengue). Coleta Indireta: feita por dedues a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliao,indcios ou proporcionalizao. 4 - APURAO DOS DADOS : Resumo dos dados atravs de sua contagem e agrupamento. a condensao e tabulao de dados.

Pgina 69 de 108

5 - APRESENTAO DOS DADOS : H duas foram de apresentao, que no se excluem mutuamente. A apresentao tabular, ou seja uma apresentao numrica dos dados em linhas e colunas distribudas de modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica. A apresentao grfica dos dados numricos constitui uma apresentao geomtrica permitindo uma viso rpida e clara do fenmeno. 6 - ANLISE E INTERPRETAO DOS DADOS : A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o fenmeno (estatstica descritiva). Na estatstica indutiva a interpretao dos dados se fundamentam na teoria da probabilidade. DEFINIES BSICAS DA ESTATSTICA FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo seja possvel da aplicao do mtodo estatstico. So divididos em trs grupos:
Fenmenos de massa ou coletivo: so aqueles que no podem ser definidos por uma simples observao. A estatstica dedica-se ao estudo desses fenmenos. Ex: A natalidade na Grande Vitria, O preo mdio da cerveja no Esprito Santo, etc. Fenmenos individuais:so aqueles que iro compor os fenmenos de massa. Ex: cada nascimento na Grande Vitria, cada preo de cerveja no Esprito Santo, etc. Fenmenos de multido:quando a s caractersticas observadas para a massa no se verificam para o particular.

DADO ESTATSTICO: um dado numrico e considerado a matria-prima sobre a qual iremos aplicar os mtodos estatsticos. POPULAO: o conjunto total de elementos portadores de, pelo menos, uma caracterstica comum. AMOSTRA: uma parcela representativa da populao que examinada com o propsito de tirarmos concluses sobre a essa populao. PARMETROS: So valores singulares que existem na populao e que servem para caracteriz-la.Para definirmos um parmetro devemos examinar toda a populao.Ex: Os alunos do 2 ano da FACEV tm em mdia 1,70 metros de estatura. ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso da amostra.

Pgina 70 de 108

ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, o levantamento e os estudos necessrios ao tratamento desses dados so designados genericamente de estatstica de atributo. Exemplo de classificao dicotmica do atributo: A classificao dos alunos da FACEV quanto ao sexo. atributo: sexo..........................classe: alunos da FACEV dicotomia: duas subclasses ( masculino e feminino) Exemplo de classificao policotmica do atributo: Alunos da FACEV quanto ao estado civil. atributo: estado civil...............classe: alunos da FACEV dicotomia: mais de duas subclasses ( solteiro, casado, divorciado, vivo, etc.) . VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno. VARIVEL QUALITATIVA: Quando seu valores so expressos por atributos: sexo, cor da pele,etc. VARIVEL QUANTITATIVA: Quando os dados so de carter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numrica, trata-se portanto da estatstica de varivel e se dividem em : VARIVEL DISCRETA OU DESCONTNUA: Seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens.Ex: N de alunos presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36. VARIVEL CONTNUA: Resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura atual do seu corpo.

Pgina 71 de 108

AMOSTRAGEM MTODOS PROBABILSTICOS Exige que cada elemento da populao possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da populao, a probabilidade de cada elemento ser 1/N. trata-se do mtodo que garante cientificamente a aplicao das tcnicas estatsticas de inferncias. Somente com base em amostragens probabilsticas que se podem realizar inferncias ou indues sobre a populao a partir do conhecimento da amostra. uma tcnica especial para recolher amostras, que garantem, tanto quanto possvel, o acaso na escolha. . AMOSTRAGEM CASUAL OU ALEATRIA SIMPLES: o processo mais elementar e freqentemente utilizado. equivalente a um sorteio lotrico. Pode ser realizada numerando-se a populao de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa seqncia, os quais correspondero aos elementos pertencentes amostra. Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1 - numeramos os alunos de 1 a 90. 2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel, colocamos na urna e aps mistura retiramos, um a um, nove nmeros que formaro a amostra. OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de nmeros aleatrios, construda de modo que os algarismos de 0 a 9 so distribudos ao acaso nas linhas e colunas. . .AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: Quando a populao se divide em estratos (subpopulaes), convm que o sorteio dos elementos da amostra leve em considerao tais estratos, da obtemos os elementos da amostra proporcional ao nmero de elementos desses estratos.

Pgina 72 de 108

Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. So portanto dois estratos (sexo masculino e sexo feminino). Logo, temos: SEXO POPULACO 10 % AMOSTRA MASC. 54 FEMIN. 36 Total 90 5,4 3,6 9,0 5 4 9

Numeramos ento os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de nmeros aleatrios. .

AMOSTRAGEM SISTEMTICA: Quando os elementos da populao j se acham ordenados, no h necessidade de construir o sitema de referncia. So exemplos os pronturios mdicos de um hospital, os prdios de uma rua, etc. Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinio. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um nmero de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o nmero sorteado fosse 4 a amostra seria: 4 casa, 22 casa, 40 casa, 58 casa, 76 casa, etc.

AMOSTRAGEM POR CONGLOMERADOS (OU AGRUPAMENTOS) Algumas populaes no permitem, ou tornam extremamente difcil que se identifiquem seus elementos. No obstante isso, pode ser relativamente fcil identificar alguns subgrupos da populao. Em tais casos, uma amostra aleatria simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos tpicos so quarteires, famlias, organizaes, agncias, edifcios etc. Exemplo:

Pgina 73 de 108

Num levantamento da populao de determinada cidade, podemos dispor do mapa indicando cada quarteiro e no dispor de uma relao atualizada dos seus moradores. Pode-se, ento, colher uma amostra dos quarteires e fazer a contagem completa de todos os que residem naqueles quarteires sorteados. MTODOS NO PROBABILSITCOS So amostragens em que h uma escolha deliberada dos elementos da amostra. No possvel generalizar os resultados das pesquisas para a populao, pois as amostras no-probabilsticas no garantem a representatividade da populao.

AMOSTRAGEM ACIDENTAL Trata-se de uma amostra formada por aqueles elementos que vo aparecendo, que so possveis de se obter at completar o nmero de elementos da amostra. Geralmente utilizada em pesquisas de opinio, em que os entrevistados so acidentalmente escolhidos. Exemplos: Pesquisas de opinio em praas pblicas, ruas movimentadas de grandes cidades etc.

AMOSTRAGEM INTENCIONAL De acordo com determinado critrio, escolhido intencionalmente um grupo de elementos que iro compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinio. Exemplo: Numa pesquisa sobre preferncia por determinado cosmtico, o pesquisador se dirige a um grande salo de beleza e entrevista as pessoas que ali se encontram.

AMOSTRAGEM POR QUOTAS Um dos mtodos de amostragem mais comumente usados em levantamentos de mercado e em prvias eleitorais. Ele abrange trs fases: 1 - classificao da populao em termos de propriedades que se sabe, ou presume, serem relevantes para a caracterstica a ser estudada;

Pgina 74 de 108

2 - determinao da proporo da populao para cada caracterstica, com base na constituio conhecida, presumida ou estimada, da populao; 3 - fixao de quotas para cada entrevistador a quem tocar a responsabilidade de selecionar entrevistados, de modo que a amostra total observada ou entrevistada contenha a proporo e cada classe tal como determinada na 2 fase. Exemplo: Numa pesquisa sobre o "trabalho das mulheres na atualidade". Provavelmente se ter interesse em considerar: a diviso cidade e campo, a habitao, o nmero de filhos, a idade dos filhos, a renda mdia, as faixas etrias etc. A primeira tarefa descobrir as propores (porcentagens) dessas caractersticas na populao. Imagina-se que haja 47% de homens e 53% de mulheres na populao. Logo, uma amostra de 50 pessoas dever ter 23 homens e 27 mulheres. Ento o pesquisador receber uma "quota" para entrevistar 27 mulheres. A considerao de vrias categorias exigir uma composio amostram que atenda ao n determinado e s propores populacionais estipuladas. SRIES ESTATSTICAS TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica. De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar :

um trao horizontal ( - ) quando o valor zero; trs pontos ( ... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogao ( ? ) quando temos dvida quanto exatido de determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que nestes documentos as tabelas no sero abertas devido a limitaes do editor html".
.

SRIE ESTATSTICA: qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie.

Pgina 75 de 108

Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta ou descontnua. Podem ser do tipo temporal, geogrfica ou especfica. a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie (fenmeno) so elementos fixos. Esta srie tambm chamada de histrica ou evolutiva. ABC VECLULOS LTDA. Vendas no 1 bimestre de 1996 PERODO UNIDADES VENDIDAS * JAN/96 FEV/96 TOTAL * Em mil unidades . b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao. ABC VECLULOS LTDA. Vendas no 1 bimestre de 1996 FILIAIS So Paulo TOTAL * Em mil unidades c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica. ABC VECLULOS LTDA. Vendas no 1 bimestre de 1996 UNIDADES VENDIDAS * 13 30 20 10 30

Rio de Janeiro 1 7

Pgina 76 de 108

MARCA UNIDADES VENDIDAS * FIAT GM 18 12

TOTAL 3 0 * Em mil unidades SRIES CONJUGADAS: Tambm chamadas de tabelas de dupla entrada. So apropriadas apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens de classificao: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrfica-temporal. ABC VECLULOS LTDA. Vendas no 1 bimestre de 1996 FILIAIS So Paulo TOTAL * Em mil unidades Obs: as sries hetergradas sero estudas em captulo especial ( distribuio de frequncias ). GRFICOS ESTATSTICOSGGG So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir as tabelas estatsticas. Caractersticas: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade.
Grficos de informao: So grficos destinados principalmente ao pblico em geral, objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as informaes desejadas estejam presentes. Grficos de anlise: So grficos que prestam-se melhor ao trabalho estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar de ser

Janeiro/96 Fevereiro/96 10 22 3 5 8

Rio de Janeiro 1 2

Pgina 77 de 108

tambm informativos. Os grficos de anlise freqentemente vm acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais revelados pelo grfico. Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo de escalas. . Classificao Cartogramas. . 1 - Diagramas: So grficos geomtricos dispostos em duas dimenses. So os mais usados na representao de sries estatsticas. Eles podem ser : 1.1- Grficos em barras horizontais. 1.2- Grficos em barras verticais ( colunas ). Quando as legendas no so breves usa-se de preferncia os grficos em barras horizontais. Nesses grficos os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica. 1.3- Grficos em barras compostas. 1.4- Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 1.5- Grficos em linhas ou lineares. So freqentemente usados para representao de sries cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo grfico. dos grficos: Diagramas, Estereogramas, Pictogramas e

Pgina 78 de 108

Quando representamos, em um mesmo sistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada pelos grficos desses fenmeno denominada de rea de excesso. 1.5- Grficos em setores. Este grfico construdo com base em um crculo, e empregado sempre que desejamos ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente proporcionais aos dados da srie. O grfico em setores s deve ser empregado quando h, no mximo, sete dados. Obs: As sries temporais geralmente no so representadas por este tipo de grfico. .

2 - Estereogramas: So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que oferecem. . 3 - Pictogramas: So construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente e sugestiva. Os smbolos deven ser auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo abaixo:

Pgina 79 de 108

4- Cartogramas: So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas. DISTRIBUIO DE FREQUNCIA um tipo de tabela que condensa uma coleo de dados conforme as freqncias (repeties de seus valores).
Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados no ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
ROL: a tabela obtida aps a ordenao dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Distribuio de freqncia sem intervalos de classe: a simples condensao dos dados conforme as repeties de seu valores. Para um ROL de tamanho razovel esta distribuio de freqncia inconveniente, j que exige muito espao. Veja exemplo abaixo:

Pgina 80 de 108

Dados Freqncia 41 42 43 44 45 46 50 51 52 54 57 58 60 Total 3 2 1 1 1 2 2 1 1 1 1 2 2 20

Distribuio de freqncia com intervalos de classe:Quando o tamanho da amostra elevado mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.

Classes

Freqncias

41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20

ELEMENTOS DE UMA DISTRIBUIO DE FREQUNCIA (com intervalos de classe): CLASSE: so os intervalos de variao da varivel e simbolizada por i e o nmero total de classes simbolizada por k. Ex: na tabela anterior k=5 e 49 |------53 a 3 classe, onde i=3. LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limite inferior de classe (li) e o maior nmero, limite superior de classe(Li). Ex: em 49 |------- 53... l3= 49 e L3= 53. O smbolo |------- representa um intervalo fechado

Pgina 81 de 108

esquerda e aberto direita. O dado 53 do ROL no pertence a classe 3 e sim a classe 4 representada por 53 |------- 57. AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre o limite superior e inferior da classe e simbolizada por hi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na distribuio de freqncia c/ classe o hi ser igual em todas as classes. AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20. AMPLITUDE TOTAL DA AMOSTRA (ROL): a diferena entre o valor mximo e o valor mnimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19. Obs: AT sempre ser maior que AA. PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes iguais. .......Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2. MTODO PRTICO PARA CONSTRUO DE UMA DIST. DE FREQUNCIAS C/ CLASSE: 1 - Organize os dados brutos em um ROL. 2 - Calcule a amplitude amostral AA. No nosso exmplo: AA =60 - 41 =19 3 - Calcule o nmero de classes atravs da "Regra de Sturges":
n i= n de classes

3 |-----| 5 6 |-----| 11 12 |-----| 22 23 |-----| 46 47 |-----| 90

3 4 5 6 7

91 |-----| 181 8 182 |-----| 362 9

Pgina 82 de 108

Obs: Qualquer regra para determinao do n de classes da tabela no nos levam a uma deciso final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado natureza dos dados. No nosso exemplo: n = 20 dados, ento ,a princpio, a regra sugere a adoo de 5 classes. 4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA/i. No nosso exemplo: AA/i = 19/5 = 3,8 . Obs:Como h > AA/i um valor ligeiramente superior para haver folga na ltima classe. Utilizaremos ento h = 4 5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes com freqncia = 0 (zero). No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira classe ser representada por ...... 41 |------- 45. As classes seguintes respeitaro o mesmo procedimento. O primeiro elemento das classes seguintes sempre sero formadas pelo ltimo elemento da classe anterior. REPRESENTAO GRFICA DE UMA DISTRIBUIO .Histograma, Polgono de freqncia e Polgono de freqncia acumulada Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as freqncias. . Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios dos intervalos de classe. A rea de um histograma proporcional soma das freqncias simples ou absolutas.
Freqncias simples ou absolutas: so os valores que realmente representam o nmero de dados de cada classe. A soma das freqncias simples igual ao nmero total dos dados da distribuio.

Pgina 83 de 108

Freqncias relativas: so os valores das razes entre as freqncias absolutas de cada classe e a freqncia total da distribuio. A soma das freqncias relativas igual a 1 (100 %).

. Polgono de freqncia: um grfico em linha, sendo as freqncias marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos intervalos de classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da posterior ltima, da distribuio. . Polgono de freqncia acumulada: traado marcando-se as freqncias acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.
Freqncia simples acumulada de uma classe: o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freqncia relativa acumulada de um classe: a freqncia acumulada da classe, dividida pela freqncia total da distribuio.

...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri..... 50 |-------- 54 4 54 |-------- 58 9 58 |-------- 62 11 62 |-------- 66 8 66 |-------- 70 5 70 |-------- 74 3 Total 40 52 56 60 64 68 72 0,100 0,225 0,275 0,200 0,125 0,075 1,000 4 13 24 32 37 40 0,100 0,325 0,600 0,800 0,925 1,000

Exerccio: (Com base na tabela acima) Sendo fi= freq. simples; xi= ponto mdio de classe; fri= freq. simples acumulada; Fi= freq. relativa e Fri= freq. relativa acumulada. Construa o histograma, polgono de frequncia e polgono de freq. acumulada: Obs: uma distribuio de freqncia sem intervalos de classe representada graficamente por um diagrama onde cada valor da varivel representado por um segmento de reta vertical e de comprimento proporcional respectiva freqncia.

Pgina 84 de 108

MEDIDAS DE POSIO Introduo So as estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal do grfico da curva de freqncia. As medidas de posies mais importantes so as medidas de tendncia central ou promdias (verifica-se uma tendncia dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica, quadrtica, cbica e biquadrtica. As outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os decis, os quartis e os percentis. . MDIA ARITMTICA = igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores. ......onde xi so os valores da varivel e n o nmero de valores. .
Dados no-agrupados:

Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de freqncias, determinamos a mdia aritmtica simples. Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de: .= (10+14+13+15+16+18+12) / 7 = 14 kilos Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica, ou seja:.. di = Xi -

Pgina 85 de 108

No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , ...d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e... d7 = 12 - 14 = - 2. . Propriedades da mdia 1 propriedade: A soma algbrica dos desvios em relao mdia nula. No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada ( ou diminuida) dessa constante. Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos: Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou Y= .+ 2 = 14 +2 = 16 kilos

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada ( ou dividida) por essa constante. Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel temos: Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou Y= .
Dados agrupados:

x 3 = 14 x 3 = 42 kilos

Sem intervalos de classe Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de filhos do sexo masculino. Calcularemos a quantidade mdia de meninos por famlia:

Pgina 86 de 108

N de meninos freqncia = fi 0 1 2 3 4 total 2 6 10 12 4 34

Como as freqncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula:

..xi. ..fi. ..xi.fi . 0 1 2 3 4 2 6 0 6

10 20 12 36 4 16

total 34 78 onde 78 / 34 = 2,3 meninos por famlia

Com intervalos de classe Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da frmula: ..onde Xi o ponto mdio da classe. Exemplo: Calcular a estatura mdia de bebs conforme a tabela abaixo. Estaturas (cm) freqncia = fi ponto mdio = xi ..xi.fi. 50 |------------ 54 4 52 208

Pgina 87 de 108

54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 70 |------------ 74 3 Total 40

56 60 64 68 72

504 660 512 340 216 2.440 = 61 cm

Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... MODA

o valor que ocorre com maior freqncia em uma srie de valores. Mo o smbolo da moda. Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o salrio recebido pelo maior nmero de empregos dessa fbrica. . A Moda quando os dados no esto agrupados

A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que mais se repete.

Exemplo: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie bimodal. . A Moda quando os dados esto agrupados a) Sem intervalos de classe

Pgina 88 de 108

Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o valor da varivel de maior freqncia. Exemplo: Qual a temperatura mais comum medida no ms abaixo: Temperaturas Freqncia 0 C 1 C 2 C 3 C 3 9 12 6

Resp: 2 C a temperatura modal, pois a de maior freqncia. . b) Com intervalos de classe A classe que apresenta a maior freqncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta. Mo = ( l* + L* ) / 2 onde l* = limite inferior da classe modal e L*= limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo. Classes (em cm) Freqncia 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 Resp: a classe modal 58|-------- 62, pois a de maior freqncia. l*=58 e L*=62 Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no conhecemos o valor real da moda). .

Pgina 89 de 108

Mtodo mais elaborado pela frmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h* l*= limite inferior da classe modal..... e..... L*= limite superior da classe modal d1= freqncia da classe modal - freqncia da classe anterior da classe modal d2= freqncia da classe modal - freqncia da classe posterior da classe modal h*= amplitude da classe modal Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a mdia aritmtica a medida de posio que possui a maior estabilidade. MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos. Smbolo da mediana: Md . A mediana em dados no-agrupados Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9. . Mtodo prtico para o clculo da Mediana Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de ordem dado fela frmula : .( n + 1 ) / 2 Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

Pgina 90 de 108

1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana A mediana ser o 5 elemento = 2 . Se a srie dada tiver nmero par de termos: O valor mediano ser o termo de ordem dado pela frmula :.... .[( n/2 ) +( n/2+ 1 )] / 2 Obs: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor correspondente. Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2 5 termo = 2 6 termo = 3 A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a mdia aritmtica do 5 e 6 termos da srie. Notas:

Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. Em um srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. A mediana, depende da posio e no dos valores dos elementos na srie ordenada. Essa uma da diferenas marcantes entre mediana e mdia ( que se deixa influenciar, e muito, pelos valores extremos). Vejamos:

Pgina 91 de 108

Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10 isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma. . A mediana em dados agrupados a) Sem intervalos de classe Neste caso, o bastante identificar a freqncia acumulada imediatamente superior metade da soma das freqncias. A mediana ser aquele valor da varivel que corresponde a tal freqncia acumulada. Exemplo conforme tabela abaixo: Varivel xi Freqncia fi Freqncia acumulada 0 1 2 3 4 total 2 6 9 13 5 35 2 8 17 30 35

Quando o somatrio das freqncias for mpar o valor mediano ser o termo de ordem dado pela frmula :.

Como o somatrio das freqncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3.. .. Quando o somatrio das freqncias for par o valor mediano ser o termo de ordem dado pela frmula :.

Pgina 92 de 108

Exemplo - Calcule Mediana da tabela abaixo: Varivel xi Freqncia fi Freqncia acumulada 12 14 15 16 17 20 total 1 2 1 2 1 1 8 1 3 4 6 7 8

Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe Devemos seguir os seguintes passos: 1) Determinamos as freqncias acumuladas ; 2) Calculamos ; 3) Marcamos a classe correspondente . Tal classe ser a classe

freqncia acumulada imediatamente superior mediana ;

4) Calculamos a Mediana pela seguinte frmula:..... l* + [( l* = o limite inferior da classe mediana.

- FAA ) x h*] / f*

FAA = a freqncia acumulada da classe anterior classe mediana. f* = a freqncia simples da classe mediana. h* = a amplitude do intervalo da classe mediana. Exemplo: classes freqncia = fi Freqncia acumulada 4

50 |------------ 54 4

Pgina 93 de 108

54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 70 |------------ 74 3 total 40

13 24 32 37 40

= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio. Emprego da Mediana

Quando desejamos obter o ponto que divide a distribuio em duas partes iguais. Quando h valores extremos que afetam de amaneira acentuada a mdia aritmtica. Quando a varivel em estudo salrio.

SEPARATRIZES Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes. . QUARTIS Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a srie em quatro partes iguais.

Pgina 94 de 108

Obs: O quartil 2 ( Q2 ) sempre ser igual a mediana da srie.

Quartis em dados no agrupados O mtodo mais prtico utilizar o princpio do clculo da mediana para os 3 quartis. Na realidade sero calculadas " 3 medianas " em uma mesma srie. Exemplo1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 } O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9 que ser = Q2. Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana ( quartil 2). Para o cculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da srie (quartil 2). Logo em { 2, 5, 6 } a mediana = 5 . Ou seja: ser o quartil 1 em {10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3

Exemplo2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 O quartil 1 ser a mediana da srie esquerda de Md : { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 O quartil 3 ser a mediana da srie direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9 Quartis para dados agrupados em classes Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana,

Pgina 95 de 108

E fi / 2.... por ... k . E fi / 4 ... sendo k o nmero de ordem do quartil.

Assim, temos: Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f* Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f* Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f* Exemplo3 - Calcule os quartis da tabela abaixo:

classes

freqncia = fi Freqncia acumulada 4 13 24 32 37 40

50 |------------ 54 4 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 70 |------------ 74 3 total O quartil 2 = Md , logo: 40

= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 O quartil 1 : E fi / 4 = 10 Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 . O quartil 3 : 3.E fi / 4 = 30 Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65

Pgina 96 de 108

DECIS A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao da porcentagem de valores que ficam aqum e alm do decil que se pretende calcular. A frmula bsica ser : k .E fi / 10 onde k o nmero de ordem do decil a ser calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma srie em 10 partes iguais. De especial interesse o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo,o quinto decil igual ao segundo quartil, que por sua vez igual mediana. Para D5 temos : 5.E fi / 10 = E fi / 2 Exemplo: Calcule o 3 decil da tabela anterior com classes. k= 3 onde 3 .E fi / 10 = 3x40/10 = 12. Este resultado corresponde a 2 classe. D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55

PERCENTIL ou CENTIL Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que P50 = Md ; P25 = Q1 e P75 = Q3. O clculo de um centil segue a mesma tcnica do clculo da mediana, porm a frmula ser : k .E fi / 100 onde k o nmero de ordem do centil a ser calculado. Exemplo: Calcule o 8 centil da tabela anterior com classes . k= 8 onde 8 .E fi / 100 = 8x40/100 = 3,2. Este resultado corresponde a 1 classe. P8 = 50 + [ (3,2 -0) x 4] / 4 = 50 + 3,2 = 53,2 Disperso ou Variabilidade: a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central ( mdia ou mediana ) tomado como ponto de comparao. A mdia - ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores - no pode, por si mesma, destacar o grau de

Pgina 97 de 108

homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto. Consideremos os seguintes conjuntos de valores das variveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5 = 70 Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa. Conclumos ento que o conjunto X apresenta disperso nula e que o conjunto Y apresenta uma disperso menor que o conjunto Z.

MEDIDAS DE DISPERSO ABSOLUTA Amplitude total : a nica medida de disperso que no tem na mdia o ponto de referncia. Quando os dados no esto agrupados a amplitude total a diferena entre o maior e o menor valor observado: AT = X mximo - X mnimo. Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: AT = 70 - 40 = 30 Quando os dados esto agrupados sem intervalos de classe ainda temos : AT = X mximo - X mnimo. Exemplo: xi 0 1 3 4 fi 2 6 5 3 Pgina 98 de 108

AT = 4 - 0 = 4 Com intervalos de classe a amplitude total a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. Ento AT = L mximo - l mnimo Exemplo: Classes 4 |------------- 6 6 |------------- 8 8 |------------- 10 AT = 10 - 4 = 6 A amplitude total tem o inconveniente e s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de clculo rpido sem muita exatido. 6 2 3 fi

Desvio quartil Tambm chamado de amplitude semi-interquatlica e baseada nos quartis. Smbolo: Dq Observaes: 1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fcil de calcular e de interpretar. Alm do mais, no afetado pelos valores extremos, grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que no se consideram representativos. 2- O desvio quartil dever ser usado preferencialmente quando a medida de tendncia central for a mediana. 3- Trata-se de uma medida insensvel distribuio dos itens menores que Q1, entre Q1 e Q3 e maiores que Q3. Exemplo: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser: Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75 e a Frmula: Dq = (Q3 - Q1) / 2

Pgina 99 de 108

Desvio mdio absoluto Para dados brutos a mdia aritmtica dos valores absolutos dos desvios tomados em relao a uma das seguintes medidas de tendncia central: mdia ou mediana. Smbolo = Dm Frmula : para a Mdia = E | Xi | /n

Frmula : para a Mediana = E | Xi - Md | / n As barras verticais indicam que so tomados os valores absolutos, prescindindo do sinal dos desvios. Exemplo: Calcular o desvio mdio do conjunto de nmeros { - 4 , - 3 , - 2 , 3 , 5 } = - 0, 2 e Md = - 2 Tabela auxiliar para clculo do desvio mdio Xi Xi | Xi | Xi - Md | Xi - Md |

- 4 (- 4) - (-0,2) = -3,8 3,8 - 3 (- 3) - (-0,2) = -2,8 2,8 - 2 (- 2) - (-0,2) = -1,8 1,8 3 5 3 - (-0,2) = 3,2 5 - (-0,2) = 5,2
E=

(- 4) - (-2) = - 2 2 (- 3) - (-2) = - 1 1 (- 2) - (-2) = 0 0 3 - (-2) = 5 5 - (-2) = 7


E=

3,2 5,2 16,8

5 7 15

Pela Mdia : Dm = 16,8 / 5 = 3,36

Pela Mediana : Dm = 15 / 5 = 3

Desvio mdio para Dados Tabulados Se os valores vierem dispostos em uma tabela de freqncias, agrupados ou no em classes, sero usadas as seguintes frmulas: Clculo pela mdia: Dm = (E |Xi |. fi ) / E fi

Pgina 100 de 108

Clculo pela mediana: Dm = (E |Xi - Md |. fi ) / E fi Exemplo de clculo pela mdia: Xi 3 4 5 6 f i Xi . f i 2 6 2 8 3 15 3 18 Xi 4,7 - 1,7 4,7 - 0,7 4,7 0,3 4,7 1,3 | Xi 1,7 0,7 0,3 1,3
E=

| Xi 3,4 1,4 0,9 3,9 9,6

|.fi

E = 10 47

Dm = 9,6 / 10 = 0,96 Para o clculo do Desvio mdio pela mediana segue-se o mesmo raciocnio. Xi 3 4 5 6 f i Md Xi - Md | Xi - Md | 2 5 2 5 3 5 3 5 -2 -1 0 1 2 1 0 1
E=

| Xi - Md | . f i 4 2 0 1 7

E = 10

Dm = 7 / 10 = 0,70 Obs: Apesar de o desvio mdio expressar aceitavelmente a disperso de uma amostra, no to freqentemente empregado como o desvio-padro. O desvio mdio despreza o fato de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se fossem todos positivos. Todavia ser preferido o uso do desvio mdio em lugar do desvio-padro, quando esse for indevidamente influenciado pelos desvios extremos. DESVIO PADRO a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representada por S .

Pgina 101 de 108

A frmula acima empregada quando tratamos de uma populao de dados noagrupados. Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5 Xi -4 -3 -2 3 5 - 0,2 - 0,2 - 0,2 - 0,2 - 0,2 - 3,8 - 2,8 - 1,8 3,2 5,2
E=

14,44 7,84 3,24 10,24 27,04 62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 o desvio padro = 3,54 Obs: Quando nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos tirar inferncias vlidas para a respectiva populao, convm efetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. A frmula ficar ento:

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padro amostra seria a raiz quadrada de 62,8 / (5 -1) = 3,96 O desvio padro goza de algumas propriedades, dentre as quais destacamos:

Pgina 102 de 108

1 = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera. 2 = Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.

Quando os dados esto agrupados (temos a presena de freqncias) a frmula do desvio padro ficar :

ou amostra Exemplo:

quando se trata de uma

Calcule o desvio padro populacional da tabela abaixo: Xi 0 1 2 3 4 f i Xi . f i 2 6 12 7 3 0 6 24 21 12 63 2,1 2,1 2,1 2,1 2,1 -2,1 -1,1 -0,1 0,9 1,9 4,41 1,21 0,01 0,81 3,61
E=

.fi 8,82 7,26 0,12 5,67 10,83 32,70

Total 30

Sabemos que E fi = 30 e 32,7 / 30 = 1,09. A raiz quadrada de 1,09 o desvio padro = 1,044 Se considerarmos os dados como sendo de uma amostra o desvio padro seria : a raiz quadrada de 32,7 / (30 -1) = 1,062 Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior.

Pgina 103 de 108

VARINCIA o desvio padro elevado ao quadrado e simbolizado por S2 A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras.

MEDIDAS DE DISPERSO RELATIVA CVP: Coeficiente de Variao de Pearson Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de CVP: Coeficiente de Variao de Pearson ( a razo entre o desvio padro e a mdia referentes a dados de uma mesma srie). ) x 100 ( o resultado neste caso expresso em A frmula do CVP = (S / percentual, entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor 100 da frmula). Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos: Discriminao PESOS MDIA 68 kg DESVIO PADRO 5,0 cm 2,0 kg

ESTATURAS 175 cm

Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Pgina 104 de 108

Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor ser o de maior homogeneidade ( menor disperso ou variabilidade). CVPestatura = ( 5 / 175 ) x 100 = 2,85 % CVPpeso = ( 2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos.

CVT: Coeficiente de Variao de Thorndike igual ao quociente entre o desvio padro e a mediana. CVT = S / Md %. ou CVT = (S / Md) x 100 quando queremos o resultado em

CVQ: Coeficiente Quartlico de Variao Esse coeficiente definido pela seguinte expresso: CVQ = (Q3 - Q1) / (Q3 + Q1) ou em %. [(Q3 - Q1) / (Q3 + Q1)] x 100 para resultado

Desvio quartil Reduzido: Dqr = (Q3 - Q1) / 2Md ou [(Q3 - Q1) / 2Md ] x 100 para resultado em %. MEDIDAS DE ASSIMETRIA Introduo: Uma distribuio com classes simtrica quando : Mdia = Mediana = Moda Uma distribuio com classes : Assimtrica esquerda ou negativa quando : Mdia < Mediana < Moda Assimtrica direita ou positiva quando : Mdia > Mediana > Moda

Pgina 105 de 108

PROBABILIDADE

Introduo: O clculo das probabilidades pertence ao campo da Matemtica, entretanto a maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou probabilstica. O conhecimento dos aspectos fundamentais do clculo da probabilidades uma necessidade essencial para o estudo da Estatstica Indutiva ou Inferencial.

Experimento Aleatrio So fenmenos que, mesmo repetido vrias vezes sob condies semelhantes, apresentam resultados imprevisveis. O resultado final depende do acaso. Exemplo: Da afirmao " provvel que o meu time ganhe a partida hoje" pode resultar: - que ele ganhe - que ele perca - que ele empate

Este resultado final pode ter trs possibilidades.

Espao Amostra o conjunto universo ou o conjunto de resultados possveis de um experimento aleatrio. No experimento aleatrio "lanamento de uma moeda" temos o espao amostra {cara, coroa}. No experimento aleatrio "lanamento de um dado" temos o espao amostra {1, 2, 3, 4, 5, 6}. No experimento aleatrio "dois lanamentos sucessivos de uma moeda" temos o espao amostra : {(ca,ca) , (co,co) , (ca,co) , (co,ca)}

Pgina 106 de 108

Obs: cada elemento do espao amostra que corresponde a um resultado recebe o nome de ponto amostra. No primeiro exemplo : cara pertence ao espao amostra {cara, coroa}.

Eventos qualquer subconjunto do espao amostra de um experimento aleatrio. Se considerarmos S como espao amostra e E como evento: Assim, qualquer que seja E, se E c S (E est contido em S), ento E um evento de S. Se E = S , E chamado de evento certo. Se E c S e E um conjunto unitrio, E chamado de evento elementar. Se E = , E chamado de evento impossvel.

Arredondamento de dados Muitas vezes, necessrio ou conveniente suprimir unidades inferiores s de determinada ordem. Esta tcnica denominada arredondamento de dados. De acordo com a resoluo 886/66 do IBGE, o arredondamento feito da seguinte maneira: 1 - Quando o primeiro algarismo a ser abandonado 0,1,2,3 ou 4, fica inalterado o ltimo algarismo a permanecer. Ex: 53,24 passa a 53,2 ; 44,03 passa a 44,0

2 - Quando o primeiro algarismo a ser abandonado 6,7,8, ou 9, aumenta-se de uma unidade o algarismo a permanecer. Ex: 53,87 passa a 53,9 ; 44,08 passa a 44,1 ; 44,99 passa a 45,0

3 - Quando o primeiro algarismo a ser abandonado 5, h duas solues:

Pgina 107 de 108

a) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer. Ex: 2,352 passa a 2,4 ; 25,6501 passa a 25,7 ; 76,250002 passa a 76,3

b) Se o 5 for o ltimo algarismo ou se ao 5 s se seguirem zeros, o ltimo algarismo a ser conservado s ser aumentando de uma unidade se for mpar. Exemplos:

24,75 passa a 24,8 24,65 passa a 24,6 24,75000 passa 24,8 24,6500 passa a 24,6

Obs: No devemos nunca fazer arredondamento sucessivos. Exemplo: 17,3452 passa a 17,3 e no para 17,35 e depois para 17,4.

Compensao Suponhamos os dados abaixo, aos quais aplicamos as regras do arredondamento: 25,32 + 17,85 + 10,44 + 31,17 = 84,78 25,3 + 17,8 + 10,4 + 31,2 = 84,7 Verificamos que houve uma pequena discordncia: a soma exatamente 84,7 quando, pelo arredondamento, deveria ser 84,8. entretanto, para a apresentao dos resultados, necessrio que desaparea tal diferena, o que possvel pela prtica do que denominamos compensao, conservando o mesmo nmero de casas decimais. Usamos "descarregar" a diferena na(s) maior(es) parcela(s). Veja: 25,3 + 17,8 + 10,4 + 31,3 = 84,8 Obs: Se a maior parcela igual ou maior que o dobro de qualquer outra parcela, "descarregamos" a diferena apenas na maior parcela.

Pgina 108 de 108