Sei sulla pagina 1di 22

1.1 Qu es la Estadstica?

Juan Bta. Chavarra

La Estadstica provee estndares metodolgicos, tiles para casi todas las disciplinas. Tiene que ver con la bsqueda de mtodos y tcnicas que provean validez al proceso de recoleccin, anlisis y presentacin de datos, y su eventual generalizacin a un universo de elementos mayor que el observado. La recoleccin de datos implica, entre otras cosas, consideraciones sobre medicin (escalas, unidades de medida, definicin de trminos, instrumentos, etc) y sobre plan o diseo (Cul es el propsito de recolectar los datos?). El anlisis implica clasificar, ordenar y resumir los datos. Tambin incluye hacer clculos e interpretarlos. En la presentacin de los resultados relevantes, el lenguaje metodolgico preciso y los protocolos y tcnicas para construccin de cuadros y grficos son de gran utilidad. Estas primeras etapas conforman La Estadstica Descriptiva. Sin embargo, en la mayora de los casos, hay inters en generalizar los resultados, por medio de estimaciones, proyecciones y pruebas de hiptesis. Tambin interesa estimar el error asociado con esa generalizacin, y esto se basa en la teora de probabilidades, un campo de la matemtica. Estas otras etapas conforman la Estadstica Inferencial. Vistazo general de los mtodos estadsticos Los mtodos estadsticos, en general, proporcionan herramientas para analizar datos. Pero esos anlisis usualmente responden a una investigacin que tiene un propsito. Para cumplir con ese propsito, la recoleccin de los datos (evidencias) debe conducirse acorde con el objetivo propuesto y respetando cierto protocolo que lleve a un anlisis vlido. Esto requiere hacer un plan (diseo), para que tengamos mayor probabilidad de contestar la pregunta de inters, y no otra. Resumiendo, podemos decir que el anlisis de los datos depende del objetivo de la investigacin y del diseo propuesto.

Diseo: Recoleccin de datos y diseo estadstico Anlisis: Anlisis estadstico de datos

Mtodos estadsticos

Visto as, un diseo implica un plan, es decir un propsito en mente, y esto afecta la forma en que se recolectan los datos. Simplificando las cosas, podemos decir que hay dos formas de recolectar datos: por observacin o por experimento. Hablamos de experimento cuando el investigador puede "controlar" los factores ms importantes o cruciales, en la recoleccin de sus datos. De otra forma hablamos de estudio por observacin. Los estudios por experimento, pueden contestar preguntas que implican causalidad. En cambio los estudios por observacin, solamente pueden aspirar a contestar preguntas que implican asociacin.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

Recoleccin de datos y diseo estadstico (Diseo)


Cada proyecto de investigacin tiene un propsito (Objetivo) Se requiere planear con ese propsito en mente Se necesita un plan (diseo) para recolectar datos por: Observacin . Experimento Muestreo al azar Aleatorizacin

Estudio por observacin Contesta preguntas sobre asociacin Estudio por experimento Contesta preguntas sobre causalidad

Para recolectar datos, estos deben "medirse" de alguna manera. Esto puede hacerse de una forma laxa con una escala cualitativa, o de una manera ms contundente, con una escala cuantitativa. En la medicin, se asignan smbolos o nmeros a objetos para representar calidad, intensidad o cantidad. Esto le permite al investigador hacer comparaciones de aspectos cualitativos y cuantitativos, y observar cambios en la caracterstica que se est analizando. Las escalas suelen clasificarse segn los siguientes criterios: tipo de relacin que permiten establecer (igualdad, orden, cantidad); si existe o no una unidad de medida (grados centgrados, kilos, etc); y si existe un verdadero origen de la escala (interpretacin del cero). La tcnica de anlisis estadstico aplicable en una situacin, depende mucho de las escalas involucradas. Una vez medida la variable y realizado algn clculo (estimacin) o prueba de hiptesis, se desea tener una apreciacin de la incertidumbre implicada en ese clculo o en esa decisin. Esto se logra con el auxilio de modelos de probabilidad. Para poder usar modelos de probabilidad, deben utilizarse mecanismos aleatorios en la seleccin de las unidades de estudio (muestreo al azar, en estudios por observacin) o en la asignacin de ellas a grupos o condiciones (aleatorizacin, en estudios por experimento). Como ya se mencion, el anlisis de los datos depende del propsito del estudio y del diseo utilizado, as como de la escala de medicin. El diseo usado implica algn mecanismo aleatorio y un posible modelo probabilstico involucrado. Esto lleva a ciertos supuestos sobre la distribucin de los datos y sobre los parmetros del modelo. En esta situacin hablamos de estadstica paramtrica, y debemos verificar esos supuestos. Si no se cumplen, podemos recurrir a transformaciones de los datos (logaritmos, raz cuadrada, etc). S an as los supuestos no se cumplen, entonces se recurre a la estadstica noparamtrica o de distribucin libre. Otro aspecto que influye en la seleccin del anlisis apropiado es el tamao de muestra. Con muestras grandes, es posible aplicar el teorema del lmite central (TLC) a los estimadores y usar el modelo probabilstico Normal. Con muestras pequeas, sin embargo, el comportamiento de muchos estimadores cambia y debe aplicarse una prueba estadstica basada en otro modelo de probabilidad diferente al Normal. Tambin ocurre que es difcil probar los supuestos cuando se tiene pocos datos. Adems si el investigador desea detectar cierta diferencia con sentido prctico para l (por ejemplo una diferencia de 4 unidades

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

entre dos promedios), debe cerciorarse de usar un tamao de muestra suficientemente grande que le permita eso. Si usa una muestra pequea, quiz su estadstica de prueba no tenga la potencia suficiente, para detectar la diferencia de inters. Una paradoja para el investigador es que, con muestras muy grandes, an la diferencia ms pequea (entre dos promedio, por ejemplo) siempre lleva a rechazar la hiptesis de trabajo, si sta es planteada como la igualdad. Por eso debe aprender a identificar la diferencia mnima con sentido "tcnico" (sustantivo, en su campo) y plantear la hiptesis de trabajo de manera acorde. Esto le llevar a utilizar distribuciones de probabilidad "no-centrales" y a realizar pruebas de hiptesis basadas en intervalos y no en "valores p".
Anlisis de los datos: aspectos que lo determinan
Objetivo del estudio y Diseo estadstico


Anlisis de los datos

Supuestos sobre el modelo probabilstico y sus parmetros

Escala de medicin

Tamao de muestra

1.2 Investigacin cientfica y Estadstica La investigacin cientfica y las ciencias fcticas


Ciencia es Conocimiento cientfico: Investigacin cientfica: Sistema de ideas establecidas provisionalmente. Actividad productora de nuevas ideas.

Una clasificacin de las Ciencias: Formales (ideales, racionales): Empricas o fcticas (reales, objetivas):

Abstracciones Hechos

Verificacin de los enunciados. Ciencias formales: La lgica es suficiente Ciencias empricas: Lgica ms observacin o experimento

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

En la lgica y la matemtica pura No se recurre a la experiencia. La base de la teora dada es necesaria y suficiente. La verdad consiste en la coherencia con un sistema de idea s admitido previamente En las ciencias empricas Debe verificarse con la experiencia. La racionalidad y la coherencia son necesarias pero no suficientes. La experiencia no garantiza que la hiptesis sea verdadera, solo dir que es probablemente cierta o adecuada (y no concluyente).
Entonces ... La lgica y la matemtica pura:

Determinan la validez o invalidez de los razonamientos, sin importar la verdad de las premisas. La ciencia emprica: Determina la verdad o falsedad de las premisas, que estn inmersas en algn campo de aplicacin. Determinar esto requiere un diseo de investigacin y un anlisis cuidadoso.

El mtodo cientfico y la contribucin de la Estadstica


Usualmente se distinguen las siguientes etapas en el mtodo cientfico: hiptesis, prediccin y verificacin. observacin,

En la observacin, la estadstica contribuye con metodologa para la recoleccin de datos. Esos datos se transforman en informacin, al analizarlos y resumirlos, y en muchos casos llevan a plantear hiptesis (proceso de induccin) que expliquen los patrones o regularidades observadas. Aqu tambin hay apoyo mediante los mtodos estadsticos de anlisis de datos. Asumiendo estas hiptesis como ciertas, se hacen predicciones para nuevas situaciones, momentos y lugares (proceso de deduccin). Aqu contribuye la teora estadstica de estimacin (basada en la teora de probabilidades). Finalmente, hay que verificar si se cumplen las hiptesis. Para eso hay que disear estudios, recolectar la informacin, analizarla y compararla con lo que plantea la hiptesis. El diseo de muestras y el diseo estadstico de experimentos, as como la metodologa de prueba estadstica de hiptesis, brindan herramientas valiossimas en la bsqueda de evidencias a favor o en contra de las hiptesis planteadas. La verificacin es quiz la etapa en que la Estadstica ms puede contribuir, pero al mismo tiempo es donde se pueden cometer los errores de mayor consecuencia. Por eso es muy importante examinar con cuidado el proceso general de verificacin de una hiptesis.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

Asimismo es importante considerar los conceptos de asociacin, causalidad y evidencia. Causalidad, asociacin y confusin. Generalmente el investigador cientfico busca establecer relaciones de causalidad, donde una condicin o factor (X1) es causa directa de otra caracterstica (Y). Tambin puede darse el caso de causas mltiples o de causas indirectas. Podemos distinguir varias situaciones: a) X1 es causa nica y directa de Y. En esta situacin X1 debe ser condicin necesaria y suficiente: sin X1 no se da Y; adems basta que se d X1 para que se d Y. b) X1 no es causa nica y hay otros factores que tambin influyen en Y. En esta situacin X1 es condicin necesaria pero no suficiente: sin X1 no se da Y; pero X1 debe estar acompaada de otra condicin X2 (por ejemplo) para que suceda Y. c) X1 es causa indirecta de Y (por medio de X3, digamos). d) X1 no es causa de Y, pero pueden ocurrir conjuntamente (aunque nada tengan que ver entre s). En la realidad es frecuente que encontremos relaciones en que la condicin X1 es causa indirecta de Y o, peor an: lo que existe entre X1 y Y es simplemente una relacin de asociacin que no implica causa (situacin d). Tambin es usual que la caracterstica Y pueda ocurrir conjuntamente con otras condiciones (X4, X5, etc), que no son su causa, pero que muestran asociacin con Y. Por razones obvias, es deseable para el investigador, poder distinguir entre las situaciones enumeradas antes. La literatura indica que para establecer evidencia de causalidad se pide el cumplimiento de tres condiciones: 1. Precedencia en el tiempo ( X precede en el tiempo a Y ) 2. Asociacin (existe asociacin entre X y Y) 3. Eliminacin o control de otros factores o variables confusoras (terceras variables) que pueden explicar la asociacin observada entre X y Y. Lo difcil es establecer si se cumple la tercera condicin. En la prctica se intenta hacerlo usando mtodos cuantitativos o cualitativos y diseos por manipulacin (va diseo) o diseos por observacin (va anlisis de datos), o una combinacin metodolgica. En general, lo que se hace es postular la posible causalidad de los cambios en Y mediante cambios deliberados u observados en X. Efecto de confusin: el cambio en Y ocurre, pero no necesariamente o exclusivamente puede ser atribuido al cambio en X . El efecto de otro factor (diferente a X) es el que produce el cambio. El efecto de ese otro factor se confunde con el efecto de X. Evidencia cientfica y significancia Estadstica. Falta redactar este prrafo

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

Mtodos y diseos de investigacin


Es usual clasificar los estudios segn diferentes criterios. Criterio Mtodo de indagacin Control sobre factores Tiempo de observacin o medicin Alcance de resultados Tipo de estudio Cualitativo Cuantitativo Observacional Experimental Transversal Longitudinal Exploratorio Inferencial

Mtodos cualitativos Vs. cuantitativos Los mtodos cualitativos: -Permiten estudiar temas selectos, en profundidad y con mucho detalle (pocos casos, mucha profundidad). -El propio investigador es con frecuencia el instrumento mismo de medicin. -La validez depende mucho de la competencia, habilidad y rigor del investigador. -Ninguna o poca posibilidad de generalizacin. Los mtodos cuantitativos: -Permiten estudiar muchos casos para un juego limitado y predeterminado de caractersticas (muchos casos, poca profundidad). -El nfasis est en la estandarizacin del instrumento de medicin. (idealmente debe ser independiente del investigador). -La validez y la confiabilidad dependen mucho del diseo y del tamao de muestra. -Tienen un alcance inferencial mucho mayor. Ambos mtodos presentan ventajas y desventajas y en muchos casos es buena estrategia usarlos de manera complementaria. Esto es particularmente cierto cuando el estudio es de naturaleza exploratoria y se desea tener una comprensin de la dinmica de lo indagado. En lo que sigue se hace referencia a los mtodos cuantitativos. Diseos por manipulacin (experimental) Vs. Diseos por observacin El diseo de una investigacin es el plan de accin del investigador para contestar las preguntas planteadas. En un sentido muy amplio, un diseo involucra recolectar datos para una variable respuesta, bajo diferentes condiciones. Interesa determinar si la respuesta cambia significativamente de una condicin a otra, y estimar el "efecto" de cada condicin. Hay situaciones en que el investigador tiene bastante control sobre las condiciones en que ocurrir la investigacin. Hay otras en que el investigador carece de control sobre ellas, y ms bien es un observador que anota lo que ocurre. En el primer caso el investigador tiene oportunidad de definir las condiciones a comparar, asignarlas aleatoriamente entre los entes de estudio y hasta utilizar una condicin testigo. Este es el diseo por manipulacin o experimento propiamente dicho. En el segundo caso

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

el investigador encuentra las condiciones ya dadas, no tiene oportunidad de rifarlas entre los entes de estudio y difcilmente encontrar una condicin testigo que sea comparable. Este es un diseo por observacin. Ejemplo 1. Un Bilogo desea determinar si la tasa de respiracin (consumo de oxgeno) cambia significativamente al cambiar los niveles de temperatura (definidos por el bilogo, en el laboratorio), para una especie de cangrejo. Ejemplo 2. En otra ocasin, se desea determinar si la tasa de respiracin es significativamente diferente de una especie a otra de cangrejos que habitan la misma zona. En ambos ejemplos, se desea hacer mediciones de la variable respuesta (consumo de oxgeno) en la unidad experimental (el cangrejo). En el ejemplo 1 se tiene tres condiciones o tratamientos, por ejemplo: temperatura baja, temperatura media, temperatura alta. En el ejemplo 2 se tiene dos condiciones o tratamientos posibles: pertenecer a la especie 1, pertenecer a la especie 2. El ejemplo 1 es un caso de diseo por manipulacin" (de las unidades experimentales). El investigador es el que asigna las unidades experimentales a las distintas condiciones o tratamientos (niveles de temperatura), y esta asignacin se hace por rifa. Las unidades experimentales de cada grupo son "tratadas" en forma distinta durante algn tiempo, despus del cual se miden las respuestas. El investigador define (o impone) las condiciones (niveles de temperatura) y hasta puede designar a una de ellas como condicin testigo. Por ejemplo la temperatura media puede corresponder al promedio del lugar habitual de residencia de esa especie. En contraste, el ejemplo 2 anterior es un caso de diseo por observacin", ya que las unidades experimentales estn repartidas en diversas condiciones en forma "natural" y esto ha ocurrido previo a la intervencin del investigador en el experimento. Tampoco puede hablarse de una condicin testigo, pues cada cangrejo debe pertenecer a alguna especie. El Bilogo lo nico que hace es "observar" la respuesta bajo condiciones previamente definidas por la naturaleza (pertenecer a una especie o a otra). El rea de la salud es prdiga en ejemplos para ilustrar estos dos tipos de diseos. Cuando una nueva droga es introducida, debe disearse un experimento por manipulacin para probar su efectividad. Primero se establece una bsqueda de sujetos idneos para el experimento. Se desea sujetos lo ms similares posibles. Una vez identificados y localizados, se verifica su anuencia a participar. Del grupo participante se selecciona la mitad en forma aleatoria, y se les administra la droga (grupo tratado). A la otra mitad no se le administra la droga (grupo testigo), y en su lugar se le da un placebo, el cual es neutral pero aparenta ser igual al tratamiento del grupo tratado. Idealmente, ni los pacientes ni los mdicos que miden la respuesta deben saber a cual grupo pertenece cada paciente. Finalmente se comparan las respuestas promedio de los grupos. Para evitar sesgos, los dos grupos (tratado, testigo) deben ser lo ms similares posibles, excepto por el hecho de que uno fue tratado y el otro no. Entonces, cualquier diferencia en las repuestas de estos dos grupos se debe fundamentalmente al tratamiento y no a otra cosa.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

En los experimentos por manipulacin es muy importante no olvidar los testigos. Por ejemplo, en estudios ecolgicos o ambientales, es muy importante utilizar testigos temporales y espaciales, ya que normalmente hay mucha variacin de un ao a otro y de un lugar a otro. En particular los cambios anuales imponen una regla de oro: todo experimento de campo debe tener un testigo contemporneo. La figura 8.1 del libro de Green (1979) ilustra perfectamente la necesidad de testigos temporales y espaciales. Los experimentos con asignacin aleatoria de los tratamientos y con grupo testigo, son difciles de llevar a cabo. Por esta razn, con frecuencia se usan otros diseos menos buenos. Por ejemplo, el grupo testigo puede ser sustituido por un "testigo histrico: pacientes tratados anteriormente con la droga estndar. Estudios sobre el efecto del fumado son diseos por observacin, en que los sujetos participantes "escogen" ellos mismos la condicin (fumador, no fumador) y el investigador simplemente observa lo que ocurre. Las personas con sus hbitos han decidido en algn momento de su vida si son fumadores o no. En otras palabras, la asignacin de los sujetos a los tratamientos se da con mucha antelacin al experimento y no es producto de un mecanismo aleatorio, sino de mecanismos psico-sociales. Un riesgo con este tipo de diseos es lo que se conoce como "confusin": la presencia de otro factor desconocido, diferente al del fumado, pero cuyos efectos se mezclan o confunden con los efectos del fumado. Para contrarrestar esto, los estadsticos suelen desagregar los datos, cruzndolos con otras variables que se sospecha pueden producir confusin. Tambin utilizan anlisis de regresin. Etapas del desarrollo de una investigacin estadstica a. b. c. d. e. f. Definicin del problema y los objetivos Definicin de la poblacin de estudio en el tiempo y en el espacio Diseo muestral o diseo experimental Ejecucin (trabajo de campo) Anlisis e interpretacin de resultados Reporte ( informe).

1.3 Conceptos y trminos estadsticos bsicos


1. Caracterstica Aquello que interesa estudiar. Ejemplos: contenido de fosfatos, estado civil, color de los ojos, peso, situacin financiera, ingresos mensuales, etc. Unidad estadstica En la mayora de los casos se refiere a la unidad de estudio. Ejemplos: el individuo (peso, color de los ojos, estado civil, etc.), la empresa (situacin financiera), la familia (ingresos mensuales), la planta (contenido de hidrolipogenasas), etc.

2.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

Unidad de muestreo. Ejemplos: la vivienda (la familia), la hoja (la planta), etc. Es importante, pues, tener en cuenta que las unidades de estudio y de muestreo no siempre coinciden. 3. Observacin Un dato concreto. Ejemplos: 72.8 Kg (peso de un individuo cualquiera), 5 hijos (nmero de hijos en una familia.) Variable Una caracterstica que vara de una unidad estadstica a otra. De otro modo se dira que es una constante. Ejemplos: la caracterstica especie no es una variable en un grupo de estudiantes, pues todos son Homo sapiens. Posiblemente sera una variable para un grupo de insectos recolectados en el campo. Nota: Caracterstica y variable son trminos usados a veces indistintamente. Poblacin Es el conjunto total de unidades estadsticas que interesa estudiar. Es importante delimitarla claramente, sobre todo en el espacio y en el tiempo. Ejemplos: los estudiantes de la Universidad de Costa Rica matriculados en el primer ciclo lectivo de 2008, las familias de las zonas urbanas de la provincia de Limn en 2007. El trmino tambin denota el total de observaciones correspondiente al total de unidades estudiadas. Ejemplos: las notas de los estudiantes mencionados antes, los ingresos familiares de las familias indicadas anteriormente. Muestra En la mayora de las situaciones no es posible indagar toda la poblacin, por razones de costo y tiempo principalmente. Lo que se hace es recolectar datos para una parte de la poblacin. La muestra es la fraccin de la poblacin que efectivamente se estudia. Por ejemplo, se entrevista solamente el 5% de todos los estudiantes de la Universidad de Costa Rica. El Muestreo es un campo de la Estadstica que estudia la forma de obtener conclusiones vlidas a partir de muestras. Para lograr eso, se recomienda usar muestras seleccionadas por un procedimiento aleatorio. Parmetro y estadstica Parmetro: funcin calculada para una caracterstica medida en toda la poblacin. Se denota con una letras del alfabeto griego. Estadstica: Si el clculo se efecta solamente con los datos de una muestra. Ejemplo: la edad promedio de los estudiantes al momento de ingreso a la Universidad de Costa Rica es un parmetro, si se calcula con todos los estudiantes que ingresaron. Si se calcula solamente con una muestra de los ingresados, entonces es una estadstica. Parmetros tambin se refieren a los valores que caracterizan a una distribucin de probabilidades (ver seccin 1.4).

4.

5.

6.

7.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

10

1.4 ESCALAS DE MEDICIN Interesa determinar la calidad, intensidad o cantidad con que se manifiesta una variable en la entidad bajo estudio. Algunas variables se pueden manifestar de ms de una manera. Ejemplo: La estatura de una persona se puede manifestar en forma cualitativa ubicndola en una de 3 categoras: alto, mediano o pequeo. Se estar manifestando en forma cuantitativa, si se mide en centmetros (v.g. 175 cm) o en pies (v.g. 5'7".) Otras variables, por su naturaleza, slo se pueden manifestar por medio de categoras que reflejan una cualidad. Ejemplos: Clase social, usando 3 categoras o clases: alta, media, baja. Rango militar, usando 6 categoras: raso, cabo, sargento, teniente, capitn, coronel. Carrera que sigue el estudiante, usando muchas categoras: Biologa, Estadstica, Educacin, Medicina, Derecho, etc. Se puede hablar, entonces, de diferentes niveles de medicin, incluyendo el ltimo ejemplo (carrera) donde no hay cuantificacin, o se puede asumir como nula. Medicin es, en general, la asignacin de smbolos o de nmeros a objetos para representar calidad, intensidad o cantidad de una caracterstica comn a todos los objetos. El resultado final es el establecimiento de una escala de medicin, la cual le permite al investigador hacer comparaciones de aspectos cualitativos y cuantitativos, que le permitan observar cambios en la caracterstica que se est midiendo. Cuando es posible la cuantificacin, los nmeros son asignados a los objetos de forma que la relacin entre los nmeros refleje la relacin entre los objetos con respecto a la caracterstica estudiada. Medicin: asignacin de smbolos o de nmeros a objetos para representar calidad, intensidad o cantidad de una caracterstica comn a todos los objetos en estudio. Escala de medicin: rango de smbolos o nmeros que le permite al investigador hacer comparaciones de aspectos cualitativos y cuantitativos, y observar cambios en la caracterstica que se est midiendo Criterios para clasificar las escalas: a. Tipo de relacin: igualdad, orden, cantidad. b. Si existe una unidad de medida. c. Origen de la escala e interpretacin del cero. d. Tcnicas estadsticas aplicables. 1) Tipos de relaciones y comparaciones comunes Cuando se comparan dos o ms cosas se pueden determinar tres tipos de relaciones: a. Relacin de igualdad Las cosas comparadas solamente pueden declararse iguales o diferentes. Ejemplos: ( - , +) (Masculino, Femenino) (Especie A, Especie B, Especie C)

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

11

b.

Relacin de orden Adems de determinarse si son iguales o diferentes, es posible determinar si las dos cosas comparadas son iguales, si una es mejor o mayor que la otra, o si una es peor o menor que la otra. Ejemplos: (Fro, Caliente) (A favor, Neutral, en Contra) Relacin de cantidad Adems de las relaciones de igualdad y de orden, se puede determinar la diferencia (resta: cuantas unidades es mayor o menor una cosa que la otra) o la razn (divisin: cuantas veces es mayor o menor una cosa que la otra) entre dos cantidades. Ejemplos: (26, 24) Son diferentes y la primera es mayor que la segunda. Pero adems hay dos unidades de diferencia: 26 24 = 2 (9, 3) Son diferentes y la primera es mayor que la segunda, pero adems la primera es tres veces mayor que la segunda: 9 / 3 = 3 Comparacin por diferencia (intervalo). Puede interesar conocer el intervalo que separa dos observaciones. O, dicho de otra forma, el nmero de unidades de diferencia. Adems, puede plantearse la comparacin de dos diferencias. Ejemplo: Comparar la diferencia de temperatura del agua entre medioda y medianoche para dos lugares: el Golfo de Nicoya (Costa Rica) y Puget Sound (costa noroeste de los Estados Unidos) Diferencia para el Golfo de Nicoya: 26C - 24C = 2C Diferencia para Puget Sound: 17C - 13C = 4C La comparacin de las diferencias sera entonces de (26-24) con (17-13) Comparacin por razn. Interesa conocer el nmero de veces que una observacin contiene a la otra, es decir la razn entre ambas. Puede plantearse adems la comparacin de dos razones. Ejemplo: Comparar la razn (desviacin estndar) / (promedio) para dos muestras. Esta razn expresada en porcentaje es el coeficiente de variacin (CV) Razn para la primer muestra: 3.5 / 7 = 0.50 Razn para la segunda: 2.8 / 6 = 0.47 La comparacin de las dos razones sera entonces de (3.5 / 7) con (2.8 / 6).

c.

2) Escalas: nominal, ordinal, de intervalo y de razn a. Escala nominal En ella se clasifica las observaciones en categoras (atributos) exhaustivas y mutuamente exclusivas. Las observaciones dentro de una misma categora se consideran iguales entre s y las observaciones de distintas categoras se consideran diferentes entre s. Si de 7 personas 4 son femeninas y 3 masculinos, se tendr: Categora No. elementos Observaciones Femenino 4 F, F, F, F, Masculino 3 M, M, M,

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

12

Es corriente asignar cdigos numricos a las categoras, sin embargo esto no implica que el fenmeno se est cuantificando, pues aqu los nmeros no reflejan una cantidad con la cual la variable se manifiesta. Ejemplo: El estado civil se puede manifestar por medio de 4 categoras con sus respectivos cdigos: 1 = Soltero 3 = Divorciado o separado 2 = Casado o unin libre 4 = Viudo. (El orden de los cdigos pudo haber sido otro) Adems, no es necesario asignar nmeros. A veces es ms prctico asignar uno o ms smbolos a cada categora (strings, en trminos informticos), pues puede ayudar a recordar el significado de la categora. Ej. SOL = Soltero DIV = divorciado o separado CAS = Casado o unin libre VIU = Viudo Sin embargo, se puede volver poco prctico usar ms de 4 smbolos por categora, pues esto hace ms lenta la digitacin y dificulta el anlisis de datos. b. Escala ordinal Las categoras se pueden ordenar (de mayor a menor o viceversa) unas respecto a otras. Lo que importa es la relacin de orden. Los elementos dentro de una misma categora se consideran iguales entre s, pero los elementos de una categora se consideran mejores, superiores o mayores que los de otra categora. Ejemplo: La opinin sobre algn aspecto se puede expresar por medio de 3 categoras ordinales (en contra, indiferente, a favor). Al igual que con la escala nominal, se puede asignar nmeros o cdigos a cada categora, pero estos solamente sirven para ordenar (nmeros ordinales) y no para indicar cambios (aumento, disminucin) constantes al pasar de una categora a otra. Ejemplo de opinin: Categoras En contra Indiferente A favor -1 0 1 Posibles cdigos 1 2 3 2 4 6

Siempre es ventajoso usar unos pocos smbolos pues ahorra tiempo al digitar y analizar los datos. Algunos aspectos relativos a los cdigos: i. No tienen unidades de medicin. Ejemplo: El -1 no significa una unidad en contra. ii. La diferencia entre valores no representa la "distancia real" entre las categoras. Ejemplo: ? (Indiferente) - (En contra) = (A favor) - (Indiferente) 2 1 # 3 2 Estas distancias pueden variar y no se conocen.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

13

c. Escala de Intervalos (existe unidad de medida) Aqu si se da la cuantificacin. Los valores (nmeros que se asignen a las observaciones u elementos) representan la cantidad (nmero de intervalos) con que se manifiesta la variable de inters. Ejemplos: La temperatura medida en C, hora del da medida en un reloj (escalas circulares), orientacin de un animal (ngulo en grados), etc. Caractersticas bsicas i. Existe una unidad de medida: el grado angular, el grado centgrado la hora del da, etc. ii. La distancia que separa las unidades es conocida y constante (intervalos iguales) Ejemplo: Temperatura 25C- 24C = 10C - 9C = 1 unidad iii. El origen de la escala no es un "verdadero cero", sino que es arbitrario (no implica ausencia de la caracterstica medida). Ejemplo 1: Temperatura: 0C= 32F As las cosas, una misma condicin de temperatura (un da muy caluroso) puede tener dos valores diferentes segn se mida en una escala centgrada o Fahrenheit (40C= 104F) El cero de la escala centgrada representa el congelamiento del agua al nivel del mar. Qu significa el "cero" de la escala F? Ejemplo 2: La hora del da: Las 0:00 horas significa medianoche por convencin y no porque se halla acabado el tiempo. d. Escala de razones (existe un verdadero cero) Es la escala ms fuerte, ya que representa el ms alto nivel de medicin posible. Se puede establecer una equivalencia entre los nmeros reales (R) y la variable bajo estudio. Ejemplos: peso en Kg., longitud en cm, tiempo transcurrido en segundos, rea en m 2, volumen en cm3 , etc. Caractersticas bsicas i. Existe una unidad de medida (Kg., cm., s., etc.) ii. Igualdad de intervalos (ver escala de intervalos) iii. Existe un verdadero cero (ausencia de la caracterstica), o un origen "natural" de la escala. Ejemplo. Un peso de cero significa ausencia de masa (o de gravedad) y ser el mismo cero ya sea medido en kilogramos o en libras. iv. Puede determinarse la igualdad de razones. Clasificacin de las variables: en Estadstica es corriente, adems de indicar la escala de medicin, clasificar la variable de acuerdo al siguiente esquema: TIPO DE VARIABLE Cualitativa Nominal Ordinal Cuantitativa Discreta Continua ESCALA DE MEDICION Nominal Ordinal Intervalo, razn Intervalo, razn

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

14

1.5 Errores en los datos y en el diseo


Hay muchos tipos de errores que pueden afectar los datos y por consiguiente los resultados de una investigacin, por lo que se amerita que tengamos conciencia de ellos. Tambin hay varios criterios para clasificar esos errores en grupos generales. Por ejemplo, se puede hablar de errores que afectan la validez (exactitud) y errores que afectan la confiabilidad (precisin), trminos que se definen ms adelante. Tambin se puede hablar de errores de muestreo y errores no de muestreo. Por el hecho de trabajar con una muestra (una fraccin de la poblacin), se incurre en error, pues el valor obtenido para la muestra seguramente no coincidir con el de la poblacin o universo de estudio. Pero hay errores que estn presentes an en censos, por ejemplo errores de medicin (instrumento mal calibrado, pregunta mal redactada en un cuestionario, ). Otro agrupamiento: errores aleatorios (impredecibles y en cualquier sentido) y no-aleatorios (sistemticos y en un solo sentido). En una muestra aleatoria, decimos que hay errores aleatorios debido al hecho de emplear el azar en la seleccin (adems de ser solamente una parte de la poblacin). En cambio, en una muestra de juicio (no aleatoria), tambin habr error de muestreo, pero no lo denominamos error aleatorio, porque ms bien depende de los sesgos consciente o inconscientes del experto que selecciona la muestra. Ambos tipos son errores de muestreo, porque solo ocurren cuando se usan muestras. En las muestras tambin ocurren errores de medicin. Cuando se usa censo, la mayora de los errores se clasifican quiz en el grupo de errores de medicin. En un censo no se habla de errores de muestreo. La severidad o grado de error aleatorio puede estimarse usando la teora de probabilidades. Por eso se recomienda emplear muestreo aleatorio. Esto errores aleatorio son inevitables, pero pueden reducirse usando un buen diseo de muestreo o una muestra ms grande. Los errores no aleatorios muchas veces pasan inadvertidos. Otras veces se les detecta y son fciles de enmendar (por ejemplo el sesgo de medicin de una balanza mal calibrada). Pero muchas veces resultan difciles o imposibles de corregir (el sesgo de seleccin, por ejemplo). La mejor arma es prevenirlos por medio de un riguroso protocolo de investigacin. Sin embargo esta no es una preocupacin propia de la Estadstica, sino ms bien de la disciplina sustantiva de aplicacin: medicina, microbiologa, ingeniera, La estadstica se ocupa de analizar y de estimar el error aleatorio. Una clasificacin posible de los errores es la siguiente: a ) Errores asociados a la tcnica de recoleccin: sesgo de seleccin, error de muestreo, sesgo de no respuesta, sub-registro, b) Errores asociados a la medicin propiamente: instrumento mal calibrado (sesgo de medicin), pregunta mal redactada, pregunta directa sobre tema delicado, c) Errores asociados al marco de muestra o directorio: omisin y duplicacin de casos, desactualizacin, A continuacin se presenta una lista de errores concretos (pero no exhaustiva) que corrientemente se mencionan en los libros de texto: - Problema mal planteado (pregunta equivocada) - Definicin imprecisa de la poblacin de estudio - Objetivos mal definidos

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

15

- Seleccin errnea del tipo de investigacin - Aplicacin de tcnica de anlisis equivocada - Sujetos de estudio con alta variabilidad inherente - Falta de uniformidad en la conduccin del trabajo de campo o de laboratorio - Definiciones inadecuadas - Personal mal capacitado - El captulo 12 del libro Introduccin a la Estadstica de la Salud (Moya, 1986) hace u n buen resumen de diferentes tipos de errores en el rea de la salud. Diseo de Investigacin, confiabilidad, validez y error Existen dos trminos que se usan indistintamente en la conversacin comn, pero tienen significados especiales en estadstica: Exactitud y precisin. Ejemplo: una balanza sin calibrar, pero sensible, puede dar pesos muy precisos, pero inexactos. En Estadstica a menos que exista parcialidad en un instrumento de medicin (balanza, regla, cuestionario, etc.), se considera que la precisin es ms importante que la exactitud. Diseo es el plan de accin para alcanzar los objetivos del estudio. Un mejor diseo aumenta la confiabilidad (precisin) y la validez (exactitud) de los datos y resultados obtenidos, en relacin con un diseo menos bueno. Confiabilidad (precisin): Es la consistencia, estabilidad o reproducibilidad de las mediciones (datos). Un instrumento o procedimiento de medicin es confiable si al aplicarlo repetidamente bajo las mismas condiciones obtiene mediciones muy cercanas entre s. Un diseo es confiable si al aplicarlo repetidamente obtiene resultados iguales o muy parecidos. Variabilidad : Lo contrario de precisin
Desviacin estndar: variabilidad entre datos de un mismo estudio. Error estndar: variabilidad entre estudios con un mismo diseo y tamao de muestra.

Validez (exactitud): Es la cercana de un dato, medido o computado, a su verdadero valor. Un dato es vlido si representa lo que se supone debe representar. A la diferencia entre la medicin y su verdadero valor se le denomina sesgo. La exactitud es muchas veces un problema de medicin. Con qu grado de detalle es posible hacer la medicin?; se encuentra el instrumento bien calibrado?; se est usando una tcnica adecuada? Otras veces es un problema de parcialidad en el procedimiento de seleccin de las unidades sobre las que se hacen las mediciones. Hubo imparcialidad en la escogencia de la muestra?

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

16

Error total: Se interpretar como la suma de la variabilidad y del sesgo.


Error total: Variabilidad (contrario de confiabilidad)

Sesgo (contrario de validez)

En resumen, "un mejor diseo" disminuye el error total. Exactitud de los datos En lo que sigue se har referencia a la exactitud. Las variables discretas (discontinuas) suelen medirse con exactitud (se obtienen nmeros exactos.) Ejemplo: cuando se cuenta el nmero de huevos en un nido, no existe ninguna duda acerca del nmero exacto de huevos que hay en l. Sin embargo, cuando se trata de grandes nmeros, las mediciones pueden ser aproximadas. Ejemplo: si en un anlisis de laboratorio se reporta 130 000 huevos en un pez, esto puede denotar que el nmero exacto es una cifra cercana (v.g. 129 716), pero no necesariamente igual a 130 000. La mayor parte de las variables continuas, se miden en forma aproximada. Es decir que el valor exacto de una nica medida es desconocido y probablemente no se puede conocer. La convencin establecida es que el ltimo dgito de la medida establecida debe denotar los lmites sobre la escala de medidas entre los que creemos que se encuentra el valor exacto. As una medida de longitud de 431 mm. se interpreta en el sentido de que el verdadero valor de dicha longitud se encuentra en algn lugar entre 430.5 mm y 431.5 mm. Exactamente donde, no lo sabemos. Si se registra una medida como 431.2, se denota con ello que el verdadero valor se encuentra entre 431.15 y 431.25. Cada vez que el instrumento respectivo permita que se agregue una cifra decimal en la medicin, se estar incrementando la exactitud. En general, suponiendo que no exista sesgo (parcialidad) en el instrumento o en el procedimiento de medicin, un nmero llega a ser cada vez ms exacto cuantas ms cifras significativas seamos capaces de darle. Ejemplo: Limites entre los que se Amplitud MEDICION halla el valor verdadero del intervalo 643 642.5 643.5 1 642.9 642.85 642.95 0.1 642.87 642.865 642.875 0.01 La ltima medicin (642.87) es ms exacta. Error mximo 0.5 0.05 0.005

Cuntas cifras significativas deben registrarse para una medida? Una regla emprica es la siguiente: a. Ordenar las medidas de menor a mayor. b. Restar la mnima de la mxima.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

17

c.

La diferencia debera estar comprendida entre 30 y 300 unidades de medicin.

Ejemplo Se est midiendo tallas de peces con exactitud de cm, y se hall que la ms grande de las medidas es de 56 cm y la ms pequea de 43 cm. Diferencia: 56-43 = 13 cm. Slo existen 13 unidades de diferencia, esto implica que las medidas se deberan hacer con una cifra significativa ms, por ejemplo, dcimas de cm: 55.8 y 43.7 cm. D = 55.8 - 43.7 = 121 unidades (dcimas de cm) Nmero de cifras significativas Nmero de dgitos que denotan la exactitud con que se hizo la medicin. Ejemplos. 8 tiene una cifra significativa; 8.0, 8.3 y 8.9 tienen dos cifras significativas. Redondeo de datos El redondeo de datos ocurre cuando se quiere reducir el nmero de cifras significativas. Lo ms corriente es redondear al dgito ms cercano, pero tambin existe redondeo "hacia arriba" y redondeo "hacia abajo". Lecturas correspondientes Sokal y Rohlf (1969) Seccin 2.3, pp. 25-28. Glass y Stanley Cap 2 (Seccin 2.3)

1.6 Fuentes de datos y mtodos e instrumentos de recoleccin


Fuentes de datos. Los datos requeridos para un estudio puede que ya existan en alguna publicacin o en alguna institucin, o en alguna base de datos de dominio pblico (datos existentes). Pero puede ser que no existan an y deban recolectarse (datos no existentes). Si los datos ya existen, es importante distinguir entre fuentes primarias y fuentes secundarias. La fuente primaria es la que directamente recolecta los datos. Por ejemplo, el Instituto Nacional de Estadstica y Censos es la fuente primaria para datos de la Encuesta de Hogares y Propsitos Mltiplos, que ejecuta el mismo instituto todos los aos. Por otro lado, una fuente secundaria es una publicacin o una institucin que tiene u ofrece datos recolectados por otras entidades o personas. Por ejemplo la publicacin anual Estado de la Nacin, en desarrollo humano sostenible, del Consejo Nacional de Rectores (CONARE) de las universidades estatales de Costa Rica, es una fuente secundaria de informacin, ya que lo que ah se proporciona es una compilacin de datos recolectados por otras instituciones y personas. Entre las ventajas de usar una fuente primaria se puede citar: a) A menudo incluye un resumen metodolgico, junto con las definiciones de trminos y el instrumento de recoleccin usado (cuestionario, por ejemplo); b) la informacin suele aparecer con mayor detalle y c) hay menos errores de transcripcin. Hay varias tipos de fuentes de datos importantes en Costa Rica. Entre las estadsticas continuas estn las Estadsticas Vitales (poblacin, nacimientos, defunciones, matrimonios),

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

18

reportadas a la oficina de Registro Civil, pero generadas en su mayora por hospitales, clnicas, puestos policiales, oficinas de trnsito, parroquias y juzgados. El ente encargado de publicar y suministrar estas estadsticas a los ciudadanos es el Instituto Nacional de Estadstica y Censos (INEC), aunque en su procesamiento intervienen otras entidades, principalmente la Caja Costarricense del Seguro Social, CCSS (para nacimientos y defunciones) y el Centro Centroamericano de Poblacin, CCP (para poblacin). Entre las encuestas peridicas, se puede mencionar la Encuesta de Hogares de Propsitos Mltiples (EHPM) ejecutada anualmente por el INEC. Esta encuesta recolecta datos sobre caractersticas de las viviendas, tamao de los hogares, caractersticas demogrficas (sexo, edad, educacin), aspectos laborales (ocupacin: actividad econmica, empleo y desempleo) , y temas especiales (como acceso a internet). Las encuestas econmicas del Banco Central son otro ejemplo de encuestas peridicas. Entre las encuestas especiales, que se hacen cada cierto nmero de aos, cabe destacar las encuestas sobre fecundidad y salud reproductiva. Tcnicas usuales de recoleccin de datos no existentes. Observacin: los datos son recogidos directamente por el investigador. Es tpico de las ciencias fsicas y naturales, as como de la Antropologa. Se usan libretas para anotar, grabadoras, cmaras fotogrficas, dispositivos para hacer conteos (nmero de automviles por minuto en una interseccin), aparato para medir oxgeno en el agua, etc. Registro: muy utilizado por entidades pblicas gubernamentales, mediante alguna norma o ley que hace obligatorio anotar o reportar el evento. Ejemplos tpicos de esto son las estadsticas vitales como nacimientos, defunciones y matrimonios. Es un mtodo barato pero a menudo presenta el problema del sub-registro si no hay una ley fuerte que lo respalde. Entrevista basada en un cuestionario: un entrevistador visita a la persona en su vivienda o en su lugar de trabajo y obtiene los datos mediante una serie de preguntas que estn escritas en un cuestionario o en una boleta. En ese mismo instrumento se anota las respuestas. Muy utilizada en censos y estudios demogrficos, econmicos, y de opinin pblica. Los medios ms utilizados son la entrevista personal y la entrevista telefnica. Cuestionario o boleta por medio de correo o de internet: la mayora de las veces tiene una alta tasa de no-respuesta, pues las personas no se sienten obligadas a responder. Tambin suele presentar un sesgo de seleccin, pues solamente representa los datos de las personas ms extrovertidas y proclives a participas. El cuestionario como instrumento de recoleccin de datos. Por su uso tan difundido, es til revisar algunos aspectos de este instrumento. Los objetivos principales del cuestionario son: a) servir de gua al entrevistador y al entrevistado; b) homogenizar (estandarizar) las preguntas y c) registrar las respuestas. A continuacin se ofrece una clasificacin posible de los tipos de preguntas, segn el contenido. - Sobre hechos. Ejemplos: En cual cantn reside? Cul es su profesin? Vot en el referendo del ao pasado? - De opinin. Ejemplos: Qu opina de la labor del ministro de Educacin ? Si la eleccin fuera hoy, por quin votara para presidente? (intencin).

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

19

Tipo test. Por ejemplo se puede usara un juego de preguntas para medir actitud. De filtro. Utilizadas para determinar si las preguntas que siguen son aplicables a ese entrevistado en particular. En cuanto a la forma de registrar la respuesta, se suele hablar de preguntas abiertas y cerradas. Las preguntas cerradas presentan una lista fijada de antemano de respuestas posibles, usualmente para marcar con equis. Ejemplo: En cuanto al tratado de Libre comercio, Est a favor ( ) Es indiferente ( ) Est en contra ( ). Las preguntas abiertas buscan recoger la respuesta del entrevistado de una manera totalmente libre, sin encasillar en categoras. Ejemplo: Cul es su opinin sobre el tratado de libre comercio? (Escriba su respuesta). El orden en que se presentan las preguntas puede ser muy importante, especialmente en temas delicados o controversiales. Se debe evitar cuestionarios extensos con muchas preguntas, pues una entrevista de ms de media hora de duracin posiblemente es contraproducente. La encuesta por muestreo La encuesta por muestreo es uno de los mtodos ms utilizados para recolectar informacin no existente. En la mayora de los casos se aplica un cuestionario, mediante entrevista directa o telefnica, a una muestra de unidades de estudio. Hay varias consideraciones importantes en el muestreo: a) El tipo de muestreo Aleatorio (probabilstico) No-aleatorio - De juicio (experto) - De conveniencia b) El procedimiento de seleccin y el diseo muestral Unidad de muestreo: elementos, conglomerados. Seleccin: aleatoria simple, aleatoria sistemtica. Diseos: irrestricto al azar, aleatorio estratificado. c) El tamao de la muestra Factores comunmente considerados: - El factor "estadstico": Homogeneidad de la poblacin Exactitud requerida en la inferencia Confianza de lograr esa exactitud - El factor de "costo": Costo de obtencin de la informacin - Enfoque: determinacin "a priori", determinacin "a posteriori" (secuencial) d) La inferencia La inferencia estadstica generalmente implica dos pasos: - Estimacin de parmetros poblacionales - Prueba de hiptesis acerca de esos parmetros Dependiendo de la informacin estadstica que se tenga de la variable (caracterstica)

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

20

que se est analizando, as como de los parmetros de la poblacin de donde proviene, el procedimientos de inferencia puede ser de una de dos formas: - inferencia paramtrica, - inferencia de distribucin libre (o no-paramtrica). e) El error asociado con la inferencia El error asociado con la inferencia se puede descomponer en dos partes: error de muestreo y sesgo. Si la seleccin de la muestra es aleatoria, esto permite medir el error de muestreo con la ayuda de la teora de probabilidades. Adems, el azar es un procedimiento imparcial que elimina el sesgo de seleccin. Pasos principales en una encuesta por muestreo 1. Planeamiento de la encuesta 1.1 Determinar en forma operativa los objetivos del estudio. Esto incluye definicin de unidad estadstica y universo de estudio; especificacin de las caractersticas de inters, etc. 1.2 Determinar la tcnica de recoleccin de datos y preparar el instrumento respectivo (v.g. entrevista personal con cuestionario estructurado). 1.3 Preparar un plan de anlisis. Incluye una lista de cuadros y grficos estadsticos a obtenerse, as como de clculos especficos a realizarse. Tambin debe contemplarse el "software" para la digitacin y tabulacin de datos. 2. Diseo estadstico de la muestra 2.1 Definir la unidad de muestreo y delimitar la poblacin estadstica. a. Anlisis de la informacin existente sobre las unidades de estudio. b. Definicin de la unidad de muestreo. c. Construccin del marco muestral. 2.2 Disear la muestra propiamente y establecer el mecanismo de seleccin. 2.3 Determinar el tamao de muestra. 2.4 Especificar el procedimiento de estimacin. 3. Trabajo de campo. 3.1 Realizar un muestreo de prueba y brindar recomendaciones para la versin final del instrumento de recoleccin de datos (v.g. el cuestionario), del diseo muestral y del tamao de muestra. 3.2 Brindar recomendaciones para el control de calidad de las actividades de campo. 3.3 Ejecucin de la encuesta. 4. Anlisis estadstico e interpretacin de los resultados de la Encuesta. Esto incluye digitacin y tabulacin de los datos, adems del anlisis propiamente dicho.

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

21

El experimento o cuasi experimento Como se mencion anteriormente, en las situaciones en que es posible cierto grado de control del investigador sobre las condiciones en que se hace la investigacin, es posible aplicar el mtodo experimental, en lugar del mtodo observacional. Se habla entonces de experimentos o cuasi-experimentos. El mtodo experimental El mtodo experimental consiste en la prueba emprica de conclusiones particulares extradas de hiptesis generales. Este tipo de verificacin requiere la manipulacin, la observacin y el registro de fenmenos. Requiere tambin el control de las variables o factores relevantes. Siempre que sea posible debiera incluir la produccin artificial deliberada de los fenmenos en cuestin, y en todos los casos exige el anlisis de los datos obtenidos en el curso de los procedimientos empricos. La experimentacin es un paso muy importante del mtodo cientfico. En las reas del saber donde es posible la investigacin experimental, el investigador tiene que emplear mucho esfuerzo en el diseo y anlisis de sus experimentos. Un diseo eficiente no slo puede producir ahorros en tiempo y dinero, sino tambin ganancias en informacin. Es corriente que el investigador se quede con dudas acerca del valor de sus conclusiones, ya que no hay garanta (seguridad) de que un experimento que se repita en condiciones similares, produzca los mismos resultados. El uso de un diseo apropiado, seguido por el anlisis estadstico, no necesariamente elimina la duda, pero le permitir asignarle un valor a la verosimilitud de sus resultados. Son muchas las reas del saber donde es posible la investigacin experimental. Entre las ms conocidas se puede citar: Fsica, Qumica, Biologa, Agricultura, Ciencias de la Salud, Psicologa y Educacin. Sin embargo, hallamos tambin que campos como la Administracin de Negocios y la Sociologa, entre otros, plantean algunas de sus investigaciones en forma de experimento. Un estadstico debe dominar las tcnicas del diseo experimental no solo por ser una herramienta fundamental en la investigacin, sino tambin por su uso tan difundido en diversos campos. Bunge (1989) ofrece una definicin que resume muy bien la idea de experimento: cambio planificado. Dice "... el experimento es aquella clase de experiencia cientfica en la cual se provoca deliberadamente algn cambio y se observa e interpreta su resultado con alguna finalidad cognoscitiva." (p. 819). Agrega adems, "El experimento cientfico ... aade a la observacin el control de ciertos factores ..." Los principios bsicos del diseo de experimentos por manipulacin se pueden resumir as: 1. Aleatorizar la asignacin de los tratamientos (condiciones) a las unidades experimentales. 2. Repetir el experimento bsico (esto implica tener dos o ms unidades experimentales por tratamiento) 3. Usar testigos (tambin conocido como "usar grupo control") 4. Controlar (reducir) el error experimental

ESTADSTICA INTRODUCTORIA CAP. 1 INTRODUCCIN

22

Terminologa en experimentos Tratamiento: es el procedimiento cuyo efecto ha de ser medido y comparado con otros. Puede ser un tipo de comida, una combinacin de temperatura y humedad, un mtodo de lectura, una dosis de medicamento, un tipo de mquina, un servicio de salud, etc. Unidad experimental: Es la unidad de material experimental a la cual se aplica un tratamiento en una realizacin del experimento. Puede ser un animal, una parcela de terreno, una persona, un trozo de metal, un grupo de semillas en un tarro, etc. Aleatorizacin: Procedimiento seguido para asignar aleatoriamente los tratamientos a las unidades experimentales, de tal forma que cada tratamiento tendr igual probabilidad de ser probado bajo las condiciones mas favorables. Repeticin: El experimento bsico puede consistir en comparar tres tratamientos. Se puede seleccionar 3 unidades experimentales y aplicarle un tratamiento a cada una de ellas. Si esto se repite con otras 3 unidades experimentales (y con los mismos tratamientos), se dice que el experimento tiene dos repeticiones. En general, cuando un tratamiento aparece mas de una vez en un experimento, se dice que esta repetido. Error o variabilidad experimental: Es una medida de la variabilidad que existe entre observaciones hechas en unidades experimentales que han sido tratadas en igual forma (estn bajo un mismo tratamiento). El error experimental solo puede estimarse correctamente cuando hay repeticin. Testigo: es el grupo que participa en el experimento, pero que no recibe tratamiento o que recibe el tratamiento estndar. En muchas situaciones el testigo permite "controlar" los factores de confusin. Diseos cuasi-experimentales Son muchas las situaciones en que el investigador puede introducir algo similar al diseo experimental en su programacin de procedimientos para la recoleccin de datos (por ej., el cundo y el a quin de la medicin), aunque carezca de control total acerca de la programacin de estmulos experimentales (el cundo y el a quin de la exposicin y la capacidad de aleatorizarla), que permita realizar un autntico experimento. Pero precisamente porque se carece de control experimental total, es imprescindible que el investigador tenga un conocimiento a fondo de cuales son las variables especficas que su diseo particular no controla. (Campbell y Stanley, 1979) Hay situaciones que impiden la asignacin aleatoria de casos (u.e.) a tratamientos y slo permiten trabajar con grupos cuyos casos ya estn autoseleccionados. Esto es lo que ocurre en un estudio de Len y Cuesta (1993) en el que grupos de clnicas establecieron por s mismas (independientemente de la investigacin) diferentes niveles de precios para el DIU. (Len y Chu, 1998), y se analiza el efecto que esto tuvo sobre la solicitud de servicios.

Potrebbero piacerti anche