Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres
1 2. INTRODUCCIN
En un mundo orientado a la globalizacin, se presentan - segundo a segundo- millones de datos que desean ser interpretados. La estadstica es una ciencia que nos permite pensar en forma clara y disciplinada, y ofrece diversas tcnicas, cuya correcta aplicacin, reduce la complejidad presente en los datos, para que estos puedan ser interpretados.
El presente apunte est orientado al conjunto ms sencillo, pero no menos til, de tcnicas de anlisis estadstico. En su primer mdulo est destinado a reconocer las races mismas del dato, caractersticas de ste, cmo y cuntos datos obtener para poder obtener conclusiones cientficamente vlidas.
En el segundo y tercer mdulo, se enfatiza el anlisis exploratorio de datos y estadstica descriptiva, como un primer paso en todo resumen de datos, utilizando para ello la disponibilidad de ordenadores, software estadstico con posibilidades de representacin grfica y tratamiento conjunto de datos multivariados.
Las posibilidades didcticas del anlisis exploratorio de datos se deben principalmente a la sencillez del aparato matemtico requerido, la importancia dada hoy da en estadstica a los sistemas de representacin mltiple, las conexiones de carcter transversal en todas las reas del quehacer humano, el trabajo en equipo y la posibilidad de desarrollo de proyectos por parte de los profesionales que requieren de informacin para sus proyecciones futuras.
En el cuarto y quinto mdulo, con la experiencia y visin obtenida en los mdulos anteriores, se comienza a estructurar la idea de leyes probabilsticas, para la presentacin de modelos que habitualmente se utilizan en ingeniera y que suelen ser usados en la teora de decisiones.
Se podra, desde un punto de vista ms amplio, definir la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de accin en situaciones prcticas que entraan incertidumbre.
Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres 2 3. PRIMER MDULO
3.1 Proceso de Medicin
En todo mbito de la vida del hombre, constantemente los medios de comunicacin invaden las percepciones de la gente con todo tipo de indicadores, tales como: cantidad de libros que en promedio leen alumnos de enseanza media, porcentaje de mujeres que sufren de maltrato psicolgico, variaciones de precios (IPC), ndices de delincuencia o seguridad ciudadana, niveles de aceptacin respecto a la gestin realizado por funcionarios pblicos, etc.
En la empresa, estos indicadores han surgido como un eficaz medio para evaluar y controlar su desempeo, en fenmenos que a juicio de los ejecutivos son de inters para la viabilidad de sta, es as como, en empresas productivas el porcentaje de bienes defectuosos son un indicador importante, mientras que en empresas de servicio, el nmero promedio de reclamos, son un indicador del buen o mal servicio que se est prestando.
Todos estos indicadores que irrumpen en la vida moderna de las personas, son producto de mediciones realizadas con algn instrumento. Sin embargo, el concepto mismo medicin ha sido apartado de los indicadores, dando por hecho que stos son un reflejo puro de la realidad, en el instante donde se produce la medicin, lo cual puede considerarse como un ideal, pero no necesariamente real..
La medicin es la asignacin de smbolos (nmeros) a sucesos, hechos u objetos del mundo emprico, sobre la base de reglas y procedimientos de un mundo abstracto como es la matemtica, que se basa en una serie de restricciones propias de su disciplina. Es por esta razn, que en general, toda investigacin debe tener claro la seleccin y diseo de la tcnica de medicin, para estar seguro de que estas mediciones son eficientes para cumplir con el objetivo de aclarar el suceso, hecho u objeto en investigacin, con limitaciones propias de la relacin propuesta entre el mundo emprico y el mundo abstracto.
Lo ms comn, cuando se habla de mediciones, es pensar en nmeros, por ejemplo, en el sistema numrico de base diez, que se compone por los smbolos: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; se construyen todos los nmeros que manejamos comnmente, pero tambin es cierto, que estos podran ser representados- las mismas mediciones- en el sistema binario, como es en informtica.
A modo de ejemplo, cuando se desea conocer la opinin que tienen los clientes de una empresa, se procede a la creacin de un cuestionario el instrumento de medicin que el cliente debe contestar. A partir del conjunto de cuestionarios ya completados, se obtienen los indicadores mundo abstracto pero, estn representando estos indicadores lo que realmente piensan los clientes de la empresa? mundo emprico . Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres 3 En la creacin del cuestionario surgen los primeros problemas, ya que se debe tener especial cuidado en la formulacin de las preguntas, a modo de ejemplo:
1. Deben ser simples, directas y familiares para todos los entrevistados, evitando modismos propios de algunos sectores. 2. Deben ser claras y lo ms especifica posible, evitando ambigedades o palabras que pueden tener muchas interpretaciones. 3. Deben satisfacer los objetivos con preguntas unidimensionales, con el fin de evitar respuestas donde no se sabe a que sector se refiere. 4. No ser muy extenso, con el fin de no abusar del tiempo del entrevistado que a mitad del cuestionario se aburra y decida contestar al azar o simplemente dejar de contestar. 5. Evitar estilos de pregunta persuasivas, ya sea por implicacin o intencionalidad. etc.
Posteriormente al llegar a la aplicacin del cuestionario se debe responder:
1. Cuntos clientes sern necesarios encuestar?. 2. Cmo acceder a los clientes para realizar la encuesta?. 3. Qu pasa cuando un cliente seleccionado se niega a responder?. 4. Sern validas las respuestas de los clientes?. 5. Estarn siendo estas respuestas fiel reflejo de lo que se piensa?, etc.
Caractersticas de las mediciones
En el sistema numrico de base tradicional, compuesto por: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; se deben distinguir las caractersticas esenciales de estos smbolos que se extrapolan al fenmeno de medicin.
En primer lugar, debemos notar que cada uno de estos smbolos es nico, aquella medicin a la cual se le asigne el smbolo 0 deber cumplir con distintas caractersticas que aquella a la cual se le asigne el smbolo 1. A modo de ejemplo, se desea medir la caracterstica comuna de ubicacin de un cliente, aquellos que pertenezcan a la comuna de Villa Alemana, cumplirn todos con ser clientes cuya ubicacin es Villa Alemana (smbolo 0), y sern distintos a aquellos clientes cuya comuna de ubicacin sea Quilpu (smbolo 1).
En segundo lugar, podremos percibir que aquella medicin que asigna un 2 es menos, en cuanto a la cantidad de la caracterstica medida que aquella que se asigna 4, se visualiza que existe un orden establecido propio de la caracterstica que se est midiendo. A modo de ejemplo, si se desea medir los hbitos de pago de los clientes, claramente un cliente cuya clasificacin sea de deficiente, es menos en cuanto a su capacidad de pago dado los antecedentes de ste, que aqul que sea clasificado como bueno. A su vez aquel cliente que se clasifica como bueno es menos en cuanto a su capacidad de pago de aquel clasificado como excelente, pero en ningn caso implica que un cliente clasificado como excelente sea n veces ms que Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
4 uno clasificado como deficiente, pues slo se ha agregado la nocin de orden a los smbolos del sistema numrico, es decir, 1 <2 <3 ... etc.
Hasta este momento, se puede apreciar que las mediciones realizadas tienen un carcter cualitativo y su riqueza informativa es limitada. En general cuando se desea aumentar el nivel informativo de los datos, ste debe ser cuantitativo, pues datos de este tipo, agregan nuevas propiedades.
Cuando los datos son de carcter cuantitativo, se agrega una tercera caracterstica, pues adems de existir las propiedades de unicidad y orden antes establecidas, se aade la nocin de distancia, pues existen entre los datos obtenidos diferencias equitativas, es decir la distancia entre el smbolo 6 4 es igual a la distancia entre los smbolos 9 7. A manera de ejemplo, variaciones en montos de pago por consumo de energa de los clientes entre los meses estivales e invernales, el cliente A tuvo una variacin del 4% mientras que el cliente B tuvo una variacin del 7%. En este caso se puede decir, la variacin, en el consumo, porcentual, de energa entre el cliente A y B es del 3%, es decir, no slo 4% es menor que 7%, sino que adems la distancia entre un cliente y otro es del 3%.
Con la nocin de distancia ya disponible, nos permite la creacin de medidas de incertidumbre, riesgo o variabilidad en la medicin, que representan los indicadores ms deseados a manejar y controlar, que adems son la principal fuente para establecer la nocin de precisin de la medicin.
Finalmente la cuarta caracterstica, definida como proporciones equitativas, requiere garantizar que se mantengan las proporciones en los mensurando. La existencia de proporciones equitativas en la medicin, la cual se garantiza con la asignacin de cero en la ausencia de la caracterstica medida, permite la comparacin de las mediciones en distintos grupos,
La utilizacin de los nmeros en estadstica comprende la utilizacin de una o ms de estas cuatro caractersticas, el problema consiste en distinguir, en las mediciones de las variables investigadas, cuales son las caractersticas que se cumplen en los mensurando. Las escalas numricas utilizadas en estadstica, se han establecido en trminos de estas cuatro caractersticas del sistema numrico, a saber: Nominal, Ordinal, Intervalar y Razn.
Tipos de Escala
Escala Nominal.- Es aquella en que los nmeros sirven solamente como etiqueta para catalogar o identificar los objetos o sucesos.
Ejemplos: - Regiones, Comunas, Marcas, Tipos de almacenes, sexo, etc.
La escala nominal es la ms pobre en cuando a informacin, pues slo se encarga de la identificar y/o clasificar, con el fin de obtener informacin rpida y Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
5 completamente dirigida. La regla general, es asignar igual nmero a objetos o sucesos que pertenezcan al mismo dominio, es decir, las categoras en que se clasifiquen los elementos deben se mutuamente excluyentes y, en su conjunto, exhaustivas para los elementos considerados.
En clasificaciones nominales no se puede establecer prioridad alguna de las categoras asignadas. Una proporcin importante de los fenmenos de mercadeo requiere una medicin en escala nominal, en situaciones tales como medir: marcas, tipos de almacenes, tipos de clientes, etc. Es muy raro que en estudios de investigacin de mercados no se incluya informacin de esta naturaleza.
La utilidad de estas categorizaciones nominales en los elementos, es que permite destacar ciertas conexiones entre categoras, y de ah entre variables. As pues cruzando categoras de, por ejemplo, regin con marca de automviles ms vendidos, se pueden establecer posicionamientos de ciertas marcas en regiones especficas.
Escala Ordinal.- Adems de lo anterior, se define una relacin ordenada entre los sucesos y/o objetos que comprenden la caracterstica de orden. En este tipo de escala, se mide si hay ms o menos de la caracterstica, en relacin con los otros objetos, sin embargo, no suministra informacin si la cantidad, mayor menor, de la caracterstica que poseen varios objetos o sucesos.
Ejemplo: - Aptitudes, preferencias, etc. - Grupo Social; 1 Bajo, 2 Medio, 3 Alto. No se puede decir que 2 es el doble de 1, slo que 2 tiene ms que 1.
En este nivel tienen sentido los conceptos del conteo de elementos, de tal forma que, ordenados puedan ir acumulando, lo que da origen a medidas de posicin basadas en los llamados "cuantiles" o clase cuantil. A modo de ejemplo, un cuartil divide la poblacin en cuatro segmentos, de tal forma que bajo un cuartil especifico se encuentra un porcentaje conocido de datos observados..
Escala Intervalar.- Adems de todo lo anterior, comprende la utilizacin de los nmeros para clasificar objetos o sucesos de manera que la distancia entre los nmeros corresponde a la distancia entre los objetos o sucesos en relacin con la caracterstica que se est midiendo.
Ejemplo: - Escala de temperatura (C, F); 0 C punto de congelacin del agua 32 F. - Nmeros ndices; IPC, IPM, PIB, etc.
Las mediciones que disfruten de esta caracterstica, poseen todas las cualidades de la escala ordinal, adems de la caracterstica de igual diferencia propia del sistema numrico. La libertad en la asignacin de los nmeros, se reduce a la Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
6 seleccin arbitraria de la unidad de medicin y un origen. Por ejemplo, los nmeros: 0, 1, 2, 3 representan una asignacin arbitraria de cero, a uno de los objetos y una diferencia de una unidad entre los objetos adyacentes, mientras que una asignacin alternativa de nmeros podra ser: 7, 9, 11, 13. Ambas asignaciones numricas son aceptables y no se puede decir que una es mejor que la otra.
Escala de Razn.- Tiene todas las propiedades de la escala de intervalos, adems del cero absoluto. En esta escala slo se puede asignar arbitrariamente la unidad de medicin o distancia, pues una vez determinado este nmero, se establecen completamente las asignaciones numricas restantes.
En una escala de razn indica que las proporciones iguales entre los valores de la escala corresponden a las proporciones iguales, entre los fenmenos que se estn midiendo. Afirmar que las ventas en el sector A, son el doble de las ventas del sector B es perfectamente legtimo, si se utilizan datos cuya escala de medicin sea de razn.
Todas las mediciones realizadas, se encuentran en el marco de una de estas escalas, pero en muchas ocasiones, el trabajo y anlisis del dato obtenido es complejo, con lo cual se recomienda alguna transformacin adecuada, que depender del tipo de escala.
Todas estas transformaciones se esquematizan y muestran en la Figura 2.1.
Figura 2.1 : Transformaciones posibles segn tipo de escala.
Adems de la clasificacin de las mediciones segn escala, que es una caracterstica propia del dato, ste tambin puede ser clasificado como un dato cualitativo cuantitativo. Los datos cualitativos, se asocian siempre a datos cuya Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
7 medicin sea en escala nominal u ordinal, mientras que los datos cuantitativos, se relacionan siempre a datos cuya medicin sea en escala intervalar o de razn, ya sean discretos o continuos.
Hasta el momento, de lo presentado del proceso de medicin, la medicin de peso, altura, tiempo, temperatura, longitud, etc., es generalmente una tarea fcil, que comprende la utilizacin de una escala al menos intervalar. El punto cero y la igualdad de diferencias son aspectos aparentemente naturales, en las reas donde ocurren estas mediciones, que estn ms bien relacionadas con las ciencias fsicas que con ciencias sociales.
En las ciencias sociales, por lo general, se debe recurrir a escalas de medicin ms bajas en cuanto a la riqueza informativa del dato, pues en el rea del comportamiento humano, el instrumento ms usado es el de la encuesta, el cual debe manifestar su percepcin del tema ante la encuesta.
Tal como se ilustra en la Figura 2.2, la dificultad de realizar mediciones respecto a un fenmeno de estudio, es directamente proporcional con la riqueza informativa de dato, pues mientras ms difcil es obtener informacin, ms pobre es la escala de medicin.
Figura 2.2 : Relacin Tipo de escala de medicin con el rea de investigacin.
Error de Medicin
Por lo visto la medicin es tan slo la relacin entre el mundo emprico y un mundo abstracto, que como hemos podido apreciar, es en realidad un proceso de medicin, que comienza con la idea de representar un suceso, hecho u objeto a travs de algn smbolo y termina con la representacin del hecho. Cuando esta relacin entre el sistema emprico corresponda directamente a las verdaderas reglas del Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
8 sistema numrico creado, se hablar de una medicin efectiva., sin embargo, es comn que en todo proceso de medicin, el valor de la medicin obtenida probablemente discrepar del valor verdadero debido a diversas causas.
El llamado valor verdadero es en realidad un concepto puramente terico y absolutamente inaccesible en la mayora de los casos. En el proceso de medicin nicamente pretendemos estimar de forma aproximada el valor del suceso, hecho u objeto medido. Para ello debemos dar un nmero con sus unidades y una estimacin del error. Dicho de otra manera el resultado de cualquier medida es siempre incierto y a lo ms que podemos aspirar es estimarlo razonablemente bien.
Es comn que estos errores se agrupen en subconjuntos, los ms comunes son los errores sistemticos, los cuales seran debidos a causas que podran ser controladas o eliminadas. Por ejemplo medidas realizadas con un aparato averiado, o mal calibrado. La fuente del error podra eliminarse usando un aparato que funcione correctamente o calibrndolo adecuadamente antes de medir. Sin embargo, tambin se pueden encontrar errores aleatorios, que son fruto del azar o de causas que no podemos controlar. Como consecuencia de ello, si repetimos una experiencia cierto nmero de veces en condiciones reproducibles, es altamente posible que no se obtenga siempre el mismo valor, sino que un conjunto de valores que seran deseables modelar. Esta modelacin de valores puede ser analizada por mtodos estadsticos y permite determinar rangos de valores ms probables y una medida de la incertidumbre.
Con el fin de controlar efectivamente el error de medicin se deben tener en cuenta tres aspectos importantes:
1. Una clara especificacin de las necesidades de informacin, con el fin de reconocer el grado de dificultad en la obtencin de medidas validas. 2. Especificar procedimientos alternativos de medicin en la obtencin de informacin. 3. Evaluar los costos de la medicin, en contraposicin con la precisin de la misma
Toda medicin se puede ser representada por la observacin misma del fenmeno (O i ), factor compuesto por tres elementos: el primero, el valor real de la medicin (R i ); el segundo, el error sistemtico asociado a la medicin (S i ); y finalmente, el error aleatorio asociado a la medicin (A i ). Formalmente, y en una primera aproximacin, se puede representar una relacin de la forma:
O i =R i +S i +A i .
La validez de una medida se refiere al grado con el cual el proceso de medicin se encuentra libre tanto de errores sistemticos como de errores aleatorios. La fiabilidad es una medida que se relaciona con el grado en el que el proceso de Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
9 medicin se presenta libre de errores aleatorios. La fiabilidad est relacionada con la consistencia y la capacidad de prediccin de los resultados obtenidos. La validez est relacionada con la siguiente pregunta, Se est midiendo lo que pensamos que se est midiendo?, por lo cual la validez es un concepto mucho ms extenso y difcil, que la fiabilidad.
Para resumir, una medida debe de ser fiable, para que se le considere vlida y para que se considere vlida el error sistemtico como aleatorio deben ser lo ms pequeos posibles. Sin embargo, si una medida no es fiable no puede ser vlida, mientras que una medida fiable tiene la posibilidad de ser valida. La fiabilidad es una condicin necesaria pero no suficiente para la validez. Por consiguiente, la validez de una medida es de gran importancia, ya que trata no solamente del error sistemtico sino tambin del error aleatorio. La fiabilidad es un concepto ms dbil ya que solamente trata del error aleatorio.
3. 2 Estad sti ca y Ci enci a
Se dice que los cientficos usan el mtodo cientfico, sin embargo, sera difcil definir la expresin mtodo cientfico, dado que los cientficos usan cuantos mtodos o medios puedan concebir, sin desprenderse del objetivo fundamental del mtodo cientfico que es producir conocimiento cientfico. Ahora bien, para que se produzca este conocimiento cientfico, se requiere partir de algn tipo de interrogantes que puedan ser respondidos con fundamentos cientficos. Precisamente, descubrir respuestas a dichas interrogantes a travs de procedimientos cientficos, es el objetivo del proceso de investigacin cientfica.
De la gran variedad de procedimientos cientficos, vinculados a distintas tcnicas de metodologa de investigacin se pueden destacar puntos esenciales en comn, que son:
1. Revisin de los hechos y teoras propuestas. 2. Formulacin de hiptesis sujetas a pruebas. 3. Evaluacin objetiva de las hiptesis y conclusiones.
Las respuestas a interrogantes relacionadas con el problema a investigar, por lo general, se hacen mediante una descripcin de; las relaciones, los hechos, los procesos relacionados del problema. Procedimiento descriptivo, que por siglos se ha utilizado y que se sigue utilizando para dar explicacin a algn problema o fenmeno, cuya caracterstica esencial es que el investigador es considerado independiente del fenmeno que est estudiando, y ste realiza su investigacin a travs de cambios realizados en el ambiente o entorno del cual el fenmeno en estudio debiera ser dependiente. Esta postura cientfica clsica, trata la investigacin como una triloga entre: el observador (investigador) problema de investigacin ambiente.
Esta forma de explicar un problema a investigar (Organismo Observado) de la investigacin cientfica clsica arraigada por la influencia cartesiana tiende a hacer Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
10 un anlisis fragmentado de los elementos que componen el problema a investigar y sobre la base de sta elaborar una explicacin del problema en su globalidad, que en una gran cantidad de problemas, est muy lejos de una verdadera explicacin. Por esto, en las ltimas dcadas han surgido nuevas tendencias, especficamente aquellas que se fundamentan en la Teora General de Sistemas (T.G.S.), como la Ciberntica, orientada a aspectos de cmo mirar, describir y comprender los problemas en su globalidad. Ahora se debe proceder en un anlisis, en donde los observadores del fenmeno (problema a investigar) forman parte del problema a travs de una investigacin operacional experimental perceptual. Es decir, la respuesta al fenmeno se realiza a travs de un modo particular e individual de conocer del observador, y su validez depende de la coherencia operacional en un dominio especificado. Ambas metodologa son representadas respectivamente en la Figura 2.3.
Figura 2.3 : Metodologas de investigacin cientficas
La estadstica proporciona una forma de pensar clara y disciplinada, especialmente cuando se trata de recolectar e interpretar informacin (tcnicas estadsticas), la estadstica como ciencia, es la actividad organizada en virtud de la cual se procura, a travs del estudio objetivo, descubrir, dominar y comprender los fenmenos que ocurren en la naturaleza y la sociedad, siendo un pilar fundamental en el proceso de investigacin cientfica
La Estadstica, se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
Podramos por tanto clasificar la estadstica en descriptiva, cuando las conclusiones de los resultados del anlisis no pretenden ir ms all del conjunto de datos, sta describe, analiza y representa un grupo de datos utilizando mtodos de organizacin de stos, grficos y medidas de desempeo que resumen y presentan la informacin contenida en ellos. Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
11 Sin embargo, al catalogar la estadstica como inferencial, es cuando el objetivo del estudio es derivar las conclusiones obtenidas de un conjunto de datos resumidos a uno ms amplio, es decir, la inferencia estadsticas: La cual se apoya en el clculo de probabilidades y a partir de datos mustrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor.
3. 3 Introduccin al Muestreo
El mundo emprico est compuesto por un sin fin de conjuntos de elementos; tales como: personas, animales, objetos, etc., habitualmente de cantidades suficientemente grandes, cuyo trabajo de recopilacin y posterior anlisis para obtener alguna informacin de inters de sta, resulta impracticable en tiempos reales. Estos conjuntos de elementos son llamados poblacin o poblacin objeto, que en una investigacin, debe quedar claramente acotada, geogrficamente o en el tiempo,
Un mecanismo, quizs el ms apropiado para poder obtener informacin, es la extraccin de un subconjunto de unidades o elementos a la cual realizar el anlisis y obtener un diagnstico de la poblacin. Este subconjunto de unidades o elementos es llamado muestra, cuyas principales razones para su uso, es llegar a obtener estimaciones de las caractersticas de inters de una poblacin en forma ms rpida y econmica.
Los mtodos o tcnicas de muestreo son un pilar fundamental dentro de los mtodos estadsticos, pues dependiendo de una buena y adecuada tcnica de muestreo, se puede determinar hasta dnde abarcan los anlisis y conclusiones que se realizan como referencia futura de un marco establecido.
Teniendo una muestra de una poblacin, esperamos que sta sea representativa de esa poblacin, es decir, que todas las caractersticas de la poblacin que se estn analizando estn reflejadas en la muestra. Mientras mejor se reflejen las caractersticas de la poblacin en la muestra, mayor es la confiabilidad de cualquier conclusin que se haga de la poblacin.
En una investigacin se pueden obtener observaciones, bsicamente, desde dos perspectivas dadas por: Obtencin de observaciones a travs del tiempo Obtencin de observaciones a travs de un diseo de muestreo. Las tcnicas de muestreo se preocupan esencialmente de las observaciones procedentes a travs de un diseo de muestreo. El diseo de muestreo, proporciona los principios fundamentales para abordar de manera eficiente la seleccin de muestras representativas de la poblacin bajo estudio y estimaciones de las caractersticas de inters de la forma ms confiable y al ms bajo costo posible.
El concepto fundamental que se utiliza, es la aleatorizacin de las unidades muestreadas, que se traduce en que las muestras sean tomadas efectivamente al azar, y no mediante procedimientos subjetivos. Ver Figura 2.4. Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
12 La presencia ausencia de aleatorizacin en el diseo de muestreo permite clasificar los mtodos de muestreo en: Muestras probabilstica, es decir, que sus elementos de alguna manera capturen las caractersticas esenciales de la poblacin, y Muestras no probabilsticas, es decir, las conclusiones obtenidas de la muestra slo representan o capturan las caractersticas esenciales de esos elementos y no de la poblacin.
Muestreo no Probabilstico: Es el tpico muestreo que se realiza a la salida de un centro comercial, salida o ingreso del metro, en una esquina de una calle, etc., en donde los resultados obtenidos slo representan el pensamiento de los encuestados, pero no el de la poblacin en estudio.
Muestreo Probabilstico: La aleatorizacin es vital, pues, las inferencias que se realicen abarcarn al comportamiento de la poblacin total. Es por ello, que una mala aleatorizacin o el no cumplimiento de lo establecido por la aleatorizacin, puede llevar a obtener conclusiones errneas, al considerarse estas muestras como sesgadas. En este muestreo cada uno de los elementos de la poblacin de inters, o poblacin objeto, tiene una probabilidad conocida, y frecuentemente igual, de ser elegido en la muestra. A las muestras aleatorias se les denomina tambin muestras probabilsticas o muestras cientficas.
Figura 2.4 Las encuesta de opinin pblica son aleatorias
En el muestreo probabilstico se utilizan bsicamente cinco tcnicas de muestreo:
1. Muestreo Aleatorio Simple (m.a.s.). 2. Muestreo Aleatorio Sistemtico (m.a.st.). 3. Muestreo Aleatorio Estratificado (m.a.e.). 4. Muestreo Aleatorio por Conglomerado (m.a.c.). 5. Muestreo Aleatorio Multietpico o con Sub-Muestreo (m.a.pe).
Encuesta Opinin Pblica
Est el comercio regional deprimido?
1. Salida Mall Marina Arauco 2. Calle Valparaso Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
13 Deberemos aclarar que en ningn caso, los mtodos y tcnicas presentadas, son rgidas en su aplicacin, sin embargo, queremos entregar una visin globalizada de lo que debe tenerse en cuenta en unamuestra estadstica, que permita conocer y entender los factores fundamentales que influyen en cada tcnica de muestreo.
La eleccin de una tcnica de muestreo, se basa en el grado de conocimientos que se tenga del comportamiento de la caracterstica de inters dentro de la poblacin objeto, el grado de precisin que se desea obtener en los estimadores utilizados, costos asociados a su aplicacin, etc.,.
3. 3. 1 Tipos de Muestreos
Muestreo aleatorio simple, tambin llamado muestreo al azar irrestricto, los elementos se escogen en forma individual y al azar de la totalidad de la poblacin, es decir, se escogen sin ningn privilegio y cada uno posee la misma probabilidad de formar parte de la muestra en cada una de las posibles muestras. A modo de ejemplo: Es recomendado cuando la caracterstica de inters se encuentra distribuida de forma homognea dentro de los elementos de la poblacin, como se muestra en la Figura 2.5.
Figura 2.5 Representacin esquemtica del muestreo aleatorio simple.
Las situaciones propicias para aplicacin de este plan de muestreo es cuando: la lista de elementos de la poblacin est disponible o es de fcil acceso; los elementos de la poblacin no presentan grandes variaciones entre grupos naturales que pudiesen formarse en sta. La importancia relativa de los diferentes elementos de la poblacin tienen el mismo peso a la hora de determinar indicadores de la poblacin bajo estudio.
La seleccin al azar es similar a la que se realiza en la extraccin aleatoria de nmeros en una lotera. Sin embargo, en el muestreo estadstico, por lo general se utiliza un programa computarizado de nmeros aleatorios o un generador de nmeros aleatorios para identificar los elementos numerados de la poblacin que se eligen para la muestra. Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
14 Muestreo aleatorio sistemtico, es un plan de muestreo al azar, en la cual se eligen los elementos de la poblacin a intervalos uniformes, a partir de un listado (ordenado), tal como elegir cada k-simo elemento despus de un arranque aleatorio. A modo de visualizacin esquemtica, suponga una poblacin de N elementos de los cuales se desea obtener una muestra de n elementos, entonces la cantidad de intervalos o grupos k, que en que se divide la poblacin, est dada por k =N / n. Luego del primer grupo de k elementos se escoge un elemento al azar, mientras que los n 1 elementos faltantes en la muestras, se escogen a intervalos regulares de k elementos, despus del primer escogido, como se muestra en la Figura 2.6.
1 . r . k 1 . r . k 1 . r . k 1 . r . k 1 k +1 (g 1)k +1 (n 1)k +1 k 2k (g 1)k +k nk =N 1 2 g n
Figura 2.6: Esquematizacin Muestreo Aleatorio Sistemtico
Las razones principales por la que utiliza el muestreo sistemtico, es: su sencilla aplicacin y supervisin., a prueba de errores y flexible
Este plan de muestreo presenta falencias, que aunque son superables, presentan molestias en su aplicacin, como por ejemplo, que el tamao de poblacin N no sea mltiplo de k, que la lista de la poblacin puede tener muchos elementos blancos o extraos, tambin puede presentar errores sistemticos, producto que el azar slo se encuentra en la seleccin de la primera muestra y puede existir un factor peridico o cclico en la lista de la poblacin que pudiera conducir a un error sistemtico en los resultados mustrales,etc.
Muestreo aleatorio estratificado, la caracterstica que se est midiendo en la poblacin objetivo, presenta mucha dispersin en grupos identificados de la sta, por los tanto, lo primero que se debe hacer es estratificar los elementos de la poblacin en subgrupos separados y excluyentes de acuerdo al comportamiento que presenta la caracterstica dentro de estos grupos. Esquemticamente, esta situacin se refleja en la Figura 2.7, donde la caracterstica a medir se presenta notoriamente distinta lo cual es reflejado por la densidad y colores de la figura.
Posterior a la clasificacin de los elemento de la poblacin en grupos, se obtiene por separado una muestra aleatoria simple o sistemtica de cada estrato. Puede utilizarse este tipo de muestreo para asegurar una representacin proporcional de diversos subgrupos en la muestra,. Por lo general el tamao de la muestra que se requiere para lograr determinado nivel de precisin en el muestreo estratificado es menor que con muestreo aleatorio simple, con la consiguiente reduccin en los costos del muestreo. Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
15 Hablar de muestreo estratificado, en trminos generales, se puede decir que consiste en la realizacin de las siguientes etapas:
1. Identificacin de los estratos excluyentes dentro de la poblacin objeto. 2. Dividir los elementos de la poblacin en las subpoblaciones distintas que llamamos estratos. 3. Dentro de cada estrato se selecciona una muestra separada a partir de todas las unidades distintas que componen ese estrato.
Figura 2.7 Representacin esquemtica del muestreo aleatorio estratificado.
Se pueden establecer, al menos tres razones, por las cuales se recomienda la estratificacin de una poblacin, estas son:
1. Para disminuir la variabilidad de la caracterstica a medir en la muestra. El tamao de la muestra en cada estrato es idealmente proporcional al tamao de la poblacin del estrato. La variabilidad disminuye segn el grado que difieran las medias de cada estrato y de la homogeneidad que exista en cada estrato. En caso de utilizar un tamao de muestra distinto a la proporcin de la poblacin en cada estrato, esto se debe a que existen otros intereses que estn influyendo en la determinacin del tamao de la muestra (como por ejemplo; costos).
2. Para utilizar distintos mtodos o procedimientos dentro de cada estrato. Se debe abandonar la simplicidad de algunos procedimientos debido a las caractersticas particulares de la poblacin, estas caractersticas pueden ser: la distribucin fsica de las subpoblaciones es totalmente diferente; puede haber diferencias entre las listas disponibles, o preferidas para diversas partes de la poblacin, etc.
3. Porque las subpoblaciones se definen como dominios de estudio en si mismo Se llama dominio a cualquier subdivisin acerca de la cual se planea un estudio para proporcionar informacin numrica de precisin conocida de esta subpobalcin. Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
16 Muestreo aleatorio por conglomerados, es un muestreo aleatorio en el cual la unidad de muestreo, que es la unidad de seleccin, contiene ms de un elemento de la poblacin, por lo tanto la unidad de muestreo es un grupo de elementos tambin llamados conglomerados. En este caso cada elemento de la poblacin debe estar identificado unvocamente con una, y slo una, unidad de muestreo.
En la aplicacin de este tipo de muestreo, lo habitual es que los elementos de la poblacin se agrupan en forma natural en subgrupos de tal manera que forman una masa que es difcil descomponer no se puede acceder directamente a ellos. As, se eligen al azar en primer lugar los conglomerados, y luego los elementos dentro de ste. Una manera de esquematizar este plan de muestreo, se muestra en la Figura 2.8, donde se pueden observar que existen conjuntos de elementos, difciles de separar.
Figura 2.8 Representacin esquemtica del muestreo aleatorio por conglomerados.
Lo que constituye un conglomerado como aceptable es asunto que depende de las condiciones prcticas, que a su vez depende del instrumento de medicin de la caracterstica en estudio, su configuracin fsica en el dominio de estudio y de los recursos disponibles.
El nmero de elementos asociados a un conglomerado se llama tamao del conglomerado. Los conglomerados pueden ser de igual tamao, que suelen ser por lo general producto de condiciones planeadas, que se dan por ejemplo, en procesos manufactura, paquetes, cajas de exportacin o importacin, etc. Sin embargo, en su mayora de las poblaciones, lo ms comn es trabajar con conglomerados de tamao desigual; por ejemplo si se desea medir la cantidad de elementos en reas, lo comn que en reas de igual o distinto tamao, existan distinto nmero de elementos.
An en los diseos que empiezan con conglomerados de igual tamao, a menudo terminan en una muestra real de conglomerados que son desiguales, debido a: marcos mustrales imperfectos, elementos no encontrados y el uso de subclases para anlisis.
La seleccin de conglomerados en primer lugar y de elementos dentro de stos Universidad Tcnica Federico Santa Mara Renato Allende Olivares Departamento de Matemticas Humberto Villalobos Torres
17 a continuacin, requiere de dos etapas de seleccin, aunque puede extenderse rpidamente a ms etapas, es conocido como muestrea aleatorio polietpico, que consiste en una jerarqua de diferentes tipo de unidades; cada unidad de primera etapa se divide, o es potencialmente divisible, en unidades de segunda etapa, etc. Las unidades de muestreo de la primera etapa se llaman unidades de muestreos primarias, mientras que en las etapas siguientes se llaman de segunda, tercera, etc. Etapa.
Generalmente, el submuestreo se utiliza para dividir conglomerados en unidades menores, que sin lugar a dudas, se solucionara al utilizar y seleccionar unidades finales, las de la ltima etapa, como unidades primarias, y aplicar directamente un muestreo en una sola etapa, sin embargo, los principales inconvenientes que presenta esta alternativa son: los conglomerados pueden existir naturalmente como, unidades convenientes de muestreo, sin embargo ser mayores que el tamao econmico deseado para su anlisis; no evita el costo de formacin de conglomerados menores en la poblacin completa; aumente generalmente, el efecto de la asociacin que pueda existir entre los conglomerados suele ser menor los grupos de mayor tamao.