Sei sulla pagina 1di 0

Universidad Tcnica Federico Santa Mara Renato Allende Olivares

Departamento de Matemticas Humberto Villalobos Torres


1
2. INTRODUCCIN


En un mundo orientado a la globalizacin, se presentan - segundo a segundo-
millones de datos que desean ser interpretados. La estadstica es una ciencia que nos
permite pensar en forma clara y disciplinada, y ofrece diversas tcnicas, cuya
correcta aplicacin, reduce la complejidad presente en los datos, para que estos
puedan ser interpretados.

El presente apunte est orientado al conjunto ms sencillo, pero no menos til,
de tcnicas de anlisis estadstico. En su primer mdulo est destinado a reconocer
las races mismas del dato, caractersticas de ste, cmo y cuntos datos obtener para
poder obtener conclusiones cientficamente vlidas.

En el segundo y tercer mdulo, se enfatiza el anlisis exploratorio de datos y
estadstica descriptiva, como un primer paso en todo resumen de datos, utilizando
para ello la disponibilidad de ordenadores, software estadstico con posibilidades de
representacin grfica y tratamiento conjunto de datos multivariados.

Las posibilidades didcticas del anlisis exploratorio de datos se deben
principalmente a la sencillez del aparato matemtico requerido, la importancia dada
hoy da en estadstica a los sistemas de representacin mltiple, las conexiones de
carcter transversal en todas las reas del quehacer humano, el trabajo en equipo y la
posibilidad de desarrollo de proyectos por parte de los profesionales que requieren de
informacin para sus proyecciones futuras.

En el cuarto y quinto mdulo, con la experiencia y visin obtenida en los
mdulos anteriores, se comienza a estructurar la idea de leyes probabilsticas, para la
presentacin de modelos que habitualmente se utilizan en ingeniera y que suelen ser
usados en la teora de decisiones.

Se podra, desde un punto de vista ms amplio, definir la estadstica como la
ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de
accin en situaciones prcticas que entraan incertidumbre.






Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres
2
3. PRIMER MDULO


3.1 Proceso de Medicin

En todo mbito de la vida del hombre, constantemente los medios de
comunicacin invaden las percepciones de la gente con todo tipo de indicadores, tales
como: cantidad de libros que en promedio leen alumnos de enseanza media,
porcentaje de mujeres que sufren de maltrato psicolgico, variaciones de precios
(IPC), ndices de delincuencia o seguridad ciudadana, niveles de aceptacin respecto
a la gestin realizado por funcionarios pblicos, etc.

En la empresa, estos indicadores han surgido como un eficaz medio para
evaluar y controlar su desempeo, en fenmenos que a juicio de los ejecutivos son de
inters para la viabilidad de sta, es as como, en empresas productivas el porcentaje
de bienes defectuosos son un indicador importante, mientras que en empresas de
servicio, el nmero promedio de reclamos, son un indicador del buen o mal servicio
que se est prestando.

Todos estos indicadores que irrumpen en la vida moderna de las personas, son
producto de mediciones realizadas con algn instrumento. Sin embargo, el concepto
mismo medicin ha sido apartado de los indicadores, dando por hecho que stos
son un reflejo puro de la realidad, en el instante donde se produce la medicin, lo cual
puede considerarse como un ideal, pero no necesariamente real..

La medicin es la asignacin de smbolos (nmeros) a sucesos, hechos u
objetos del mundo emprico, sobre la base de reglas y procedimientos de un mundo
abstracto como es la matemtica, que se basa en una serie de restricciones propias de
su disciplina. Es por esta razn, que en general, toda investigacin debe tener claro la
seleccin y diseo de la tcnica de medicin, para estar seguro de que estas
mediciones son eficientes para cumplir con el objetivo de aclarar el suceso, hecho u
objeto en investigacin, con limitaciones propias de la relacin propuesta entre el
mundo emprico y el mundo abstracto.

Lo ms comn, cuando se habla de mediciones, es pensar en nmeros, por
ejemplo, en el sistema numrico de base diez, que se compone por los smbolos: 0, 1,
2, 3, 4, 5, 6, 7, 8, 9; se construyen todos los nmeros que manejamos comnmente,
pero tambin es cierto, que estos podran ser representados- las mismas mediciones-
en el sistema binario, como es en informtica.

A modo de ejemplo, cuando se desea conocer la opinin que tienen los
clientes de una empresa, se procede a la creacin de un cuestionario el instrumento
de medicin que el cliente debe contestar. A partir del conjunto de cuestionarios ya
completados, se obtienen los indicadores mundo abstracto pero, estn
representando estos indicadores lo que realmente piensan los clientes de la empresa?
mundo emprico .
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres
3
En la creacin del cuestionario surgen los primeros problemas, ya que se debe
tener especial cuidado en la formulacin de las preguntas, a modo de ejemplo:

1. Deben ser simples, directas y familiares para todos los entrevistados,
evitando modismos propios de algunos sectores.
2. Deben ser claras y lo ms especifica posible, evitando ambigedades o
palabras que pueden tener muchas interpretaciones.
3. Deben satisfacer los objetivos con preguntas unidimensionales, con el
fin de evitar respuestas donde no se sabe a que sector se refiere.
4. No ser muy extenso, con el fin de no abusar del tiempo del entrevistado
que a mitad del cuestionario se aburra y decida contestar al azar o
simplemente dejar de contestar.
5. Evitar estilos de pregunta persuasivas, ya sea por implicacin o
intencionalidad. etc.

Posteriormente al llegar a la aplicacin del cuestionario se debe responder:

1. Cuntos clientes sern necesarios encuestar?.
2. Cmo acceder a los clientes para realizar la encuesta?.
3. Qu pasa cuando un cliente seleccionado se niega a responder?.
4. Sern validas las respuestas de los clientes?.
5. Estarn siendo estas respuestas fiel reflejo de lo que se piensa?, etc.


Caractersticas de las mediciones

En el sistema numrico de base tradicional, compuesto por: 0, 1, 2, 3, 4, 5, 6,
7, 8, 9; se deben distinguir las caractersticas esenciales de estos smbolos que se
extrapolan al fenmeno de medicin.

En primer lugar, debemos notar que cada uno de estos smbolos es nico,
aquella medicin a la cual se le asigne el smbolo 0 deber cumplir con distintas
caractersticas que aquella a la cual se le asigne el smbolo 1. A modo de ejemplo,
se desea medir la caracterstica comuna de ubicacin de un cliente, aquellos que
pertenezcan a la comuna de Villa Alemana, cumplirn todos con ser clientes cuya
ubicacin es Villa Alemana (smbolo 0), y sern distintos a aquellos clientes cuya
comuna de ubicacin sea Quilpu (smbolo 1).

En segundo lugar, podremos percibir que aquella medicin que asigna un
2 es menos, en cuanto a la cantidad de la caracterstica medida que aquella que se
asigna 4, se visualiza que existe un orden establecido propio de la caracterstica que
se est midiendo. A modo de ejemplo, si se desea medir los hbitos de pago de los
clientes, claramente un cliente cuya clasificacin sea de deficiente, es menos en
cuanto a su capacidad de pago dado los antecedentes de ste, que aqul que sea
clasificado como bueno. A su vez aquel cliente que se clasifica como bueno es menos
en cuanto a su capacidad de pago de aquel clasificado como excelente, pero en
ningn caso implica que un cliente clasificado como excelente sea n veces ms que
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

4
uno clasificado como deficiente, pues slo se ha agregado la nocin de orden a los
smbolos del sistema numrico, es decir, 1 <2 <3 ... etc.

Hasta este momento, se puede apreciar que las mediciones realizadas tienen
un carcter cualitativo y su riqueza informativa es limitada. En general cuando se
desea aumentar el nivel informativo de los datos, ste debe ser cuantitativo, pues
datos de este tipo, agregan nuevas propiedades.

Cuando los datos son de carcter cuantitativo, se agrega una tercera
caracterstica, pues adems de existir las propiedades de unicidad y orden antes
establecidas, se aade la nocin de distancia, pues existen entre los datos obtenidos
diferencias equitativas, es decir la distancia entre el smbolo 6 4 es igual a la
distancia entre los smbolos 9 7. A manera de ejemplo, variaciones en montos de
pago por consumo de energa de los clientes entre los meses estivales e invernales, el
cliente A tuvo una variacin del 4% mientras que el cliente B tuvo una variacin del
7%. En este caso se puede decir, la variacin, en el consumo, porcentual, de energa
entre el cliente A y B es del 3%, es decir, no slo 4% es menor que 7%, sino que
adems la distancia entre un cliente y otro es del 3%.

Con la nocin de distancia ya disponible, nos permite la creacin de medidas
de incertidumbre, riesgo o variabilidad en la medicin, que representan los
indicadores ms deseados a manejar y controlar, que adems son la principal fuente
para establecer la nocin de precisin de la medicin.

Finalmente la cuarta caracterstica, definida como proporciones equitativas,
requiere garantizar que se mantengan las proporciones en los mensurando. La
existencia de proporciones equitativas en la medicin, la cual se garantiza con la
asignacin de cero en la ausencia de la caracterstica medida, permite la comparacin
de las mediciones en distintos grupos,

La utilizacin de los nmeros en estadstica comprende la utilizacin de una o
ms de estas cuatro caractersticas, el problema consiste en distinguir, en las
mediciones de las variables investigadas, cuales son las caractersticas que se
cumplen en los mensurando. Las escalas numricas utilizadas en estadstica, se han
establecido en trminos de estas cuatro caractersticas del sistema numrico, a saber:
Nominal, Ordinal, Intervalar y Razn.

Tipos de Escala

Escala Nominal.- Es aquella en que los nmeros sirven solamente como etiqueta para
catalogar o identificar los objetos o sucesos.

Ejemplos:
- Regiones, Comunas, Marcas, Tipos de almacenes, sexo, etc.

La escala nominal es la ms pobre en cuando a informacin, pues slo se
encarga de la identificar y/o clasificar, con el fin de obtener informacin rpida y
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

5
completamente dirigida. La regla general, es asignar igual nmero a objetos o sucesos
que pertenezcan al mismo dominio, es decir, las categoras en que se clasifiquen los
elementos deben se mutuamente excluyentes y, en su conjunto, exhaustivas para los
elementos considerados.

En clasificaciones nominales no se puede establecer prioridad alguna de las
categoras asignadas. Una proporcin importante de los fenmenos de mercadeo
requiere una medicin en escala nominal, en situaciones tales como medir: marcas,
tipos de almacenes, tipos de clientes, etc. Es muy raro que en estudios de
investigacin de mercados no se incluya informacin de esta naturaleza.

La utilidad de estas categorizaciones nominales en los elementos, es que
permite destacar ciertas conexiones entre categoras, y de ah entre variables. As
pues cruzando categoras de, por ejemplo, regin con marca de automviles ms
vendidos, se pueden establecer posicionamientos de ciertas marcas en regiones
especficas.

Escala Ordinal.- Adems de lo anterior, se define una relacin ordenada entre los
sucesos y/o objetos que comprenden la caracterstica de orden. En este tipo de escala,
se mide si hay ms o menos de la caracterstica, en relacin con los otros objetos, sin
embargo, no suministra informacin si la cantidad, mayor menor, de la
caracterstica que poseen varios objetos o sucesos.

Ejemplo:
- Aptitudes, preferencias, etc.
- Grupo Social; 1 Bajo, 2 Medio, 3 Alto. No se puede decir
que 2 es el doble de 1, slo que 2 tiene ms que 1.

En este nivel tienen sentido los conceptos del conteo de elementos, de tal
forma que, ordenados puedan ir acumulando, lo que da origen a medidas de posicin
basadas en los llamados "cuantiles" o clase cuantil. A modo de ejemplo, un cuartil
divide la poblacin en cuatro segmentos, de tal forma que bajo un cuartil especifico
se encuentra un porcentaje conocido de datos observados..

Escala Intervalar.- Adems de todo lo anterior, comprende la utilizacin de los
nmeros para clasificar objetos o sucesos de manera que la distancia entre los
nmeros corresponde a la distancia entre los objetos o sucesos en relacin con la
caracterstica que se est midiendo.

Ejemplo:
- Escala de temperatura (C, F);
0 C punto de congelacin del agua 32 F.
- Nmeros ndices; IPC, IPM, PIB, etc.

Las mediciones que disfruten de esta caracterstica, poseen todas las
cualidades de la escala ordinal, adems de la caracterstica de igual diferencia propia
del sistema numrico. La libertad en la asignacin de los nmeros, se reduce a la
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

6
seleccin arbitraria de la unidad de medicin y un origen. Por ejemplo, los nmeros:
0, 1, 2, 3 representan una asignacin arbitraria de cero, a uno de los objetos y una
diferencia de una unidad entre los objetos adyacentes, mientras que una asignacin
alternativa de nmeros podra ser: 7, 9, 11, 13. Ambas asignaciones numricas son
aceptables y no se puede decir que una es mejor que la otra.

Escala de Razn.- Tiene todas las propiedades de la escala de intervalos, adems del
cero absoluto. En esta escala slo se puede asignar arbitrariamente la unidad de
medicin o distancia, pues una vez determinado este nmero, se establecen
completamente las asignaciones numricas restantes.

Ejemplo:
- Ventas pesos, dlares, etc.
- Estatura unidad
- Peso unidad

En una escala de razn indica que las proporciones iguales entre los valores de
la escala corresponden a las proporciones iguales, entre los fenmenos que se estn
midiendo. Afirmar que las ventas en el sector A, son el doble de las ventas del sector
B es perfectamente legtimo, si se utilizan datos cuya escala de medicin sea de
razn.

Todas las mediciones realizadas, se encuentran en el marco de una de estas
escalas, pero en muchas ocasiones, el trabajo y anlisis del dato obtenido es
complejo, con lo cual se recomienda alguna transformacin adecuada, que depender
del tipo de escala.

Todas estas transformaciones se esquematizan y muestran en la Figura 2.1.


Figura 2.1 : Transformaciones posibles segn tipo de escala.


Adems de la clasificacin de las mediciones segn escala, que es una
caracterstica propia del dato, ste tambin puede ser clasificado como un dato
cualitativo cuantitativo. Los datos cualitativos, se asocian siempre a datos cuya
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

7
medicin sea en escala nominal u ordinal, mientras que los datos cuantitativos, se
relacionan siempre a datos cuya medicin sea en escala intervalar o de razn, ya sean
discretos o continuos.

Hasta el momento, de lo presentado del proceso de medicin, la medicin de
peso, altura, tiempo, temperatura, longitud, etc., es generalmente una tarea fcil, que
comprende la utilizacin de una escala al menos intervalar. El punto cero y la
igualdad de diferencias son aspectos aparentemente naturales, en las reas donde
ocurren estas mediciones, que estn ms bien relacionadas con las ciencias fsicas que
con ciencias sociales.

En las ciencias sociales, por lo general, se debe recurrir a escalas de medicin
ms bajas en cuanto a la riqueza informativa del dato, pues en el rea del
comportamiento humano, el instrumento ms usado es el de la encuesta, el cual debe
manifestar su percepcin del tema ante la encuesta.

Tal como se ilustra en la Figura 2.2, la dificultad de realizar mediciones
respecto a un fenmeno de estudio, es directamente proporcional con la riqueza
informativa de dato, pues mientras ms difcil es obtener informacin, ms pobre es
la escala de medicin.


Figura 2.2 : Relacin Tipo de escala de medicin con el rea de investigacin.


Error de Medicin

Por lo visto la medicin es tan slo la relacin entre el mundo emprico y un
mundo abstracto, que como hemos podido apreciar, es en realidad un proceso de
medicin, que comienza con la idea de representar un suceso, hecho u objeto a travs
de algn smbolo y termina con la representacin del hecho. Cuando esta relacin
entre el sistema emprico corresponda directamente a las verdaderas reglas del
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

8
sistema numrico creado, se hablar de una medicin efectiva., sin embargo, es
comn que en todo proceso de medicin, el valor de la medicin obtenida
probablemente discrepar del valor verdadero debido a diversas causas.

El llamado valor verdadero es en realidad un concepto puramente terico y
absolutamente inaccesible en la mayora de los casos. En el proceso de medicin
nicamente pretendemos estimar de forma aproximada el valor del suceso, hecho u
objeto medido. Para ello debemos dar un nmero con sus unidades y una estimacin
del error. Dicho de otra manera el resultado de cualquier medida es siempre incierto y
a lo ms que podemos aspirar es estimarlo razonablemente bien.

Es comn que estos errores se agrupen en subconjuntos, los ms comunes son
los errores sistemticos, los cuales seran debidos a causas que podran ser
controladas o eliminadas. Por ejemplo medidas realizadas con un aparato averiado, o
mal calibrado. La fuente del error podra eliminarse usando un aparato que funcione
correctamente o calibrndolo adecuadamente antes de medir. Sin embargo, tambin
se pueden encontrar errores aleatorios, que son fruto del azar o de causas que no
podemos controlar. Como consecuencia de ello, si repetimos una experiencia cierto
nmero de veces en condiciones reproducibles, es altamente posible que no se
obtenga siempre el mismo valor, sino que un conjunto de valores que seran deseables
modelar. Esta modelacin de valores puede ser analizada por mtodos estadsticos y
permite determinar rangos de valores ms probables y una medida de la
incertidumbre.

Con el fin de controlar efectivamente el error de medicin se deben tener en
cuenta tres aspectos importantes:

1. Una clara especificacin de las necesidades de informacin, con el fin
de reconocer el grado de dificultad en la obtencin de medidas validas.
2. Especificar procedimientos alternativos de medicin en la obtencin de
informacin.
3. Evaluar los costos de la medicin, en contraposicin con la precisin de
la misma


Toda medicin se puede ser representada por la observacin misma del
fenmeno (O
i
), factor compuesto por tres elementos: el primero, el valor real de la
medicin (R
i
); el segundo, el error sistemtico asociado a la medicin (S
i
); y
finalmente, el error aleatorio asociado a la medicin (A
i
). Formalmente, y en una
primera aproximacin, se puede representar una relacin de la forma:

O
i
=R
i
+S
i
+A
i
.

La validez de una medida se refiere al grado con el cual el proceso de
medicin se encuentra libre tanto de errores sistemticos como de errores aleatorios.
La fiabilidad es una medida que se relaciona con el grado en el que el proceso de
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

9
medicin se presenta libre de errores aleatorios. La fiabilidad est relacionada con la
consistencia y la capacidad de prediccin de los resultados obtenidos. La validez est
relacionada con la siguiente pregunta, Se est midiendo lo que pensamos que se est
midiendo?, por lo cual la validez es un concepto mucho ms extenso y difcil, que la
fiabilidad.

Para resumir, una medida debe de ser fiable, para que se le considere vlida y
para que se considere vlida el error sistemtico como aleatorio deben ser lo ms
pequeos posibles. Sin embargo, si una medida no es fiable no puede ser vlida,
mientras que una medida fiable tiene la posibilidad de ser valida. La fiabilidad es una
condicin necesaria pero no suficiente para la validez. Por consiguiente, la validez de
una medida es de gran importancia, ya que trata no solamente del error sistemtico
sino tambin del error aleatorio. La fiabilidad es un concepto ms dbil ya que
solamente trata del error aleatorio.


3. 2 Estad sti ca y Ci enci a

Se dice que los cientficos usan el mtodo cientfico, sin embargo, sera difcil
definir la expresin mtodo cientfico, dado que los cientficos usan cuantos mtodos
o medios puedan concebir, sin desprenderse del objetivo fundamental del mtodo
cientfico que es producir conocimiento cientfico. Ahora bien, para que se produzca
este conocimiento cientfico, se requiere partir de algn tipo de interrogantes que
puedan ser respondidos con fundamentos cientficos. Precisamente, descubrir
respuestas a dichas interrogantes a travs de procedimientos cientficos, es el objetivo
del proceso de investigacin cientfica.

De la gran variedad de procedimientos cientficos, vinculados a distintas
tcnicas de metodologa de investigacin se pueden destacar puntos esenciales en
comn, que son:

1. Revisin de los hechos y teoras propuestas.
2. Formulacin de hiptesis sujetas a pruebas.
3. Evaluacin objetiva de las hiptesis y conclusiones.

Las respuestas a interrogantes relacionadas con el problema a investigar, por
lo general, se hacen mediante una descripcin de; las relaciones, los hechos, los
procesos relacionados del problema. Procedimiento descriptivo, que por siglos se ha
utilizado y que se sigue utilizando para dar explicacin a algn problema o fenmeno,
cuya caracterstica esencial es que el investigador es considerado independiente del
fenmeno que est estudiando, y ste realiza su investigacin a travs de cambios
realizados en el ambiente o entorno del cual el fenmeno en estudio debiera ser
dependiente. Esta postura cientfica clsica, trata la investigacin como una triloga
entre: el observador (investigador) problema de investigacin ambiente.

Esta forma de explicar un problema a investigar (Organismo Observado) de la
investigacin cientfica clsica arraigada por la influencia cartesiana tiende a hacer
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

10
un anlisis fragmentado de los elementos que componen el problema a investigar y
sobre la base de sta elaborar una explicacin del problema en su globalidad, que en
una gran cantidad de problemas, est muy lejos de una verdadera explicacin. Por
esto, en las ltimas dcadas han surgido nuevas tendencias, especficamente aquellas
que se fundamentan en la Teora General de Sistemas (T.G.S.), como la
Ciberntica, orientada a aspectos de cmo mirar, describir y comprender los
problemas en su globalidad. Ahora se debe proceder en un anlisis, en donde los
observadores del fenmeno (problema a investigar) forman parte del problema a
travs de una investigacin operacional experimental perceptual. Es decir, la
respuesta al fenmeno se realiza a travs de un modo particular e individual de
conocer del observador, y su validez depende de la coherencia operacional en un
dominio especificado. Ambas metodologa son representadas respectivamente en la
Figura 2.3.



Figura 2.3 : Metodologas de investigacin cientficas


La estadstica proporciona una forma de pensar clara y disciplinada,
especialmente cuando se trata de recolectar e interpretar informacin (tcnicas
estadsticas), la estadstica como ciencia, es la actividad organizada en virtud de la
cual se procura, a travs del estudio objetivo, descubrir, dominar y comprender los
fenmenos que ocurren en la naturaleza y la sociedad, siendo un pilar fundamental en
el proceso de investigacin cientfica

La Estadstica, se ocupa de los mtodos y procedimientos para recoger,
clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la
variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de
realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones.

Podramos por tanto clasificar la estadstica en descriptiva, cuando las
conclusiones de los resultados del anlisis no pretenden ir ms all del conjunto de
datos, sta describe, analiza y representa un grupo de datos utilizando mtodos de
organizacin de stos, grficos y medidas de desempeo que resumen y presentan la
informacin contenida en ellos.
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

11
Sin embargo, al catalogar la estadstica como inferencial, es cuando el
objetivo del estudio es derivar las conclusiones obtenidas de un conjunto de datos
resumidos a uno ms amplio, es decir, la inferencia estadsticas: La cual se apoya en
el clculo de probabilidades y a partir de datos mustrales, efecta estimaciones,
decisiones, predicciones u otras generalizaciones sobre un conjunto mayor.


3. 3 Introduccin al Muestreo

El mundo emprico est compuesto por un sin fin de conjuntos de elementos;
tales como: personas, animales, objetos, etc., habitualmente de cantidades
suficientemente grandes, cuyo trabajo de recopilacin y posterior anlisis para
obtener alguna informacin de inters de sta, resulta impracticable en tiempos
reales. Estos conjuntos de elementos son llamados poblacin o poblacin objeto,
que en una investigacin, debe quedar claramente acotada, geogrficamente o en el
tiempo,

Un mecanismo, quizs el ms apropiado para poder obtener informacin, es la
extraccin de un subconjunto de unidades o elementos a la cual realizar el anlisis y
obtener un diagnstico de la poblacin. Este subconjunto de unidades o elementos es
llamado muestra, cuyas principales razones para su uso, es llegar a obtener
estimaciones de las caractersticas de inters de una poblacin en forma ms rpida y
econmica.

Los mtodos o tcnicas de muestreo son un pilar fundamental dentro de los
mtodos estadsticos, pues dependiendo de una buena y adecuada tcnica de
muestreo, se puede determinar hasta dnde abarcan los anlisis y conclusiones que se
realizan como referencia futura de un marco establecido.

Teniendo una muestra de una poblacin, esperamos que sta sea
representativa de esa poblacin, es decir, que todas las caractersticas de la poblacin
que se estn analizando estn reflejadas en la muestra. Mientras mejor se reflejen las
caractersticas de la poblacin en la muestra, mayor es la confiabilidad de cualquier
conclusin que se haga de la poblacin.

En una investigacin se pueden obtener observaciones, bsicamente, desde
dos perspectivas dadas por: Obtencin de observaciones a travs del tiempo
Obtencin de observaciones a travs de un diseo de muestreo. Las tcnicas de
muestreo se preocupan esencialmente de las observaciones procedentes a travs de
un diseo de muestreo. El diseo de muestreo, proporciona los principios
fundamentales para abordar de manera eficiente la seleccin de muestras
representativas de la poblacin bajo estudio y estimaciones de las caractersticas de
inters de la forma ms confiable y al ms bajo costo posible.

El concepto fundamental que se utiliza, es la aleatorizacin de las unidades
muestreadas, que se traduce en que las muestras sean tomadas efectivamente al azar,
y no mediante procedimientos subjetivos. Ver Figura 2.4.
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

12
La presencia ausencia de aleatorizacin en el diseo de muestreo permite
clasificar los mtodos de muestreo en: Muestras probabilstica, es decir, que sus
elementos de alguna manera capturen las caractersticas esenciales de la poblacin, y
Muestras no probabilsticas, es decir, las conclusiones obtenidas de la muestra slo
representan o capturan las caractersticas esenciales de esos elementos y no de la
poblacin.

Muestreo no Probabilstico: Es el tpico muestreo que se realiza a la
salida de un centro comercial, salida o ingreso del metro, en una
esquina de una calle, etc., en donde los resultados obtenidos slo
representan el pensamiento de los encuestados, pero no el de la
poblacin en estudio.

Muestreo Probabilstico: La aleatorizacin es vital, pues, las
inferencias que se realicen abarcarn al comportamiento de la
poblacin total. Es por ello, que una mala aleatorizacin o el no
cumplimiento de lo establecido por la aleatorizacin, puede llevar a
obtener conclusiones errneas, al considerarse estas muestras como
sesgadas. En este muestreo cada uno de los elementos de la
poblacin de inters, o poblacin objeto, tiene una probabilidad
conocida, y frecuentemente igual, de ser elegido en la muestra. A las
muestras aleatorias se les denomina tambin muestras
probabilsticas o muestras cientficas.



Figura 2.4 Las encuesta de opinin pblica son aleatorias


En el muestreo probabilstico se utilizan bsicamente cinco tcnicas de
muestreo:

1. Muestreo Aleatorio Simple (m.a.s.).
2. Muestreo Aleatorio Sistemtico (m.a.st.).
3. Muestreo Aleatorio Estratificado (m.a.e.).
4. Muestreo Aleatorio por Conglomerado (m.a.c.).
5. Muestreo Aleatorio Multietpico o con Sub-Muestreo (m.a.pe).

Encuesta Opinin Pblica

Est el comercio regional
deprimido?

1. Salida Mall Marina Arauco
2. Calle Valparaso
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

13
Deberemos aclarar que en ningn caso, los mtodos y tcnicas presentadas,
son rgidas en su aplicacin, sin embargo, queremos entregar una visin globalizada
de lo que debe tenerse en cuenta en unamuestra estadstica, que permita conocer y
entender los factores fundamentales que influyen en cada tcnica de muestreo.

La eleccin de una tcnica de muestreo, se basa en el grado de conocimientos
que se tenga del comportamiento de la caracterstica de inters dentro de la poblacin
objeto, el grado de precisin que se desea obtener en los estimadores utilizados,
costos asociados a su aplicacin, etc.,.


3. 3. 1 Tipos de Muestreos

Muestreo aleatorio simple, tambin llamado muestreo al azar irrestricto, los
elementos se escogen en forma individual y al azar de la totalidad de la poblacin, es
decir, se escogen sin ningn privilegio y cada uno posee la misma probabilidad de
formar parte de la muestra en cada una de las posibles muestras.
A modo de ejemplo: Es recomendado cuando la caracterstica de inters se encuentra
distribuida de forma homognea dentro de los elementos de la poblacin, como se
muestra en la Figura 2.5.


Figura 2.5 Representacin esquemtica del muestreo aleatorio simple.


Las situaciones propicias para aplicacin de este plan de muestreo es cuando: la
lista de elementos de la poblacin est disponible o es de fcil acceso; los
elementos de la poblacin no presentan grandes variaciones entre grupos naturales
que pudiesen formarse en sta. La importancia relativa de los diferentes elementos de
la poblacin tienen el mismo peso a la hora de determinar indicadores de la poblacin
bajo estudio.

La seleccin al azar es similar a la que se realiza en la extraccin aleatoria de
nmeros en una lotera. Sin embargo, en el muestreo estadstico, por lo general se
utiliza un programa computarizado de nmeros aleatorios o un generador de
nmeros aleatorios para identificar los elementos numerados de la poblacin que se
eligen para la muestra.
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

14
Muestreo aleatorio sistemtico, es un plan de muestreo al azar, en la cual se
eligen los elementos de la poblacin a intervalos uniformes, a partir de un listado
(ordenado), tal como elegir cada k-simo elemento despus de un arranque aleatorio.
A modo de visualizacin esquemtica, suponga una poblacin de N elementos de
los cuales se desea obtener una muestra de n elementos, entonces la cantidad de
intervalos o grupos k, que en que se divide la poblacin, est dada por k =N / n.
Luego del primer grupo de k elementos se escoge un elemento al azar, mientras que
los n 1 elementos faltantes en la muestras, se escogen a intervalos regulares de k
elementos, despus del primer escogido, como se muestra en la Figura 2.6.



1 . r . k 1 . r . k 1 . r . k 1 . r . k
1 k +1 (g 1)k +1 (n 1)k +1
k 2k (g 1)k +k nk =N
1 2 g n

Figura 2.6: Esquematizacin Muestreo Aleatorio Sistemtico


Las razones principales por la que utiliza el muestreo sistemtico, es: su
sencilla aplicacin y supervisin., a prueba de errores y flexible

Este plan de muestreo presenta falencias, que aunque son superables,
presentan molestias en su aplicacin, como por ejemplo, que el tamao de poblacin
N no sea mltiplo de k, que la lista de la poblacin puede tener muchos elementos
blancos o extraos, tambin puede presentar errores sistemticos, producto que el
azar slo se encuentra en la seleccin de la primera muestra y puede existir un factor
peridico o cclico en la lista de la poblacin que pudiera conducir a un error
sistemtico en los resultados mustrales,etc.


Muestreo aleatorio estratificado, la caracterstica que se est midiendo en la
poblacin objetivo, presenta mucha dispersin en grupos identificados de la sta, por
los tanto, lo primero que se debe hacer es estratificar los elementos de la poblacin en
subgrupos separados y excluyentes de acuerdo al comportamiento que presenta la
caracterstica dentro de estos grupos. Esquemticamente, esta situacin se refleja en
la Figura 2.7, donde la caracterstica a medir se presenta notoriamente distinta lo cual
es reflejado por la densidad y colores de la figura.

Posterior a la clasificacin de los elemento de la poblacin en grupos, se
obtiene por separado una muestra aleatoria simple o sistemtica de cada estrato.
Puede utilizarse este tipo de muestreo para asegurar una representacin proporcional
de diversos subgrupos en la muestra,. Por lo general el tamao de la muestra que se
requiere para lograr determinado nivel de precisin en el muestreo estratificado es
menor que con muestreo aleatorio simple, con la consiguiente reduccin en los costos
del muestreo.
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

15
Hablar de muestreo estratificado, en trminos generales, se puede decir que
consiste en la realizacin de las siguientes etapas:

1. Identificacin de los estratos excluyentes dentro de la poblacin objeto.
2. Dividir los elementos de la poblacin en las subpoblaciones distintas que
llamamos estratos.
3. Dentro de cada estrato se selecciona una muestra separada a partir de
todas las unidades distintas que componen ese estrato.


Figura 2.7 Representacin esquemtica del muestreo aleatorio estratificado.


Se pueden establecer, al menos tres razones, por las cuales se recomienda la
estratificacin de una poblacin, estas son:

1. Para disminuir la variabilidad de la caracterstica a medir en la muestra.
El tamao de la muestra en cada estrato es idealmente proporcional al
tamao de la poblacin del estrato. La variabilidad disminuye segn el
grado que difieran las medias de cada estrato y de la homogeneidad que
exista en cada estrato. En caso de utilizar un tamao de muestra distinto
a la proporcin de la poblacin en cada estrato, esto se debe a que
existen otros intereses que estn influyendo en la determinacin del
tamao de la muestra (como por ejemplo; costos).

2. Para utilizar distintos mtodos o procedimientos dentro de cada estrato.
Se debe abandonar la simplicidad de algunos procedimientos debido a
las caractersticas particulares de la poblacin, estas caractersticas
pueden ser: la distribucin fsica de las subpoblaciones es totalmente
diferente; puede haber diferencias entre las listas disponibles, o
preferidas para diversas partes de la poblacin, etc.

3. Porque las subpoblaciones se definen como dominios de estudio en si
mismo Se llama dominio a cualquier subdivisin acerca de la cual se
planea un estudio para proporcionar informacin numrica de precisin
conocida de esta subpobalcin.
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

16
Muestreo aleatorio por conglomerados, es un muestreo aleatorio en el cual la
unidad de muestreo, que es la unidad de seleccin, contiene ms de un elemento de la
poblacin, por lo tanto la unidad de muestreo es un grupo de elementos tambin
llamados conglomerados. En este caso cada elemento de la poblacin debe estar
identificado unvocamente con una, y slo una, unidad de muestreo.

En la aplicacin de este tipo de muestreo, lo habitual es que los elementos de
la poblacin se agrupan en forma natural en subgrupos de tal manera que forman una
masa que es difcil descomponer no se puede acceder directamente a ellos. As, se
eligen al azar en primer lugar los conglomerados, y luego los elementos dentro de
ste. Una manera de esquematizar este plan de muestreo, se muestra en la Figura 2.8,
donde se pueden observar que existen conjuntos de elementos, difciles de separar.


Figura 2.8 Representacin esquemtica del muestreo aleatorio por conglomerados.


Lo que constituye un conglomerado como aceptable es asunto que depende de
las condiciones prcticas, que a su vez depende del instrumento de medicin de la
caracterstica en estudio, su configuracin fsica en el dominio de estudio y de los
recursos disponibles.

El nmero de elementos asociados a un conglomerado se llama tamao del
conglomerado. Los conglomerados pueden ser de igual tamao, que suelen ser por lo
general producto de condiciones planeadas, que se dan por ejemplo, en procesos
manufactura, paquetes, cajas de exportacin o importacin, etc. Sin embargo, en su
mayora de las poblaciones, lo ms comn es trabajar con conglomerados de tamao
desigual; por ejemplo si se desea medir la cantidad de elementos en reas, lo comn
que en reas de igual o distinto tamao, existan distinto nmero de elementos.

An en los diseos que empiezan con conglomerados de igual tamao, a
menudo terminan en una muestra real de conglomerados que son desiguales, debido
a: marcos mustrales imperfectos, elementos no encontrados y el uso de subclases
para anlisis.

La seleccin de conglomerados en primer lugar y de elementos dentro de stos
Universidad Tcnica Federico Santa Mara Renato Allende Olivares
Departamento de Matemticas Humberto Villalobos Torres

17
a continuacin, requiere de dos etapas de seleccin, aunque puede extenderse
rpidamente a ms etapas, es conocido como muestrea aleatorio polietpico, que
consiste en una jerarqua de diferentes tipo de unidades; cada unidad de primera etapa
se divide, o es potencialmente divisible, en unidades de segunda etapa, etc. Las
unidades de muestreo de la primera etapa se llaman unidades de muestreos primarias,
mientras que en las etapas siguientes se llaman de segunda, tercera, etc. Etapa.

Generalmente, el submuestreo se utiliza para dividir conglomerados en
unidades menores, que sin lugar a dudas, se solucionara al utilizar y seleccionar
unidades finales, las de la ltima etapa, como unidades primarias, y aplicar
directamente un muestreo en una sola etapa, sin embargo, los principales
inconvenientes que presenta esta alternativa son: los conglomerados pueden existir
naturalmente como, unidades convenientes de muestreo, sin embargo ser mayores
que el tamao econmico deseado para su anlisis; no evita el costo de formacin de
conglomerados menores en la poblacin completa; aumente generalmente, el efecto
de la asociacin que pueda existir entre los conglomerados suele ser menor los grupos
de mayor tamao.

Potrebbero piacerti anche