Sei sulla pagina 1di 25

Temas de Estadística y Probabilidades

INTRODUCCIÓN A LA ESTADÍSTICA:

EVOLUCIÓN
CONCEPTOS BÁSICOS
ETAPAS DEL ANALISIS ESTADISTICO
POBLACIÓN Y MUESTRA

Lic. Mónica Pascual Página 1


Temas de Estadística y Probabilidades

INTRODUCCIÓN
En nuestra primera unidad didáctica comprenderemos el significado de la palabra
estadística, y podremos observar como a través de la historia la utilización de esta
herramienta ha sido fundamental en el desarrollo de diversas actividades, notaremos su
presencia en las distintas disciplinas naturales, sociológicas, económicas, como
tecnológicas. El análisis Estadístico - presente en cada acto humano - puede dotar al
investigador de una estrategia diferencial respecto de otros profesionales. La posibilidad
de mejorar continuamente los procesos repetitivos, debe basarse en respaldos
estadísticos de acuerdo a lo que se espera proyectado hacia el futuro.

OBJETIVOS ESPECÍFICOS
► Que el alumno pueda notar que, a partir de la necesidad de información en distintos
campos, desde hace tiempo existe tanto esmero en unificar sus indicadores y la
interpretación de los valores calculados.

► Que el alumno posea un marco para la elección del tipo de muestreo más adecuado en
una investigación

Lic. Mónica Pascual Página 2


Temas de Estadística y Probabilidades

CONTENIDOS
Los primeros indicios.
 Evolución conocida.
 Necesidad de información censal.
 Teorías probabilísticas

Conceptos y Etapas de la Estadística.


 Estadística descriptiva
 Estadística inferencial
 Recolección de la información
 Presentación de los datos
 Análisis de la información

El proceso de muestreo
 Población y Muestra
 Marco de muestreo
 Elección del método de muestreo
 Tipos de muestreo probabilístico: probabilístico o no probabilístico
 Tipos de muestreo no probabilístico

Determinación del tamaño de muestra en un muestreo probabilístico

 Error de muestreo
 Nivel de confianza
 Cálculo del tamaño de muestra para la media
 Cálculo del tamaño de muestra para una variable categórica

Lic. Mónica Pascual Página 3


Temas de Estadística y Probabilidades

Esquema de contenidos

Los
Organización
primeros Romanos
política
Censos
indicios

Registro de Compilación
Francia
bautismos, estadísitca de
1500 Inglaterra fallecimientos, recursos
matrimonios nacionales

Predicciones sobre
proporciones de
1600 nacimientos de
varones y mujeres

Bernoulli, Masseres, Teoría de las


1700 Lagrange, Laplace probabiidades

Teoría de los Teoría de los


1800 errores de mínimos
observación cuadrados

Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos


faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la
población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro
de riqueza y población se hizo con el objetivo de preparar la construcción de las

Lic. Mónica Pascual Página 4


Temas de Estadística y Probabilidades

pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de
verificar un nuevo reparto.

En el antiguo Israel La Biblia da referencias, en el libro de los Números, de los datos


estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra
parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de
conocer el número de la población.

También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos
efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y
militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que
se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y
ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organización política, quienes mejor


supieron emplear los recursos de la estadística.

Cada cinco años realizaban un censo de la población y sus funcionarios públicos


tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los
recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas.

En este breve párrafo ya distinguimos y vemos la aplicación de varios términos que


diferenciamos como: “censo” y “recuentos”.

También nos referimos a la forma de trabajo como “anotar nacimientos,


defunciones y matrimonios” y metodología estadística en “periódicos”.

Evolución conocida

Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la


población bajo la autoridad del imperio.

Lic. Mónica Pascual Página 5


Temas de Estadística y Probabilidades

Durante los mil años siguientes a la caída del imperio Romano se realizaron muy
pocas operaciones Estadísticas, con la notable excepción de las relaciones de tierras
pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en
el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos.
En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran
Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras
de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra.

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra,


trataron de revivir la técnica romana, los métodos estadísticos permanecieron casi
olvidados durante la Edad Media.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás
Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron
grandes aportes al método científico, de tal forma que, cuando se crearon los Estados
Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de
aplicarse a los datos económicos.

Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al


temor que Enrique VII tenía por la peste. Más o menos por la misma época, en Francia la
ley exigió a los clérigos a registrar los bautismos, fallecimientos y matrimonios. Durante un
brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a
publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años y en
1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y
fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban
treinta años y efectuó predicciones sobre el número de personas que morirían de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabría
esperar, fue un esfuerzo innovador en el análisis estadístico.

En el año 1540 Sebastián Muster realizó una compilación estadística de los


recursos nacionales, comprensiva de datos sobre organización política, instrucciones

Lic. Mónica Pascual Página 6


Temas de Estadística y Probabilidades

sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más
concretas de métodos de observación y análisis cuantitativo y amplió los campos de la
inferencia y la teoría Estadística.

Los eruditos del siglo XVII demostraron especial interés por la Estadística
Demográfica como resultado de la especulación sobre si la población aumentaba, decrecía
o permanecía estática.

En los tiempos modernos tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
países. El primer empleo de los datos estadísticos para fines ajenos a la política estuvo a
cargo de Gaspar Neumann en 1691, un profesor alemán que vivía en Breslau. Este
investigador se propuso destruir la antigua creencia popular de que en los años
terminados en siete moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de
partidas de defunción pudo demostrar que en tales años no fallecían más personas que en
los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés
Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida
humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan
todas las compañías de seguros.

Intente elaborar un breve resumen de lo concerniente a Estadística en el párrafo


anterior que acabamos de presentarle.

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

_______________________________________________________________

Lic. Mónica Pascual Página 7


Temas de Estadística y Probabilidades

Lea atentamente el siguiente concepto:

Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No
obstante durante cierto tiempo, la teoría de las probabilidades limitó su
aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los
grandes problemas científicos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la


palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con
sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante
consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino
status, que significa estado o situación. Esta etimología aumenta el valor intrínseco de la
palabra, por cuanto la estadística revela el sentido cuantitativo de las más variadas
situaciones.

Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este
interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la
aplicación del principio de promedios y de la variabilidad a los fenómenos sociales.
Quételect fue el primero en realizar la aplicación práctica de todo el método Estadístico,
entonces conocido, a las diversas ramas de la ciencia.

Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos


matemáticos fundamentales para la teoría Estadística; la teoría de los errores de
observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados
desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó
el método conocido por Correlación, que tenía por objeto medir la influencia relativa de
los factores sobre las variables. De aquí partió el desarrollo del coeficiente de correlación
creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease

Lic. Mónica Pascual Página 8


Temas de Estadística y Probabilidades

Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de
las relaciones.

Los progresos más recientes en el campo de la Estadística se refieren al ulterior


desarrollo del cálculo de probabilidades, particularmente en la rama denominada
indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la
Física como resultado de las investigaciones atómicas y que este principio se juzga
aplicable tanto a las ciencias sociales como a las físicas.

Queda entonces claramente establecido que cada vez que citamos estadística
estamos refiriéndonos a un método científico, herramienta de la cual se nutren
varias ciencias.

Lic. Mónica Pascual Página 9


Temas de Estadística y Probabilidades

La Estadística se ocupa de los métodos y procedimientos para recolectar,


organizar, resumir, presentar y analizar datos cuantitativos (o cualitativos
transformables en cuantitativos) relativos a un conjunto de individuos u observaciones
que permiten extraer conclusiones válidas y efectuar decisiones lógicas basadas en
dichos análisis.

Esta definición abarca todos los temas que se abordarán en el presente curso y
permite hacernos las siguientes preguntas:

¿Cómo y dónde se obtienen los datos? ¿Trabajamos con todos los datos o con
algunos? ¿Cómo pueden ser los datos? ¿Cómo se organizan? ¿Qué tipos de análisis se
pueden hacer? ¿Cómo interpretamos esos datos?

Las respuestas a estas preguntas se distribuyen en dos ramas de la Estadística:

Estadística descriptiva se refiere a la recolección, presentación, descripción,


análisis e interpretación de un conjunto de datos. Consiste en resumir dichos datos con
elementos de información (medidas descriptivas) que caracterizan la totalidad de los
mismos. La estadística descriptiva es el método que permite resumir o describir de un
conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento
proporcionado por éstos.

La estadística inferencial se refiere al proceso de lograr generalizaciones


acerca de las poblaciones, partiendo de un subconjunto de la misma denominada
muestra. Es un conjunto de técnicas utilizado para obtener conclusiones que sobrepasan
los límites del conocimiento aportado por los datos; es decir, es un proceso que busca dar

Lic. Mónica Pascual Página 10


Temas de Estadística y Probabilidades

una adecuada base científica para poder extraer conclusiones válidas sobre la población
de la cual la muestra ha sido obtenida.

En este punto será muy importante el método utilizado para recolectar la muestra,
de manera que ésta represente verdaderamente las características de la población

Recolección de la información

Los datos que se requieren para realizar un estudio estadístico se obtienen de


varias formas:

a) De organismos gubernamentales como el INDEC (Instituto de Estadística y Censos); de


revistas especializadas en comercio, procesos industriales, etc.; de bases de datos
existentes en nuestro país y el extranjero a través de las redes de computadoras.

Lic. Mónica Pascual Página 11


Temas de Estadística y Probabilidades

b) A través de un experimento. Por ejemplo, para probar la eficacia de un nuevo jabón en


polvo para lavarropas, se determinan las pruebas que se van a realizar, que otros tipos de
jabones se considerarán y cuál es el nivel de riesgo el cual están dispuestos a aceptar.

c) Otra forma es realizar encuestas o entrevistas. En este caso no se ejerce control sobre
el comportamiento de las personas que se estudian; se realizan preguntas sobre
creencias, actitudes, conductas y otras características.

Presentación de los datos

Una vez recopilada la información, ésta se vuelca a una planilla de cálculo para
facilitar su procesamiento.

El primer paso en esta etapa será identificar qué tipos de variables están presentes
y en función de cómo se clasifiquen, se organizan y se presentan en tablas de frecuencia,
en tablas de contingencia y se representan gráficamente.

Análisis de la información

El análisis consiste en calcular, a partir de los datos procesados, los diferentes


indicadores que permiten caracterizar la muestra y/o población de la cual los datos has
sido extraídos

Lic. Mónica Pascual Página 12


Temas de Estadística y Probabilidades

Para dar respuesta a esta pregunta, es necesario definir los conceptos de Población
y Muestra. Es de fundamental importancia comenzar el estudio definiendo cuál es la
Población objetivo.

Población (N) es la totalidad de los elementos (individuos y/u objetos) de los


cuales se obtendrá la información necesaria para dar respuesta al problema de
investigación. De manera que las unidades de población poseen una característica común,
la que se estudia y da origen a los datos necesarios para la investigación.

Entonces, una población es el conjunto de todas las personas, animales o cosas


que concuerdan con una serie determinada de especificaciones, definidas en una
dimensión espacio y en una dimensión tiempo.

La población debe definirse en forma precisa. Una incorrecta definición de la


población puede tener como consecuencia la obtención de información sesgada.

Veamos un ejemplo de cómo definir correctamente una población: suponga que se


va a realizar una prueba de concepto de producto para un nuevo medicamento sin receta
para aliviar los síntomas del catarro. Supongamos que se define a la población como
“todas las personas en un rango de 21 a 70 años”. Esta definición es incorrecta, ya que no
todas las personas adquieren un
POBLACION producto de este tipo sin receta
N cuando tienen catarro. Una correcta
definición de la población para el
MUESTRA ejemplo presentado sería “todas las
n
personas en un rango de 21 a 70 años
que hayan adquirido alguna o varias
marcas de la competencia durante la
última vez que tuvieron catarro”

Lic. Mónica Pascual Página 13


Temas de Estadística y Probabilidades

El ejemplo anterior muestra claramente la necesidad de una correcta definición de


la población de estudio. Por eso es importante que se defina en términos de:

 unidad de muestreo: es un elemento, o unidad que contiene al elemento,


disponible para selección en alguna etapa del proceso de muestreo

 extensión: se refiere a los límites geográficos

 tiempo: lapso en el cual se recolectará la información

La población de interés a menudo se especifica en términos de alguna combinación de los


siguientes factores: características geográficas, demográficas, uso de producto o servicio,
medidas sicológicas, etc

Un censo, por ejemplo, es el recuento de todos los elementos de una población

Las poblaciones suelen ser muy numerosas, por lo que es difícil estudiar a todos
sus miembros; además de que esto suele no ser posible, tampoco es necesario. Es como si
se quisiera estudiar la composición química del agua de un río y para ello se intentara
analizar toda el agua que corre por su cauce, cuando solamente se pueden tomar unas
muestras para realizar ese estudio y llegar a conclusiones generalizables con respecto a la
composición química del agua de todo el río.

Cuando se presenta esta situación, entonces en lugar de trabajar con la población,


se trabaja con una parte de ella llamada muestra.

La Muestra (n) es entonces un subconjunto de la población. Por supuesto, se


espera a través del estudio que lo que se averigüe en la muestra sea cierto para la
población en su conjunto.

La muestra descansa en el principio de que las partes representan al todo y, por


tal, refleja las características que definen la población de la que fue extraída. Para que a
partir del análisis realizado sobre la muestra se pueda hacer una inferencia a la población,

Lic. Mónica Pascual Página 14


Temas de Estadística y Probabilidades

es decir, se pueda extender el análisis a la población de la cual fue tomada la muestra,


ésta debe ser representativa.

Que la muestra sea representativa depende en gran medida de la forma en que


sea seleccionadas las unidades muestrales y del tamaño de ésta.

El proceso de muestreo es la etapa del estudio en el que se define cuál va a ser el


método de muestreo a utilizar, cuál es el marco de muestreo a utilizar, de qué forma se
va a recolectar la información y cuál va a ser el tamaño de la muestra.

Marco de muestreo

El marco de muestreo es una lista de los miembros o elementos de la población de


la cual se seleccionarán las unidades de muestreo. Como ejemplos de marco de muestreo
se pueden mencionar las listas de empresas de una industria, listas de correos compradas
a organizaciones comerciales, directorio de una ciudad o un mapa

En algunas ocasiones se puede obtener una lista de elementos de la población,


pero la misma puede omitir a algunos elementos, como es el caso de las guías de teléfono.
Los directorios telefónicos pueden ser un buen marco de muestreo para recopilar
información a través de encuestas telefónicas; sin embargo hay personas que pagan por
no estar en la guía, algunos individuos se han mudado o cambiado de teléfono. Esto hace
que el marco de muestreo sea deficiente.

En algunos casos, las discrepancias entre la población y el marco de muestreo


puede ser lo suficientemente pequeña para ignorarla. En otros casos, el investigador debe
reconocer esta diferencia y reflejar el marco de muestreo aplicando un procedimiento

Lic. Mónica Pascual Página 15


Temas de Estadística y Probabilidades

para producir una muestra representativa de individuos con las características deseadas:
por ejemplo, utilizando procedimientos de marcado de dígitos aleatorios para encuestas
telefónicas

Elección del método de muestreo


Una vez que se ha tomado la decisión de trabajar con una muestra, el paso
siguiente es decidir cuál será el tipo de muestreo a utilizar. Existen básicamente dos
clasificaciones y cada una de ellas agrupa diferentes subtipos de muestreo.
El muestreo básicamente puede clasificarse en:

a) Probabilístico: en este caso, cada elemento de la muestra tiene una probabilidad


conocida de ser seleccionado para formar parte de la misma. Este tipo de muestreo
asegura la representatividad de la muestra extraída y permite hacer inferencias a la
población.

b) No Probabilístico: la selección de las unidades de análisis se hace siguiendo


determinados criterios del investigador, procurando en la medida de lo posible, que la
muestra sea representativa. Pero la realidad es que este tipo de muestra adolece de
fundamentación probabilística y no corresponde hacer inferencias a la población.

A pesar de estas diferencias tan importantes, para algunos tipos de estudio el


muestreo probabilístico resulta excesivamente costoso, en tiempo y dinero, y se acude a
métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza
de que la muestra extraída sea representativa, ya que no todos los sujetos de la población
tienen la misma probabilidad de ser elegidos. El muestreo no probabilístico, cuando el
investigador toma todos los recaudos necesarios para seleccionar la muestra, permite
tomar decisiones basadas en el análisis de la misma.

Lic. Mónica Pascual Página 16


Temas de Estadística y Probabilidades

Tipos de muestreo probabilístico

a) Muestreo por azar simple: para seleccionar a las unidades muestrales se emplea
una tabla de números aleatorios o se generan éstos a través de un ordenador. A cada
elemento de la población se le asigna un número que permita identificarlo; luego se
seleccionan los elementos que van a integrar la muestra de tamaño n haciendo coincidir el
número de identificación con los primeros n números aleatorios. La probabilidad que
tiene cada elemento de ser seleccionado es: P(x) = n/N

b) Muestreo sistemático: como en el muestreo por azar simple, se enumeran los


elementos de la población. Se elige por azar simple al primer integrante de la muestra y a
partir de éste, el resto de las unidades muestrales se toman de k en k individuos, siendo
k=N/n

c) Muestreo estratificado: en este tipo de muestreo se subdivide a la población en


grupos o estratos que se suponen homogéneos con respecto a alguna característica que
se va a estudiar. Luego se realiza un muestreo aleatorio (por azar o sistemático) en cada
uno de los estratos. Lo que se pretende con este tipo de muestreo es asegurarse de que
todos los estratos de interés estarán representados adecuadamente en la muestra.
El muestreo estratificado se subdivide en dos tipos:

Estrato proporcional: el tamaño de la muestra tomado de cada estrato es proporcional


al tamaño relativo del estrato en la población total, de manera que:

𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒𝑙 𝑒𝑠𝑡𝑟𝑎𝑡𝑜⁄𝑁

Estrato desproporcional u óptimo: el número de elementos que se toma en cada


estrato es proporcional al tamaño relativo del estrato y a la desviación estándar de la
variable de estratificación

Lic. Mónica Pascual Página 17


Temas de Estadística y Probabilidades

d) Muestreo por conglomerado: en los distintos tipos de muestreo hasta ahora


mencionados, se selecciona directamente al elemento que va a formar parte de la
muestra. En el muestreo por conglomerado, se seleccionan unidades muestrales o
“conglomerados” que contienen a los elementos de la población que van a conformar la
muestra. Así por ejemplo, los hospitales, las universidades, las construcciones, son
conglomerados naturales. El muestreo por conglomerados consiste en seleccionar
aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño
muestral establecido) y luego puede recopilarse la información de todos los elementos del
conglomerado o puede seleccionarse en forma aleatoria, por alguno de los tres métodos
expuestos antes, una submuestra de cada conglomerado. En este último caso, el muestreo
se denomina bietápico. Cuando los conglomerados son áreas geográficas suele hablarse
de "muestreo por áreas".

Tipos de muestreo no probabilístico

a) Muestreo por conveniencia: el investigador selecciona directa e intencionalmente los a


individuos de la población más accesibles para obtener información. Por ejemplo, la gente
en una reunión, podría ser designada como muestra. También es el caso de los individuos
que son detectados en centros comerciales. Este es un método fácil y barato, pero el
sesgo puede ser importante.

b) Muestreo por juicio: el investigador selecciona a individuos que juzga de antemano


tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la
información aportada por esas personas es vital para la toma de decisiones.

c) Muestreo por cuotas: Es la técnica más difundida sobre todo en estudios de mercado y
sondeos de opinión. En primer lugar es necesario dividir la población de referencia en
varios estratos definidos por algunas variables de distribución conocida (como el género o
la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte
proporcional de población que representan. Finalmente se multiplica cada peso por el
tamaño de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia

Lic. Mónica Pascual Página 18


Temas de Estadística y Probabilidades

del muestreo estratificado en que una vez determinada la cuota, el investigador es libre
de elegir a los sujetos de la muestra dentro de cada estrato.

d) Muestreo bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y
estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes,
sectas, determinados tipos de enfermos, etc

Determinación del tamaño de muestra en un muestreo probabilístico

La elección del tamaño de muestra está condicionado por factores administrativos,


financieros y estadísticos. Dentro de los primeros, podemos mencionar la naturaleza de la
investigación y la decisión asociada a los resultados de ésta. Las restricciones
presupuestarias son un fuerte factor financiero que en muchas ocasiones condiciona
fuertemente el tamaño de la muestra, a punto tal de tener que en algunos casos, revisar
los objetivos del estudio.
Entre los factores estadísticos, que son los que nos ocupan, los más importantes
son la precisión y el nivel de confianza

Error de muestreo o nivel de precisión: e


Cualquiera sea el procedimiento de muestreo utilizado, la muestra diferirá de la
población. A esta diferencia se la denomina error de muestreo, es decir, es la diferencia de
tolerancia máxima entre la estadística de muestra y el parámetro poblacional. Si se quiere
eliminar el riesgo del error y considerarlo como 0%, entonces la muestra sería del mismo
tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse.
Cuando una muestra es aleatoria o probabilística, es posible calcular sobre ella el
error muestral o error de muestreo. Este error indica el porcentaje de incertidumbre. En
resumen, para fijar el tamaño de la muestra adecuado a cada estudio, es preciso primero
determinar el porcentaje de error que estamos dispuestos a admitir. Una vez hecho esto,

Lic. Mónica Pascual Página 19


Temas de Estadística y Probabilidades

deberán realizarse las operaciones estadísticas correspondientes para poder calcular el


tamaño de la muestra que nos permite situarnos dentro del margen de error aceptado.
e = 𝐱̅ ± µ
Debemos advertir que el error muestral nunca debe calcularse como un porcentaje
del tamaño de la muestra respecto al del universo.
El Nivel de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos. Llamamos nivel de confianza a la probabilidad de que el intervalo
construido en torno a un estadístico capte el verdadero valor del parámetro.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es
un rango de valores (calculado a partir de una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada. La probabilidad de
que el verdadero valor del parámetro se encuentre en el intervalo construido se
denomina nivel de confianza.
El nivel de confianza se obtiene a partir de la distribución normal estándar, que es
un tema que se estudia más adelante. Por ahora y sólo a los fines del cálculo del tamaño
de muestra, se indican a continuación los valores Z de la distribución normal estándar
asociados a los niveles de confianza más utilizados:
Nivel de confianza 95 %: Z = 1,96
Nivel de confianza 99 %: Z = 2,575
Nivel de confianza 99,7%: Z = 2,967
2 2
Cálculo del tamaño de muestra para la media: 𝑛 = 𝑧 𝑒2𝛿

En la fórmula precedente, Z corresponde al valor de la distribución normal


estándar asociado al nivel de confiabilidad, es el nivel de precisión o error de muestreo y
σ2 es la varianza poblacional. Este último valor corresponde a la variabilidad de la
población, tema que se trata en el módulo “Medidas de variabilidad y forma”. Para
facilitar la comprensión del tema, vale explicar que entre las medidas de variabilidad más
importantes está el desvío estándar (σ), que es el promedio de las variaciones de los
valores que adopta la variable respecto a su media. La relación entre la varianza y el

Lic. Mónica Pascual Página 20


Temas de Estadística y Probabilidades

desvío estándar es: 𝛿 = √𝛿 2. En algunas ocasiones, la variabilidad puede expresarse


como la varianza y otras como el desvío estándar
Si la varianza poblacional es un dato que no se conoce, puede ser estimada de la
siguiente manera:

a) pueden utilizarse datos sobre la varianza poblacional utilizados en estudios anteriores.


Si fuera este el método para estimar la varianza poblacional, debe asegurarse de la validez
actual de este valor.
b) a través de una muestra piloto: se estima la varianza poblacional mediante la varianza
muestral s2
c) si existe evidencia que la población estudiada tiene distribución normal, se estima
dividiendo el rango o amplitud de la población por 4 y a este valor se lo eleva al cuadrado.

𝒁𝟐 𝒑 (𝟏−𝒑)
Cálculo del tamaño de muestra para una variable categórica: 𝒏 =
𝒆𝟐

Z es el valor de la distribución normal estándar asociado al nivel de confiabilidad, e es el


error de muestreo aceptable y p es la proporción verdadera de éxito. Es decir, que en
realidad p es el parámetro de la población que se quiere encontrar. Entonces, ¿cómo se
establece un valor que es justo para lo que se debe tomar una muestra que permita
determinarlo? Se tienen un par de alternativas:

a) es posible que se disponga de información histórica o experiencias relevantes que


permitan fijar una predicción de p
b) Cuando no se dispone de datos históricos o experiencias relevantes, se puede intentar
proporcionar un valor de p que nunca subestime el tamaño de la muestra requerido.
Entonces debe determinarse el valor de p que hará que el producto de p (1-p) sea lo
más grande posible. El valor p = 0,50 asegura el mayor tamaño de muestra para un
nivel de confiabilidad y error dado. Luego, según los indicios que la investigación pueda
ir dando, este valor se puede ajustar a uno más real.

Lic. Mónica Pascual Página 21


Temas de Estadística y Probabilidades

Observando las fórmulas puede darse cuenta que a medida que disminuye el error
muestral y/o aumenta el nivel de confiabilidad, el tamaño de muestra es mayor.

Apliquemos los conceptos estudiados en el siguiente ejemplo:

Se quiere estudiar cuáles son los factores que más han incidido en los accidentes de
trabajo en el sector de la construcción durante el año 2015 en la ciudad de Mar del Plata.
 Población: todos los trabajadores afiliados en el sindicato de la construcción en Mar del
Plata durante el año 2015.
 Unidad de muestreo: el trabajador
 Extensión: ciudad de Mar del Plata
 Tiempo: año 2015
 Marco de muestreo: el listado de todos los trabajadores afiliados al sindicato durante
el año 2015 en la ciudad de Mar del Plata
 Tamaño de muestra: para calcular el tamaño de muestra, se utiliza la fórmula para una
variable categórica, dado el objetivo del estudio. Se utiliza un nivel de confianza del
95% y se acepta un error muestral del 5%. De acuerdo a esto, el tamaño adecuado será
de 385 trabajadores
𝒁𝟐 𝒑 (𝟏−𝒑) 𝟏.𝟗𝟔𝟐 𝒙 𝟎.𝟓 𝒙 𝟎.𝟓
𝒏= = = 𝟑𝟖𝟒. 𝟏𝟔
𝒆𝟐 𝟎.𝟎𝟓𝟐

 Tipo de muestreo: se indica a continuación el mecanismo de selección de las unidades


muestrales para los diferentes subtipos de muestreo probabilístico comentados.

a) Muestreo por azar: como criterio para la selección al azar de los trabajadores
puede utilizarse el número de afiliado al sindicato. Utilizando una tabla de
números aleatorios (que puede encontrarse en libros de estadística o pueden

Lic. Mónica Pascual Página 22


Temas de Estadística y Probabilidades

generarse con una planilla de cálculo), si la muestra (n) va a ser de 385 individuos,
se seleccionan del marco de muestreo los 385 primeros trabajadores cuyo número
de afiliado coincidan con los primeros 385 números aleatorios.

b) Muestreo sistemático: El primer individuo que va a integrar la muestra se


selecciona a través de un muestreo por azar simple, es decir, que se selecciona
haciendo coincidir el número de afiliado con un número aleatorio. Luego, teniendo
en cuenta la totalidad de afiliados al sindicato, se divide al total de la población por
el tamaño que tendrá la muestra para determinar cada cuantos afiliados se hará la
extracción del elemento. Así, si la población fuera de 7700 trabajadores, cada 20
afiliados se seleccionará a uno para formar parte de la muestra (7700/385 = 20).

c) Muestreo estratificado: En el estudio que se pretende realizar podría ser


importante tener en cuenta que las grandes empresas que cuentan con muchos
empleados tienen una mayor cantidad de accidentados que las pequeñas
constructoras con pocos empleados. En virtud de lo expuesto puede tomarse como
base para estratificar a la población “la cantidad de trabajadores por empresa”. Así
es que podrían agruparse en aquellas que tienen menos de 50, entre 51 y 100 y
más de 100 empleados. Supongamos que la proporción que cada estrato o grupo
de empresas según la cantidad mencionada de trabajadores es: 60% para las que
tienen menos de 50 empleados, 25% para aquellas que tienen entre 51 y 100 y
15% para las que tienen más de 100.
Si la decisión es realizar un “muestreo estratificado proporcional”, entonces el
tamaño de cada estrato dentro de la muestra debe ser proporcional al tamaño
relativo del estrato en la población total; de manera que, para un n=385 la
cantidad de trabajadores seleccionados en cada estrato debe ser 231, 96 y 58
elementos respectivamente en cada uno de ellos.

Lic. Mónica Pascual Página 23


Temas de Estadística y Probabilidades

d) Muestreo por conglomerado: En este planteo, se puede usar como marco de


muestro a las empresas constructoras asociadas a las cámaras de la construcción
(si hubiera más de una) de la ciudad de Mar del Plata en el año 2015. El
procedimiento comienza seleccionando, por algunos de los subtipos de muestreo
previamente explicados, las empresas constructoras que son las que contienen a
los elementos que van a formar parte de la muestra. Una vez que éstas han sido
seleccionadas, el siguiente paso es escoger a los elementos dentro de las
empresas, para lo cual pueden realizarse muestreos al azar (simple o estratificado)
entre los trabajadores de las constructoras seleccionadas hasta completar el total
de la muestra.

Vamos a determinar la población, marco de muestreo, unidad de muestreo, extensión y


tiempo
1) Luego de relevar en Mayo de 2.003 los Ingenios que van a producir alcohol durante
la zafra de este año, para asentar el número de trabajadores inscriptos con aportes
previsionales se encontró que varios de ellos debían regularizar su situación.

2) Se quiere verificar el nivel auditivo de los trabajadores de una empresa minera


radicada en Sur de Tucumán, en Agosto de 2.007

Lic. Mónica Pascual Página 24


Temas de Estadística y Probabilidades

3) En una exposición de productos de seguridad el 22 de junio pasado, los


organizadores luego del recorrido por los distintos stands, consultaban a los
asistentes ¿Cuál de ellos había sido el preferido por los visitantes?

Lic. Mónica Pascual Página 25

Potrebbero piacerti anche