Sei sulla pagina 1di 41

ESTIMACIÓN DE BAYES

I.C. CLAUDIA ELISA ORIHUELA LAGUNA


Hablaremos de muestro probabilístico siempre que se cumplan dos
condiciones:

Conozco de forma precisa dicha


Todos los elementos de mi población
probabilidad para cada elemento, lo
tienen una probabilidad mayor de cero
que se conoce como probabilidad de
de ser seleccionados en la muestra.
inclusión.
MUESTREO
PROBABILÍSTICO
El cumplimiento de ambos criterios es el que hace posible obtener
resultados no sesgados cuando estudio la muestra. En ocasiones, estos
resultados no sesgados requieren usar técnicas de ponderación
(weighting), pero esta ponderación es posible precisamente porque
conozco qué probabilidad tengo de que cada individuo sea
seleccionado en mi muestra. Las muestras generadas en estas
condiciones se conocen también como muestras probabilísticas.
La definición anterior nos lleva a concluir que
sólo podemos hacer muestreo probabilístico si
dispongo de un marco muestral. El censo de un Una vez que tengo un marco muestral, la forma
país, el conjunto de direcciones de hogares en exacta que empleo para seleccionar mi muestra
una población o la lista de clientes de una define las diferentes técnicas de muestreo
empresa, son ejemplos de marcos muestrales probabilístico: Muestreo aleatorio simple,
que hacen posible un muestreo probabilístico. En muestreo sistemático, muestreo estratificado,
cada uno de estos casos, el universo a estudiar es muestreo por conglomerados, muestreo
diferente: habitantes de un país, hogares de una desproporcionado…
población y clientes de una empresa,
respectivamente.
Características

• Cuantitativo
• Todos los casos tienen la misma probabilidad de ser
• seleccionados
• Es ciego a la hora de seleccionar los casos
• No requiere un conocimiento de la población a estudiar
• Persigue la inferencia estadística
• Requiere una muestra con mayor número de casos

Ventajas

• Cada uno de los individuos de la población tiene la misma posibilidad de ser


elegido (simple)
• Asegura que la muestra represente adecuadamente a la población en
función de unas variables seleccionadas (estratificado)
• Se forma para representar tan fielmente como sea posible a toda la
población (por área)

Desventajas

• Marco muestral inadecuado


• No cubrir toda la población
• Elementos extraños o perdidos
• Agrupaciones
TIPOS DE
MUESTREO
PROBABILÍSTICO
MUESTREO ALEATORIO SIMPLE

• Es la técnica de muestreo en la que todos los


elementos que forman el universo y que,
por lo tanto, están descritos en el marco
muestral, tienen idéntica probabilidad de ser
seleccionados para la muestra. Sería algo así
como hacer un sorteo justo entre los
individuos del universo: asignamos a cada
persona un boleto con un número
correlativo, introducimos los números en
una urna y empezamos a extraer al azar
boletos. Todos los individuos que tengan un
número extraído de la urna formarían la
muestra. Obviamente, en la práctica estos
métodos pueden automatizarse mediante el
uso de ordenadores.
MUESTREO SISTEMÁTICO
• Es una técnica dentro de la categoría de muestreos
probabilísticos – y que por lo tanto requiere tener
un control preciso del marco muestral de individuos
• Ejemplo seleccionables junto con la probabilidad de que
• Supongamos que tenemos un marco muestral de sean seleccionados – consistente en escoger un
5.000 individuos y deseamos obtener una muestra individuo inicial de forma aleatoria entre la
población y, a continuación, seleccionar para la
de 100 de ellos. Dividimos en primer lugar el marco
muestra a cada enésimo individuo disponible en el
muestral en 100 fragmentos de 50 individuos. A marco muestral.
continuación seleccionamos un número aleatorio
• El muestreo sistemático es un proceso muy simple
entre 1 y 50, para extraer el primer individuo al y que sólo requiere la elección de un individuo al
azar del primer fragmento: por ejemplo el 24. A azar. El resto del proceso es trivial y rápido. Los
partir de este individuo, queda definida la muestra resultados que obtenemos son representativos de
extrayendo los individuos de la lista con intervalos la población, de forma similar al muestreo aleatorio
de 50 unidades, tal y como sigue simple, siempre y cuando no haya algún factor
intrínseco en la forma en que los individuos están
24, 74, 124, 174, …, 4.974
listados que haga que se reproduzcan ciertas
características poblacionales cada cierto número de
individuos. Este suceso es realmente poco
frecuente.
MUESTREO ESTRATIFICADO

• Según la profesión,
El municipio de residencia,
El sexo,
El estado civil,
Edad,
Nivel Socioeconómico,
etc..
• Tipos de muestreo estratificado: dependiendo del tamaño que asignamos a los
estratos, hablaremos de diferentes tipos de muestreo estratificado. También se
acostumbra a hablar de diferentes formas de “afijación” de la muestra en estratos.
• Muestreo estratificado proporcionado: cuando seleccionamos una característica de
los individuos para definir los estratos, suele ocurrir que el tamaño de las
subpoblaciones resultantes en el universo son diferentes.
• Por ejemplo, queremos estudiar el % de la población que fuma en México y
pensamos que la edad puede ser un buen criterio para estratificar (es decir,
pensamos que existen diferencias importantes en el hábito de fumar
dependiendo de la edad). Definimos 3 estratos: menores de 20 años, de 20 a 44
años y mayores de 44 años. Es de esperar que al dividir toda la población
mexicana en estos 3 estratos no resulten grupos de igual tamaño. Efectivamente,
si miramos datos oficiales, obtenemos:
• Estrato 1 – Población Mexicana menor de 19 años: 42,4 millones (41,0%)
• Estrato 2 – Población Mexicana de 20 a 44 años: 37,6 millones (36,3%)
• Estrato 3 – Población Mexicana mayor de 44 años: 23,5 millones (22,7%)
• Si usamos muestreo estratificado proporcionado, la muestra deberá tener estratos que
guarden las mismas proporciones observadas en la población. Si en este ejemplo
queremos crear una muestra de 1.000 individuos, los estratos tendrán que tener un
tamaño como sigue:
ESTRATO POBLACIÓN PROPORCIÓN MUESTRA
1 42.4 M 41.0 % 410
2 37.6 M 36.3 % 363
3 23.5 M 22.7 % 227

1000 ∙ 41
1= = 410
100
1000 ∙ 36.3
2= = 363
100
1000 ∙ 22.7
3= = 227
100
• Muestreo estratificado uniforme: hablaremos de una afijación uniforme cuando asignamos el mismo
tamaño de muestra a todos los estratos definidos, sin importar el peso que tienen esos estratos en la
población. Siguiendo con el ejemplo anterior, un muestreo estratificado uniforme definiría la siguiente
muestra por estrato:

ESTRATO POBLACIÓN PROPORCIÓN MUESTRA


1 42.4 M 41.0 % 334
2 37.6 M 36.3 % 333
3 23.5 M 22.7 % 333

1000
1= = 333.33, 𝑝𝑜𝑟 𝑠𝑒𝑟 𝑚𝑎𝑦𝑜𝑟 𝑒𝑙 % 𝑠𝑒 𝑑𝑒𝑗𝑎 𝑒𝑛 334
3
1000
2= = 333
3
1000
3= = 333
3
• Esta técnica favorece los estratos que tienen menos peso en la población,
equiparándolos en importancia a los estratos más relevantes. Globalmente, reduce
la eficiencia de nuestra muestra (menor precisión en los resultados), pero como
contrapartida permite estudiar características particulares de cada estrato con
mayor precisión. En nuestro ejemplo, si queremos emitir alguna afirmación
específica sobre la población del estrato 3 (mayores de 44 años), podremos hacerlo
con menor nivel de error muestral si empleamos una muestra de 333 unidades que
si lo hacemos con una muestra de 227 (como ocurría en el muestreo estratificado
proporcional).
MUESTREO CONGLOMERADO

• Podemos ver esta técnica desde otro


punto de vista. Mientras que en todas las
técnicas vistas hasta ahora las unidades de
muestreo coinciden con las unidades a
estudiar (individuos), en el muestreo por
conglomerados las unidades de muestreo
son grupos de unidades de estudio, algo
que puede resultar muy beneficioso en
relación al coste del propio muestreo. A
cambio, es habitual obtener una menor
precisión al usar esta técnica, causada por
falta de heterogeneidad dentro de los
conglomerados.
• EJEMPLOS:
• Conglomerados naturales como: Las unidades hospitalarias, los
departamentos universitarios, una caja de determinado producto, etc.
• Conglomerados no naturales como: Las urnas electorales.
TIPOS DE MUESTREO NO
PROBABILÍSTICO
• El muestreo no probabilístico es aquella técnica utilizada en la muestra
estadística que, al contrario de la muestra probabilística, se basa en un
proceso que no les permite a todos los individuos de una población
investigada tener la misma oportunidades de ser seleccionados.

• Es decir, en este tipo de muestreo predominan aquellos individuos que al


cumplir con cierta cualidad o característica benefician a la investigación,
entonces pueden ser parte de la muestra.
• A la hora de clasificar al
muestreo no probabilístico,
podemos encontrar los
siguientes tipos:
Muestreo por conveniencia: el muestreo no
probabilístico por conveniencia es aquel que, tal
como lo indica su nombre, el investigador realiza
la muestra en base a las selección de individuos
que considera accesibles, fácil y de rápida
investigación. Esto, generalmente, lo hace por
proximidad al investigador.

Por ejemplo: El investigador decide realizar un


estudio sobre la opinión de un profesor en un aula
determinada. Al utilizar el muestreo por
conveniencia, conforma su muestra para
encuestar en base a los primeros 5 alumnos de la
lista del aula.
• Muestreo por cuotas: en este, el investigador se asegura de
formar la muestra de forma que ésta sea equitativa y
proporcional de acuerdo a las características, cualidades o
rasgos de la población a estudiar.

• Por ejemplo: El investigador debe realizar una muestra sobre


empleados de una empresa en donde 60% son mujeres y 40%
son hombres. Por lo tanto, el investigador debe realizar la
muestra seleccionando individuos para que dicha muestra sea
proporcional a la población. Dicha selección la hace a través de
un muestreo por conveniencia o a elección del investigador.
• Muestreo de bola de nieve: también conocido como muestreo en
cadena, este método de muestra no probabilística es aquella en donde
el encargado de la investigación le exige al primer sujeto identificar o
señalar a otra persona que tenga potencial y que cumpla con los
requisitos de dicha investigación.
• Por ejemplo: Un investigador decide realizar una investigación en donde la
muestra va a estar conformada por individuos que posean una rara
enfermedad. Por lo tanto, al encontrar un individuo que posea dicha
enfermedad, el investigador le pide ayuda a este individuo para encontrar
otros con sus mismas características, conformándose de esta manera la
muestra.
• Muestreo discrecional: también conocida como muestreo por juicio o
intencional. En este caso se consiguen las muestras y los sujetos se
eligen para llegar a ser un grupo en donde la muestra busca un objetivo
específico. En este particular, el encargado de la investigación sabe que
algunas personas resultan más adecuadas para el análisis que otras.
• Por ejemplo: Se desea realizar una investigación sobre el
comportamiento de los padres con sus hijos. Por lo tanto, el investigador
seleccionara los individuos para su muestra en base a personas que
tengan hijos, ya que lo considera aptos de conocimiento para formar
parte de la muestra deseada.
Ventajas

• Las ventajas que suele presentar el muestreo no probabilístico son:


• Menor costo para realizar la investigación.
• Se pueden controlar las características de la muestra.
• Conlleva menor tiempo, ya que se conoce el individuo que va a
formar la muestra.
• Se pueden conocer las características poco comunes.

Desventajas

• Las desventajas de utilizar el muestreo no probabilístico son:


• No es una muestra que asegure la representación total de la
población.
• No generaliza y es subjetivo.
• No es recomendable en el caso de que la investigación sea causal o
descriptiva.
• Algunos ejemplos que permitirán entender la muestra no probabilística son los
siguientes:
• Un profesor desea analizar la cantidad de estudiantes con metas realistas, así que utiliza
voluntarios conocidos, envía a la escuela la encuesta, estos estudiantes y ellos actúan
como la muestra.
• Un investigador social elige 50 personas desempleadas de una población y
posteriormente pide a 5 de estas personas para que busquen 10 personas desempleadas
que ellos conozcan para terminar el análisis y la investigación, utilizando el método de
bola de nieve.
LA DISTRIBUCIÓN
NORMAL EN LA TOMA
DE DECISIONES
• La variable aleatoria normal x
representa el
comportamiento de muchos
fenómenos naturales,
sociales, económicos,
industriales, etc. Por lo que es
de bastante uso. La
distribución se origina cuando
el número de ensayos en una
variable aleatoria discreta se
vuelve muy grande.
Características de la curva normal:
• También es llamada Campana de Gauss, curva de Gauss o curva normal.
• Es simétrica respecto a su valor central (𝜇)
• Su punto máximo coincide con la media(𝜇)
• Tiene puntos de inflexión situados a ambos lados de la media (𝜇) a una
distancia (±𝑛𝜎) de ella. (n = 1,2,3)
• Su área total bajo la curva es 1 (100%)
• Esta función no tiene una solución sencilla para calcular valores de
probabilidad, por lo que se requiere de una variable especial llamada
variable normal estándar (z).
• Distribución normal estándar.
• La distribución de probabilidad
normal es una curva simétrica en
forma de campana.

• La curva en su totalidad vale 1,


como es simétrica si se divide a la
mitad, cada una de ellas vale 0.5,
porque 0.5 + 0.5 = 1.00 que es el
área total de esta curva.
• Para trabajar con la distribución normal se utiliza la distribución normal estándar,
• esta distribución se divide a la mitad con la media que vale cero y con
• desviaciones estándar de valor 1.
• La desviación estándar es la distancia
promedio que hay entre un punto y
la media, por ejemplo, la distancia
que hay entre x (0) y s (1) es una
desviación estándar o la distancia
que hay entre x y -3s es tres
desviaciones estándar.

• No existen distancias negativas,


entonces una desviación estándar
negativa sólo indica que ésta ubicada
a la izquierda de la media y una
desviación estándar positiva ésta
ubicada a la derecha de la media.
• Con la distribución normal se
calculan áreas bajo la curva,
por ejemplo, el área que hay
entre la media y una desviación
estándar positiva se presenta
en figura de la izquierda. Esta
área tiene un valor que a
continuación se explicará como
obtenerla.
• Cuando se presenta un problema a resolver con la distribución normal la variable
implicada x se transforma a un valor de z, que son las unidades en términos de
desviaciones estándar que utiliza la distribución normal, la fórmula empleada para esta
transformación es la siguiente
𝒙−𝒙ഥ
𝒛=
𝒔
𝑑𝑜𝑛𝑑𝑒:
• 𝑧 = 𝑣𝑎𝑙𝑜𝑟 𝑒𝑛 𝑡é𝑟𝑚𝑖𝑛𝑜𝑠 𝑑𝑒 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
• 𝑥ҧ = 𝑚é𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎
• 𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟

• Para calcular los valores de z se utiliza la Tabla 1 Áreas bajo la curva normal estándar,
que se presenta a continuación.
EJEMPLO
• Suponga que a varios solicitantes de trabajo se les hace una prueba de
aptitud. Los resultados de la prueba forman una distribución normal
con media aritmética de 80 y una desviación estándar de 4.
a) ¿Qué proporción de resultados obtuvieron entre 80 y 84?
b) ¿Qué proporción de resultados se encuentra entre 75 y 83?
c) ¿Qué proporción de resultados quedaron entre 75 y 78?
d) ¿Qué proporción de resultados es superior a 85?
e) ¿Qué proporción de resultados está abajo de 85?
a) ¿Qué proporción de resultados obtuvieron entre 80 y 84?
• 𝑥ҧ = 80 𝑠= 4
𝑥−𝑥ҧ 80−80 0
• 𝑆𝑖 𝑥 = 80, 𝑧 = = = =0
𝑠 4 4
𝑐𝑜𝑚𝑜 𝑥 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑧 𝑠𝑖𝑒𝑚𝑝𝑟𝑒 𝑒𝑠 = 0,
𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑠 𝑒𝑙 𝑐𝑒𝑛𝑡𝑟𝑜, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 á𝑟𝑒𝑎.
𝑥−𝑥ҧ 84−80 4
• 𝑆𝑖 𝑥 = 84, 𝑧 = = = =1
𝑠 4 4
𝑢𝑛𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
Para obtener el área se utiliza la
Tabla 1 Áreas bajo la curva
normal estándar, al valor de 1,
se le agregan dos ceros porque
la distribución normal emplea
un entero y dos decimales, es
decir, 1.00, entonces se busca
1.0 en la columna z y como falta
un cero busco en la columna 𝑃 80 ≤ 𝑥 ≤ 84 = 𝑃 0 ≤ 𝑧 ≤ 1 = 0.3413 = 34.13%
.00, la intersección de estas
columnas es la área, es decir,
0.3413.
• b) ¿Qué proporción de resultados se encuentra entre 75 y 83?
𝑥−𝑥ҧ 75−80 −5
• 𝑆𝑖 𝑥 = 75, 𝑧 = = = = −1.25
𝑠 4 4
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟, 𝑠𝑢 á𝑟𝑒𝑎 𝑒𝑠 𝑑𝑒 0.3944
𝑥−𝑥ҧ 83−80 3
• 𝑆𝑖 𝑥 = 83, 𝑧 = = = = 0.75
𝑠 4 4
𝑠𝑢 á𝑟𝑒𝑎 𝑒𝑠 0.2734
La Tabla 1 Áreas bajo la curva normal estándar
presenta sólo valores positivos, pero, como es
simétrica, la área de –1.25 y 1.25 es el misma.
Entones para obtener el área de – 1.25 se busca
1.2 en la columna z y como falta un cinco busco
en la columna .05, la intersección de estas
columnas es la área, es decir, 0.3944.
Para la área de 0.75 se busca .7 en la columna z
y como falta un cinco busco en la columna .05, la
área es decir, 0.2734.

𝑃 75 ≤ 𝑥 ≤ 83 = 𝑃 −1.25 ≤ 𝑧 ≤ 0.75 = 𝑃(−1.25 ≤ 𝑧 ≤ 0) + 𝑃(0 ≤ 𝑧 ≤ 0.75) = 0.3944 + 0.2734


= 0.6678 = 66.78%
• c) ¿Qué proporción de resultados quedaron entre 75 y 78?
𝑥−𝑥ҧ 75−80 −5
• 𝑆𝑖 𝑥 = 75, 𝑧 = = = = −1.25
𝑠 4 4
𝑠𝑢 á𝑟𝑒𝑎 𝑒𝑠 𝑑𝑒 0.3944
𝑥−𝑥ҧ 78−80 −2
• 𝑆𝑖 𝑥 = 78, 𝑧 = = = = −0.5
𝑠 4 4
𝑠𝑢 á𝑟𝑒𝑎 𝑒𝑠 0.1915
𝑃 75 ≤ 𝑥 ≤ 78 = 𝑃 −1.25 ≤ 𝑧 ≤ −0.5 = 𝑃 −1.25 ≤ 𝑧 ≤ 0 − 𝑃 0 ≤ 𝑧 ≤ −0.5 = 0.3944 − 0.1915
= 0.2029 = 20.29%
• d) ¿Qué proporción de resultados es
superior a 85?
𝑥−𝑥ҧ 85−80 5
• 𝑆𝑖 𝑥 = 85, 𝑧 = = = =
𝑠 4 4
1.25
𝑠𝑢 á𝑟𝑒𝑎 𝑒𝑠 𝑑𝑒 0.3944

𝑃 𝑥 > 83 = 𝑃 𝑧 ≤ 1.25 = 𝑃(𝑧 ≥ 0) − 𝑃(0 ≤ 𝑧 ≤ 1.25) = 0.5 − 0.3944 = 0.1056


= 10.56%
• e) ¿Qué proporción de resultados está
abajo de 85?

𝑃 𝑥 < 85 = 𝑃 𝑧 < 1.25 = 𝑃(𝑧 ≤ 0) + 𝑃(0 ≤ 𝑧 ≤ 1.25) = 0.5 + 0.3944


= 0.8944 = 89.44%

Potrebbero piacerti anche