Sei sulla pagina 1di 42

Paso 2 actividades sobre distribuciones muéstrales y estimación

Por
Eliana Vasquez
Código:
Sandy Torres
Código:
Ana Silvia Espinosa Ramírez
Código: 1118122381
Sonia Fuentes
Código:
María Zulma Alarcón Ávila
Código: 52996069

Inferencia Estadística
551112- 5

Presentado a
Freddy Yesid Villamizar

Universidad Nacional Abierta y a Distancia UNAD


CEAD Yopal-
Escuela ciencias de la educación -ECDU
04 de Julio de 2020
Introducción

La estadística como rama de las matemáticas que con sus métodos y técnicas de muestreo

permiten recolectar, organizar, calcular, analizar y formular conclusiones, encontrando las

principales características de una variable en grupo de individuos o de cualquier situación que

esta requiera.

En el presente trabajo abordaremos contenidos asociados con la estadística inferencial

que se encarga de generalizar al total de la población las características obtenidas al analizar una

muestra. El muestreo es uno de los principales aspectos a considerar en la prueba de hipótesis.

A continuación, se relacionan conceptos que van desde la medida de tendencia central a

las medidas de dispersión, diferentes tipos de ejercicios donde nos permiten interactuar con

cada uno de los conceptos expuestos.


Objetivos

Objetivo general

Estudiar conceptos básicos y propiedades de la estadística inferencial, para poder

formular hipótesis sobre una población objeto de estudio partir de una muestra, mediante la

resolución de situaciones del contexto real.

Objetivos específicos

1. Consultar propiedades de las diferentes distribuciones muéstrales.

2. Reconocer propiedades y características de las diferentes distribuciones muéstrales.

3. Resolver ejercicios donde intervengan media, mediana y moda.


Parte A

Consultar la definición, propiedades, cuando o para qué se utiliza de las siguientes palabras

1.1. Distribución de muestreo, distribución normal y distribución de probabilidad

Teoría Del Muestreo

Uno de los propósitos de la estadística inferencial es estimar las características

poblacionales desconocidas, Mirar la información obtenida de una muestra, de una población. El

punto de interés es la muestra, la cual debe ser representativa de la población objeto de estudio.

Se seguirán ciertos procedimientos de selección para asegurar de que las muestras

reflejen observaciones a la población de la que proceden

Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto

observa. Una muestra es un subconjunto de observaciones seleccionadas de una población.

Errores en el Muestreo Errores en el Muestreo Cuando se utilizan valores muéstrales

(parámetros), o estadísticos para estimar valores poblacionales, pueden ocurrir dos tipos

generales de errores: El error muestral y El error no muestral.

El error muestral se refiere a la variación natural existente entre muestras tomadas de la

misma población. Aún si se ha tenido gran cuidado para asegurar que dos muestras del mismo

tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticas

en todos sus detalles. El error muestral es UN concepto importante que ayudará a entender mejor

la naturaleza de la estadística inferencial. Los errores que surge al tomar las muestras y que no

pueden clasificarse como errores muéstrales y se denominan errores no muéstrales. El sesgo de


las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia

sistemática inherente a un método de muestreo que da estimaciones de un parámetro que son, en

promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parámetro real. Ejemplo:

la longitud del dedo índice de personas de la misma edad y sexo. El sesgo muestral puede

suprimirse, o minimizarse, usando la aleatorización.

La aleatorización se refiere a cualquier proceso de selección de una n muestra de la

población en el que la selección es imparcial o no está sesgada; una muestra elegida con

procedimientos aleatorios se llama muestra aleatoria muestra aleatoria.

Los tipos más comunes de técnicas de muestreo aleatorios son:

 El muestreo aleatorio simple.

 El muestreo estratificado.

 El muestreo por conglomerados

 El muestreo sistemático.

Si una muestra aleatoria se elige de tal manera que todos los elementos de la población

tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

 La distribución muestral resulta de considerar todas las muestras posibles tomadas de una

población.

 Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de

acercarse al parámetro de la población.

 El muestreo puede hacerse con o sin reposición y la población de partida puede ser

infinita o finita.
 Una población finita en la que se efectúa muestreo con reposición puede considerarse

infinita teóricamente. Una población muy grande puede considerarse como infinita.

 En todas las posibles muestras de tamaño n en una población. Para cada muestra es

posible calcular un estadístico (media, desviación típica, proporción) que variará de una a

otra. Así se obtiene una distribución del estadístico que se llama distribución muestral.

 Las dos medidas fundamentales de esta distribución son la media y la desviación típica,

también denominada error típico.

 Si el tamaño de la muestra es lo suficientemente grande las distribuciones muestrales son

normales y en esto se basarán todos los resultados que se encuentren.

1.2. Desviación típica

Conocida como desviación estándar y representada de manera abreviada por la letra

griega minúscula sigma σ o la letra latina s, así como por las siglas SD (de standard desviation,

en algunos textos traducidos del inglés).

Es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto

de datos numéricos.

Una desviación estándar baja indica que la mayor parte de los datos de una muestra

tienden a estar agrupados cerca de su media (también denominada el valor esperado), mientras

que una desviación estándar alta indica que los datos se extienden sobre un rango de valores más

amplio.

La desviación estándar de una variable aleatoria, población estadística, conjunto de datos

o distribución de probabilidad es la raíz cuadrada de su varianza. Es algebráicamente más simple,

aunque en la práctica menos robusta, que la desviación media. Una propiedad útil de la
desviación estándar es que, a diferencia de la varianza, se expresa en las mismas unidades que

los datos a partir de los que se calcula.

La desviación estándar se usa comúnmente para medir la fiabilidad de las conclusiones

estadísticas. Como el margen de error en los datos de los sondeos de opinión.

La desviación estándar se denomina "error estándar" de la estimación o "error estándar de

la media" (cuando se refiere a una media). Se calcula como la desviación estándar de todas las

medias que se calcularían a partir de esa población si se extrajera un número infinito de muestras

y se calculase la media para cada muestra.

La desviación estándar de una población y el error estándar de una estadística obtenida a

partir de esa población (como la media) son bastante diferentes pero están relacionados

(relacionados por la inversa de la raíz cuadrada del número de observaciones).

El margen de error de una encuesta se calcula a partir del error estándar de la media (o

alternativamente, del producto de la desviación estándar de la población y la inversa de la raíz

cuadrada del tamaño de la muestra, que es lo mismo) y es por lo general, aproximadamente el

doble de la desviación estándar: la mitad del ancho de un intervalo de confianza del 95 por

ciento.

Cuando solo está disponible una muestra de datos de una población, el término

desviación estándar de la muestra o desviación estándar muestral, puede referirse a la cantidad

mencionada anteriormente aplicada a esos datos o también a una cantidad sobre la que se realiza

un ajuste que sirve de estimación no sesgada de la desviación estándar de la población (es decir,

de la desviación estándar de toda la población).


1.3. Distribución normal y distribución muestral

1.3.1. Distribución normal

La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre

(1667-1754).  Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más

profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más

comúnmente, como la "campana de Gauss".  La distribución de una variable normal está

completamente determinada por dos parámetros, su media y su desviación estándar, denotadas

generalmente por μ y σ . 

Imagen 1. Campana de Gauss

Imagen 1. Campana de Gauss Tomada de: https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png

Formula de la Distribución Normal


−1 X −μ
1 2
(
σ

f ( X )= e
√2 πσ
e=¿ constante matemática con valor aproximado de 2,71828
π=¿ constante matemática con valor aproximado de 3,14159
μ=¿ media de la población
σ =¿ desviación estándar de la población
La distribución normal es de vital importancia en estadística por tres razones

fundamentales:

 Muchas variables continuas en el mundo de los negocios tienen distribuciones que se

asemejan estrechamente a la distribución normal.

 la distribución normal sirve para acercarse a diversas distribuciones de probabilidad

discreta como la distribución binominal y la distribución de Poisson.

 la distribución normal proporciona las bases para la estadística inferencial clásica por su

relación con el teorema de limite central. [ CITATION Mar06 \l 3082 ]

La desviación estándar indica que tan agrupados o dispersos están los datos alrededor de

la media, debido a la baja o alta dispersión de los datos.

Cuando la desviación estándar es pequeña la curva de Gauss está concentrada alrededor

de la media y es señal de una baja dispersión de los datos.

Cuando la desviación estándar es muy grande la campana de Gauss se aplana y se va a los

extremos esto debido a que los datos se encuentran más alejados de la media.

N (μ,σ)
μ= Mediade la poblacion
σ =Desviación estándar
Propiedades o Características

 La forma de la campana de Gauss depende de los parámetros de media μ y de la

deviación estándar σ .

 El área bajo la curva es 1.


 La curva normal es asintótica

 Es simétrica respecto al centro, exactamente igual a ambos lados de la media.

 Tiene una única moda que coincide con su media y su mediana.

 El 50% de los valores se encuentras a cada lado de la media, 50% al lado

izquierdo y 50% lado derecho.

 Tiene una asíntota en el eje y cerca a cero.

 Puede tomar cualquier valor entre −∞ , ∞

 A mayor valor de σ mayor dispersión, ruido o distanciamiento de los datos

alrededor del valor medio. Es decir, a mayor σ  la forma de campana es más

abierta. En cambioσ pequeño indica que los dados se ciñen a la media y la forma

de la campana es más cerrada o puntiaguda.

Cuando o para que se utiliza: la Distribución Normal permite modelar diferentes

fenómenos como lo son los fenómenos naturales, sociales y psicológicos.

Se utiliza muy a menudo porque hay muchas variables asociadas a fenómenos naturales

que siguen el modelo de la norma. Para analizar características morfológicas de individuos

como; personas, animales, plantas, entre otros. Se realizan análisis como por ejemplo de peso,

talla, diámetro, distancia, perímetro, entre otros. Características fisiológicas como, por ejemplo:

efecto de una misma dosis de un fármaco, o la misma cantidad de un fertilizante.

Dentro de los fenómenos sociales, se encuentran estudios relacionados como, por

ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de

examen. En cuanto los fenómenos psicológicos, por ejemplo: cociente intelectual, grado de
adaptación a un medio, fenómenos relacionados con la violencia familiar, abuso sexual a niños,

entre otros.

Valores estadísticos muéstrales como la media, varianza y moda.

1.3.2. Distribución muestral


Es el conjunto de estadísticos (valores que resultan del análisis del muestreo), que pueden

obtenerse de las diferentes muestras de igual tamaño que conforman una población determinada.

Es una distribución de probabilidades de una estadística muestral calculada a partir de todas las

muestras posibles de tamaña “n” elegidas al azar de una población determinada.

Una distribución muestral es una distribución de probabilidad de una estadística muestral

calculada a partir de todas las muestras posibles de tamaña “n” elegidas al azar de una población

determinada. Generalmente nos interesa conocer una o más de las siguientes características de la

distribución muestral.

Propiedades o Características

 Su forma funcional; como aparece en su representación gráfica.


 Su media
 Su desviación estándar; error estándar.
Tipos de distribuciones muéstrales
 Distribución de la media
 Distribución de la varianza
 Distribución de la proporción
 Distribución de la diferencia de medias
 Distribución de la diferencia de proporciones
 Distribución del cociente variancias
Distribución muestral de medias

Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si

consideramos cada una de estas medias como valores de una variable aleatoria podemos

estudiar su distribución que llamaremos distribución muestral de medias.

 Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la

distribución muestral de medias sigue también una distribución normal

σ
N (μ, )
√n

 Si la población no sigue una distribución normal, pero n>30, aplicando el

llamado Teorema central del límite la distribución muestral de medias se aproxima

también a la normal anterior.

Distribución de la varianza

Si se tiene una muestra aleatoria X 1 , X 2 , … , X n de tamaño n de una población normal

con media μ y varianza σ ² si bien no se puede determinar la distribución de probabilidades de la

varianza muestral S ², es posible hacerlo para una función S ². [ CITATION Lóp06 \l 3082 ]

Distribución muestral de proporciones

En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la

variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una
distribución binomial y cuando la extensión de la población es grande la distribución binomial

B(n,p) se aproxima a la normal N (np , √ npq)

 Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una

√ pq
(
distribución normal N p ,
n ) donde p es la proporción de uno de los valores que

presenta la variable estadística en la población y q=1-p.

Distribución de la diferencia de medias


Cuando el tamaño de dos muestras es mayor o igual a 30, la distribución muestral de la

diferencia entre las medias de las muestras sigue la distribución normal con media m 1−m2=0 y

2 2
error estándar √(σ /n )+(σ /n ) CITATION Alf99 \l 3082 (Alfons Sarria Arrufat, 1999)
1 1 2 2

Distribución de la diferencia de proporciones


Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino

que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos

reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar

respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución

muestral de medias, a excepción de que al extraer las muestras de la población se calcula el

estadístico proporción (p=x/n en donde "x" es el número de éxitos u observaciones de interés y

"n" el tamaño de la muestra) en lugar del estadístico media.

Imagen 2. Representación gráfica de la distribución normal de proporciones


Imagen 2. Tomada de: http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01b.html

Distribución del cociente variancias


Dadas dos muestras independientes de sendas poblacionales normales N ( μ1 ; σ 21 ) y

N ( μ2 ; σ 22 ), las variables aleatorias.

( n−1 ) S 21 ( n−1 ) S 22
2
y 2
σ1 σ2
Tiene distribución X 2 con n−1y m−1 grados de libertad respectivamente, siendo ambas

independientes. [ CITATION Her07 \l 3082 ]

Imagen 3. Esquema de muestra aleatoria simple. Estadísticos muéstrales


Imagen 3. Tomada de [CITATION Her07 \p 44 \l 3082 ]
1.4. Distribuciones de frecuencia relativas y distribución de probabilidad normal

1.4.1. Distribuciones de frecuencia relativas

Una distribución de frecuencia relativa describe los porcentajes del número total de

observaciones correspondiente a cada categoría. Una distribución de frecuencia relativa no nos

indica cuál es el número de observaciones en cada categoría, sino cuál es el porcentaje de

observaciones en cada categoría. Esta información es muy valiosa.

La distribución o tabla de frecuencias es una tabla de los datos estadísticos con sus

correspondientes frecuencias, dónde:


1) Frecuencia absoluta: el número de veces que aparece un valor, se representa con f i donde el

subíndice representa cada uno de los valores. La suma de las frecuencias absolutas es igual al

número total de datos, representado por N.

f 1+ f 2 + f 3+ f 4+ f 5 +…+ f n

Equivalente a

∑ fi
i=1

2) Frecuencia relativa: El resultado de dividir la frecuencia absoluta de un determinado valor

entre el número total de datos, se representa por ni. La suma de las frecuencias relativas es

igual a 1. Lo cual puede verse fácilmente si se factoriza N.

fi
ni =
N
3) Frecuencia acumulada: la suma de frecuencias absolutas de todos los valores iguales o

inferiores al valor considerado, se representa por  f i .

4) Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre el

número total de datos, se representa por ni .

Ejemplo 1:

Se realiza una tabla de frecuencia con los datos del problema número 2. “La siguiente tabla muestra

las ventas, en miles de dólares de 20 vendedores de una compañía de computadoras”.

Tabla 1: Tabla de frecuencia

Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia Relativa


Clase X absoluta f relativa fr acumulada F Acumulada Fr
25,10 - 40,04 25,1+ 40,04 12 12 12 12
=0,6
2 20 20
32,57
40,04 - 55,04 47,54 5 0,25 12+5=17 17
20
55,04 - 69,98 62,51 1 0,05 18 18
20
69,98 - 84,92 77,45 0 0 18 18
20
84,92 - 99,86 92,39 2 0,1 20 20
20
312,46 20 1
Tabla 1; Realizada por Zulma Alarcón en base a datos del problema 2.

1.4.2. Distribución de probabilidad normal

Es una distribución de probabilidad continua, también nombrada distribución de Gauss, modelo

probabilístico más importante, sus parámetros son: μ= Mediade la poblacion y

σ =Desviación estándar.

Sus características

 Media, Mediana y Moda coinciden en el máximo de la curva.

 El área encerrada bajo la campa y el eje X es igual a la unidad.

 Los puntos de inflexión son los puntos μ+σ y μ−σ

Imagen 4: Campana da Gauss distribución probabilidad normal

Imagen 4: Campana de Gauss tomada de https://image.slidesharecdn.com/distribucion-normal-181008205048/95/distribucion-


normal-4-638.jpg?cb=1539032130
1.5. Desviación estándar de la distribución muestral de variable aleatoria

La desviación estándar de la distribución muestral de un estadístico se conoce como error

estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por σ x ,

es 1.58. Con esto se puede demostrar que, si de una población se eligen muestras de

tamaño n con reemplazo, entonces el error estándar de la media es igual a la desviación

estándar de la distribución de los errores muestrales.

En general se tiene: σ x =σ e

Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la

formula siguiente para encontrar σ x .

σ N −n
σ x=

√ n N −1
donde σ x  es la desviación estándar de la población de donde se toman las muestras, n es el

tamaño de la muestra y N el de la población.

Como regla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población es al

menos 20 veces el tamaño de la muestra ( N ≥ 20), entonces se puede usar la fórmula.

N −n
El factor 
√ N −1
 se denomina factor de corrección para una población finita.

Ejemplo: Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de

tres maestros universitarios de matemáticas:

Tabla 2. Tabla de datos


Maestro de matemáticas Antigüedad
A 6
B 4
C 2

Tabla 2; Realizada por Elina Vasquez

Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo.

Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error

estándar, o la desviación estándar de la distribución muestral.

Solución: Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras

posibles de tamaño 2, con sus respectivas medias muestrales.

Tabla 3. Media muestral

Muestras Antigüedad Media Muestral


A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3

Tabla 3; Realizada por Elina Vasquez

2+ 4+6
La media poblacional es: μ= =4  
3

5+4 +3
La media de la distribución muestral es:  μ X = =4  
3

La desviación estándar de la población es:

( 6−4 )2 + ( 4−4 )2 + ( 2−4 )2


σ=
√ 3
=1.63

Entonces, de acuerdo a los datos de la tabla el promedio de la antigüedad es 4 y con respecto a la

misma la dispersión (distancia) o desviación estándar entre los datos es de 1.63


El error estándar o la desviación estándar de la distribución muestral es:

(5−4 )2 + ( 4−4 )2 + ( 3−4 )2


σ x=
√ 3
=0.816

Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que:

σ 1,63
σ x= = =1.152
√ n √2
Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección

obtendremos el valor correcto:

σ N −n 1,63 3−2
σ x=
√ =
√ n N −1 √ 2 3−1 √
=0,816

Imagen 5. Diagrama de flujo de las decisiones que deben tomarse cuando se calcula el

valor del error estándar:


Imagen 5: tomada de: http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap01b.html

1.6. Muestra aleatoria de una distribución normal con media

Si tenemos una muestra aleatoria de una población N (m , s) , se sabe (Teorema del

límite central) que la fdp de la media muestral es también normal con media m y varianza s2/n.

Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30) para

poblaciones cualesquiera. Es decir σ / √ n  es el error típico, o error estándar de la media.

¿Cómo usamos esto en nuestro problema de estimación?

1º problema: No hay tablas para cualquier normal, sólo para la normal m=0 y s=1 (la

llamada z); pero haciendo la transformación (llamada tipificación)

X́ −μ
z= una normal de media m y desviación s se transforma en unaz.
σ / √n

Llamando z a al valor de una variable normal tipificada que deja a su derecha un área bajo

la curva de a, es decir, que la probabilidad que la variable sea mayor que ese valor es a (estos son

los valores que ofrece la tabla de la normal)

Imagen 6: Campana de Gauss para la distribución normal de medias


Imagen 6: Tomada de; http://www.hrc.es/bioest/esti_medias.html

Podremos construir intervalos de la forma

X́ −μ
z 1−σ < <z
2 σ / √n σ2

Para los que la probabilidad es 1 - a.

Teniendo en cuenta la simetría de la normal y manipulando algebraicamente

σ σ σ
X́ −Z = < μ< X́ + ¿Z = ¿ La cual también se puede escribir X́ ∓ Z = o, haciendo énfasis en
a/2
√n √n
a /2
√n a/2

σ
que  es el error estándar de la media, X́ ∓ Z EE( X́ )
a
√n 2

Recuérdese que la probabilidad de que m esté en este intervalo es 1 - a. A un intervalo de

este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - a)%,

o nivel de significación de 100a%. El nivel de confianza habitual es el 95%, en cuyo

caso a=0,05 y z a /2=1,96.Al valor  X́ se le denomina estimación puntual y se dice que  X́ es un

estimador de m.

Ejemplo: Si de una población normal con varianza 4 se extrae una muestra aleatoria de

tamaño 20 en la que se calcula  X́ =5,3 se puede decir que m tiene una probabilidad de 0,95 de

estar comprendida en el intervalo

2
5,3 ∓ 1,96 =(4,42 6,18)
√ 20
Que sería el intervalo de confianza al 95% para m
En general esto es poco útil, en los casos en que no se conoce m tampoco suele

conocerse s2; en el caso más realista de s2 desconocida los intervalos de confianza se construyen

con la t de Student (otra fdp continua para la que hay tablas) en lugar de la z.

s
X́ ∓t =
a/2
√n

s
o, haciendo énfasis en que  es el error estándar estimado de la media,
√n
^ ( X́ )
X́ ∓t E E
a
2

Esta manera de construir los intervalos de confianza sólo es válida si la variable es normal.

Cuando n es grande (¿ 30) se puede sustituir t por zsin mucho error.

1.7. Estimación, estimación puntual, estimación real y estimador del parámetro objetivo

1.7.1. Estimación: Una estimación estadística es un proceso mediante el que establecemos

qué valor debe tener un parámetro según deducciones que realizamos a partir de

estadísticos. En otras palabras, estimar es establecer conclusiones sobre características

poblacionales a partir de resultados muestrales.

son estadísticos independientes de los parámetros de la población, y que se utilizan para

aproximarlos. Si θ es el parámetro de interés, el estimador se denotará por ˆθ. En el caso de una

población Normal, podemos considerar la media muestral como estimador de la media

poblacional (es decir, X = µˆ) y la varianza muestral como estimador de la varianza poblacional

( s ²=σˆ ²) Para una distribución Bi(m, p), donde m denota el número de pruebas de Bernoulli, la

proporción p se puede estimar a partir de la proporción poblacional (que denotaremos por pˆ).
Por tanto, X́ , s ² y pˆ son estimadores puntuales de µ ,σ ² (en distribución Normal) y p (en

distribución Binomial), respectivamente.

Un estimador es una regla, a menudo expresada como una fórmula, que indica como calcular

el valor de una estimación con base en las mediciones contenidas en una muestra. Sáez, A.

(2010).

1.7.2. Estimación puntual: Una estimación puntual consiste en establecer un valor concreto

(es decir, un punto) para el parámetro. El valor que escogemos para decir “el

parámetro que nos preocupa vale X” es el que suministra un estadístico concreto.

Como ese estadístico sirve para hacer esa estimación, en lugar de estadístico suele

llamársele estimador. Así, por ejemplo, utilizamos el estadístico “media aritmética de

la muestra” como estimador del parámetro “media aritmética de la población”. Esto

significa: si quieres conocer cuál es el valor de la media en la población, estimaremos

que es exactamente el mismo que en la muestra que hemos manejado:

Algunos estimadores frecuentes son: media muestral, proporción muestral, Varianza muestral,

Cuasi-varianza muestral. (Manzano Arrondo 2012-2014)

Imagen 7: Estimación puntual y por intervalo

Imagen 7: https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcQmAip9MywqitUZRRhFW5qxFKlRLH8MVPQlbA&usqp=CAU
No podemos evaluar la bondad de un procedimiento de estimación puntual en base

en el valor de una sola estimación; más bien, debemos observar los resultados cuando

el procedimiento de estimación se usa en innumerables veces. Como la estimación son

números, evaluamos la bondad del estimador puntual al construir una distribución de

frecuencias de los valores de estimaciones un muestreo repetida y observar como se

agrupa esta distribución alrededor del parámetro objetivo. Sáez, A. (2010). Pag,392.

1.7.3. Estimación real

La información de la muestra se puede utilizar para calcular el valor de una estimación

puntual, una estimación de intervalo o amabas. En cualquier caso, la estimación real se logra

con el uso de un estimador del parámetro objetivo. Sáez, A. (2010).

1.7.4. Estimador del parámetro objetivo

Propiedades de los estimadores Varianza de un estimador Si dos estimadores son centrados,

¿cuál podríamos considerar mejor? Aquel que tenga menor varianza es más probable que dé

lugar a estimaciones que estén más próximas al verdadero valor del parámetro. Llamamos

eficiencia o precisión de un estimador:

Eficiencia [ θ^ ] =1/var [ θ^ ] Menor varianza= Mayor eficiencia.

Cuando damos un valor estimado de un parámetro, sería lógico dar una medida de la precisión

de esa estimación Error estándar del estimador El error estándar de un estimador es la desviación

típica de dicho estimador: Si la desviación típica depende del parámetro, la sustitución del

parámetro por su estimación da lugar al error estándar estimado:

1.8. Estimación de intervalo y sesgo


Estimador por intervalo: Par de valores de estadísticos que se utilizan para estimar el

parámetro poblacional. (como variables aleatorias que son tendrán su correspondiente

distribución en el muestreo)

Estimación por intervalo: Valores numéricos concretos que toma el estimador por

intervalo para una muestra determinada.

1.9. Error de estimación, colas de la densidad de probabilidad y límite probabilístico en

el error de estimación

1.9.1. Error de estimación

Una forma de evaluar la bondad de cualquier procedimiento de estimación puntual es en

términos de las distancias entre la estimación que genera y el parámetro objetivo. Esta cantidad,

que varia aleatoriamente en muestreo repetido, se denomina Error de estimación. Por supuesto

que nos gustaría que el Error de estimación fuera tan pequeño como fuera posible.

Error de estimación ε es la distancia entre un estimador y su parámetro objetivo. Esto es,

^ |.
ε =|θ−θ

Como θ es una variable aleatoria, el valor de estimación también es una cantidad aleatoria y no

podemos decir que tan grande o pequeña será para una estimación particular , pero podemos

plantear enunciados de probabilidad acerca de él. Sáez, A. (2010).

1.9.2. Teoría de colas

Uno, que comprende la teoría de colas (líneas de espera), se refiere al número de personas

(u objetos) que esperan servicio en un punto particular en el tiempo, La teoría de colas es


también importante para determinar el número de cajeras para un supermercado y para diseñar

hospitales y clínicas.

1.9.3. límite probabilístico en el error de estimación

La teoría estadística brinda cálculos probabilísticos del tamaño deseado del error muestral para

una estadística en particular o estimación; estos usualmente son expresados en términos de error

estándar

1.10. Intervalos de confianza, estimador de intervalo y límites de confianza superior e

inferior

1.10.1. Intervalo de confianza

Un intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que

permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación

puntual buscada (con una determinada probabilidad). Un intervalo de confianza nos va a permitir

calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores

van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el

parámetro poblacional.

Intervalo de confianza=media ± margen de error

El intervalo de confianza no sirve para dar una estimación puntual del parámetro poblacional,

si nos va a servir para hacernos una idea aproximada de cuál podría ser el verdadero de este. Nos

permite acotar entre dos valores en dónde se encontrará la media de la población.

1.10.2. Estimador de intervalo


La estimación por intervalos consiste en establecer el intervalo de valores donde es más

probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes

consideraciones:

a. Si conocemos la distribución muestral del estimador podemos obtener las probabilidades

de ocurrencia de los estadísticos muéstrales.

b. Si conociéramos el valor del parámetro poblacional, podríamos establecer la

probabilidad de que el estimador se halle dentro de los intervalos de la distribución

muestral.

c. El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se

establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y

definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se

sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es

denominado "intervalo de confianza".

1.10.3. Límites de confianza superior e inferior

En cuanto a los limites superiores e inferiores de un intervalo de confianza se puede comprender

desde la imagen 9

Imagen 8: Estructura de un intervalo de confianza con sus límites superiores e

inferiores.

Imagen 8: se realizó en base a imagen 9


Imagen 9 Ejemplo de intervalo de confianza superior e inferior

Imagen 9 tomada de; https://slideplayer.es/slide/10235578/

Parte B

Realizar los siguientes ejercicios y comparar cada uno de ellos con ayuda de un

Software, ya sea GeoGebra, R o RStudio, presentar evidencias del apoyo de este y justificar

los resultados presentados.

Desarrollado por

1. La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:


a. Construya las distribuciones de frecuencia relativa, de frecuencia absoluta y
distribución acumulada.

Tabla 4. Tabla de datos ordenados.

DATOS ORDENADOS
25 28 32 33 35 36
38 42 44 44 47 48
48 49 51 52 53 56
57 58 58 59 61 63
66 67 69 72 76 78

Tabla 5. Tabla de frecuencias

Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia Relativa


Clase X absoluta f relativa fr acumulada F Acumulada Fr

25 3 30,5 5 0,166666667 5 0,166666667


6
36 4 41,5 5 0,166666667 10 0,333333333
7
47 5 52,5 9 0,3 19 0,633333333
8
58 6 63,5 7 0,233333333 26 0,866666667
9
69 8 74,5 4 0,133333333 30 1
0
      30 1    

b. Calcular la media, mediana, moda y desviación estándar.

Calcular la media, mediana, moda y desviación estándar.

Media
25+28+32+… .+72+76+78
=51.67
30

Mediana

Se ordenan los datos de menor a mayor y se encuentra el que queda en el medio. En este caso
como el dato es par se ubica los números que están en el medio y se saca el promedio.

Mediana = 51.5

Moda

El valor que más se repite: 44, 48, 58

Desviación Estándar

∑ ¿ x−μ∨¿2 ¿
σ=
√ N
Haciendo el cálculo

σ =14.82

2. La siguiente tabla muestra las ventas, en miles de dólares de 20 vendedores de una

compañía de computadoras.

Desarrollo

1. Primero se ordenan los datos en una tabla, para poder apreciar mejor cada uno de ellos.

Tabla 6. Tabla de datos ordenados.

Datos Ordenados
25,1 25,4 26,9 28,7 29,3
31,7 32,3 35,6 35,6 36,8
37,8 39,7 40,2 42,9 44,2
45,2 50,6 55,2 88,2 99,8

a. Calcular la media

Para calcular la media es de recordar que esta se halla al sumar todos los datos y dividir el

resultado entre el número total de datos.

X́ =
∑ xi
N

851,2
X́ = =42,56
20

X́ =42,56

Por lo tanto y de acuerdo a lo anterior se puede identificar que la media para los datos en

miles de dólares sobre las ventas realizadas por 20 vendedores en una compañía de

computadores es de: $42,56. Mil dólares.

b. Calcular la mediana

Para el caso de la mediana se tiene presente que es el valor que ocupa el lugar central de

todos los datos una vez estos están ordenados; cuando el número de datos es impar solo es tomar

exactamente el que ocupa el lugar central, pero como en este caso que el número de datos es par,

se toman los dos datos centrales (estando ordenados) y se halla el promedio, es decir;
~ 36,8+37,8
X= =37,3
2
~
X =37,3

c. Calcular la desviación estándar

La desviación estándar es igual a la raíz cuadrada de la diferencia entre el promedio de

los cuadrados de los valores y el cuadrado del promedio. Por tales motivos es que antes se

tiene que hallar la varianza recordando que esta es; promedio de los cuadrados de las

desviaciones medias alrededor de la media. Esta se halla teniendo presente los tipos de datos

que estemos analizando si estos son de una población a de una muestra.

Formula

σ=
√ ∑ ( x−μ )
n

σ =desviaci ó n est á ndar poblacional

n=Tamaño de la poblaciòn

x=Cada valor de la poblaciòn

μ= Media poblacional

 Primer paso:

Se halla el promedio sumando todos los datos y dividiéndolos en el número de datos.

25,1+25,4+ 26,9+28,7+…+ 88,2+ 99,8


μ=
20

852,2
μ= =42,56
20

μ=42,59 miles de dolares


 Segundo paso:

Se halla la varianza, esta se halla tomando cada uno de los datos, menos el promedio

elevado al cuadrado. Como lo indica la formula.


2

σ 2
=
∑ ( X−μ )
n

( 25,1−42,59 )2 +(25,4−42,59)² +(26,9−42,59) ²+( 28,7−42,59)²+ …+(88,2−42,59) ²+( 99,8−42,59)²


σ 2=
20

7195,768
σ 2= =359,7884
20

σ 2=359,7884 miles de dòlares ²

 Tercer paso:

Se halla la desviación estándar

σ =√ 359,7884=18,9680

Si se tomaran los datos como una muestra


2
2
s=
∑ ( X −μ )
n−1

2 ( 25,1−42,59 )2+(25,4−42,59)²+(26,9−42,59)²+(28,7−42,59) ²+…+(88,2−42,59)² +(99,8−42,59) ²


s=
19

7195,768
s2= =378,7246
19

s2=378,7246 miles de dòlares ²

s= √378,7246=19,4608

d. ¿Qué medias de tendencia central y de dispersión se elegirían y por qué?

En cuanto a medidas de tendencia central elegiría; la media, la mediana; estas sirven como

punto de referencia para la interpretación de datos, además que se necesitan para sacar otros; en
el caso de la media es la suma de cada uno y todos los valores dividida entre el total de los datos,

sin embargo, no se debe fiar de esta únicamente para un análisis mas exacto puesto que esta

puede ser afectada por los valores de los datos extremos. La mediana; es la que ocupa el valor

central en un conjunto de datos para lo que los datos deben estar ordenados, de esta manera la

mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, es

muy recomendado y apropiado el uso de la media cunado se tienen que hacer observaciones

extremas.

En cuanto a medidas de dispersión elegiría; la varianza, deviación estándar, el rango, la

varianza y la deviación estándar se realizan de pendiendo de si los datos que se tienen son de una

población o de una muestra lo que indica que los datos obtenidos son más precisos. El rango es

la diferencia entre el mayor y el menor de los datos de una distribución estadística.

En términos generales las medidas de dispersión muestran la variabilidad de una distribución,

indicando por medio de números, se las diferentes puntuaciones de una variable están muy

alejadas de la media. Cuando mayor sea ese valor, mayor será la variabilidad, cuando menor sea,

mas homogénea será la media. Así se puede identificar si todos los datos son parecidos o si por

el contrario se evidencian grandes variaciones entre ellos.


3. La duración de las bombillas producidas por cierto fabricante tiene una media de 20000

horas y una desviación típica de 40 horas. La población sigue una distribución normal. Si

se ha comprado 9 bombillas como muestra aleatoria:

a. Hallar la varianza de la media muestral

∑ ( x−x )2
s2=
n−1

∑ ( x −x )2
σ=
n−1

σ =40 horas

σ 2=402

σ 2=1.600 horas

b. Hallar el error estándar de la media muestral

σ 40
σ x= = =13,333
√ n √9

4. En la secretaría de cierta universidad se ha comprobado que la nota media de los

candidatos para la admisión a la maestría a Matemáticas sigue una distribución normal

con desviación típica de 0,45. Se toma una muestra aleatoria de 25 solicitudes y se

obtiene una media muestral de calificaciones igual a 2,1

a. Calcule un intervalo de confianza del 95% para la media poblacional

0,95
95 %= =0,475 valor z=1,96
2
Datos:

n=25

x́=2,1

σ =0,45

1−∝=95 %

z=1,96

σ
formula: x́ ± z
√n
0,45
2,1 ±1,96
√ 25
0,45
μ=2,1± 1,96
5

μ=2,1± 1,96(0,09)

μ=2,1± 0,1764

μ=2,1+ 0,1764=2,2764

μ=2,1−0,1764=1,9236

μ=(1.9236 ; 2.2764)

b. Calcule un intervalo de confianza del 99% para la media poblacional

0,99
99 %= =0,4950 valor z=2,58
2

Datos:

n=25
x́=2,1

σ =0,45

1−∝=99 %

z=2,58

σ
formula: x́ ± z
√n
0,45
2,1 ±2,58
√ 25
0,45
μ=2,1± 2,58
5

μ=2,1± 2,58(0,09)

μ=2,1± 0,2318

μ=2,1+ 0,2318=2,3318

μ=2,1−0,2318=1,8682

μ=(1.8682 ; 2.3318)

5. Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra.

Diseña un experimento en el que se observa las tensiones de ruptura, en libras, de 16

hilos del proceso seleccionados aleatoriamente. Las tensiones son 20.8, 20.6, 21.0, 20.9,

19.9, 20.2, 19.8, 19.6, 20.9, 21.1, 20.4, 20.6, 19.7, 19.6, 20.3, 20.7. Supóngase que la

tensión de ruptura de una fibra se encuentra modelada por una distribución normal con

desviación estándar de 0.45 libras. Construir un intervalo de confianza estimado del 98%

para el valor real de la tensión de ruptura promedio de la fibra.


0,98
98 %= =0,49 valor z=2,3263
2

Datos:

n=16

x́=20.38

σ =0,45

1−∝=98 %

z=2,3263

σ
formula: x́ ± z
√n
0,45
20,38 ±2,33
√ 16
0,45
μ=20,38± 2,3263
4

μ=20,38± 2,3263(0,1125 )

μ=20,38± 0,2617

μ=20,38+0,2617=20,6417

μ=20,38−0,2617=20.1183

μ=(20.1183 ; 20.6417)
Conclusiones

El anterior trabajo fue muy importante para reforzar los conocimientos previos sobre

estadística abordados en otros cursos. Su contenido puede ser transportado al contexto real, ya

que nos enseña a la resolución de problemas estadísticos, el cual se calcula distribuciones

muéstrales y de estimación, y acertar en una probabilidad porcentual confiable de una población

utilizando intervalos, aspectos que pueden vincularse a nuestra vida cotidiana. Como futuros

licenciados en matemáticas el conocimiento y técnicas abordadas previamente nos permite o

aplicarlos en el proceso la enseñanza-aprendizaje dentro y fuera del aula a partir de una muestra

disponible para llegar inferir sobre una población.

Las medidas de tendencia central, nos permiten interpretar los valores más

representativos de los datos de acuerdo a la forma como se tienden a concentrar; la media indica

el promedio de los datos, en otras palabras, indica el valor que obtendrá cada una de las unidades

de análisis si se distribuyen los valores en partes iguales, la media indica es el valor que separa

los datos en partes iguales, cada una de las cuales cuenta con el cincuenta de por ciento de los

datos.

Se puede concluir que este trabajo es muy importante porque aporta a nuestra vida cotidiana,

ya que nos enseña a la resolución de problemas estadísticos, el cual se calcula distribuciones

muéstrales y de estimación, y acertar en una probabilidad porcentual confiable de una población

utilizando intervalos. El cual nos permite como futuros licenciados matemáticos llevarlos a cabo

dentro la enseñanza-aprendizaje de nuestros estudiantes.


Bibliografía
Alfons Sarria Arrufat, J. G. (1999). Introducción a la estadística en Psicología. Barcelona

España: Universidad de Barcelona.

Canavos, G., Meyer, P., Spiegel, M., & Mendenhall, S. (1988). Probabilidad y estadística.

Aplicaciones y métodos. Recuperado de https://gsosa61.files.wordpress.com/2008/03/10-

canavos-g-probabilidad-y-estadistica-aplicaciones-y-metodos.pdf

Herrerias Pleguezuelo , R., & Palacios Gonzalez, F. (2007). Cursom de Inferencia Estadistica y

Del Modelo Lineal Simple . Madrid España: DELTA.

López Casuso, R. (2006). Calculo de Probabilidades e Inferencia Estadistica con topicos de

Econometria. Caracas - Venezuela: UCAB.

Mark L. Berenson, D. M. (2006). ESTADISTICA PARA ADMINISTRACION. Mexico: Pearson

Educación.

Sáez, A. (2010). Métodos Estadísticos con R y R Commander, Universidad de Jaen,. Recuperado

de https://cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf

Vicente Manzano Arrondo – 2012-2014. Estimación estadística, recuperado de;

http://asignatura.us.es/dadpsico/apuntes/EstimacionEstadistica.pdf

Wackerly, D., Mendenhall, W., & Scheaffer, R. (2009). Wackerly, D.D. and Mendenhall, W. and

Scheaffer, R.L. Estadística Matemática Con Aplicaciones, Séptima Edición, Cengage Learning.

Recuperado de https://docs.google.com/viewer?

a=v&pid=sites&srcid=Y2llbmNpYXMudW5hbS5teHxtLWVzdGFkaXN0aWNhMXk
WedGrafia

https://moodle2.unid.edu.mx/dts_cursos_mdl/pos/ME/TD/AM/07/La_distribucion_normal.pdf
https://www.youtube.com/watch?v=CuKr7GzohbI

https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

https://www.youtube.com/watch?v=VTTqr5cAzvw

https://es.khanacademy.org/math/statistics-probability/sampling-distributions-library

https://commons.wikimedia.org/wiki/File:Normal_distribution_pdf.png

https://es.slideshare.net/djpachoncito/distribucion-normal-por-wallter-lopez

https://economipedia.com/definiciones/intervalo-de-confianza.html

https://www.uv.es/webgid/Inferencial/5_estimacin_por_intervalos.html#:~:text=b)%20Si%20conoci

%C3%A9ramos%20el%20valor,se%20establece%20alrededor%20del%20estimador.

Potrebbero piacerti anche