Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
binomial
Herramientas
Matemáticas III
Estadística I
1
Variable aleatoria discreta
Por variable numérica, se entiende una variable que produce respuestas
numéricas ante una medición o un conteo. Así, podemos citar como
ejemplos: identificar cuántos varones existen en un determinado curso de la
universidad (conteo) o bien la frecuencia de arribo de los colectivos
interurbanos a determinado lugar (medición).
Podemos clasificar a las variables numéricas en discretas y continuas.
Cuando se desea recabar datos de un evento y este proceso implica una
medición, estamos tratando con una variable numérica continua.
En cambio, si al recabar los datos, el proceso surgen de un conteo entonces
la variable es una variable numérica discreta.
μ = n.p,
Donde
n = es el número de ensayos;
p = probabilidad de aciertos;
E(x) = n.p.
2
Distribuciones de variable aleatoria discreta
Para realizar un estudio de distribución de variable aleatoria, debemos
considerar todos los casos posibles en los que se puede presentar el evento;
son mutuamente excluyentes y exhaustivos.
Tendremos que tener en cuenta también que, en muchos casos, el evento
aleatorio puede tomar valores no numéricos.
En este caso, la distribucion de probabilidad es una lista mutuamente
excluyente de todos los resultados numéricos posibles; de tal manera que
cada probabilidad de ocurrencia se asocia con un resultado.
Hemos visto, en el punto anterior, la expresión de la media, μ:
𝑁
2 2
𝜎 = ∑[𝑋𝑖 − 𝐸(𝑥𝑖) ] . 𝑃(𝑥𝑖) .
𝑖=1
Por lo tanto:
𝑁
2
𝜎= √𝜎 2 = √∑[𝑋𝑖 − 𝐸(𝑥𝑖) ] . 𝑃(𝑥𝑖) =
𝑖=1
3
Distribución binomial
Parámetros
1) Cada resultado del ensayo puede lograr solo dos resultados, si a uno lo
denominamos acierto o éxito, el otro se denominará desacierto o fracaso.
2) Si a la probabilidad del éxito la llamamos P(acierto) = p, la probabilidad
del fracaso P(desacierto) = q; por lo tanto, q = 1- p.
3) Los eventos son independientes entre sí. Esto indica que el resultado
obtenido por cada ensayo es independiente del resultado de ensayos
anteriores.
4) La probabilidad del acierto se considera constante; esto significa que la
población es muy grande o infinita, o que los ensayos se realizan sin
reposición.
Expresión general
(𝑞 + 𝑝)𝑛 = 𝑎0 . 𝑞 𝑛 . 𝑝0 + 𝑎1 . 𝑞 𝑛−1 𝑝1 + ⋯ + 𝑎𝑛 . 𝑞 0 . 𝑝𝑛 .
𝑃(𝑥) = 𝑛. 𝐶𝑥 . 𝑞 𝑛−𝑥 . 𝑝 𝑥 .
4
Media
E(x) = n.p.
Varianza
Var(x) = n.p.q.
Desvío estándar
𝜎 = √𝑉𝑎𝑟𝑥 = √𝑛. 𝑝. 𝑞.
∑ 𝑃(𝑥𝑖) = 1.
5
Bibliografía de referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía
(7.a ed.). México: Pearson Educación.
6
Distribución
de Poisson
Herramientas
Matemáticas III
Estadística I
1
Distribución de Poisson
Este tipo de distribución es apropiada para determinadas situaciones
donde se analizan eventos aleatorios con restricciones predeterminadas,
como la cantidad de hechos o eventos producidos en un intervalo de
tiempo o de espacio.
Entre ellos, se puede analizar la distribución de llamadas telefónicas de un
central de remises, los trámites de contribuyentes en una oficina pública, las
personas que llegan a una farmacia mutual y el número de colectivos que
llegan a destino en una terminal de una gran ciudad.
Parámetro
Expresión general
𝜆𝑥 . 𝑒 −𝜆
𝑃(𝑥) = .
𝑥!
2
Donde:
x = número de éxitos/ocurrencias;
λ = promedio de ocurrencias;
e = logaritmo neperiano (e = 2,717281...).
En esta distribución, debe cumplirse que:
∑ 𝑃(𝑥𝑖) = 1,
Media
En la distribución de Poisson, la media es igual que el valor esperado. E(x) es
igual que la esperanza matemática, que, en esta distribución, coincidiría con
λ, es decir, lambda, lo que nos quedaría expresado de esta manera:
𝜇 = 𝜆 = 𝐸(𝑥).
Varianza
La varianza, siguiendo el mismo razonamiento, también es igual a λ:
𝜎 2 = 𝑉𝑎𝑟(𝑥)= λ.
Desvío estándar
La desviación estándar:
𝜎 = √𝜎 2 = √𝜆.
3
cuando n es grande y p es pequeña, es decir, si el número de ensayos es
grande y la probabilidad binomial de tener éxito es pequeña.
Una estimación, utilizada con más frecuencia por los expertos en el tema, es
que la distribución de Poisson provee una buena aproximación a la
distribución binomial cuando n es igual o mayor que 20, y p es igual o menor
que 0,05.
4
Bibliografía de referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía
(7.a ed.). México: Pearson Educación.
5
Distribución
hipergeométrica
Herramientas
Matemáticas III
Estadística I
1
Distribución hipergeométrica
Es la distribución correcta para calcular el riesgo del consumidor; a menudo, se
aproxima a la distribución binomial.
Si contamos una población finita de tamaño N y, de estos N elementos de la
población, solamente k de ellos cumplen con una característica particular,
deducimos que N - k es la cantidad de elementos de la población que no cumplen
con esa condición.
Si de la población se extrae una muestra de n elementos de manera tal que se
cumpla que:
(𝑁−𝑘)
𝐶(𝑛−𝑥) . 𝐶𝑥𝑘
𝑃(𝑥) = .
𝐶𝑛𝑁
Parámetros
Nos preguntamos: ¿por qué, si el evento presenta características similares a las
de una distribución binomial, no se resuelve mediante ese modelo, o bien
buscamos esta alternativa? La respuesta es que existen motivos que hacen que
se prefiera utilizar este tipo de distribución por sobre la binomial.
2
Expresión general
Esta expresión se basa en la teoría combinatoria, donde:
N = tamaño de la población;
n = tamaño de la muestra;
(𝑁−𝑘)
𝐶(𝑛−𝑥) . 𝐶𝑥𝑘
𝑃(𝑥) = .
𝐶𝑛𝑁
𝑘 𝐸(𝑥)
𝜇= = .
𝑁. 100 𝑛. 100
𝑛
𝐸(𝑥) = .
𝑁. 𝑘
3
Bibliografía de Referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía (7.a
ed.). México: Pearson Educación.
4
Distribución
de variable
continua
Herramientas
Matemáticas III
Estadística I
1
Distribución de variable
continua
Como habíamos visto, las variables podían ser continuas o discretas; de esta
manera, podemos entonces clasificar los modelos de acuerdo con el tipo de
variable.
Variable discreta:
o binomial;
o de Poisson;
o hipergeométrica.
Variable continua:
o normal;
o T (de Student);
o chi cuadrado.
Distribución normal
2
Distribución normal estándar
3
7) La probabilidad de que la variable aleatoria tome un valor en un intervalo
(a; b) está dada por la superficie encerrada por la función y el eje
horizontal en ese intervalo:
P(a ≤ x ≤ b) = ∫F(x).dx.
4
Figura 3: Distribución Normal-Características
z.σ = x – μ,
𝜇(𝑧) = 0,
y su desviación estándar:
𝜎(𝑧) = 1.
5
Se construyeron tablas para distribución normal estándar (DNE), donde,
para cada valor de Z, se obtuvo un porcentaje del área total, y estas tablas
se encuentran en los apéndices de la bibliografía. En esta tabla, verificamos
que el área encerrada por la DNE, para z = 1, es igual a 0,3413; para z = 2, a
0,4772; y para z = 3, a 0,4987, de acuerdo con lo expresado por la ley
empírica. Como ejercicio, prueba corroborar la ley empírica con estos
resultados.
𝜇(𝑥) = 𝑛. 𝑝.
𝜎(𝑥) = √𝑛. 𝑝. 𝑞.
6
Resolución de una Distribución de Poisson por aproximación
con la normal
Si bien sirve para el cálculo en forma manual, es muy engorroso utilizarla por
lo que podemos utilizar las tablas para calcular las probabilidades de
Poisson.
Para poder asimilar este tipo de distribución a una distribución normal,
siempre con las precauciones del caso, deberíamos realizar los reemplazos
que vemos a continuación.
7
Bibliografía de referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía
(7.a ed.). México: Pearson Educación.
8
Tipos de
muestras
Herramientas
Matemáticas III -
Estadística I
1
Muestreo. Clasificación
Muestras
2
Muestra
Sistemática
Muestra
Globalizada o por
Conglomerados
Muestra Por
Juicio
Muestra
Muestras No Muestra Por
Bola de
probabilisticas Cuotas
nieve
Muestra Por
Conveniencia
Cuando todas las muestras que se pueden extraer de una población tienen
la misma posibilidad de ser elegidas se llama muestreo aleatorio simple.
Teniendo cada muestra el mismo tamaño, cualesquiera de ellas tiene la
misma probabilidad de ser seleccionada.
3
En cambio, si el muestreo es sin sustitución, indica que si un componente
es extraído, no será posible su eleccion nuevamente.
Muestreo globalizado
Muestreo estratificado
4
Muestreo sistemático
Distribución de muestreo
En los anteriores apartados, se han analizado las diferentes formas de
determinar las muestras de una población con el objetivo de obtener los
estadísticos para poder inferir sobre los parámetros de la población.
5
El trabajo de uno es inferir el desvío estándar de la población, según el
desvío estándar de una muestra S y correlativamente la media poblacional
μ, según el valor de la media muestral 𝑥̅ . Con el mismo razonamiento, se
podría determinar la proporción p en la población que se contará de la
proporción p de la muestra.
6
Referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía (7.a
ed.). México: Pearson Educación.
7
Teorema central
del límite
Herramientas
Matemáticas III -
Estadística I
1
Teorema central del límite
Habiendo realizado muchas distribuciones con diferentes formas, distintas
de la distribución normal, y se demostró que se deberían considerar con el
Teorema del Límite Central, que nos permite inferir sobre la media
poblacional, a partir de la distribución de la media muestral, de manera
independiente de la forma de su distribución.
2
Figura 1: Distribución muestral de Ia media de distintas poblaciones para
muestras de n = 2, 5 y 30.
3
Concepto de error muestral estándar
Al igual que la distribución de las proporciones muestrales, tienen un
comportamiento similar a la distribución de las medias muestrales. Para la
estimación de la proporción poblacional, se seguirá un procedimiento
similar al utilizado para la estimación de la media.
Fuente: RICHARD I. LEVIN y DAVID RUBIN. “Estadística para Administración y Economía”. 7ª Edición
Revisada- Ed. Pearson 2012- México.
p = 0,5
Fuente: RICHARD I. LEVIN y DAVID RUBIN. “Estadística para Administración y Economía”. 7ª Edición
Revisada- Ed. Pearson 2012- México.
4
Fuente: RICHARD I. LEVIN y DAVID RUBIN. “Estadística para Administración y Economía”. 7ª Edición
Revisada- Ed. Pearson 2012- México.
Se tendría:
Fuente: RICHARD I. LEVIN y DAVID RUBIN. “Estadística para Administración y Economía”. 7ª Edición
Revisada- Ed. Pearson 2012- México.
5
Referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía (7.a
ed.). México: Pearson Educación.
6
Estimación y
error muestral
Herramientas
Matemáticas III -
Estadística I
1
Estimación. Concepto
Tipos de estimación:
Error muestral
E = x –m
El cual, expresado como una proporción del desvío estándar de esa
distribución que se denomina como error muestral estándar, es:
̅−𝛍
𝐄 = 𝐳. 𝛔(𝐗̅) = 𝐗
𝝈
𝝈(𝑿̅) =
√𝒏
La expresión del error de estimación será:
σ
E = z.
√n
El error de estimación es un valor que se puede estimar a priori como el
máximo error permitido entre el valor de la media de una muestra y el
2
valor de la media poblacional, siendo este error función de z del desvío
estándar poblacional y de n, tamaño de la muestra:
Estimación puntual
Es un número determinado a través de una fórmula que se utiliza para
estimar un parámetro de población desconocido. El ejemplo más simple lo
constituye la media, ya que está dada por la expresión matemática:
∑(𝒙(𝒊). 𝒇(𝒊) )
̅=
𝑿
𝒏
Una estimación puntual es mucho más útil si viene acompañada por una
estimación del error que podría estar implicado.
3
Estimaciones por intervalos de la media
Se sabe que con las medias de todas las muestras se genera la distribución
muestral de medias, la que es normal, y su media x m es igual a la media
poblacional.
Fuente: Lectura N°4- Pag. N°24-HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) Profesor: MARIO
MARÍN
E = x –m
4
El cual,si es expresado como una proporción del desvío estándar de esa
distribución, se denomina como error muestral estándar.
𝑬 = 𝒁. 𝝈(𝑿)
̅̅̅̅
𝝈
𝝈(𝑿̅) =
√𝒏
𝝈
𝑬 = 𝒁.
√𝒏
𝒁. 𝝈 𝟐
𝒏=( )
𝑬
5
Teniendo en cuenta entonces que:
𝐩. 𝐪
𝛔(𝐩̅) = √
𝐧
Y:
𝐄 = 𝐙. 𝛔(𝐩̅)
𝐙 𝟐
𝐧 = ( ) . 𝐩. 𝐪
𝐄
6
2) Si se determina que p toma el valor de 0,5, entonces q= (1-p) = 0,5. En este
caso, el producto de p. q toma su máximo valor.
7
Referencias
Levin, R. y Rubin, D. (1996). Estadística para administradores. México DF: Pearson
Educación.
8
Tamaño de
la muestra
Herramientas
Matemáticas III -
Estadística I
1
Determinación del tamaño de
una muestra para estimar la
media poblacional
𝐸 = 𝑧. 𝜎𝑥̅
Y considerando que:
𝜎
𝜎𝑥̅ =
√𝑛
Sustituyendo en la anterior expresión, se obtendrá el error cometido en
función del tamaño n de la muestra:
𝜎
𝐸 = 𝑧.
√𝑛
De la expresión que, si se despeja el tamaño de la muestra:
𝑧. 𝜎 2
𝑛=( )
𝐸
2
Donde:
E: es el error máximo permitido que se pretende obtener.
σ:es el desvío estándar poblacional.
Z: es el grado de seguridad para ejecutar la inferencia.
n: es el tamaño de la muestra que se quiere hallar para cumplir con la
consigna.
Ejemplo:
1,96 . 25 2
𝑛=( )
5
𝑛 = 96 𝑝𝑎𝑠𝑡𝑖𝑙𝑙𝑎𝑠
𝑥𝑛 − 𝑥𝑖
𝜎=
𝐾
c) O bien, según la experiencia obtenida en casos similares, es decir, en
forma subjetiva.
3
Luego de definir el tamaño de la muestra apropiado, se debería calcular el
desvío estándar de la media de esa muestra y con ese valor por el valor de Z
se obtiene su producto. Si este producto es menor que la tolerancia (error
E), entonces el tamaño de la muestra es el correcto. En caso contrario, se
deberá aumentar el tamaño de la muestra para disminuir el error E.
𝜎 = √𝑝. 𝑞
Sustituyendo en la ecuación:
𝜎
𝜎𝑥̅ =
√𝑛
Se obtiene la siguiente expresión para el desvío estándar de la proporción
en función del tamaño de la muestra:
𝑝. 𝑞
𝜎𝑝̅ = √
𝑛
Y, por consiguiente, el error:
𝐸 = 𝑧. 𝜎𝑝̅
𝑧 2
𝑛 = ( ) . 𝑝. 𝑞
𝐸
4
En este caso, como siempre, el valor de p es la proporción entre los
elementos que poseen una característica determinada de la población y la
población total, y q es la proporción entre los elementos que no poseen esa
característica y la población total.
5
Referencias
Berenson, M., y Levine, D. (1996). Estadística Básica en Administración (6.a ed.).
México: Prentice Hall.