Sei sulla pagina 1di 67

Estadstica

Estadstica Descriptiva:

Definicin. Frecuencias Absolutas y Relativas

Medidas Descriptivas de: Posicin, Centralizacin, Dispersin y


Forma

Grficos

Calculadora Estadstica

Estadstica Inferencial:

Variable Aleatoria. Funcin de Distribucin. Funcin de Densidad

La Distribucin Normal. Clculo de Probabilidades. Uso de las


Tablas. Calculadora

La Distribucin Normal. Ejemplos

La Estadstica es la ciencia que trata de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y
analizar datos, as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso
formular predicciones. Podemos por tanto clasificar la Estadstica en:

Descriptiva o deductiva, que tiene por objeto la recogida, recopilacin, y reduccin de datos, su organizacin en tablas y
grficos y el clculo de unos valores que representen al conjunto de datos.

Inferencial o inductiva tiene por objeto establecer previsiones o conclusiones sobre una poblacin basndose en los
resultados obtenidos de una muestra

Definiciones de trminos estadsticos

Poblacin: es el conjunto de elementos, individuos o entes sujetos a estudio y de los cuales queremos obtener un
resultado.

Variable: es la caracterstica que estamos midiendo.

Existen dos tipos de variables:

Variable cualitativa: Es aquella que expresa un atributo o caracterstica, ejemplo: Rubio, moreno, etc.

Variable cuantitativa: Es aquella que podemos expresar numricamente: edad, peso, etc. Esta a su vez la podemos
subdividir en:

Variable discreta, aquella que entre dos valores prximos puede tomar a lo sumo un nmero finito de
valores. Ejemplos: el nmero de TSE de una familia, el de obreros de una fabrica, el de alumnos de la
universidad, etc.

Variable continua la que puede tomar los infinitos valores de un intervalo. En muchas ocasiones la
diferencia es ms terica que prctica, ya que los aparatos de medida dificultan que puedan existir todos los
valores del intervalo. Ejemplos, peso, estatura, distancias, etc.

La variable se denota por las maysculas de letras finales del alfabeto castellano. A su vez cada una de
estas variables puede tomar distintos valores , colocando un subndice, que indica orden.

X = (X1, X2 , ...... Xn)

Muestra: Conjunto de elementos que forman parte de poblacin . La muestra representa a esta poblacin.

Tamao muestral: Es le nmero de elementos u observaciones que tomamos. Se denota por n N.

Dato: Cada uno de los individuos, cosas, entes abstractos que integran una poblacin o universo determinado. Dicho de
otra forma, cada valor observado de la variable.

Frecuencias absolutas, relativas y acumuladas.

Frecuencia absoluta: Llamaremos as al nmero de repeticiones que presenta una observacin. Se representa por n i.

Frecuencia relativa: Es la frecuencia absoluta dividida por el nmero total de datos, se suele expresar en tanto por uno:

La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad.

Frecuencia absoluta acumulada: es la suma de los distintos valores de la frecuencia absoluta tomando como referencia
un individuo dado. La ltima frecuencia absoluta acumulada es igual al n de casos:

N1 = n1

N2 = n1+ n2
Nn = n1 + n2 + . . . . . . + nn-1 + nn= n

Frecuencia relativa acumulada: es el resultado de dividir cada frecuencia absoluta acumulada por el nmero total de
datos, se la suele representar con la notacin: Fi

Tabla de frecuencias para una variable discreta.

xi ni Ni fi Fi

x1 n1 N1 f1 F1

x2 n2 N2 f2 F2

x3 n3 N f3 1

ni=N 1

EJEMPLO 1

Queremos hacer un estudio estadstico del nmero de Tcnicos Superiores en Electricidad (TSE) que existen en las
empresas elctricas de una determinada ciudad. Para ello se ha encuestado a 50 empresas y se han obtenido los siguientes datos:

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4

3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

Se pide:

a) Cul es la poblacin objeto de estudio?

b) Qu variable estamos estudiando?


c) Qu tipo de variable es?

d) Construir la tabla de frecuencias?

e) Cul es el nmero de empresas que tiene como mximo 2 TSE?

f) Cuntas empresas tienen ms de 1 TSE, pero como mximo 3?

g) Qu porcentaje de empresas tiene ms de 3 TSE ?

SOLUCIN:

a) La poblacin objeto de estudio es las empresas de electricidad de una ciudad.

b) La variable que estamos estudiando es el nmero de TSE por empresa.

c) El tipo de variable es discreta ya que el nmero de TSE solo puede tomar determinados valores enteros.

d) Para construir la tabla de frecuencias tenemos que ver cuantas empresas tienen un determinado nmero de TSE.
Podemos ver que el nmero de TSE, toma los valores existentes entre 0 TSE, los que menos y 6 TSE, los que ms y tendremos:

xi ni Ni fi Fi

0 2 2 0.04 0.04

1 4 6 0.08 0.12

2 21 27 0.42 0.54

3 15 42 0.30 0.84

4 6 48 0.12 0.96

5 1 49 0.02 0.98

6 1 50 0.024 1

N = 50 1
e) El nmero de empresas que tienen dos o menos TSE es: 2+4+21 = 27

f) El nmero de empresas que tienen ms de un TSE pero tres como mximo es: 21 + 15 = 36

Por ltimo el porcentaje de empresas que tiene ms de tres TSE, son aquellos que tienen 4; 5 y 6 es decir 6+1+1= 8

El porcentaje ser el tanto por uno multiplicado por cien es decir, la frecuencia relativa de dichos valores multiplicado por 100:
( 0.12+0.02+0.02)* 100 = 0,16 + 100 = 16 %

Marca de Clase

Cuando nos encontramos con una distribucin con un gran nmero de variables, se se suelen agrupar en intervalos para
facilitar la comprensin de los datos Se indica por L i-1 al extremo inferior del intervalo y por L i al extremo superior. Cerramos el
intervalo por la izquierda y abrimos por la derecha, pero se puede hacer al contrario; [Li-1 , Li) Para operar utilizaremos la marca
de clase, el punto medio de un intervalo

Amplitud del intervalo: la longitud del intervalo, se representa por: a = Li - Li-1

N de intervalos: A partir de la raz cuadrada del nmero de datos, decidimos, redondeando el nmero de
intervalos.

Recorrido: Valor mayor, menos valor menor de los datos. Re= xn-x1

Amplitud: Divisin entre el Recorrido y el nmero de intervalos que hayamos decidido.

EJEMPL0 2

Se desea hacer un estudio estadstico del precio de un pequeo interruptor elctrico de la marca Interelec, en las tiendas de
material elctrico de una ciudad. Para ello se conocen los precios en 40 tiendas de esa ciudad. Los datos obtenidos en euros son:

3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5

5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8
3,3 4,3 4,1 5,8 4,4 4,8 6,1 4,3 5,3 4,5

4,0 5,4 3,9 4,7 3,3 4,5 4,7 4,2 4,5 4,8

Se pide:

a) Cul es la poblacin objeto de estudio?

b) Qu variable estamos estudiando?

c) Qu tipo de variable es?

d) Qu problema plantea la construccin de la tabla de frecuencias?

e) Cuntas tiendas tienen un precio entre 3,25 y 3,75 euros?

f) Cunto tiendas tienen un precio superior a 4,75 euros?

g) Qu porcentaje de tiendas tienen precios menores de 4,25 euros?

SOLUCION:

a) La poblacin objeto de estudio son las tiendas dematerial elctrrico de una ciudad

b) La variable que estamos estudiando es el precio de un interruptor de la marca Interelec.

c) El tipo de variable es continua.

d) El problema que plantea es que existen muchos valores diferentes para por tanto es conveniente agrupar la serie en
intervalos.

La manera de hacerlo sera la siguiente: primero, calculamos el recorrido Re = x n x1= 6.1 3.3 = 2.8

Cuando no se nos dice nada el n de intervalos, se obtiene calculando la raz cuadrada del n de datos observado. Veremos
que la raz cuadrada de 40 es igual a 6.32 por lo tanto tomaremos 6 intervalos.

Como el recorrido es 2.8 si lo dividimos por el n de intervalos tendremos la amplitud de cada uno de ellos y as: 2,8/6 = 0,46.

Importante: La amplitud es de 0,46 por lo que adems de no ser muy fcil operar, puede que no cubra el rango de la variable.
Lo podemos evitar, tomaremos un valor superior, en este caso 0,5:

[Li-1,, Li) ni Ni fi Fi

[3,25, 3,75) 3 3 0.075 0.075

[3,75, 4,25) 8 11 0.2 0.275


[4,25, 4,75) 14 25 0.35 0.625

[4,75, 5,25) 6 31 0.15 0.775

[5,25, 5,75) 4 35 0.1 0.875

[5,75, 6,25) 5 40 0.125 1

N= 40

e) 3

f) 15

g) %=F2*100=0.275*100=27.5

Medidas descriptivas

Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos resumen la informacin contenida en
ella.
Medidas de Posicin: Cuantiles
Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo
nmero de valores. Los ms usados son los cuartiles, los deciles y los percentiles.
PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de
orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%


CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular
de los percentiles:

- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos
- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los
datos
- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos

DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso
particular de los percentiles.

Ejemplo:

Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias, calcular sus cuartiles.

xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
n=100

Solucin:

1.
Primer cuartil:

2.
Segundo cuartil:

3.
Tercer cuartil:
Medidas de Centralizacin

Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay
diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:
MEDIA : (media aritmtica o simplemente media). es el promedio aritmtico de las observaciones, es decir, el cociente entre la
suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos estn agrupados utilizamos las marcas de clase, es decir c i en vez de xi.
MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50%
de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central,
si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

MODA (M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene
porque ser nica.

Medidas de Dispersin
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin
nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de
dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central.
Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos
permitirn comparar varias muestras.
MEDIDAS DE DISPERSIN ABSOLUTAS
VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de
observaciones.
Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:

Si los datos estn agrupados utilizamos las marcas de clase en lugar de X i.


DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este
problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza
Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la frmula (cuasi desviacin
tpica):
RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax -
xmin

MEDIDAS DE DISPERSIN RELATIVAS


COEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin de dos distribuciones que
no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se
define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica

CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor
es la dispersin y menor la representatividad de la media.
Medidas de Forma
Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de barras de la distribucin, con la
distribucin normal.
MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica coinciden.

Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas) descienden ms lentamente por la
derecha que por la izquierda.

Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la distribucin es asimtrica a la
izquierda.

Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es el Coeficiente de Asimetra de Pearson:

Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y negativo cuando existe
asimetra a la izquierda.
MEDIDA DE APUNTAMIENTO O CURTOSIS
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones segn su
grado de curtosis:

Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo
que presenta una distribucin normal). Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los
valores centrales de la variable. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores
centrales de la variable.

EJEMPLO 1

El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales caractersticas han
sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda, varianza y desviacin tpica.

SOLUCIN:

La media: suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si
ordenamos los datos de mayor a menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en
el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la
mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la
distribucin.

Sx2=

La desviacin tpica S: es la raz cuadrada de la varianza.

S = 427,61 = 20.67

El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 das

El coeficiente de variacin: cociente entre la desviacin tpica y el valor absoluto de la media aritmtica

CV = 20,67/52,3 = 0,39

EJEMPLO 2

El precio de un interruptor magentotrmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y
27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadstica, ms abajo) diagrama de barras y el diagrama de caja.

SOLUCIN:

(Utilizar la calculadora de debajo)


[El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos), bigotes el recorrido]

Abrir Calculadora Estadstica

Ir a Calculadora Estadstica
Resumen de Frmulas

GRFICOS

Para apreciar con una simple visin la magnitud o posicin de las variables, se suelen efectuar una representacin grfica, los
sistemas de grficos ms usuales son:

Diagrama de sectores: el rea de cada sector es proporcional a la frecuencia que se quiera representar, sea absoluta o
relativa
Diagrama de barras: se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una VARIABLE DISCRETA. En el
eje de abcisas, situaremos los diferentes valores de la variable. En el eje de ordenadas la frecuencia. Levantaremos barras o
columnas SEPARADAS de altura correspondiente a la frecuencia adecuada.

Polgono de frecuencias: es la recta que une los extremos de las variables de una distribucin, por ejemplo, la evolucin de la
temperatura de un paciente

Ejemplo Interactivo (en ventana emergente)

Histogramas: diagrama de barras para distribuciones cuantitativsa continuas

Pictogramas: diagrama de barras en los que las barras se sustituyen por dibujos alusivos a la variable
EJEMPLO

La tabla de frecuencias es:

Variable F. Absolutas F. Relativas F. Acumuladas

xi ni fi Ni
Dada la tabla siguiente que da el nmero de TSE en
12 empresas: 1 1 0,083 1

Nmero de TSE (xi) 1 2 3 4 2 3 0,250 4

Frecuencias (ni) 1 3 5 3 3 5 0,416 9

4 3 0,250 12

12 1
ESTADISTICA INFERENCIAL

Variable Aleatoria

Si en un experimento aleatorio a cada suceso aleatorio elemental le asignamos un valor numrico obtenemos una variable
aleatoria, que puede ser discreta o continua. Cuando el conjunto numrico es el de los nmeros enteros la variable aleatoria es
discreta. Si el conjunto numrico es el de los nmeros reales la variable aleatoria es continua.

Variable Aleatoria Discreta


Si x es una variable aleatoria continua, slo puede tomar ciertos valores en un intervalo.

V. A. Discreta: Funcin de Probabilidad

Si x1, x2, x3,..............xn son los valores de x y p1, p2, p3,...........pn las probabilidades de los sucesos correspondientes a los valores de
x se llama funcin de probabilidad o distribucin de probabilidades de la variable x al conjunto de los pares (xi, pi)

(x1, p1), (x2, p2), (x3, p3), .......... (xn, nn)

formados por los valores de x y sus probabilidades correspondientes.

Si el conjunto de valores de x tiene n elementos: p = 1


i

Y si es infinito numerable:

La funcin de probabilidad P(x) de la variable aleatoria x es la funcin que asigna a cada valor xi de la variable su
correspondiente probabilidad pi

Ejemplo. Lanzamos al aire una moneda repetidamente, veamos la probabilidad de obtener cara la primera vez, la segunda, etc. y su
distribucin de probabilidades
xi 1 2 3 ... n
pi 1/2 1/4 1/8 .... 1/2n

Lanzamiento y probabilidad

Distribucin de probabilidad

V. A. Discreta: Funcin de Distribucin

En muchas ocasiones no nos interesa tanto conocer la probabilidad de que la variable aleatoria x tome exactamente un
determinado valor xi, sino conocer la probabilidad de que tome valores menores o iguales que un cierto valor xi. En tales casos es
necesario acumular los distintos valores de la funcin de probabilidad hasta el valor deseado. Se trata de una nueva aplicacin
llamada funcin de distribucin

Sea x una variable aleatoria. La probabilidad de que x sea menor o igual que un valor t , se escribe P (x t) y esta probabilidad ser
funcin de t. Si a esta funcin la designamos por F(t):

F(t) = P (x t)

Esta funcin se llama funcin de distribucin.

Si xi es creciente con i y suponemos que t est comprendido entre dos de estos valores valores:

xh-1 < t xh

la condicin: x t x = x1 x = x2 ................x = xh

P (x t) = P (x1) + P (x2) + .......... + P (xh)

Luego la funcin de distribucin F(t) es la suma de las probabilidades de todos los sucesos x = xi tales que xi t

Ejemplo. En el ejemplo anterior del lanzamiento de una moneda, la funcin F(t) toma los siguientes valores:
Para 0<t1 F(t) = 1/2

Para 1<t2 F(t) = 1/2 + !/4 = 3/4 = 1 - 1/22

Para 2<t3 F(t) = 1/2 + !/4 + 1/8 = 7/8 = 1 - 1/23

Para n-1 < t n F(t) = 1 - 1/2n

Vemos que F(t) es una funcin escalonada, creciente y si t

Lo que hemos visto se puede generalizar al caso en que la funcin de distribucin es una funcin continua.

Variable Aleatoria Continua


Si x es una variable aleatoria continua, puede tomar cualquier valor en un intervalo.

V. A. Continua: Funcin de Probabilidad

Si la variable aleatoria es continua hay infinitos valores posibles de la variable y entre cada dos de ellos se podran definir infinitos
valores ms. En estas condiciones no es posible deducir la probabilidad de un valor puntual de la variable, como se puede
hacer en el caso de variables aleatorias discretas. Pero s es posible calcular la probabilidad acumulada hasta un cierto valor
(funcin de distribucin), y podremos analizar como cambia la probabilidad acumulada en cada punto (estos cambios no son
probabilidades sino otro concepto denominado densidad de probabilidad).

Ejemplo. Sea x la v.a. que describe la duracin de las lmparas de una determinada marca y modelo. Los valores de una variable
estadstica continua siempre se consideran agrupados en intervalos de clase, luego no tiene sentido plantearse la probabilidad de
resultados "aislados" (como, por ejemplo, la probabilidad de que una lmpara dure, exactamente, 265 h). En todo caso, esas
probabilidades deben valer cero. Pero s podemos preguntarnos, por ejemplo, cul es la probabilidad de que una lmpara dure
menos de 265 horas? o cul es la probabilidad de que una lmpara dure entre 300 y 340 horas?

V. A. Continua: Funcin de Distribucin

Para conocer la probabilidad de que la variable aleatoria x tome valores menores o iguales que un cierto valor xi es necesario
acumular los distintos valores de la funcin de probabilidad hasta el valor deseado. Se trata de una nueva aplicacin llamada
funcin de distribucin

La probabilidad de que x sea menor o igual que un valor t , se escribe P (x t) y esta probabilidad ser funcin de t. Si a esta
funcin la designamos por F(t):

F(t) = P (x t)

Esta funcin se llama funcin de distribucin.

Ejemplo. Sea un disco graduado entre dos valores a y b, a<b, que se hace girar en presencia de una pestaa que permanece
inmvil. Veamos la probabilidad de que al parar el disco la pestaa marque un valor entre a y un valor t, y tambin la funcin de
distribucin correspondiente:
V. A. Continua: Funcin de Densidad

Sea la funcin de distribucin F(t) = P (x t) y supongamos dos nmeros reales a y b, a<b, entonces:

F(a) = P (x a) y F(b) = P (x b)

F(b) - F(a) = P (x b) - P (x a) = P(a<xb)

Se llama densidad media de probabilidad en el intervalo [a, b] a:


En el ejemplo anterior del crculo que gira, la funcin de densidad es:

Resumen
------------------
Introduccin

En la industria la calidad final que se obtiene en un proceso depende de muchos factores: experiencia de los operarios, calidad de
las materias primas, estado de las herramientas, etc. Algunos de estos parmetros se conocen de forma exacta (variables
asignables), mientras que otros se sabe que siguen una tendencia (variables aleatorias). La estadstica nos proporciona una
herramienta muy interesante para poder trabajar con estos casos en los que se conoce slo el comportamiento pero no el valor
preciso: la variable aleatoria.

Variable aleatoria es una funcin que asocia un nmero a cada suceso elemental de un espacio muestral.

Supongamos que hacemos un histogramas de frecuencias relativas de la intensidad de disparo de un interruptor automtico. El
histograma tendr la forma de la figura izquierda de debajo. A medida que los intervalos se van haciendo ms pequeos, la lnea
poligonal de frecuencias relativas tiende hacia una lnea curva. Esta curva es la grfica de una funcin f(x) llamada funcin de
densidad, figura debajo derecha, que est asociada a una distribucin de probabilidades de una variable aleatoria continua.

Variable estadstica Variable aleatoria

Frecuencia relativa de xi Probabilidad del suceso xi

Fi = fi/n y Fi = 1 f(xi) = pi y pi = 1
Cuando se trabaja con una variable aleatoria continua siempre se determinan probabilidades de que la variable aleatoria X
pertenezca a un cierto intervalo P(x1 X x2), ya que la probabilidad en un punto es cero.

La funcin de densidad f(x) es una funcin asociada a una variable aleatoria continua X que permite hallar mediante el clculo de
reas las probabilidades en las distribuciones continuas.

La funcin de distribucin de una variable aleatoria continua es la funcin que determina la probabilidad de que la variable
aleatoria X tome un valor menor o igual a xi: F(xi) = P(X xi)

El rea de la regin comprendida entre f(x), OX y dos rectas x 1 y x2 es la probabilidad de que la variable aleatoria X est en el
intervalo [x1, x2].

La Distribucin Normal N (,

La distribucin normal N (, es un modelo matemtico que rige muchos fenmenos. La experiencia demuestra que las
distribuciones de la mayora de las muestras tomadas en el campo de la industria se aproximan a la distribucin normal si el tamao
de la muestra es grande. Esta distribucin queda definida por dos parmetros: la media y la desviacin tpicaSe presenta
mediante una curva simtrica conocida como campana de Gauss. Esta distribucin nos da la probabilidad de que al elegir un valor,
ste tenga una medida contenida en unos intervalos definidos. esto permitir predecir de forma aproximada, el comportamiento
futuro de un proceso, conociendo los datos del presente.
La desviacin tpica es grande, el intervalo de incertidumbre de la La desviacin tpica es pequea, el intervalo de incertidumbre de
medida es grande, la precisin es dbil la medida es pequea, la precisin es grande

Tienen especial inters los siguientes intervalos:


La Distribucin Normal Tipificada

La distribucin normal tipificada N (, . Cuando la media de la distribucin es 0 y la varianza es 1 se denomina "normal


tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta
distribucin.

La tabla nos da la probabilidad acumulada, es decir, la que va desde - hasta un valor. No nos da la probabilidad concreta en ese
punto. En una distribucin continua en el que la variable puede tomar infinitos valores, la probabilidad en un punto concreto es cero.

Mtodo para Calcular Probabilidades (Tabla con Valores + y -)

Abrir Ventana con Tabla (valores + y -)

La probabilidad en un intervalo t1tt2 se obtiene restando de la probabilidades acumulada t2 p(t2) la probabilidad acumulada de t1
p(t1)
P(t1tt2) = p(t2) - p(t1)

Ejemplo:

Probabilidad en el intervalo -1 t 0,5

P(-1 t 05) = p(0,5) - p(-1) =

= 0,6915 -0,1587 = 0,5328

Mtodo para Calcular Probabilidades (Tabla con Valores slo +)

Abrir Ventana con Tabla (valores +)

En este caso hay que hacer algunas consideraciones, tal como se indica a continuacin:

La probabilidad p de que un valor cualquiera t se encuentre


en el intervalo - < t < + es de 1 (100%)
La probabilidad p de que un valor cualquiera t se encuentre
en el intervalo - < t < t1 es de p(t1)

Ejemplo:

P(t 1,75) = 0,9599

[P(t >1,75) = 1-0.9599 = 0,041]

La probabilidad p de que un valor cualquiera t se encuentre


en el intervalo - < t < -t1 es de p(-t1) = 1 - p(t1)

Ejemplo:

P(t -0,5) = 1- P(t 0,5) = 1-0,6915 = 0,3085

tambin

P(t -0,5) = P(t > 0,5) = 1-P(t 0,5) = 0,3085

La probabilidad p de que un valor cualquiera t se encuentre


en el intervalo -t1 < t < +t1 es de p(-t1<t<+t1) = p(t1) - p(-t1) =
2p(t1)-1

Ejemplo:

P(-1 t 1) = 2P(t 1) -1= 2 0,8413 -1 = 0,6826


La probabilidad p de que un valor cualquiera t se encuentre
en el intervalo t1 < t < t2 es de p(t1<t<t2) = p(t2) - p(t1)

Ejemplo:

P(1 t 1,85) = P(t1,85) - P(t1) = 0.9678 - 0,8413 =


0,1265

La probabilidad p de que un valor cualquiera t se encuentre


en el intervalo -t1 < t < +t2 es de p(-t1<t<+t2) = p(t2) - p(-t1) =
p(t2) - [1 - p(t1)] = p(t2) + p(t1) -1

Ejemplo:

P(-1 t 1,85) = P(t1,85) + P(t1) -1 = 0.9678 +


0,8413 - 1 = 0,8091

La probabilidad p de que un valor cualquiera t se encuentre


en el intervalo -t1 < t < -t2 es de p(-t1<t<-t2) = p(-t2) - p(-t1) =
[1 - p(t2)] - [1 - p(t1)] = p(t1) - p(t2)

Ejemplo:

P(-1,85 t -1) = P(t1,85) -P(t1) = 0.9678 - 0,8413 =


0,1265

Tipificacin de la Variable
Si se tiene una curva normal N (y se quiere hallar las probabilidades a partir de las tablas de la normal estndar N(0,1) es
preciso realizar un cambio de variable (tipificacin):

P(X x) = P(t (x -)

Es decir, la probabilidad de que x est entre entre dos valores a y b es igual a la probabilidad de que t est entre:

(a -y (b -

Ejemplo:

Sea la curva normal N(100,10), se desea hallar la probabilidad de que x tome un valor entre 90 y 110.

t1 = (90 -100)/10 = -1

t2 = (110 -100)/10 = 1

Se busca en la tabla N(0,10) p(-1<t<1) = p(1) - p(-1) = p(1) - [1 - p(1)] = p(1) + p(1) - 1 = 0,8413 + 0,8143 - 1 = 0,6826 y en porcentaje
68,26%

Distribucin Normal: Ejemplos


Abrir Ventana con Tabla (valores + y -) Abrir Ventana con Tabla (valores +) Abrir Calculadora de Probabilidad

Ejemplo 1.- El tiempo medio en realizar una misma tarea por parte de los empleados de una empresa se distribuye segn una
distribucin normal, con media de 5 das y desviacin tpica 1 da. Calcular el porcentaje de empleados que realizan la tarea en un
tiempo inferior a 7 das.

t1 = -y t2 = (7 -5)/1 = 2

En la tabla la probabilidad acumulada para el valor 2 (equivalente a un tiempo inferior a 7 das.). Esta probabilidad es 0,9772. Por lo
tanto, el porcentaje de empleados que realizan la tarea en un tiempo inferior a 7 das es del 97,7%.

Ejemplo 2.- La vida media de una lmpara, segn el fabricante, es de 68 meses, con una desviacin tpica de 5. Se supone que se
distribuye segn una distribucin normal En un lote de 10.000 lmparas. a) Cuntas lmparas superarn previsiblemente los 75
meses?. b) Cuntos lmparas se estropearn antes de 60 meses?

a)

t = (75 -68)/5 = 1,4

P (X > 75) = (t > 1,4) = 1 - P (t 1,4) = 1 - 0,9192 = 0,0808

Luego, el 8,08% de las lmparas (808 lmparas) superarn los 75 meses

b)

t = (60 -68)/5 = -1,6

P (X 60) = (t -1,6) = P (t> 1,6) = 1 - P (t 1,6) = 0,0548

Luego, el 5,48% del lote (548 lmparas) no llegarn probablemente a durar 60 meses

Ejemplo 3. -El consumo medio bimestral de energa elctrica en una ciudad es de 59 Kwh., con una desviacin tpica de 6 Kwh. Se
supone que se distribuye segn una distribucin normal. a) Cuntos Kwh. tendra que consumir bimestralmente para pertenecer al
5% de la poblacin que ms consume?. b) Si usted consume 45 Kwh. qu % de la poblacin consume menos que usted?

a)

Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,95 (95%), por lo que por arriba estara el
5% restante. Este valor corresponde a t = 1,645. Ahora calculamos la variable normal X equivalente a ese valor de la normal
tipificada:

1,645 = (X -59)/6 X = 67,87

Por lo tanto, tendra usted que consumir ms de 67,87 Kwh. bimestralmente para pertenecer al 5% de la poblacin que ms
consume

b)

Vamos a ver en que nivel de la poblacin se situara usted en funcin de los 45 Kwh. consumidos.

Calculamos el valor de la normal tipificada correspondiente a 45 Kwh.

t = (45 -59)/9 = -2.333

P (X 45) = P (t -2,333) = P (t > 2,333) = 1 - P (t 2,333) = 1 - 0,9901 = 0,0099

Luego, tan slo un 1,39% de la poblacin consume menos que usted.

Ejemplo 4. Una empresa instala en una ciudad 20.000 bombillas para su iluminacin. La duracin de una bombilla sigue una
distribucin normal con media 302 das y desviacin tpica 40 das. Calcular. a) Cuntas bombillas es de esperar que se fundan
antes de 365 das? Cuntas durarn ms de 400 das? Explica razonadamente las respuestas.

a)

Tipificamos el valor 365 t = (365 -302)/40 = 1,575


P (X 365) = P (t 1,575 ) = 0,9418

Luego el 94,18% de las lmparas, es decir 20.000 0.9418 = 18.836 bombillas se fundirn antes de 365 das

b)

Tipificamos el valor 400 t = (400-302)/40 = 2,45

P (X > 400) = P (t >2,45 ) = 1- P (t 2,45 ) = 1 - 0,9929 = 0,0071

Entonces el 0,71% de las lmparas, es decir 20.000 0.0071 = 142 bombillas durarn ms de 400 das

Ejemplo 5. El tiempo medio de los electricistas de una empresa en realizar el montaje de un determinado cuadro elctrico es de 4
das, con una desviacin tpica de 1 da. Se supone que se distribuye segn una distribucin normal. Calcular: a) Porcentaje de
electricistas que tardan menos de 3 das. b) Tiempo a partir del cual del cual se sita el 10% de los electricistas que ms tiempo
emplean en realizar el cuadro. c) Tiempos mnimo y mximo que engloba al 60% de los electricistas con tiempo medio.

a)

t = (3 -4)/1 = -1

P (X 3) = P (t -1)

P (t -1) = P (t > 1)

P (t > 1) = 1 - P (t 1) = 1 - 0,8413 = 0,1587

Luego, el 15,87 % de los electricistas emplean un tiempo inferior a 3 das

b)

Buscamos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,9 (90%), lo que quiere decir que por
encima se sita el 10% superior. Este valor corresponde a t = 1,282. Ahora calculamos la variable normal X equivalente a ese
valor de la normal tipificada:

1,282 = (X -4)/1 X = 5,282

Despejando X, su valor es 5,282. Por lo tanto, el 10% de los electricistas que ms tardan en realizar un cuadro lo hacen en

5.28 das
c)

Buscamos en la tabla el valor de t cuya probabilidad acumulada es el 0,8 (80%). Como sabemos que hasta la media la
probabilidad acumulada es del 50%, quiere decir que entre la media y este valor hay un 30% de probabilidad. Por otra
parte, al ser la distribucin normal simtrica, entre -t y la media hay otro 30% de probabilidad. Por lo tanto, el segmento (-
t, +t) engloba al 60% de los electricistas con tiempo medio.

El valor de t que acumula el 80% de la probabilidad es 0,842, por lo que el segmento viene definido por (-0,842, +0,842).
Ahora calculamos los valores de la variable X correspondientes a estos valores de t.

-0,842 = (X -4)/1 X = 3,158

0,842 = (X -4)/1 X = 4,158

Los valores de X son 3,158 y 4,158. Por lo tanto, los electricistas con tiempos comprendidos entre 3,158 das y 4,158 das
constituyen el 60% de la poblacin con un tiempo medio de realizacin del cuadro.

Potrebbero piacerti anche