Sei sulla pagina 1di 130

Conceptos Bsicos y

Estadstica Descriptiva
Ing. Leonardo Calle
Concepto de Estadstica
O Se refiere a un conjunto de mtodos para
manejar la obtencin, presentacin y
anlisis de observaciones numricas.
Concepto de Estadstica
O Sus fines son describir al conjunto de
datos obtenidos y tomar decisiones o
realizar generalizaciones acerca de las
caractersticas de todas las
observaciones bajo consideracin.
reas que conforman a la Estadstica
O Estadstica Descriptiva (Deductiva): es la
encargada de la organizacin, condensacin,
presentacin de los datos en tablas y grficos y
del clculo de medidas numricas que permitan
estudiar los aspectos ms importantes de los
datos.
DESCRIBIR
reas que conforman a la Estadstica
O Estadstica Inferencial o Inferencia Estadstica:
est definida por un conjunto de tcnicas,
mediante las cuales se hacen generalizaciones o
se toman decisiones en base a informacin parcial
obtenida mediante tcnicas descriptivas.
INFERIR
reas de Aplicacin de la Estadstica
O El uso de la Estadstica es muy amplio. Resulta difcil
nombrar un rea en la cual no se emplee.
O Los mtodos estadsticos han encontrado aplicacin
en:
O Gobierno
O Negocios
O Ciencias Sociales
O Ingeniera
O Ciencias Fsica y Naturales
O Control de Calidad
O Procesos de Manufactura
O Muchos otros campos de la actividad intelectual.
reas de Aplicacin de la Estadstica
O Esto se debe a la creciente facilidad con la cual se
pueden manejar grandes cantidades de datos
numricos, debido al uso de
Conceptos de Poblacin y
Muestra
O Poblacin: es la coleccin de todas las posibles
mediciones u observaciones que pueden hacerse
de una variable bajo estudio.
Conceptos de Poblacin y
Muestra
O Se clasifica en dos categoras:
O Finita: es aquella que incluye una cantidad
limitada contable de observaciones,
individuos o medidas. Siempre que sea
posible alcanzar (contar) el nmero total
de todas las posibles mediciones, se
considera como finita la poblacin.

Conceptos de Poblacin y
Muestra
O Infinita: es aquella que incluye un gran
conjunto de observaciones o mediciones
que no pueden alcanzarse por conteo. Al
menos, hipotticamente, no existe lmite
en cuanto al nmero de observaciones que
el experimento puede generar.
Conceptos de Poblacin y
Muestra
O Muestra:
O es un conjunto de mediciones u observaciones
tomadas a partir de una poblacin.
O es un subconjunto de la poblacin.
Conceptos de Poblacin y
Muestra
O Muestra aleatoria: se considera aleatoria
siempre y cuando cada observacin,
medicin o individuo de la poblacin
tenga la misma probabilidad de ser
seleccionado.
Tipos de datos y escalas de medida
O Variables:
O son las caractersticas o lo que se estudia
de cada individuo de la muestra. Ej: sexo,
edad, peso, estatura, color de ojos, estado
civil, temperatura, cantidad de
nacimientos, presin, grosor, dimetro, ...
O Datos:
O son los valores que toma la variable en
cada caso.
Tipos de datos
O Cualitativos: son datos que solo toman
valores asociados a las cualidades o
atributos, clasificndolos en una de
varias categoras, es decir, no son
valores numricos. Ej:
O Sexo: f/m.
O Hbito de fumar: Fumador/No fumador
O Color de ojos: negro, azul, marrn,
O Religin: catlica, evanglica,
O Estado civil: soltero, casado, divorciado,
Tipos de datos
O Cuantitativos: provienen de variables
que pueden medirse, cuantificarse o
expresarse numricamente. Ejemplos:
O Peso
O Edad
O Estatura
O Presin
O Humedad
O Intensidad de un sismo
O Cantidad de hermanos
Escalas de medida
O Tipos de variables cuantitativas:
O Discretas: es aquella que solo puede
tomar un nmero finito o infinito numerable
de valores. Ejemplo: cantidad de
hermanos.
O Continuas: es la variable que puede tomar
cualquier valor en una escala continua.
Ejemplo: cantidad de lquido contenido en
un recipiente.
Escalas de medida
O Escala Nominal.
O Escala Ordinal.
O Escala de Intervalos.
O Escala de Razn o Proporcin.
O Escala Absoluta.

Variables Cualitativas
Variables
Cuantitativas
Escalas de medida
O Escala nominal: los datos se pueden agrupar en
categoras que no mantienen una relacin de
orden entre si, por lo tanto no estn definidas las
operaciones lgicas (>, <, , ) sino solo las de
igualdad o diferencia.
O Ejemplos: color de ojos, sexo, profesin, estado
civil, religin.
Escalas de medida
O Escala ordinal: existe un cierto orden o
jerarqua entre las categoras (>, <, , ).
O Ejemplos: grados militares, organigrama
de una empresa, escalafn de los
profesores universitarios, grados de
disnea, estadiaje de un tumor.
Escalas de medida
O Escala de Intervalos: valores numricos de las
variables y adems de las relaciones de orden
(>, <, , ), se pueden establecer distancias, es
decir, tienen sentido las operaciones de suma y
resta. Tiene dos propiedades:
O Existe una unidad de medida que se mantiene
constante para todos los valores que toma la
variable.
O Existe un valor patrn u origen relativo que no
significa la ausencia de valor en la variable.
Escalas de medida
O Ejemplo: temperatura, nivel de ruido,
movimientos ssmicos.
Escalas de medida
O Escala de razn o proporcin: es la ms completa y
general de todas las escalas. Se caracteriza porque
los valores de la variable son nmeros entre los
cuales, adems de las relaciones de orden (>, <, ,
) y distancia (+,-), se pueden establecer mltiplos y
proporciones.
O Ejemplos: peso, altura, volumen
Escalas de medida
O Escala Absoluta: se caracteriza porque
los valores que toma la variable son el
resultado de contar y por lo tanto, est
constituida por los enteros positivos y el
cero.
O Ejemplos: nmero de hermanos, cantidad
de autos vendidos, cantidad de
accidentes en una interseccin, cantidad
de hijos,
Datos Univariantes y Multivariantes
O Univariantes o unidimensionales: slo
recogen informacin sobre una
caracterstica (Ej: edad de los alumnos de
una clase).
O Bivariantes o bidimensionales: recogen
informacin sobre dos caractersticas de
la poblacin. (Ej: edad y estatura de los
alumnos de una clase).
Datos Univariantes y Multivariantes
O Multivariantes o pluridimensionales:
recogen informacin sobre tres ms
caractersticas. (Ej: edad, estatura y peso
de los alumnos de una clase).
Abusos que se pueden cometer con la
Estadstica
O Conclusiones errneas debido a que los datos son
numricamente insuficientes.
O Representaciones grficas engaosas (escalas).
O Datos muestrales no representativos:
O Muestra que no incluye a elementos de toda la poblacin.
O Ciertas categoras de personas no responden
correctamente.
O Respuestas voluntarias (sesgadas).
TEMA 2. ESTADSTICA DESCRIPTIVA
Organizacin de los datos
O Una vez que se ha
realizado la
recoleccin de los
datos, se obtienen
datos en bruto, los
cuales rara vez son
significativos sin una
organizacin y
tabulacin.
Organizacin de los datos
O Formas de organizar los datos:
O Un arreglo: es la forma ms sencilla de organizar los
datos en bruto, consiste en colocar las observaciones
en orden segn su magnitud: ascendente o
descendente.
O Poco prctica cuando se tiene una gran cantidad de
datos.
Organizacin de los datos
O Una distribucin de frecuencias: es un arreglo de
los datos que permite expresar la frecuencia de
ocurrencias de las observaciones en cada una
de las clases, mostrando el patrn de la
distribucin de manera ms significativa.

Clase Pto.
Medio
f
i
F
i
fr
i
FR
i
Organizacin de los datos
O La Distribucin de Frecuencias:
O Se recomienda su uso cuando se tienen grandes
cantidades de datos (n).
O Su construccin requiere, en primer lugar, la
seleccin de los lmites de los intervalos de clase.
O Para definir la cantidad de intervalos de clase (k),
se puede usar:
O La regla de Sturges: k = 1 + 3.3log(n)
O k = n
Organizacin de los datos
O La cantidad de clases no puede ser tan pequeo
(menos de 5) o tan grande (ms de 20), que la
verdadera naturaleza de la distribucin sea
imposible de visualizar.
O La amplitud de todas las clases deber ser la
misma. Se recomienda que sea impar y que los
puntos medios tengan la misma cantidad de
cifras significativas que los datos en bruto.
O Los lmites de las clases deben tener una cifra
significativa ms que los datos en bruto.
Organizacin de los datos
O Determinar:
O Punto medio = (Li+Ls)/2.
O Frecuencia absoluta de la clase (f
i
).
O Frecuencia acumulada de la clase (F
i
).
O Frecuencia relativa de la clase (fr
i
):
O fr
i
= f
i
/n
O Frecuencia relativa acumulada de la clase
(FR
i
).

Ejemplos de Distribucin de
Frecuencias
A continuacin se presentan las
calificaciones de 60
estudiantes que presentaron la
PINA en el ao 2009:
Ejemplos de Distribucin de
Frecuencias
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

a) Construya una distribucin de frecuencias.
b) Qu puede concluir de estos datos.

Representacin grfica de los datos
O Los grficos permiten visualizar en
forma global y rpida el comportamiento
de los datos.
O Para datos cuantitativos agrupados en
clases, comnmente se utilizan tres
grficos:
O Histogramas.
O Polgono de frecuencias.
O Ojiva o Polgono de frecuencias acumuladas.
Representacin grfica de los datos
Histograma
Representacin grfica de los datos
Histograma y
Polgono de Frecuencias
Ojiva
Representacin grfica de los datos
Representacin grfica de los datos
O Para datos cualitativos se usan:
O Curvas
O Barras
O Sectores
Barras
Representacin grfica de los datos
Barras
Representacin grfica de los datos
Curvas
Representacin grfica de los datos
Sectores, torta o circular
Ejemplos de construccin
de grficos
Medidas de tendencia central o
posicin
O Corresponden a valores que
generalmente se ubican en la parte
central de un conjunto de datos.
O Forma como los datos pueden
condensarse en un solo valor central
alrededor del cual todos los datos
muestrales se distribuyen.
Medidas de tendencia central o
posicin
O Las medidas de tendencia central ms
importantes son:
O Media: Aritmtica y Aritmtica ponderada.
O Mediana.
O Moda.
Media Aritmtica
O Es la suma de todas las observaciones dividida entre el
nmero total de observaciones.
O Expresada de forma ms intuitiva, podemos decir que la
media aritmtica es la cantidad total de la variable distribuida
a partes iguales entre cada observacin. (wikipedia)
O Por ejemplo, si en una habitacin hay tres personas, la
media de dinero que tienen en sus bolsillos sera el resultado
de tomar todo el dinero de los tres y dividirlo a partes iguales
entre cada uno de ellos. Es decir, la media es una forma de
resumir la informacin de una distribucin (dinero en el
bolsillo) suponiendo que cada observacin (persona) tendra
la misma cantidad de la variable. (wikipedia)
Mediana
O Es el valor que ocupa la posicin central
de un conjunto de observaciones, una vez
que han sido ordenados en forma
ascendente o descendente.
O Divide al conjunto de datos en dos partes
iguales.
Clculo de la mediana
O Para datos no agrupados:
O Si n es impar: posicin donde se ubica la
mediana es igual a (n+1)/2.
O Si n es par: (n+1)/2 no es entero, por lo
tanto la mediana ser igual al promedio de
las dos posiciones centrales.

Clculo de la mediana
O Datos agrupados: clase mediana es la que
contiene a la observacin que ocupa la
posicin n/2.
Donde: Lm: lmite inferior de la clase mediana.
F(x
m-1
): frecuencia acumulada de la clase
anterior a la clase mediana.
f(x
m
): frecuencia absoluta de la clase mediana.
Cm: amplitud de la clase mediana.
Moda
O Observacin o clase que tiene la mayor
frecuencia en un conjunto de
observaciones.
O Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
O Es la nica medida de tendencia central
que se puede determinar para datos de
tipo cualitativo.
Clculo de la moda
O Para datos no agrupados: es simplemente la
observacin que ms se repite.
O Para datos agrupados:
Donde: Lim: lmite inferior de la clase modal.

1
: diferencia entre f
i
de la clase modal y la
anterior.

2
: diferencia entre f
i
de la clase modal y la
posterior.
Cm: amplitud de la clase modal (clase de mayor
frecuencia).
Relacin entre la media, la mediana y
la moda
Cuando los datos son sesgados es mejor emplear la Md
Propiedades, ventajas y desventajas de
la media
Propiedades:
O La suma de las diferencias entre las
media muestral y el valor de cada
observacin es cero.
O La media de una constante es la
constante.
O Si todas las observaciones x
i
se
multiplican por una constante a, la X
tambin se debe multiplicar por ese
mismo valor constante.
Propiedades, ventajas y desventajas de
la media
O Si se somete a una variable estadstica X
a un cambio de origen y escala, Y = a +
bX, la media aritmtica de dicha variable
X vara en la misma proporcin.
O La media de la suma de dos variables es
igual a la suma de sus medias.
Propiedades, ventajas y desventajas de
la media
Ventajas:
O Emplea en su clculo toda la informacin
disponible.
O Se expresa en las mismas unidades que
la variable en estudio.
O Es el centro de gravedad de toda la
distribucin, representando a todos los
valores observados.
O Es una valor nico.
Propiedades, ventajas y desventajas de
la media
O Se trata de un concepto familiar para la
mayora de las personas.
O Es til para llevar a cabo procedimientos
estadsticos como la comparacin de
medias de varios conjuntos de datos.
Propiedades, ventajas y desventajas de
la media
Desventajas:
O Se ve adversamente afectada por
valores extremos, perdiendo
representatividad.
O Si el conjunto de datos es muy grande
puede ser tedioso su clculo manual.
O No se puede calcular para datos
cualitativos.
O No se puede calcular para datos que
tengan clases de extremo abierto, tanto
superior como inferior.
Ventajas y desventajas de la mediana
Ventajas:
O Fcil de calcular si el nmero de observaciones no
es muy grande.
O No se ve influenciada por valores extremos, ya que
solo influyen los valores centrales.
O Fcil de entender.
Ventajas y desventajas de la mediana
O Se puede calcular para cualquier tipos de
datos cuantitativos, incluso los datos con
clase de extremo abierto.
O Es la medida de tendencia central ms
representativa en el caso de variables que
solo admiten la escala ordinal.
Ventajas y desventajas de la mediana
Desventajas:
O No utiliza en su clculo toda la
informacin disponible.
O No pondera cada valor por el nmero de
veces que se ha repetido.
O Hay que ordenar los datos antes de
determinarla.
Ventajas y desventajas de la
moda
Ventajas:
O No requiere clculos.
O Puede usarse para datos tanto
cuantitativos como cualitativos.
O Fcil de interpretar.
O No se ve influenciada por valores
extremos.
O Se puede calcular en clases de extremo
abierto.
Ventajas y desventajas de la
moda
Desventajas:
O Para conjuntos pequeos de datos su valor no tiene
casi utilidad, si es que de hecho existe. Solo tiene
significado en el caso de una gran cantidad de
datos.
O No utiliza toda la informacin disponible.
O No siempre existe, si los datos no se repiten.
Ventajas y desventajas de la
moda
O En ocasiones, el azar hace que una sola
observacin se no representativa se el
valor ms frecuente del conjunto de
datos.
O Difcil de interpretar si los datos tiene 3 o
ms modas.

Medidas de dispersin, variacin o
variabilidad.
O Son valores numricos que indican o
describen la forma en que las
observaciones estn dispersas o
diseminadas, con respecto al valor
central.
Medidas de dispersin, variacin o
variabilidad.
O Son importantes debido a que dos
muestras de observaciones con el mismo
valor central pueden tener una
variabilidad muy distinta.

Medidas de dispersin, variacin o
variabilidad.
O Rango.
O Varianza.
O Desviacin Tpica.
O Coeficiente de variacin.
Medidas de dispersin: Rango
Rango (amplitud o recorrido):
O Est determinado por los dos valores extremos de
los datos muestrales, es simplemente la diferencia
entre la mayor y menor observacin.
O Es una medida de dispersin absoluta, ya que
depende solamente de los datos y permite
conocer la mxima dispersin.
Medidas de dispersin: Rango
O Casi no se emplea debido a que depende
nicamente de dos valores.
O No proporciona una medida de
variabilidad de las observaciones con
respecto al centro de la distribucin.
O Notacin: R
Medidas de dispersin:
Varianza
O Es un valor numrico que mide el grado
de dispersin relativa porque depende de
la posicin de los datos x
1
,x
2
,,x
n
con
respecto a la media.
O Es el promedio al cuadrado de las
desviaciones de cada observacin con
respecto a la media.
O Notacin: s
2
,
2
, var(X)
Medidas de dispersin: Desviacin
Tpica
O Es la raz cuadrada de la varianza.
O Notacin: s, .
Medidas de dispersin: Coeficiente de
Variacin
O Es una medida de dispersin relativa que
permite comparar el nivel de dispersin de dos
muestras de variables estadsticas diferentes.
O No tiene dimensiones.
O Notacin: CV =



Ventajas y Desventajas del
Rango
Ventajas:
O til cuando se quiere conocer la
extensin de las variaciones extremas
(valor mximo de la dispersin).
O Fcil de calcular.
Ventajas y Desventajas del
Rango
Desventajas:
O No es una MD con respecto al centro de
la distribucin.
O Solo emplea dos valores en su clculo.
O No se puede calcular en distribuciones de
lmite de clase abierto.
Propiedades, Ventajas y Desventajas
de la Varianza
Propiedades:
1. Siempre es mayor o igual a cero y
menor que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y ser Var(Y) =
b
2
Var(X)
Propiedades, Ventajas y Desventajas
de la Varianza
Ventajas:
O Es til cuando se compara la
variabilidad de dos o ms conjuntos de
datos.
O Utiliza toda la informacin disponible.
Desventajas:
O No proporciona ayuda inmediata cuando
se estudia la dispersin de un solo
conjunto de datos.
O Difcil de interpretar por tener sus
unidades elevadas al cuadrado.
Ventajas y Desventajas de la
Desviacin Tpica
Ventajas:
O Esta expresada en las mismas unidades
que la variable en estudio.
O Utiliza todas las observaciones en su
clculo.
O Fcil de interpretar.
Desventajas:
O No tiene.
Ventajas y Desventajas del Coeficiente
de Variacin
Ventajas:
O Es la nica MD que permite comparar el
nivel de dispersin de dos muestras de
variables diferentes.
O Emplea toda la informacin disponible en
su clculo.
O Fcil de calcular.
Ventajas y Desventajas del Coeficiente
de Variacin
Desventaja:
O No es una MD con respecto al centro de
la distribucin de los datos.
Medidas de Forma
O Son medidas numricas que permiten
determinar la forma que tiene la curva de
los datos, por lo tanto, sirven para
corroborar lo que los grficos muestran.
Medidas
de forma
-Asimetra

-Kurtosis o apuntamiento
Coeficiente de Pearson
Coeficiente de Fisher
Medidas de Forma: Asimetra
O Permiten estudiar la forma de la curva,
dependiendo de cmo se agrupan los
datos.
Medidas de Forma: Asimetra
Coeficiente de Asimetra de Pearson:
O Fcil de calcular e interpretar.
O Clculo:
o Interpretacin:
ASP
= 0, Simtrica

> 0, Asimtrica o sesgo positivo

< 0, Asimtrica o sesgo negativo
Medidas de Forma: Kurtosis
O Miden si los valores de la distribucin
estn ms o menos concentrados
alrededor de los valores medios de la
muestra (zona central de la distribucin).
O Se definen tres tipos de distribucin
segn su grado de Kurtosis:
Medidas de Forma: Kurtosis
O Mesocrtica: grado de concentracin medio
alrededor de los valores centrales de la variable.
O Leptocrtica: grado de concentracin elevado.
O Platicrtica: grado de concentracin reducido.

Medidas de Forma: Kurtosis
Interpretacin:
CK
=3 Mesocrtica o regular

>3 Leptocrtica o puntiaguda

<3 Platicrtica o plana
Coeficiente de correlacin
O Medida de la relacin existente entre dos
variables. Su valor est comprendido entre 1 y 1.
Si es negativo la relacin entre las variables es
inversa, es decir, a medida que aumentan los
valores de una decrecen los de la otra. Si es
positivo la asociacin es directa, es decir, los
valores de una variable aumentan con la otra. Un
valor de cero indica ausencia de relacin. Cuando
las variables son continuas y tienen una relacin
lineal, el coeficiente de correlacin lineal de
Pearson es una medida de asociacin adecuada.
Cuando las variables no son continuas se utilizan
otros coeficientes de correlacin.


Pues es el coeficiente de correlacin muestral de Pearson. El
coeficiente de correlacin es el coseno entre ambos vectores
centrados:
Si r = 1, el ngulo , ambos vectores son colineales (paralelos).
Si r = 0, el ngulo , ambos vectores son ortogonales.
Si r =-1, el ngulo , ambos vectores son colineales de
direccin opuesto.

Ms generalmente:
Media y varianza de funciones
de X
O Definimos Y
i
= X
i
+
O Donde y son constantes reales y el
subindice i vara de 1 hasta n
O

+
O Var (Y) =
2
()
Estandarizar una muestra
O Significa definir una nueva variable Y, en
trmino de los valores observados X, de
tal manera que:



O Toda muestra estandarizada tiene media
= 0, y varianza 1
Series temporales y filtros
O Una serie temporal o cronolgica es una secuencia de datos,
observaciones o valores, medidos en determinados momentos del
tiempo, ordenados cronolgicamente y, normalmente, espaciados
entre s de manera uniforme. El anlisis de series temporales
comprende mtodos que ayudan a interpretar este tipo de datos,
extrayendo informacin representativa, tanto referente a los
orgenes o relaciones subyacentes como a la posibilidad de
extrapolar y predecir su comportamiento futuro.

O De hecho, uno de los usos ms habituales de las series de datos
temporales es su anlisis para prediccin y pronstico. Por ejemplo
de los datos climticos, de las acciones de bolsa, o las series
pluviomtricas. Resulta difcil imaginar una rama de las ciencias en
la que no aparezcan datos que puedan ser considerados como
series temporales. Son estudiadas en estadstica, procesamiento
de seales, econometra y muchas otras reas.

Ruido: perturbaciones no controladas que ocultan la
presencia de un determinado comportamiento
Filtro de medias mviles de k-trminos: es el reemplazo de
cada observacin X(t) por el promedio de ese valor y los (k-1)
valores previamente observados.
Experimento
O Conjunto de acciones con las que, utilizando
procedimientos claramente establecidos, se
efecta algn tipo de observacin o medida
O Espacio muestral del experimento: se
denomina as al par (,S) donde
a) es el conjunto de todos los resultados
posibles del experimento
b) S es el conjunto potencia de , es decir que
S es el conjunto de todos los subconjuntos de
y es denominado espacio de eventos
Considerar que
O no es vaco
O S cumple con incluir al conjunto vaco

Ejemplo
O = {s;c}
O S= {; {s}; {c};}

Experimento estadstico
O Se sabe cuales son todos los resultados
posibles antes de su ejecucin
O Cualquier realizacin del experimento
debe conducir a un resultado que no es
conocido a tal ejecucin, pero que no es
uno de los posibles
O El experimento puede ser repetido bajo
idnticas condiciones
O Un conjunto es contable si y solo si, es
posible establecer una correspondencia
uno a uno entre los elementos de E y
aquellos de B, donde B es un subconjunto
de nmeros enteros positivos
O Un espacio muestral (,S) es discreto si y
solo si es contable
O Eventos mutuamente excluyentes: son
dos ms elementos de que no tienen
elementos en comn
Eventos
O Cada subconjunto del espacio muestral
(del conjunto de resultados) se denomina
evento.
O Si el evento consta de un solo elemento
de se lo denomina evento elemental o
punto muestral.
O Si consta de ms elementos recibe el
nombre de evento compuesto.
O se lo llama evento seguro
O Al evento que no contiene ningn punto
muestral se lo llama evento imposible ().
Espacio Muestral
O Se denomina al conjunto de todos los
posibles resultados de un fenmeno
aleatorio.
O Se lo nota con la letra .
O Se tiran dos monedas:
= {(C,C);(C,S);(S,C);(S,S)}

Experimento aleatorio
O Aquellos fenmenos con las siguientes
propiedades:
a. No se conoce a priori el resultado
b. Se conocen todos los resultados
posibles.
c. Se lo puede repetir bajo las mismas
condiciones.
Ejemplos
O Sacar cartas de un mazo.

O Tirar una moneda.

O Arrojar un dado.
Teora de la probabilidad
O La teora de la probabilidad es la parte de las
matemticas que estudia los fenmenos aleatorios
estocsticos. Estos deben contraponerse a los
fenmenos determinsticos, los cuales son
resultados nicos y/o previsibles de experimentos
realizados bajo las mismas condiciones
determinadas, por ejemplo, si se calienta agua a
100 grados Celsius a nivel del mar se obtendr
vapor. Los fenmenos aleatorios, por el contrario,
son aquellos que se obtienen como resultado de
experimentos realizados, otra vez, bajo las
mismas condiciones determinadas pero como
resultado posible poseen un conjunto de
alternativas, por ejemplo, el lanzamiento de un
dado o de una moneda.
O Muchos fenmenos naturales son aleatorios, pero
existen algunos como el lanzamiento de un dado,
donde el fenmeno no se repite en las mismas
condiciones, debido a que la caractersticas del
material hace que no exista una simetra del
mismo, as las repeticiones no garantizan una
probabilidad definida. En los procesos reales que
se modelizan mediante distribuciones de
probabilidad corresponden a modelos complejos
donde no se conocen a priori todos los parmetros
que intervienen; sta es una de las razones por
las cuales la estadstica, que busca determinar
estos parmetros, no se reduce inmediatamente a
la teora de la probabilidad en s.


Definicin clsica de
probabilidad
O La probabilidad es la caracterstica de un evento,
que hace que existan razones para creer que ste
se realizar.
O La probabilidad p de que suceda un evento S de
un total de n casos posibles igualmente probables
es igual a la razn entre el nmero de ocurrencias
h de dicho evento (casos favorables) y el nmero
total de casos posibles n.
p = P(S) =



O La probabilidad es un nmero (valor) que varia entre 0 y 1.
Cuando el evento es imposible se dice que su probabilidad
es 0, si el evento es cierto y siempre tiene que ocurrir su
probabilidad es 1.

O La probabilidad de no ocurrencia de un evento est dada
por q, donde:
q = P(no S) = 1 -


O Sabemos que p es la probabilidad de que ocurra un evento
y q es la probabilidad de que no ocurra, entonces p + q = 1

O Simblicamente el espacio de resultados, que normalmente
se denota por w1 y w2 , es el espacio que consiste en
todos los resultados que son posibles. Los resultados, que
se denota por , etctera, son elementos del espacio .

Probabilidad discreta
O Este tipo de probabilidad, es aquel que
puede tomar slo ciertos valores diferentes
que son el resultado de la cuenta de alguna
caracterstica de inters.
Probabilidad continua
O Una variable aleatoria es una funcin medible
X: -> R
que da un valor numrico a cada suceso en

Funcin de densidad
La funcin de densidad, o densidad de probabilidad
de una variable aleatoria, es una funcin a partir de
la cual se obtiene la probabilidad de cada valor que
toma la variable. Su integral en el caso de variables
aleatorias continuas es la distribucin de
probabilidad. En el caso de variables aleatorias
discretas la distribucin de probabilidad se obtiene a
travs del sumatorio de la funcin de densidad.

Teorema: Desigauldad de
Boole
O Si P es una funcin de probabilidades y
E
1
y E
2
son eventos cualesquiera en un
espacio muestral (,S),
entonces P(E
1
E
2
)1-P(E
1
c
)-P(E
2
c
)
Cardinalidad de eventos
finitos
O Nmero de elementos que posea el
evento con respecto al total contenido en
el espacio de eventos
O Si tiene N elementos, esto es
=(w
1
,w
2
,w
N
) y E es un evento en un
espacio muestral (,S), tal que E tiene k
elementos, kN, entonces:
P(E) =
()
()
=

, 0
Teorema
O Sean E
1
,E
2
E
k
, k eventos (conjuntos)
cuyas cardinalidades son
respectivamente n
1
,n
2
,n
k
; si se debe
tomar primero un elemento de E
1
, luego
un elemento de E
2
y as sucesivamente
hasta tomar el ltimo elemento en E
k
,
entonces el nmero de opciones que es
posible elegir es igual a:
n
1
*n
2
**n
k
Combinaciones y muestras
O Nmero de combinaciones: nmero de
muestras de tamao n que pueden
tomarse desde una poblacin objetivo que
tiene tamao N, y donde el orden no es
relevante.

=
!
! !

n!=1*2*3**n
Coeficiente binomial
O Nmero de combinaciones de tamao n
tomadas de una poblacin objetivo de
tamao N

O n! = n*(n-1)!
Permutaciones
O Subconjuntos ordenados de tamao n
tomados de un conjunto de tamao N
O Nmero de permutaciones: el nmero de
permutaciones de tamao n que se
pueden obtener de un conjunto de
tamao N, para nN, es igual a n! veces
el nmero de combinaciones del mismo
tamao
O Permutaciones de tamao n
n
P
N
=
!
!

Combinaciones y
permutaciones (n=2)
Muestras (combinaciones) Conjuntos ordenados
AB AB BA
AC AC CA
AD AD DA
BC BC CB
BD BD DB
CD CD DC
Permutaciones de tamao n
O El nmero de permutaciones de tamao
n, tomadas de un conjunto de tamao
N=n es igual a n!
Coeficiente multinomial
O Cuando se determinan las combinaciones
de tamao n en una poblacin objetivo de
tamao N, es posible ver tambin que a la
poblacin se la est partiendo en 2
grupos, uno de tamao n y otro N-n, y se
pueden obtener

combinaciones y

, a estas se las llama muestras o


combinaciones distinguibles
O Bajo estas condiciones, el nmero de
muestras o combinaciones distinguibles
cuando el espacio de eventos se
particiona en k conjuntos distinguibles o
identificables, de tamao n
1
,n
2
,n
k
se lo
denota por

1
,
2
,

y se puede
demostrar que este nmero es igual a
!

1
!
2
!

!
, de modo que estamos
asegurando que:

1
,
2
, ,

=
!

1
!
2
!

!

Muestreo con y sin reposicin
O Probabilidad condicional
Dado un experimento estadstico,
consideremos 2 eventos uno E
1
y otro E
2
,
tales que el primero ha ocurrido mientras
que el segundo E
2
, est por ocurrir. La
probabilidad de que ocurra E
2
dado que ha
ocurrido E
1
se lo denota y define como:
O
2

1
=

1

2
(
1
)
,
1

Teorema
O Si P es una funcin de probabilidades y
E1 y E2 son eventos mutuamente
excluyentes en un espacio muestral (,S),
entonces

P(E
1
E
1
UE
2
)=P(E
1
)/[P(E
1
)+P(E
2
)]
Ejemplo
O En el lanzamiento de un dado se sabe que ha
salido nmero menor que 3 o nmero mayor
que 3. Se pide, que determinemos cual es la
probabilidad que haya salido nmero menor
que 3.
E1: sale nmero menor que 3
E2: sale nmero mayor que 3
E1 y E2 son mutuamente excluyentes
P(E1)=2/6, P(E2)=3/6
P(E1

2
) =
(
1
)

1
+(
2
)
=
2/6
2
6
+
3
6
=
2
5

Eventos estocsticamente
independientes
O Sean E
1
y E
2
eventos de un mismo
espacio muestral, diremos que el evento
E
1
es estocsticamente independiente del
evento E
2
cuando y solo cuando:

P(E
2
E
1
)=P(E
2
), as como P(E
1
E
2
)=P(E
1
)
es decir que P(E
1
E
2
)=P(E
1
)P(E
2
)
Eventos estocsticamente
independientes pero no
mutuamente excluyentes
O E
1
y E
2
son estocsticamente
independientes pero no son mutuamente
excluyentes pues P(E
1
E
2
)
Teorema
O Si E
1
y E
2
son eventos independientes en
un mismo espacio muestral (,S)
entonces, tambin son independientes los
siguientes pares de eventos:
i) E
1
y E
2
c
ii) E
1
c
y E
2
iii) E
1
c
y E
2
c
O Tres eventos E
1
, E
2
y E
3
son
estocsticamente independientes, cuando
y solo cuando es verdad que se cumplen
las siguientes cuatro condiciones:
i) P(E
1
E
2
)=P(E
1
)P(E
2
)
ii) P(E
1
E
3
)=P(E
1
)P(E
3
)
iii) P(E
2
E
3
)=P(E
2
)P(E
3
)
iv) P(E
1
E
2
E
3
)=P(E
1
)P(E
2
)P(E
3
)


Teorema
O Si E
1
, E
2
y E
3
son eventos
estocsticamente independientes en un
espacio muestral , entonces es verdad
que deben:
i) E
1
y E
2
E
3
ser estocsticamente
independientes
ii) E
1
y E
2
UE
3
ser estocsticamente
independientes
iii) E
1
c
y E
2
E
3
c
ser estocsticamente
independientes


Ejemplo
O Se lanzan 4 dados de forma sucesiva,
determine la probabilidad que en los
cuatro dados salga un nmero par
P(E1)=P(E2)=P(E3)=P(E4)=1/2
P(E1 2 3 4) =
1/2 1/2 1/2 1/2 = 1/16
Regla de la probabilidad total y
Teorema de Bayes
O Supongamos que el conjunto de los
resultados posibles , espacio de
eventos, de un experimento es
particionado en k eventos, a los que
denominaremos E
1
, E
2
,,E
k
O

=1
=
O A es un evento cualquiera en
A=(AE
1
)U(AE
2
)UU(AE
k
)=
(

=1
)


O P(A)=P(AE
1
)+P(AE
2
)++P(AE
k
)=
(

=1


entonces, la regla de la probabilidad total es
P(A) = (

)(

=1
)
Teorema
O Si P(E1
2
) = (
1

2
), entonces E
1
y E
2

son estocsticamente independientes.
Teorema de Bayes
O Sea (,S) el espacio muestral de un
experimento estadstico; sean adems E
1
,
E
2
,,E
k
, k eventos exhaustivos y
mutuamente excluyentes en dicho espacio
muestral. Sea A un evento cualquiera que
resulta en el experimento. Bajo estas
condiciones,

=
(

)(

)
(

)(

=1

O Para r entero positivo constante, no mayor
que k.
Ejercicio
O En la ensambladora de Chevrolet, los tcnicos son
entrenados de 3 diferentes maneras para cumplir
con sus tareas especficas; la una forma es
entrenarlos en una planta fuera del pas (10%), la
otra en la misma planta donde van a trabajar
(55%), y la tercera forma es entrenarlos en el pas
pero en una fbrica que no es en la que van a
trabajar (35%). Se sabe que el primer tipo de
personas cumplen con sus labores el 98%, el
segundo tipo el 97%, y el tercer tipo el 95% de las
veces. Se encuentra un da cualquiera que alguien
no cumpli sus tareas especficas. Cul es la
probabilidad de que quien no cumpli fue
entrenado en el exterior?

Potrebbero piacerti anche