Sei sulla pagina 1di 23

MA34B ESTADSTICA

INTRODUCCIN
Prof. Rodrigo Abt B.
ma34b.abt@gmail.com
ALGUNAS PREGUNTAS (1)
Se lanza una moneda 10.000 veces, obtenindose un total de 4.387 caras. Est
cargada la moneda?
Un agricultor puede plantar papas o tomates. Si no llueve y planta papas, recibe
$1.000 por saco; pero si planta tomates, solo recibe $600 por saco. En cambio si
llueve y planta papas, recibe $800, frente a los $1.200 que recibira si planta
tomates. Segn el pronstico del tiempo, existe un 75% de probabilidad de que
llueva. Qu le conviene plantar al agricultor?
El ejecutivo de un banco de un conocido banco observa preocupado que 23 de la 40
cuentas que maneja presentan sobregiros, lo cual comunica al gerente. El gerente lo
tranquiliza indicando que histricamente las cuentas con sobregiro en el banco no
superan el 50%?. Debe preocuparse el ejecutivo con esta respuesta?
Una barra de acero se somete a una prueba de calor y se mide su longitud (cm) para
diferentes temperaturas (C), obtenindose la siguiente tabla:
ALGUNAS PREGUNTAS (2)
PUEDE PREDECIR LA LONGITUD
DE LA BARRA A 100 C ?
ALGUNAS PREGUNTAS (3)
QU PUEDE OPINAR AL
RESPECTO?
QU ES LA ESTADSTICA?
Es una disciplina de las matemticas utilizada para describir, analizar e
interpretar datos en los que interviene el fenmeno del azar
ESTADSTICA
DESCRIPTIVA: RECOLECCIN,
DESCRIPCIN Y RESUMEN DE DATOS
INFERENCIAL: MODELAMIENTO,
INFERENCIA Y PREDICCIN
Procesos productivos (Control de calidad)
Estudios de mercado (Clusters, Segmentacin, Encuestas)
E-Commerce, Deteccin de patrones (OCR, Redes Neuronales, Data Mining)
Bsqueda de yacimientos (Geoestadstica)
Gentica, Biotecnologa (Bioestadstica)
Economa (Series econmicas, Econometra)
Conabilidad de Materiales (Resistencia probabilstica de materiales)
Prediccin del tiempo y contaminacin ambiental
Soporte a ciencias experimentales y otras ciencias
APLICACIONES
EL RAZONAMIENTO ESTADSTICO
Todo problema estadstico correctamente planteado se puede esquematizar en los
siguientes pasos:
Paso 0: Denir objetivos y preguntas de estudio
Recoleccin de datos: denicin de universo y marco de estudio, seleccin de variables y tipo
de muestreo).
Descripcin de los datos (Estadstica Descriptiva): visualizacin, valores representativos,
variabilidad, tendencias, valores extremos, datos perdidos, limpieza, etc.).
Anlisis de los datos: estimacin, eleccin de modelos, inferencia.
Decisin-Prediccin: contraste de hiptesis iniciales, extensiones, validacin
EL AZAR
Lo que diferencia un problema estadstico de cualquier otro problema con datos es la
presencia del azar o incertidumbre.

El azar reeja la ignorancia que tenemos de las cadenas causales de la naturaleza. Los
fenmenos fortuitos son, por denicin, aquellos cuyas leyes ignoramos Henri, Poincar
(1854-1912)
En las matemticas, las variables que representan sucesos, observaciones o resultados de un
experimento en que est presente el azar reciben una denominacin bastante conocida:
variables aleatorias, lo cual sugiere el uso de PROBABILIDADES.
En Probabilidades, el punto de partida es un modelo, que proporciona la respuesta que
tericamente debiese esperarse de una variable aleatoria.
Mientras que en Estadstica, una vez obtenidos los valores de una variable aleatoria, se
intenta reconstruir el (o los) posibles modelos que generaron dichas observaciones.
PROBABILIDADES VS. ESTADSTICA
MODELO
PROBABILSTICO
DATOS
DATOS
MODELO
PROBABILSTICO
PROBABILIDADES ESTADSTICA
+ SUPUESTOS
PRESENCIA DEL ERROR (1)
Uno de los principales objetivos de la Estadstica es generar un modelo
de probabilstico que represente de mejor manera el fenmeno aleatorio
en estudio. Dado que interviene el azar, no podemos garantizar un 100%
de precisin en nuestros modelos, y por ello, debemos estar dispuestos
a tolerar un determinado margen de error.
FENMENO =
- ESTIMACIONES
- MODELOS
- DECISIONES
+
ERROR
11
PRESENCIA DEL ERROR (2)
En Estadstica el error siempre est presente, y puede provenir de dos
fuentes:
ERROR
DE MEDICIN:
-
ACOTAR
-
CONTROLAR
ALEATORIO:
- ESTIMAR
-
MODELAR
POBLACIN Y MUESTRA
Cuando un investigador trabaja con un fenmeno aleatorio, registra
datos e informacin relacionados a un conjunto de elementos o
individuos de estudio, al que se le denomina Poblacin.
La mayor parte del tiempo los investigadores trabajan con
informacin limitada de la poblacin, ya sea por tiempo, costo,
disponibilidad y/o facilidad para obtener la informacin. En este caso
se acostumbra a trabajar con un subconjunto de esta, denominado
Muestra, que debe satisfacer determinadas caractersticas para
garantizar buenos resultados.
EXPERIMENTO
Tomemos muestras de un conjunto de 100 chas con 3 colores
diferentes y analicemos los resultados. Qu se necesita para inferir la
distribucin total de colores de las chas?
Una buena muestra debe ser idealmente representativa y conable, esto es, debe reejar de
manera lo ms el posible las caractersticas de la poblacin en estudio, y adems contar con
la certeza de que los medios que se utilizaron para obtenerla garanticen dicha
representatividad.
A modo de analoga, se puede pensar que la muestra es un modelo a escala de la poblacin:
CARACTERSTICAS DE UNA
MUESTRA
La rama Estadstica del Muestreo se encarga de las tcnicas y mtodos
para determinar la muestra a utilizar. Los tipos de muestreo se pueden
resumir en el siguiente esquema:
MUESTREO
MUESTREO
NO PROBABILSTICO
PROBABILSTICO
POR CUOTA
POR CONVENIENCIA
M.A.S.
CON REEMPLAZO SIN REEMPLAZO
POR ETAPAS
POR
CONGLOMERADOS
ESTRATIFICADO
SUPUESTOS BSICOS EN
ESTADSTICA
Se tiene una poblacin P, sobre la cual queremos estudiar una
caracterstica que medimos a travs de una v.a. X.
Se toma una muestra aleatoria simple (m.a.s.) M de tamao n:
X
1
,X
2
,...X
N
en que los X
i
son i.i.d.
La v.a. X sigue una distribucin F no del todo desconocida
Se pretende determinar F
P
M
TIPOS DE VARIABLES
Si X:" # Q , dependiendo de Q, X puede ser:
Cuantitativa
Continua ( Q ! IR )
Discreta ( Q ! IN )
Cualitativa
Nominal ( Q es un conjunto de atributos o categoras )
Ordinal ( Q es un conjunto de categoras ordenadas )
JUSTIFICACIN DEL MTODO
CMO ASEGURAMOS QUE LA
MUESTRA NOS PUEDE DAR
INFORMACIN PARA
DESCIFRAR F?
CASO CUANTITATIVO (1)
Ejemplo: Supongamos que observamos los valores: 1,2 1,7 5,5 6,2 y
7,6 para una variable aleatoria continua X con distribucin F
desconocida.
Para darnos una idea de la distribucin de los valores de X, podemos
construir la distribucin emprica F
N
de X, la cual podemos denir
como:
F
n
(x) =
Card{x
i
/x
i
x}
n
CASO CUANTITATIVO (2)
CASO CUANTITATIVO (3)
La distribucin emprica Fn(x) tiene propiedades de una funcin
distribucin:
F
n
(-$) = 0
F
n
(+$) = 1
Si x%y F
n
(x)%F
n
(y)
Adems, se puede notar que nF
n
(x) corresponde al nmero de
observaciones menores o iguales a x, es decir, cuenta el nmero de
xitos entre n observaciones, por lo que nF
n
(x) se puede modelar
como una distribucin binomial, esto es: nF
n
(x) " Bin(n,P(X%x) ),
siendo la ltima probabilidad igual a F(x), la distribucin terica de X.
De la ley de los grandes nmeros se puede mostrar que si N es
grande, se debera esperar que F
N
(X) no diera mucho de F(X).
22
CASO CUALITATIVO
Si el conjunto Q = {q
1
,q
2
,...,q
n
} es un conjunto de
atributos tal que:
Representa la ley terica de probabilidades de X, y dada
una m.a.s. x
1
,x
2
,...,x
n
, se dene la ley emprica de
proporciones como:
Siguiendo un razonamiento anlogo se puede concluir
que:
f
n
(q
j
) p
j
f
n
(q
j
) =
Card{x
i
/x
i
= q
j
}
n
P(X = q
j
) = p
j
j = 1, . . . , n
NOTAS
Hemos probado que la distribucin emprica de una m.a.s. de X nos acerca a la
distribucin real de X, lo que justica esta forma de proceder.
A pesar de que las distribuciones empricas convergen a las tericas, aumentar el
tamao de muestra no siempre es conveniente, ya que, si bien el error de muestreo
decrece, los errores por causa de la poblacin y medicin aumentan. Lo ideal es
tener un equilibro entre ambos errores.
Ms que el tamao de la muestra, importa el error que se espera respecto de la
poblacin.
Para muestras grandes la diferencia entre usar muestreo con o sin reemplazo es
despreciable.
Los valores obtenidos de una m.a.s. son aleatorios, y por ende al repetir el
experimento, los valores cambian.

Potrebbero piacerti anche