Sei sulla pagina 1di 89

Fundamentos de Estadstica

Introduccin a la Estadstica
Prof. Dr. Eduardo Valenzuela D.
eduardo.valenzuela@usm.cl

Universidad Tecnica Federico Santa Mara

Magster en Economa Energetica p. 1/6

Introduccin
Modelacin

Realidad versus Modelo

Magster en Economa Energetica p. 2/6

Introduccin
Modelacin

Realidad versus Modelo Modelos Deterministicos

Magster en Economa Energetica p. 2/6

Introduccin
Modelacin

Realidad versus Modelo Modelos Deterministicos Modelos no-Deterministicos

Magster en Economa Energetica p. 2/6

Introduccin
Modelacin

Realidad versus Modelo Modelos Deterministicos Modelos no-Deterministicos Toma de decisiones bajo Incertidumbre

Magster en Economa Energetica p. 2/6

Denicin
Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenmenos no-deterministicos Algunas aplicaciones:

Magster en Economa Energetica p. 3/6

Denicin
Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenmenos no-deterministicos Algunas aplicaciones: Ingeniera

Magster en Economa Energetica p. 3/6

Denicin
Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenmenos no-deterministicos Algunas aplicaciones: Ingeniera Compaas de Seguros

Magster en Economa Energetica p. 3/6

Denicin
Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenmenos no-deterministicos Algunas aplicaciones: Ingeniera Compaas de Seguros Estudios de Mercado

Magster en Economa Energetica p. 3/6

Denicin
Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenmenos no-deterministicos Algunas aplicaciones: Ingeniera Compaas de Seguros Estudios de Mercado Control de Calidad

Magster en Economa Energetica p. 3/6

Denicin
Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenmenos no-deterministicos Algunas aplicaciones: Ingeniera Compaas de Seguros Estudios de Mercado Control de Calidad Instrumentos Financieros

Magster en Economa Energetica p. 3/6

Denicin
Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenmenos no-deterministicos Algunas aplicaciones: Ingeniera Compaas de Seguros Estudios de Mercado Control de Calidad Instrumentos Financieros Medicina

Magster en Economa Energetica p. 3/6

Algunos Trminos
Poblacin: Coleccin completa de todas los individuos de interes para el investigador. Parmetro: Valor que caracteriza un aspecto de la poblacin. Muestra: Subconjunto de la poblacin y que es representativa de esta. Estadistico: Medida descriptiva de la muestra que se utiliza para estimar al respectivo parmetro poblacional. Variable: Caracteristica de la poblacin que se analiza en el estudio estadistico.

Magster en Economa Energetica p. 4/6

Tcnicas de Muestreo
Muestreo Aleatorio simple: Procedimiento mediante el cul todas las muestras de un determinado tamao, poseen la misma "chance" de ser extraidas. Muestreo Aleatorio Estraticado: Esquema de muestreo que primero particiona a la poblacin en diversos "estratos" y posteriormente extrae una mustra aleatoria simple en cada uno de ellos.

Magster en Economa Energetica p. 5/6

Muestreo
Error muestral: Diferencia entre el valor del parmetro poblacional y el producido por el estadistico o estadigrafo basado en una muestra. Sesgo muestral: Tendencia a favorecer la seleccin de determinados individuos de la poblacin.

Magster en Economa Energetica p. 6/6

Muestreo Poblacin vs Muestra Muestreo implica Error muestral Acotar la probabilidad de cometer errores Estadistica Descriptiva Inferencial

Magster en Economa Energetica p. 7/6

Tipos de Variables
Variables cualitativas: Caracteristica que representa una cualidad de los individuos poblacionales. Variables cuantitativas: Caracteristica que corresponde a una magnitud asociada a laos individuos de la poblacin.

Magster en Economa Energetica p. 8/6

Escalas de Medicin
Escala nominal: Nombres o clases que se utilizan para organizar los datos en categorias separadas y distintas. Escala ordinal: Mediciones que jerarquizan los datos en categorias, ordenadas en virtud de un determinado criterio.

Magster en Economa Energetica p. 9/6

Escalas de Medicin
Escala de intervalos: Mediciones respecto de una escala numerica en la cual la diferencia entre valores tiene interpretacin y la ubicacin del cero es arbitrario. Escala de proporciones: Mediciones respecto de una escala numerica en la cual tanto la diferencia como los cuocientes tienen interpretacin y la ubicacin del cero es absoluto.

Magster en Economa Energetica p. 10/6

Estadistica Descriptiva
Proporciona procedimientos que permiten organizar, procesar y presentar los datos muestrales con el n de extraer informacin relevante que este contenida en ellos. Datos Muestrales Clasicacin
A1 , A2 , . . . , Ak : clases

Magster en Economa Energetica p. 11/6

Nmero de clases
Si se dispone de n datos muestrales, se suele usar la regla de Sturges: k = [3, 3 log n] + 1
k = [3, 3 log 1000] + 1 = [3, 3 3] + 1 = 9 + 1 = 10

Ejemplo: Para n = 1000, usar:

clases

Magster en Economa Energetica p. 12/6

Observaciones y Preguntas
Las clases deben ser excluyentes y todo elemento muestral debe pertenecer a una de ellas. Existen clases que concentren mas datos?. Se presenta un comportamiento uniforme?. Se visualiza mas de un punto de concentracin?.

Magster en Economa Energetica p. 13/6

Construccin de clases
Si los datos muestrales estan medidos por lo menos al nivel de intervalos y si los representamos por:
x1 , x2 , . . . , xn

entonces la amplitud de las clases es de:


max xi min xi c= k

Magster en Economa Energetica p. 14/6

Construccin de clases
con esto se determinan los limites superior e inferior de cada clase:
clase limites relacin A1 [a1 b1 ] b1 = a1 + c A2 ]a2 b2 ] b2 = a2 + c . . . . . . . . . Ak ]ak bk ] bk = ak + c

en donde a1 = min xi y ak+1 = bk

Magster en Economa Energetica p. 15/6

Ejemplo
Consideremos una muestra de n = 50 datos: 68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81 84 92 77 57 70 59 85 74 78 79 91 102 83 67 66 75 79 82 93 90 101 80 79 69 76 94 71 97 95 83 86 69 numero de clases: k = [3, 3 log 50] + 1 = 6

Magster en Economa Energetica p. 16/6

Continuacin Ejemplo
min xi = 50 y max xi = 102, por lo que c = 10250 = 8, 7 6 redondeando, tomaremos c = 9, con lo que las clases quedan: clase limites marca de clase A1 [50 59] 54, 5 A2 ]59 68] 63, 5 A3 ]68 77] 72, 5 A4 ]77 86] 81, 5 A5 ]86 95] 90, 5 A6 ]95 104] 99, 5

Magster en Economa Energetica p. 17/6

Grco de Tallo y Hoja


Una forma alternativa de visualizar los datos, es mediante el grco de tallo y hoja: La coma decimal esta un digito a la derecha de los dos puntos:
5 6 7 8 9 10 : : : : : : 079 0567899 001122344567788999 001233344456 01233457 12

Magster en Economa Energetica p. 18/6

Distribuciones de Frecuencias
Para descubrir como se reparten los datos entre las clases, consideraremos las frecuencias Frecuencia absoluta: Es el nmero de observaciones muestrales que caen en cada clase: ni , para i = 1, . . . , k . Frecuencia relativa: Es la proporcin de datos con respecto a toda la muestra que pertenecen a cada clase: fi , para i = 1, . . . , k . Se tiene que: fi =
ni n

Magster en Economa Energetica p. 19/6

Distribuciones de Frecuencias
Frecuencia absoluta acumulada: Es la suma acumulada de las frecuencias absolutas hasta cada clase: Ni , para i = 1, . . . , k . con Ni = i nj , para j=1 i = 1, . . . , k Frecuencia relativa acumulada: Es la suma acumulada de las fercuencias relativas hasta cada clase: Fi , para i = 1, . . . , k . con Fi = i fj , para i = 1, . . . , k j=1 Se tiene que: Fi =
Ni n

Magster en Economa Energetica p. 20/6

Ejemplo
clase limites A1 [50 59] A2 ]59 68] A3 ]68 77] A4 ]77 86] A5 ]86 95] A6 ]95 104] total ni 3 5 15 17 7 3 50 Ni 3 8 23 40 47 50 fi 0, 06 0, 10 0, 30 0, 34 0, 14 0, 06 1, 00 Fi 0, 06 0, 16 0, 46 0, 80 0, 94 1, 00

Magster en Economa Energetica p. 21/6

Representaciones Grcas
Otra forma de representar la informacin muestral, es mediante grcos Histograma: Se gracan las frecuencias con respecto a las diversas clases. Poligono de frecuencias: Representa las frecuencias en las marcas de clases unidas por segmentos de rectas. Distribucion de frecuencias acumuladas: Aqui se representan las frecuencias acumuladas hasta cada clase.

Magster en Economa Energetica p. 22/6

Representaciones Grcas
Ojiva: Poligonal que une las frecuencias acumulativas en cada clase. Grco de barras: Las frecuencias se representan por barras proporcionales a ellas. Grcos circulares: Las frecuencias se muestran como sectores circulares.

Magster en Economa Energetica p. 23/6

Histograma
Histograma de x

0.0 50

0.01

0.02

0.03

60

70

80 x

90

100

110

Magster en Economa Energetica p. 24/6

Ojiva
Ojiva de x
1.0 Frec 0.0 50 0.2 0.4 0.6 0.8

60

70 x

80

90

100

Magster en Economa Energetica p. 25/6

Pastel
Grafico circular de x

Magster en Economa Energetica p. 26/6

Estadistica descriptiva bivariada


Analisis descriptivo conjunto de dos o mas variables. Si (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) es una muestra bivariada de las variables X e Y . Si k es el nmero de clases para X y l, para Y , se denen: Frecuencia absoluta conjunta: El nmero de observaciones muestrales que caen en la clase Ai segun X y en la clase Bj segun Y .
ni,j , i = 1, . . . , k, j = 1, . . . , l

Frecuencia relativa conjunta: Proporcin muestral de ni,j .

Magster en Economa Energetica p. 27/6

Tablas de contingencia
Se denen las frecuencias marginales de X e Y respectivamente por:
l k

ni,. =
j=1

ni,j , n.,j =
i=1

ni,j

y las respectivas frecuencias relativas conjuntas y marginales por:


fi,j ni,j ni,. n.,j = , fi,. = , f.,j = n n n

Magster en Economa Energetica p. 28/6

Ejemplo
[1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] 15 8 4 5 12 9 2 13 10 1 16 18
ni,.

113

Magster en Economa Energetica p. 29/6

Ejemplo
[1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] 15 8 4 5 12 9 2 13 10 1 16 18
ni,. 27 26 25 35 113

Magster en Economa Energetica p. 29/6

Ejemplo
[1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] ni,. 15 8 4 5 12 9 2 13 10 1 16 18 23 49 41 113

Magster en Economa Energetica p. 29/6

Ejemplo
[1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] ni,. 15 8 4 27 5 12 9 26 2 13 10 25 1 16 18 35 23 49 41 113

Magster en Economa Energetica p. 29/6

Medidas de tendencia central


Son estadisticos que proporcionan valores representativos de la muestra, de tal manera que todos los datos muestrales caen en torno a estos valores. Moda Mediana Media ( geomtrica ) Media ( aritmtica )

Magster en Economa Energetica p. 30/6

Si los datos muestrales han sido agrupados en clases y estas marcas de clase son x1 , . . . , xk con frecuencias relativas fi . Se dene la media de x por
k

x=
i=1

1 f i xi = n

n i xi
i=1

Magster en Economa Energetica p. 31/6

Medidas de variabilidad
Las medidas de variabilidad o de dispersin, pretenden cuanticar el grado de homogeneidad presente en la muestra; determinan que tan concentrados o dispersos estan los datos. Algunas medidad de dispersin son: Rango Desviacin media Rango intercuartlico Varianza y Desviacin estandar

Magster en Economa Energetica p. 32/6

La varianza se dene por:


k 2 Sx

=
i=1

1 fi (xi x) = n
2

k i=1

ni (xi x)2

y la desviacin estandar por:


2 Sx = + Sx

Magster en Economa Energetica p. 33/6

Observacin
Cabe hacer notar que cuando la varianza muestral se usa como un estimador de la varianza poblacional, su denicin se modica levemente en la forma:
1 2 S = n1
k i=1

ni (xi x)2

Esta varianza modicada es preferible como estimador, 2 pues posee mejores propiedades que Sx .

Magster en Economa Energetica p. 34/6

Desigualdad de Tschebyscheff
Una interpretacin interesante de la desviacion estandar es la proporcionada por la Desigualdad de Tschebyscheff, que plantea intuitivamente que: En todo conjunto de observaciones y para todo numero real r > 1, se tiene que al menos 1 r12 de ellas caen en el intervalo: [ rSx ; x + rSx ] x

Magster en Economa Energetica p. 35/6

Grcamente:

Magster en Economa Energetica p. 36/6

Resumen
Las principales medidas descriptivas de la muestra son:
Resumen de $x$ Min. 1st Q. Med. Mean 3rd Q. Max. 50.00 71.00 78.50 78.36 84.00 102.00 N = 50 Median = 78.5 Quartiles = 71; 84

Que pueden representarse grcamente por:

Magster en Economa Energetica p. 37/6

Grco de Cajn
1.0 -1.0 -0.5 0.0 0.5

Magster en Economa Energetica p. 38/6

Elementos de Inferencia Estadstica


Al modelar un fenmeno en la vida real, las variables que nos interesan generalmente son de naturaleza no-deterministica y en consecuencia pueden representarse por variables aleatorias. Para poder obtener probabilidades asociadas a estas variables aleatorias X , podemos ocupar su funcion de distribucion FX : FX (x) = P [X x]

Magster en Economa Energetica p. 39/6

Problema
Pero en la mayoria de los casos, esta funcin, depender de parmetros desconocidos , es decir tenemos:
FX (x; ) = P [X x]

y para que estos modelos sean de alguna utilidad, se requiere previamente estimar estos parametros a partir de informacion emprica recopilada a partir de una muestra aleatoria de X .

Magster en Economa Energetica p. 40/6

Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica:

Magster en Economa Energetica p. 41/6

Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica: Estimacion puntual.

Magster en Economa Energetica p. 41/6

Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica: Estimacion puntual. Estimacion por intervalos de conanza.

Magster en Economa Energetica p. 41/6

Problemas
Esto nos lleva a los principales problemas de la inferencia estadistica: Estimacion puntual. Estimacion por intervalos de conanza. Prueba de hipotesis.

Magster en Economa Energetica p. 41/6

Estimacion puntual
En el mbito de la estimacion puntual se han desarrollado diversos metodos para construir estimadores puntuales, entre ellos:

Lo que hace necesario denir cualidades de los estimadores, para asi poder seleccionar el mejor entre varios posibles.

Magster en Economa Energetica p. 42/6

Estimacion puntual
En el mbito de la estimacion puntual se han desarrollado diversos metodos para construir estimadores puntuales, entre ellos: Mtodo de momentos.

Lo que hace necesario denir cualidades de los estimadores, para asi poder seleccionar el mejor entre varios posibles.

Magster en Economa Energetica p. 42/6

Estimacion puntual
En el mbito de la estimacion puntual se han desarrollado diversos metodos para construir estimadores puntuales, entre ellos: Mtodo de momentos. Mtodo de minimos cuadrados. Lo que hace necesario denir cualidades de los estimadores, para asi poder seleccionar el mejor entre varios posibles.

Magster en Economa Energetica p. 42/6

Estimacion puntual
En el mbito de la estimacion puntual se han desarrollado diversos metodos para construir estimadores puntuales, entre ellos: Mtodo de momentos. Mtodo de minimos cuadrados. Mtodo de mxima verosimilitud. Lo que hace necesario denir cualidades de los estimadores, para asi poder seleccionar el mejor entre varios posibles.

Magster en Economa Energetica p. 42/6

Propiedades
Entre las principales propiedades de los estimadores se cuentan:

Magster en Economa Energetica p. 43/6

Propiedades
Entre las principales propiedades de los estimadores se cuentan: Insesgamiento

Magster en Economa Energetica p. 43/6

Propiedades
Entre las principales propiedades de los estimadores se cuentan: Insesgamiento Varianza minima

Magster en Economa Energetica p. 43/6

Propiedades
Entre las principales propiedades de los estimadores se cuentan: Insesgamiento Varianza minima Error cuadratico minimo

Magster en Economa Energetica p. 43/6

Propiedades
Entre las principales propiedades de los estimadores se cuentan: Insesgamiento Varianza minima Error cuadratico minimo Eciencia

Magster en Economa Energetica p. 43/6

Propiedades
Entre las principales propiedades de los estimadores se cuentan: Insesgamiento Varianza minima Error cuadratico minimo Eciencia Consistencia

Magster en Economa Energetica p. 43/6

Ejemplo
Supongamos que la variable aleatoria X esta distribuida normalmente: X N (, 2 ) Se dice que X1 , . . . , Xn es una Muestra aleatoria de X , si: Los X1 , . . . , Xn son independientes Cada Xi posee la misma ditribucion que X

Magster en Economa Energetica p. 44/6

Ejemplo
Usando estos datos se pueden obtener estimadores puntuales de los parametros y 2 , los cuales poseen varias de las propiedades anteriores; ellos son:
n = 1 X n
2 Sn n

Xi
i=1

1 = n1

n i=1

(Xi Xn )2

que son la media y varianza muestral.

Magster en Economa Energetica p. 45/6

Ejemplo
Notemos que los valores que estos estimadores producen, dependen de los valores muestrales y en consecuencia cambiaran de una a otra muestra. Esto nos lleva a considerar las distribuciones muestrales de estos estimadores.

Magster en Economa Energetica p. 46/6

Distribuciones muestrales
Bajo la suposicion de que:
X N (, 2 )

se puede vericar que la distribucion empirica de la media muestral a partir de una muestra aleatoria de tamao n es:
2 Xn N (, ) n

que es nuevamente una normal.

Magster en Economa Energetica p. 47/6

Distribuciones muestrales
Analogamente la distribucion empirica de la varianza muestral es: 2 (n 1)Sn 2 (n 1) 2 que se denomina Chi cuadrado con n 1 grados de libertad y que para usarla al igual que la normal, hay que recurrir a tablas estadisticas

Magster en Economa Energetica p. 48/6

Otras distribuciones
Ademas de estas distribuciones, es necesario considerar otras mas que aparecen en los procesos de estimacion y prueba de hipotesis, ellas son: La distribucion t de student con k grados de libertad, que se simboliza por t(k). La distribucion Fisher con k y l grados de libertad, que se representa por F (k, l).

Magster en Economa Energetica p. 49/6

Otras distribuciones
Analogamente a la distribucion normal y chi-cuadrado, para evaluar probabilidades asociadas a ellas, es necesario obtener los valores usando una tabla estadistica, una calculadora que las tenga implementadas o un programa computacional adecuado.

Magster en Economa Energetica p. 50/6

Observacin
Cabe hacer notar que si bien es cierto estos estimadores puntuales, al evaluarlos en los datos muestrales, nos proporcionan una estimacion puntual, que sirve para aproximar el valor desconocido del parametro en estudio; ellos no entregan idea alguna sobre el error que se produce en este proceso de estimacion.

Magster en Economa Energetica p. 51/6

Observacin
Para poder cuanticar este error, se requeriria estimar los parametros por medio de un intervalo de conanza, que nos indique una region que pudiera contener al parametro buscado, mas una evaluacion de la proporcion de veces que tomaremos una decision correcta al usar este procedimiento, para estimar los parametros; esto se conoce como el coeciente de conanza

Magster en Economa Energetica p. 52/6

Estimacion por intervalos de conanza


Llamaremos un intervalo de conanza para el parametro con coeciente de conanza , a un intervalo del tipo:
[T1 (X1 , . . . , Xn ); T2 (X1 , . . . , Xn )]

que cumpla:
P [T1 T2 ]

Magster en Economa Energetica p. 53/6

Estimacion por intervalos de conanza


Se puede ver que si X N (, 2 ), entonces el intervalo de conanza para con coeciente de conanza esta dado por:
S S n n t(1+)/2 (n 1); Xn + n t(1+)/2 (n 1)] [X n n

Magster en Economa Energetica p. 54/6

Observacin
Existen algunas situaciones en las cuales la varianza 2 se conoce y por lo tanto no se requiere previamente estimarla. Tambien en aquellos casos en que el tamao muestral n crece tendiendo a innito n , se puede vericar que la distribucion t de student se aproxima en un cierto sentido a la distribucion normal.

Magster en Economa Energetica p. 55/6

Observacin
Para estas situaciones, que se denominan muestras grandes, el intervalo de conanza para la media muestral Xn se transforma en:
n z(1+)/2 ; Xn + z(1+)/2 ] [X n n

Magster en Economa Energetica p. 56/6

Continuacin
Analogamente se puede obtener el intervalo de conanza para 2 con coeciente de conanza , resultando:
2 2 (n 1) Sn (n 1) Sn ; (1+)/2 (n 1) (1)/2 (n 1)

El uso de estos intervalos de conanza nos permite estimar los parametros de interes, indicando la precision que permiten obtener los datos disponibles.

Magster en Economa Energetica p. 57/6

Prueba de Hiptesis
Existen situaciones en las cuales se tiene algun conocimiento previo sobre los parametros de una distribucin ( Hipotesis ) y se desea analizar si este supuesto es consecuente con los datos muestrales. Esto lleva a una Prueba de Hiptesis, para lo que se necesita:

Magster en Economa Energetica p. 58/6

Prueba de Hiptesis

Magster en Economa Energetica p. 59/6

Prueba de Hiptesis
Una hipotesis nula H0 .

Magster en Economa Energetica p. 59/6

Prueba de Hiptesis
Una hipotesis nula H0 . Una hipotesis alternativa H1 .

Magster en Economa Energetica p. 59/6

Prueba de Hiptesis
Una hipotesis nula H0 . Una hipotesis alternativa H1 . Una funcion de los datos T (X1 , . . . , Xn ), cuya distribucin bajo H0 se conozca.

Magster en Economa Energetica p. 59/6

Prueba de Hiptesis
Una hipotesis nula H0 . Una hipotesis alternativa H1 . Una funcion de los datos T (X1 , . . . , Xn ), cuya distribucin bajo H0 se conozca. Un nivel de signicancia 0 < < 1.

Magster en Economa Energetica p. 59/6

Prueba de Hiptesis
Una hipotesis nula H0 . Una hipotesis alternativa H1 . Una funcion de los datos T (X1 , . . . , Xn ), cuya distribucin bajo H0 se conozca. Un nivel de signicancia 0 < < 1. Una regin de rechazo.

Magster en Economa Energetica p. 59/6

Acciones
Al tomar la decisin de rechazar o no la hiptesis nula sobre la base de los datos muestrales, se producen las siguientes posibilidades: accin ; realidad rechazar H0
H0 verdadera H0 falsa

Error I

Correcto

no rechazar H0 Correcto Error II La idea es limitar a valores pequeos las probabilidades de estos errores.

Magster en Economa Energetica p. 60/6

Magster en Economa Energetica p. 61/6

Potrebbero piacerti anche