Sei sulla pagina 1di 39

ESTADSTICA INFERENCIAL

MSc. Patricia Castillo Aranbar

Objetivos de la asignatura

Conocimiento de herramientas y principios del anlisis estadstico de seales. Descubrir las posibles relaciones estadsticas existentes entre distintas variables/seales aleatorias (independencia, correlacin,...) y como aprovechar su conocimiento (estimacin, prediccin, etc.) Aplicacin de los conceptos tratados a otras disciplinas y problemas reales.
MSc. Patricia Castillo Aranbar

Contenido

Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar

Introduccin

En el capitulo de Estadstica Descriptiva el alumno estudi las tcnicas para resumir informacin del conjunto de datos para una variable X. Ahora bien, los datos que tratamos de estudiar pueden incluir valores de varias variables relacionadas entre si. Por ejemplo: en un individuo su altura, su peso y su edad, en un gas su presin, su volumen y su temperatura, en un vehculo su potencia, su velocidad y su consumo, etc.

Por ello en este capitulo estudiaremos las tcnicas para resumir informacin de la distribucin del conjunto de datos de los que se conocen dos variables X e Y , llamadas distribuciones bidimensionales o bivariadas.
MSc. Patricia Castillo Aranbar

Contenido

Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar

Diagramas de dispersin

Al igual que ocurre en el caso unidimensional, tambin es posible hacer grficos de distribuciones de frecuencias bidimensionales. Hay un grafico bidimensional especialmente til; este es el diagrama de dispersin que es simplemente un dibujo cartesiano de la muestra observada. La figura proporciona el diagrama de dispersin de los datos de la muestra de 33 alumnos donde se han medido su altura X y su peso Y . A la vista del diagrama de dispersin de la figura parece constatarse que el peso aumenta con la altura.
MSc. Patricia Castillo Aranbar

Contenido

Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar

Covarianza

En las siguientes figuras se muestran cuatro diagramas de dispersin. En algunos se aprecia que los puntos estn ms alineados que en otros, es decir, en algunos de ellos hay mayor grado de asociacin lineal.
Correlacin Lineal Correlacin Inversa Correlacin fuerte Correlacin dbil Correlacin Nula

MSc. Patricia Castillo Aranbar

Covarianza

La medida de asociacin lineal ms simple entre dos variables es la covarianza. Viene definida por:

y si se opera, se obtiene la expresin ms simplificada:

MSc. Patricia Castillo Aranbar

Covarianza: Ejemplo

Dada la siguiente tabla encontrar la covarianza para las dos variables x e y.

MSc. Patricia Castillo Aranbar

Contenido

Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar

Coeficiente de correlacin

El inconveniente de la covarianza como medida de la asociacin lineal entre dos variables es que depende de las unidades de X e Y , por ello se define el coeficiente de correlacin entre dos variables rxy, por:

Se define como el cociente entre la covarianza de X e Y y el producto de las desviaciones tpicas.

MSc. Patricia Castillo Aranbar

Propiedades del coeficiente de correlacin


1)

El signo del coeficiente de correlacin es el mismo que el de la covarianza.

Si la covarianza es positiva, la correlacin es directa.


Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin.
2)

El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1. 1 r 1 Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.
MSc. Patricia Castillo Aranbar

3)

4)

5)

Coeficiente de correlacin: Ejemplo

De un muelle cuelgan pesas, obtenindose los siguientes alargamientos:

Calcular e interpretar el coeficiente de correlacin entre estas variables.

Solucin: Sea x los pesos e y los alargamientos,

MSc. Patricia Castillo Aranbar

Contenido

Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar

Rectas de regresin

Los modelos de regresin provienen de los trabajos de Galton en biologa a finales del siglo XIX. Galton estudi la dependencia de la estatura de los hijos (y) respecto a la de sus padres (x), encontrando lo que denomin regresin a la media. Los padres bajos tienen hijos bajos, pero en promedio ms altos que sus padres, y los padres altos tienen hijos altos, pero en promedio ms bajos que sus padres.
La recta de regresin corresponde a la recta.

que mejor se aproxima a los puntos del diagrama de dispersin para la altura X y el peso Y .
MSc. Patricia Castillo Aranbar

Rectas de regresin

Dada la recta de regresin, a la recta y = a x + b que mejor se aproxima a la nube de puntos del diagrama de dispersin. Para hallar a y b se impone el criterio de que las suma de las distancias cuadrticas di2 sea mnima, donde para cada valor de xi, di es la diferencia entre el valor observado yi y el valor que predice la recta i = axi + b. Como tenemos dos variables, segn se tome x o y como variable independiente, tenemos dos rectas:

MSc. Patricia Castillo Aranbar

Propiedades de las rectas de regresin

Las dos rectas de regresin se cortan en el punto de las medias de las variables (x, y). El producto de las pendientes de las rectas es el cuadrado del coeficiente de correlacin.

Las rectas de regresin se usan para predecir el valor de una variable cuando se conoce la otra, y se debe cumplir que el coeficiente de correlacin sea prximo a -1 o a 1.

MSc. Patricia Castillo Aranbar

Ejemplo 1

En el ao 2000 los ingresos de determinadas empresas, en millones de soles y de empleados en miles, fue:

Determinar el coeficiente de correlacin y la recta de regresin de los ingresos respecto de los empleados. Sea x los empleados e y los ingresos,

MSc. Patricia Castillo Aranbar

Ejemplo 2

El ndice de mortalidad y de una muestra de poblacin que consuma diariamente x cigarrillos aparece en la tabla adjunta, donde se estudiaron siete muestras distintas de poblacin que consuma distinto nmero de cigarrillos:

Estudiar la correlacin. Qu ndice de mortalidad se podra predecir para un consumidor de 32 cigarrillos diarios?

MSc. Patricia Castillo Aranbar

Ejemplo 2

Sea x el nmero de cigarrillos, adems y el ndice de mortalidad

MSc. Patricia Castillo Aranbar

Ejemplo 3

La distribucin de edades y presin arterial de 10 personas es:

a) Calcular el coeficiente de correlacin.

b) Estimar la tensin de una persona de 60 aos.


Sea x la edad e y la presin arterial,

MSc. Patricia Castillo Aranbar

Ejemplo 3

Con la recta de regresin de y sobre x:

Para una edad de x = 60 aos el modelo lineal predice una presin arterial de:

MSc. Patricia Castillo Aranbar

Ejemplo 4

La tabla siguiente representa una muestra de la que se conocen.

Hallar a y b.

MSc. Patricia Castillo Aranbar

Ejercicios 8

Ejercicio 8. Se observaron las edades de 5 nios y sus pesos respectivos, obtenindose la tabla:

a) Hallar el coeficiente de correlacin y las dos rectas de regresin b) Qu peso corresponder a un nio de 5 aos? c) Qu edad corresponder a un nio de 22 kg?

MSc. Patricia Castillo Aranbar

Ejercicios 9

Ejercicio 9. Los ingresos en determinadas empresas en miles de euros y de empleados en miles es el siguiente:

a) Estudiar la correlacin entre las variables. b) Hallar la recta de regresin de los ingresos, en miles de euros, respecto de los empleados, en miles.

MSc. Patricia Castillo Aranbar

Ejercicios 10

Hallar la recta de regresin y respecto de x a partir de:

MSc. Patricia Castillo Aranbar

Contenido

Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar

Parmetros y estadsticos

Los parmetros como la media , la desviacin tpica o la proporcin p son caractersticas constantes de una poblacin. Los estadsticos como la media x, la desviacin tpica Sx o la proporcin |p| son caractersticas de las muestras y son variables aleatorias.

Ejemplo Si por ejemplo decimos que el 42% de los escolares de la comunidad suelen perder al menos un da de clase a causa de gripes y catarros, nos referimos a la poblacin y la proporcin la designamos por p = 0.42. Sin embargo, si observamos 1000 escolares donde 540 han perdido clase nos referimos a la muestra y la proporcin la designamos por |p| = 0.54.

MSc. Patricia Castillo Aranbar

Contenido

Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones muestrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar

Distribuciones muestrales

Si en una poblacin conocemos la proporcin p de los individuos que tienen cierta caracterstica, podemos elegir aleatoriamente muestras de tamao n y obtener la proporcin en cada muestra

MSc. Patricia Castillo Aranbar

Ejemplo 1

Si por ejemplo sabemos que el 40% de los escolares de nuestro instituto tienen laptop en casa, podemos preguntar aleatoriamente a grupos de tamao n = 50 y obtener la proporcin de los que tienen ordenador en cada muestra.

El n de xitos x de una muestra de tamao n se distribuye de forma binomial B(n; p), si lo aproximamos a la distribucin normal N(np;(npq)) y si se divide x por n se obtiene:
MSc. Patricia Castillo Aranbar

Ejemplo 2

En una localidad de 6000 habitantes, la proporcin de menores de 16 aos es p = 1/4.


a) Cul es la distribucin de la proporcin de menores de 16 aos en muestras de 50 habitantes de dicha poblacin? b) Halla la probabilidad de que, en una muestra de 50 habitantes, haya entre 15 y 20 habitantes menores de 16 aos.

MSc. Patricia Castillo Aranbar

Ejemplo 3

El 42% de los habitantes de un municipio es contrario a la gestin del alcalde y el resto son partidarios de este. Si se toma una muestra de 64 individuos, cul es la probabilidad de que ganen los que se oponen al alcalde?

MSc. Patricia Castillo Aranbar

Distribucin muestral de la media

Si cierta caracterstica x en una poblacin es una variable aleatoria normal N(; ), podemos elegir aleatoriamente muestras de tamao n y obtener en cada muestra la media, por ejemplo

MSc. Patricia Castillo Aranbar

Distribucin muestral de la media

Si por ejemplo sabemos que el peso de los libros de texto en el instituto se distribuye de forma normal y su peso medio es de = 400 g y su desviacin tipica = 50 g, podemos tomar aleatoriamente muestras de tamao n = 16 y obtener el peso medio

MSc. Patricia Castillo Aranbar

Distribucin muestral de la media

El peso de los libros de texto en el instituto se distribuye de forma normal con un peso medio de = 400 g y una desviacin tipica = 50 g. Si tomamos una muestra aleatoria de tamao n = 16, hallar la probabilidad de que el peso medio est entre 375 y 425 g.

El peso de los libros es

MSc. Patricia Castillo Aranbar

Bibliografa

Probabilidad y Estadstica para Ingenieros - 6ta Edicion - Ronald E. Walpole , Raymond H. Myers & Myers. P. Z. Peebles Jr., Probability, Random Variables and Random Signal Principles, cuarta edicin, McGrawHill, 2001. A. Papoulis, Probability, Random Variables and Stochastic Processes, cuarta edicin, McGrawHill, 2002.
MSc. Patricia Castillo Aranbar

GRACIAS
Estadstica Inferencial

Potrebbero piacerti anche