Sei sulla pagina 1di 34

UNIVERSIDAD DE LOS ANDES Facultad de Ingeniera Departamento de Ingeniera Industrial Probabilidad y Estadstica I

Sesin # 2 Estadstica Descriptiva y Representacin Grfica de Datos Estadsticos Mario Castillo (Coordinador General Curso)
1

Contenido
1. Contexto General - Escalas de Medicin - Poblacin - Variables Aleatorias - Muestras Distribucin de Frecuencias de una Variable Aleatoria - Variables discretas - Variables continuas - Variables categricas Estadsticas Bsicas Medidas de Tendencia - Media Muestral - Mediana Muestral - Percentiles y Cuartiles Medidas de Variabilidad - Varianza Muestral - Desviacin Muestral Casos de Aplicacin

2.

3.

4.

1. Contexto General
Escalas de Medicin
Estadsticas Descriptivas Permitidas Escala Descripcin Ejemplos

1.

2. Razn

3.

Para dos valores x1 y x2 el cociente x1/x2 es una cantidad con un significado prctico. El 0 corresponde a la ausencia del atributo. Para dos valores x1 y x2 la distancia (x1- x2) es una cantidad con un significado prctico Hay un orden natural (ascendente o descendente) de los valores a travs de la escala.

Longitud Peso Estatura Dinero

La media geomtrica, la media armnica, la media, el rango y la desviacin estndar

Intervalo

Satisface las propiedades 2 y 3 de la escala de Razn, pero no la 1.

Temperatura (Celsius o Fahrenheit) Aos Calendario. Talla de zapatos.

El rango, la media y la desviacin estndar.

1. Contexto General
Escalas de Medicin

Escala

Descripcin

Ejemplos

Estadsticas Descriptivas Permitidas

Ordinal

Satisface nicamente la tercera propiedad de la escala de Razn.

Clasificacin de los equipos en un torneo Estratos Calificaciones A, B, C

Los percentiles.

Nominal

No satisface ninguna de las propiedades de la escala de Razn. Comprende variables que identifican atributos o cualidades.

Color de los ojos Gnero Nmero de telfono

El porcentaje y la moda.

1. Contexto General
Poblacin Conjunto (personas, cosas u objetos abstractos) del cual se quiere estudiar ciertas propiedades caractersticas de los elementos que lo conforman. Dichas propiedades se expresan a travs de variables que denotaremos por X, Y y Z, por ejemplo. Muestra Aleatoria Conceptualmente: una muestra aleatoria de tamao n de una poblacin es un subconjunto de n elementos de la poblacin seleccionados de acuerdo con un procedimiento aleatorio que garantice su representatividad. Formalmente: Una MA de una poblacin X, consiste en un conjunto X1, X2, ..., Xn de n Variables Aleatorias independientes que tienen la misma distribucin que la VA X.

Distribucin de Frecuencias de una Variable Aleatoria Variables Discretas

Intensidad del trfico 16 14 12 10 8 6 4 2 0 Intensidad del trfico 1 3 2 11 3 10 4 15 5 9


0 Facilidad de parqueo 10 5 20 15 25

Facilidad de parqueo

1 4

2 6

3 7

4 9

5 22

Visibilidad y facilidad de acceso al punto 16 14 12 10 8 6 4 2 0 Visibilidad y facilidad de acceso al punto 1 4 2 14 3 7 4 13 5 10

2. Distribucin de Frecuencias de una Variable Aleatoria Variables Continuas


Promedio Transacciones 3 ltimos Meses

Histograma Variable Ingresos Cajero


12

14 12

10

Frecuencia
400 o menos 401600 601800 8011000 10011200 12011400 14011600 16011800 18012000 20012200 22012400 2400 o ms Transacciones Mensuales

Frecuencia

10 8 6 4 2 0

8 6 4 2 0

00 80 00 0 10 000 00 12 000 00 14 000 00 16 000 00 18 000 00 20 000 00 22 000 00 24 000 0 26 000 00 0 28 000 00 0 0 y 000 m ay or ...
Clase

60

2. Distribucin de Frecuencias de una Variable Aleatoria Variables Categricas

Estrato 16 14 12 10 8 6 4 2 0
2 3 4 5 6

Estrato

3. Estadsticas Bsicas - Medidas de Tendencia


Consideremos una Muestra Aleatoria x1, x2, , xn de una poblacin dada. n La Media Muestral se define por: X = ( X i ) / n
i =1

La Mediana Muestral Corresponde al valor medio de las n observaciones. Para calcularlo, se ordenan las n observaciones (incluyendo las que tienen valores repetidos) Si n es impar: mediana = [(n +1)/2] simo valor de la muestra. Si n es par: mediana = promedio entre el [n /2] simo y el [(n/2) + 1] simo valores de la muestra.

Mediana Muestral - Ejemplo


Si n es impar: mediana = [(n +1)/2] simo valor de la muestra. Si n es par: mediana = promedio entre el [n /2] simo y el [(n/2) + 1] simo valores de la muestra.

= (10.2 + 10.9)/2

10

Considere los siguientes datos sobre la concentracin de globulina receptora, para una muestra de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de hierro: x1 = 15.2 x2 = 9.3 x3 = 7.6 x4 = 11.9 x5 = 10.4 x6 = 9.7 x7 = 20.4 x8 = 9.4 x9 = 11.5 x10 = 16.2 x11 = 9.4 x12 = 8.3 Determine la mediana muestral de las observaciones.

a. b. c. d.

11.61 9.7 9.4 10.05

11

Ejercicio Mediana Muestral Respuesta


1 2 3 4 5 6 7 8 9 10 11 12 15.2 9.3 7.6 11.9 10.4 9.7 20.4 9.4 11.5 16.2 9.4 8.3 7.6 8.3 9.3 9.4 9.4 9.7 10.4 11.5 11.9 15.2 16.2 20.4

Si n es impar: mediana = [(n +1)/2] simo valor de la muestra. Si n es par: mediana = promedio entre el [n /2] simo y el [(n/2) + 1] simo valores de la muestra.

Media Muestral Mediana

11.61 10.05

= (9.7 + 10.4)/2

12

Relacin Medidas de Tendencia

13

14

Estadsticas Bsicas - Medidas de Variabilidad Varianza Muestral


S
2

1 n 2 = ( xi x ) n 1 i =1

Desviacin Estndar Muestral s =

+ S

15

Varianza Muestral - Ejemplo


S
2

1 n 2 = ( xi x ) n 1 i =1

16

Considere los siguientes datos sobre la concentracin de globulina receptora, para una muestra de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de hierro: x1 = 15.2 x7 = 20.4 x2 = 9.3 x8 = 9.4 x3 = 7.6 x9 = 11.5 x4 = 11.9 x10 = 16.2 x5 = 10.4 x11 = 9.4 x6 = 9.7 x12 = 8.3

Determine la varianza muestral de las observaciones. a. b. c. d. 3.79 3.63 14.41 13.21

Ejercicio Varianza Muestral Solucin


S
2

1 n 2 = ( xi x ) n 1 i =1

xi 15,2
9,3 7,6 11,9 10,4 9,7 20,4 9,4 11,5 16,2 9,4 8,3 139,3 11,6083333

( xi x ) 2
12,9000694 5,32840278 16,0667361 0,08506944 1,46006944 3,64173611 77,2934028 4,87673611 0,01173611 21,0834028 4,87673611 10,9450694 158,569167 14,4153788

xi =

( xi x ) 2 =
s2 =

x=

18

Estadsticas Bsicas y Cuartiles y Percentiles


Estadsticos salary N Media Mediana Desv. tp. Varianza Mnimo Mximo Percentiles Vlidos Perdidos 474 0 34419,57 28875,00 17075,66 3E+008 15750,00 135000,00 21000,00 22950,00 24000,00 24825,00 26700,00 28875,00 30750,00 34500,00 37162,50 41100,00 59700,00

10 20 25 30 40 50 60 70 75 80 90

19

ANLISIS DEL PUNTAJE UNIANDES CON BASE EN EL RENDIMIENTO DE LOS ESTUDIANTES DE PRIMER SEMESTRE DE 2000-II
Realizado por: Carlos Castellanos Dirigido por: Mario Castillo

20

OBJETIVOS
Analizar la poblacin de los estudiantes que cursaron primer semestre en el segundo periodo del 2000 respecto a su desempeo acadmico y su relacin con el puntaje uniandes Analizar la capacidad de prediccin del puntaje uniandes Formular las conclusiones y recomendaciones

21

METODOLOGA

Anlisis descriptivo
General Por programa Por colegio

Anlisis estadstico avanzado


Factorial Discriminante

22

Qu es un estudiante exitoso?
Se define como exitoso al estudiante que logre un promedio acumulado superior a 3.25; sin embargo, el punto de corte se maneja como un parmetro. Se toma como otro punto de referencia un promedio acumulado de 3.5

23

HISTOGRAMA DEL PROMEDIO ACUMULADO


Histogram
70 60

50

40 30

20

Frequency

10 0

Std. Dev = .50 Mean = 3.66 N = 575.00

Promedio de los estudiantes de segundo semestre del 2000

88 4. 63 4. 38 4. 13 4. 88 3. 63 3. 38 3. 13 3. 88 2. 63 2. 38 2. 13 2. 88 1. 63 1.

24

HISTOGRAMA DEL PUNTAJE TOTAL UNIANDES


Histogram
50

40

30

20

Frequency

10

Std. Dev = 139.74 Mean = 458.4 N = 575.00


0 5. 77 0 5. 72 0 5. 67 0 5. 62 0 5. 57 0 5. 52 0 5. 47 0 5. 42 0 5. 37 0 5. 32 0 5. 27 0 5. 22

Puntaje uniandes total

25

DISTRIBUCIN POR QUINTILES

26

MEDIAS DE LOS PROMEDIOS ACUMULADOS POR QUINTILES

27

Tabulacin Cruzada
Quintiles del puntaje uniandes * Quintiles del promedio acumulado

Quintiles del puntaje uniandes

20.00 40.00 60.00 80.00 100.00

Total

20.00 44 27 26 14 8 119

Quintiles del promedio acumulado 40.00 60.00 80.00 31 21 14 35 19 23 25 27 20 16 30 31 8 15 30 112 118 115

100.00 6 11 16 26 52 111

Total 116 115 114 117 113 575

28

ANLISIS DE LOS COLEGIOS DE MS APORTE


Cdigo Colegio 19489 19472 24299 24281 55988 19513 19331 19422 19349 36723 19364 16741 19505 19497 62497 19448 46490 16774 62208 4234 21899 25395 34306 19430 22574 Ciudad BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. CALI, VALLE BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. CALI, VALLE BOGOTA D.C. CARTAGENA, BOLIVAR BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. BOGOTA D.C. N 8 33 18 13 14 18 13 8 23 13 31 9 16 7 12 29 14 5 7 7 12 11 7 9 5 TOT_PROM %Prom inf. a 3.25 %Prom inf. a 3.5 4.23 0.00 12.50 4.07 3.03 12.12 4.01 5.56 5.56 3.92 15.38 23.08 3.91 7.14 7.14 3.82 0.00 11.11 3.81 15.38 15.38 3.81 25.00 25.00 3.79 8.70 17.39 3.79 7.69 15.38 3.66 12.90 19.35 3.66 22.22 44.44 3.62 12.50 43.75 3.6 14.29 57.14 3.59 0.00 41.67 3.55 24.14 27.59 3.54 14.29 42.86 3.51 20.00 60.00 3.5 14.29 57.14 3.49 28.57 42.86 3.43 33.33 58.33 3.38 36.36 63.64 3.28 42.86 85.71 3.27 55.56 66.67 3.16 40.00 80.00

29

CROSSTABS

30

QUINTILES IDENTIFICADOS

Quintiles

PROMEDIO EN MATEMTICAS

PROMEDIO EN FSICA

PUNTAJE UNIANDES

FISICA

MATEMATICAS

QUIMICA

20 40 60 80

2,80 3,11 3,39 3,72

2,67 3,00 3,33 3,67

361 444 518 608

50 54 57 61

45 48 52 56

52 55 59 63

31

QUINTILES ICFES EN MATEMTICAS VS. PROMEDIO EN MATEMTICAS


Tabla de contingencia Quintiles Matemticas ICFES * Quintiles cursos Matemticas Quintiles cursos Matemticas 2 3 4 99 90 54 26,4% 67 21,9% 104 20,6% 90 20,5% 56 12,9% 416 20,2% 24,0% 66 21,6% 106 21,0% 95 21,6% 84 19,4% 441 21,4% 14,4% 48 15,7% 104 20,6% 94 21,4% 97 22,4% 397 19,3%

1 Quintiles Matemticas ICFES 1 Recuento % de Quintiles Matemticas ICFES Recuento % de Quintiles Matemticas ICFES Recuento % de Quintiles Matemticas ICFES Recuento % de Quintiles Matemticas ICFES Recuento % de Quintiles Matemticas ICFES Recuento % de Quintiles Matemticas ICFES 94 25,1% 83 27,1% 113 22,4% 75 17,1% 44 10,2% 409 19,9%

5 38 10,1% 42 13,7% 77 15,3% 85 19,4% 152 35,1% 394 19,2%

Total 375 100,0% 306 100,0% 504 100,0% 439 100,0% 433 100,0% 2057 100,0%

Total

32

QUINTILES ICFES EN QUMICA VS. PROMEDIO EN MATEMTICAS


Tabla de contingencia Quintiles Qumica ICFES * Quintiles cursos Matemticas Quintiles cursos Matemticas 2 3 4 85 68 37 25,9% 108 26,9% 93 20,5% 82 19,6% 48 10,5% 416 20,2% 20,7% 71 17,7% 111 24,5% 108 25,8% 83 18,2% 441 21,4% 11,3% 69 17,2% 91 20,1% 93 22,2% 107 23,5% 397 19,3%

1 Quintiles Qumica ICFES 1 Recuento % de Quintiles Qumica ICFES Recuento % de Quintiles Qumica ICFES Recuento % de Quintiles Qumica ICFES Recuento % de Quintiles Qumica ICFES Recuento % de Quintiles Qumica ICFES Recuento % de Quintiles Qumica ICFES 122 37,2% 107 26,7% 102 22,5% 55 13,1% 23 5,0% 409 19,9%

5 16 4,9% 46 11,5% 56 12,4% 81 19,3% 195 42,8% 394 19,2%

Total 328 100,0% 401 100,0% 453 100,0% 419 100,0% 456 100,0% 2057 100,0%

Total

33

QUINTILES EN PUNTAJE UNIANDES VS. PROMEDIO EN MATEMTICAS


Tabla de contingencia Quintiles Puntaje Uniandes * Quintile s cursos Matemticas Quintiles cursos Matemticas 2 3 4 110 82 43 27,4% 99 24,2% 84 20,3% 83 20,0% 40 9,5% 416 20,2% 20,4% 93 22,7% 97 23,5% 99 23,9% 70 16,7% 441 21,4% 10,7% 80 19,6% 83 20,1% 90 21,7% 101 24,1% 397 19,3% 1 Quintiles Puntaje Uniandes 1 Recuento % de Quintiles Puntaje Uniandes Recuento % de Quintiles Puntaje Uniandes Recuento % de Quintiles Puntaje Uniandes Recuento % de Quintiles Puntaje Uniandes Recuento % de Quintiles Puntaje Uniandes Recuento % de Quintiles Puntaje Uniandes 146 36,4% 104 25,4% 91 22,0% 54 13,0% 14 3,3% 409 19,9% 5 20 5,0% 33 8,1% 58 14,0% 89 21,4% 194 46,3% 394 19,2% Total 401 100,0% 409 100,0% 413 100,0% 415 100,0% 419 100,0% 2057 100,0%

Total

34

Potrebbero piacerti anche