Sei sulla pagina 1di 159
UNIVERSIDAD DE TARAPACA (L0GO UTA) ESTADISTICA SOCIAL 104811 PROF: VICTOR BARRIENTOS NUNEZ ( LEGADO INTELECTUAL ) ’ INTRODUCCION Los métodos y técnicas estadisticas son, en la actualidad, de gran utiidad en diferentes campos de la ciencia, desde la economia, las finanzas, la Ingenieria, la matemética en general, hasta la sociologia, la psicologia, la biologia, la medicina, ete, CCualesquiera sea la profesién que una persona ejerce, su actividad principal consiste en tomar decsiones que sean las mas adecuadas posibles. Para esto, la estacistica juega un papel preponderente : ya que, el tratamiento estadistico de la informacién, vinculada a un problema en estudio, proporciona una base cbjetiva para tomar buenas decisiones, Se puede estudiar estadistica sin necesidad de manejar un desarrollo matemtico elevado; de aqui que, en este libro se enfatizan la comprensién de los conceptos estadisticos, la interpretacién de resultados y la elaboracién de conclusiones. EI libro esté estructurado en nueve capitulos que, en general, estén desarrollados en la forma mas sencilla posible, con ejemplos précticos resueltos Y guias de eercicios para que sean desarrollados por los alumnos. ‘Talvez, el capitulo 6, que se refiere a Elementos de probabilidad, esté tratado ‘con un poco mas de rigurosidad matematica que el resto del libro; la razén esta fen que, la Teoria de la probabilidad, es el fundamento, o base, de la Estadist om INDICE ‘CAPITULO 1. IDEAS PRELIMINARES Paginas Estadistica. Toma de decisiones. Poblacion y muestra 12 Atributos y variables. ‘CAPITULO 2. DESCRIPCION DE LA INFORMACION RELACIONADA | Paginas ‘CON UNA CARACTERISTICA DE UNA POBLACION DDescripcién de Informacidn relacionada con un atributo. 35 ‘Descripclon de informacién relacionada con una variable discreta. | 5-10 Descripeién de informacién relacionada con una variable continua. | 10-15 Guia 1 de ejercicos. 16-17 CAPITULO 3. MEDIDAS DE RESUMEN Paginas La media aritmética, 18-20 La meciana y el percentil de orden K. 21-24 La moda. 24-25 Medias de dispersin. La varianza y la desviacién tipica. 25.27 El coeficiente de variacién y el puntaje tipico. 28-29 Guia 2 de ejerccios. 30-34 | CHPTTULO 4 DESCRIPCION DE LA INFORHACION RELACIONADA | Pépinas (CON DOS CARACTERISTICAS DE UNA POBLACION Generalidades. Cuadro de doble entrada 35:39 Distribuciones de variables marginales y condicionales. 90-44 Guia 3 de ejercicios. 45-46, CAPITULO 5. EL MODELO LINEAL SIMPLE Paginas Generalidades acerca del modelo de regresién lineal simple. 47-50 i modelo exponencial 50-52 ‘Blementos del andlsis de correlacién. 52-56 Guia 4 de ejerccios 57-59 CAPITULO 6, ELEMENTOS DE PROBABILIDADES Paginas Generalidedes. Experimento, Espacio myestral. Suceso. Probabilidad | 60-67 Probabilidad de sucesos compuestos. 67-70 Funcién de probabilidad. 70-73 Probabilidad Condicional e independencia. 7378 Ley de la probabilidad total y ley de Bayes. 78-83 Guia 5 de ejercicios, 84-87 CAPITULO 7, ALGUNAS DISTRIBUCIONES DE PROBABILIDAD Paginas La distribucién binomial. 88-92 La distribucién exponencial, 92.93 La distribucién normal. 93-98 Elteorema del limite central. 9-100 | Aproximacién normal de la binomial. 100-102 | Guia 6 de ejercicios. 102-105 / | ‘CAPITULO 7. ALGUNAS DISTRIBUCIONES DE PROBABILIDAD inas | La distribucién binomial. 88-92 La distribucién exponencial. 92-93 La distribucién normal. 93-98 El teorema del limite central. 99-100 ‘Aproximacién normal de la binomial. 100-102 | Guia 6 de ejercicios. 102-105 ‘CAPITULO 8. ELEMENTOS DE INFERENCIA Paginas Generalidades.. 106-107 Estimacién de pardmetros. Intervalo de confianza para y. 107-112 Intervalo de confianza para el parametro o . 112-113 Intervalo de confianza para el cuociente de varianzas. 113-114 Intervalo de confianza para la diferencia de medias. 115-116 Intervalo de confianza para el parémetro p . 116-117 | Intervalo de confianza para la diferencia de proporciones. 118 Prueba de hipétesis relacionada con el parémetro 1. 120-122 Prueba de hipotesis relacionada con el pardmetro or. | Saree Prueba de hipétesis relacionada con la diferencia de medias. 125-127 Prueba de hipétesis relacionada con el parametro p . 7-128 Prueba de hipétesis relacionada con la diferencia de proporciones. | 127-150 Guia 7 de ejercicios. s31553 CAPITULO 9. ALGUNAS APLICACIONES DE LA PRUEBA 77, | paginas Prueba de hipétesis relacionada con la distribuci6n uniforme. 134-137 Prueba de hipétesis relacionada con un patrén histérico. 137-139 Prueba de hipstesis para la diferencia entre proporciones. 140-142 Prueba de Independencia de dos variables categoricas. | 143-145 Guia 8 de ejercicios. 146-149 TABLAS ESTADISTICAS 150-153 BIBLIOGRAFIA | 154 | : | CAPITULO 1 IDEAS O CONCEPTOS PRELIMINARES 1.1. ESTADISTICA La Estadistica, se puede considerar como un conjunto de métodos y procedimientos para obtener, describir e interpretar datos, u observaciones de algin fenémeno, 0 de algiin experimento, con el fin de elaborar conclusiones € inferences vélidas, que sirvan para orientar una determinada actividad; la cual, generalmente, estdasociada a tomar decisiones relacionadas con algin problema, 1.2. TOMA DE DECISIONES: Una de las actividades fundamentales que realiza una persona que dirige, ya sea una empresa, 0 un grupo de trabajo, es la toma de decisiones. Tomar un buena decisién implica seguir, por lo menos, las siguientes etapas: 2) Definirclaramente el problema. Esto implica, entre otras cosas, especificar la pobiacién en estudio y las variables, asociadas a los objetivos del estudio. b) Obtener la informacién necesaria, usando por ejemplo: encuestas, fichas, entrevistas personales, etc. ©) Descrbir la informacién obtenida, usando por ejemplo: cuadros, gréficos, medidas de resumen. 6) Interpretar los resultados obtenidos en la etapa anterior. «) Elaborar conclusiones. ‘) Tomar las decisiones, mas adecuadas, de acuerdo al andlisis anterior, La Estadistica Descriptiva, nos va a proporcionar los métodos y técnicas para escribir e interpretar la informacién que se tiene de algin fenémeno, 0 problema, de tal mado que esto sina como una base objetiva para tomar alguna decisién reacionada con él 1.3. POBLACION Y MUESTRA El conjunto total de elementos , de donde se puede obtener informacion del fendmeno en estudio, recibe el nombre de Poblacién 0 Universo. Por razones practicas , y/o econémicas , generalmente no es posible aa EE (CAPITULO 1 IDEAS PRELIMINARES obtener la informacién en todos los elementos de la poblacién, se recurre entonces a una parte representativa de ella llamada Muestra, En cualquier investigacién, 0 andlisis, es fundamental que la muestra sea Jo mas representativa de la poblacién de donde proviene, de manera que, las conclusiones que de ella se obtengan, aseguren la seriedad y objetividad det estudio que se ha hecho, Esto es de vital importancia, sobre todo cuando se desea inferir caracteristicas referentes a la poblacién total, @ partir de una muestra de ella, Debe tenerse presente que, para que una muestra sea representativa de una poblacién, sus componentes deben ser elegidos al azar, de modo de asegurar que cualquier elemento de la poblacién tenga la misma probabilidad de ser elegido en la muestra, 1.4, ATRIBUTOS Y VARIABLES El estudio de un fenémeno, implica la obtencién de informacién de alguna de sus caracteristicas, las cuales se pueden expresar cualitativamente 0 ‘uantitativamente, Lamaremos Atributos, a las caracteristicas de los fenémenos susceptibles e exoresarse cualitativamente, por ejemplo; actividad, estado civil, etc. Llamaremos Variables, a las caracteristicas de los fenémenos susceptibles de expresarse cuantitativamente, por ejemplo: ingreso mensual, ventas, etc. Diremos que una variable es Discreta, cuando sélo toma ciertos valores dentro de un intervalo, por ejemplo: Numero de cargas familiares por ‘empleado, Namero de articulos fallados, etc. Diremos que una variable es Continua, cuando toma cualquier valor dentro de un intervalo, por ejemplo: ventas diarias, gastos de operaciones, etc. Observacién. tra forma mas rigurosa de definir Variable Discreta se vera mas adelante en el capitulo de Variables Aleatorias. Alli una variable se dird discreta, cuando toma valores dentro de un conjunto finito 0 infinito numerable, mientras que la variable se considerar continua, cuando toma valores dentro de un subconjunto de niimeros reales. 2, DESCRIPCION DF INFORMACION DE UNA VARIABLE DISCRETA 3 CAPITULO 2 DESCRIPCION DE LA INFORMACION RELACIONADA CON UNA CARACTERISTICA DE UNA POBLACION Para describir la informacién que se obtiene de una caracteristica de un fendmeno, se usan una serie de instrumentos estadisticas, los cuales iremos ‘ocupando a través del curso. Entre los instrumentos més usados estan los cuadros de frecuencias y los gréficos. En esta oportunidad consideraremos los siguientes ‘casos: informacién relacionada con un atributo, con una variable discreta y con tuna variable continua, 2.1. DESCRIPCION DE INFORMACION RELACIONADA CON UN ATRIBUTO. Cuando la informacin se refiere a atributos, los cuadros y gréficos son Felativamente faciles de realizar y, las distintas formas de hacerlo, depende fundamentalmente de la habilidad e imaginacién de la persona que realiza el trabajo. ‘A modo de ejemplo, consideremos lo que se describe en el siguiente Cuadro. DISTRIBUCION DEL PERSONAL “INTAC S.A” DIC. 2007. | SECCION | N°DEPERSONAS | PORCENTAJE | [ARMADURIA 64 wi ‘ADMINISTRACION a2 309 SERVICIOS 30 20 TOTAL 136 100,0 Esta misma informacién se puede describir también en grafices, como los ‘que se dan a continuacién: el de Barras” y el Circular”. ——————— ‘CAPITULO 2: DESCRIPCION DE INFORMACION DE UNA VARIABLE DISCRETA, 4 DISTRIBUCION DEL PERSONAL DE “INTAC” ARICA S.A. DIC. 2007 Personas Pore. ry an 42 bad 30 22,0 ARMADURIA ADMINISTR. SERVICIOS DISTRIBUCION DEL PERSONAL DE "INTAC" ARICA S.A. DIC 2007 “DARMADURIA ADMINISTRAC. DSERVICIOS | ‘CAPITULO 2 DESCRIPCION Di: INFORMACION DE LNA VARIABLE DISCRETA Apreciacién General. “Tanto en el Cuadro como en los Graficos, es posible apreciar que, en ‘cuanto a personal, seria relativamente més importante la Seccién Armaduria. Recomendacién. En general, en la construceién de cuadros y graficos, es conveniente tener presente ciertas formalidades, que faciiten su comprensién y permitan interpretar correctamente los resultados. Asi, por ejemplo, es importante que el ‘encabezamiento contenga la informacién minima necesaria para entender laramente jo que alli se describe. Lo mismo debe hacerse en los lencabezamientos de columnas de los cuadros y en los ejes de los gréficos. 2.2, DESCRIPCION DE INFORMACION RELACIONADA CON UNA VARIABLE DISCRETA. CASO 1. A través del siguiente ejemplo, veremos un procedimiento para describir el comportamiento de una masa de datos relacionados con una variable discreta, ‘Supongamos que los directivos de la empresa “AVA”, la cuel tiene 4500 ‘empleados, desean un Informe acerca del "Numero de Cargas Famillares” de sus empleados, porque la empresa desea implementar un sistema de boniicacién de acuerdo con el comportamiento de dicha variable. Para hacer este andiisis, $e eligié una muestra aleatoria de 53 empleados. Un procedimiento que se podria seguir es: 41) Obtener fa informacion de las fichas de cada empleado. Supongamos que , los siguientes datos corresponden al niimero de cargas familiares de cada uno de los 53 empleados de la empresa, elegidos aleatoriamente. we) a) x] ‘| w| al ol as) | nf a] of ole 2) Descibirlainformaci6n disponible mediante un Cuadro de Frecuencias, que sea lo mis completo posible en cuanto a la informacién que entrega. Se suglere el siguiente, el cual contiene cinco columnas, donde se indican: las Clases, las Frecuencias Absolutas, las Frecuencias Relativas, las Frecuencias Absolutas y las Frecuencias Relativas Acumuladas. CARGAS FAMILIARES POR EMPLEADO “AVA S.A.” ENE. 2008 [CARS FAN] ERPLEADOS | PORCENTAXE | EVPLERDOS | PORCENTAES (ease s3) | cacumutaoos) | (ACUMULADOS) 0 75 4 75 T 15 2 26 fo it 208 2B 4 3 B 245 36 oo a 17,0 5 349 5 | ins 5 962 6 38 33 1000 | En general, cualquier Cuadro de Frecuencias de este tipo, consta de las Sguientes partes: 2) Encabezamiento, donde se indica toda la informacién minima necesaria para entender daramente lo que alli se describe. b) Primera columna, donde se indican los distintos valores de a variable que se presentan en la masa de datos. Se designan, en general con y, « 1), = CLASES 0 CATEGORIAS Enel ejemplo, . tenian tres cargas familiares cada uno”. Segunda Columna, donde se indica el nimero de veces que aparece cada clase .y, en a masa de datos. Se designen, f, = FRECUENCIAS ABSOLUTAS Enel ejemplo, f, =11, lo cual se interpreta diciendo, “11 empleados de cuya interpretacién es, "Algunos empleados de AVA AVA tenian 2 cargas familiares cada uno". 4) Tercera Columna, donde se indican, mediante porcentajes la importancia relativa de cada clase y, . = FRECUENCIAS RELATIVAS Ademés, = 4}-100% , donde nes e nimero total de dates Se designan, Enel ejemplo, h, 7,0,,cuya interpretacién es, “el 17 % de los cempleados de AVA tendrian 4 cargas familiares cada uno”. uarta y Quinta Columna, aqui se indican las Frecuencias Absolutas y Relatvas Acumuladas. Se designan: = FRECUENCIA ABSOLUTA ACUMULADA = 5 / RECUENCIA RELATIVA RCUMULADA = 5, Enel ejemplo, F, = 23, lo cual se interpreta diciendo, “Hay 23 cempleados de AVA", con : 0, 1 6 2.cargas familiares cada uno”. Enel ejemplo, H, = 67,9 % , lo cual se interpreta diciendo, “el 67.9 ‘% de los empleados de AVA, tendrian cada uno: 0, 1,263 cargas femiiares" La masa de datos se puede describir también mediante gréficos, como el de Barras, para las frecuencias absolutas, y como el de Escalera, para las frecuencias acumuladas, Estos dos Graficos se presentan a continuacién. GRAFICOS DE BARRA Y EN ESCALERA. tra forma de describir la informacién, relacionada con una variable iscreta, es mediante los gréficos de Barra, para las frecuencias absolutas, y los agrificas en Escalera para las frecuencias acumuladas. Estos gréficos describen, en forma geométrica, Io mismo que se resume en el cuadro de frecuencias. El gréfico de barra, que se presenta a continuacién corresponde al Caso 1. Grafico de Barra. Caso 1. CARGAS FAMILIARES POR EMPLEADO AVA S.A. ENERO 08 Empleados. Porcentaje is 243 0 208 E 110 ‘ 1st ‘ ua f 1s zi 32 ‘cargas Famitares Construccién. En este gréfico, cada barra es ubicada en la clase y, , del ele horizontal, a una altura equivalente a la frecuencia absoluta fj. En el eje vertical derecho se indican los porcentajes correspondientes Interpretacién de la Tercera Barra. Hay 11 empleados de la empresa que tienen 2 cargas familiares cada uno, ellos representarian al 20,8 % del total de empleados’ Observacién. El grafico permite visualizar, en forma més répida, aspectos del comportamiento de la variable en estudio, como por ejemplo: lo mds frecuente (barra més alta), lo menos frecuente, etc. Grafico de Escalera. Caso 1. En este gréfico se describe lo que corresponde a las frecuencias absolutas y relatives acumuladas. DE INFORMACION DE UNA VARIABLE DISCRETA ___2 CARGAS FAM. POR EMPLEADO AVA S.A. ENE 08 (ACUM.) mpleados Porcen 1000 962 st cargas Famiiares Construccién. En este gréfico, cada punto esta ubicado frente a la clase y, , 2 una ra equivalente a la frecuencia acumulada F, Interpretacién del Tercer escalén. Hay 23 empleados que tienen cada uno : 0, 1, 6 2 cargas familiares, 35 representarian al 43,2 % del total de empleados * . Grafico de Barras Horizontal. Lo mismo que esté descrito en los gréficos anteriores, se puede sumir usando barras horizontales. No DE CARGAS FAMILIARES POR EMPLEADO “AVA S.A.” ENE. 2008 N’DE_PORCENT. EMPL. BASE S3 j=] des oS 4 15 8 Ist 2 25 1 208 a 84 1B 245 36 O79 9 170 45 (849 6 3 sl 962 aera 531000 En general, un informe acerca del comportamiento de un grupo de datos, de una variable, deberia incluir algiin cuadro y/o gréfico, junto con igunas conclusiones, que se puedan deducir de los resultados obtenidos. Un Informe relacionado con el caso que se plantea aqui, podria incluir, or ejemplo, el ditimo grafico y las siguientes conclusiones : Dentro de la empresa, lo mas frecuente es que los empleados tengan 3, familiares cada uno. 45,3 % de los empleados tendrian, cada uno, 2 6 3 cargas. 2 mayorfa de los empleados de la empresa, un 77 4 % tendrian, cada uno: 1,2,3,64 cargas. etc. ._DESCRIPCION DE INFORMACION RELACIONADA CON UNA VARIABLE CONTINUA En esta parte, veremos la forma de describir el comportamiento de un into de datos de una variable continua en estudio, mediante los respondientes Cuadros de Frecuencia y Gréficos. Para esto, usaremos pmo material de trabajo e! siguiente caso supuesto: Caso 2: “Consumo Mensual de Electricidad por Departamento” ‘Aqui, vamos 2 suponer que se ha hecho un estudio sobre el Consumo ensval de Electricidad ( en Kw / hr ), en los departamentos de los edificios de! tor Norte de Arica. Para esto, se eligid una muestra aleatoria de 40 departamentos, de la poblacién en estudio consistente en 1500 departamentos. | propésito de este andlsis, es tomar alguna decisién sobre rebajas en las taifas de consumo, de acuerdo con el comportamiento de la variable en dio. La variable en estudio es * Consumo mensual de electricidad ” [kw / hr]. La poblacién en estudio esté constituida por 1.500 departamentos. DE INFORMACION DE LUNA VARIABLE DISCRETA ‘consumos estén expresados en kilowatt por hora (kw/h) (en Kw / hr ) POR DEPARTAMENTO. ). MASA DE DATOS: CONSUMO MENSUAL DE ELECTRICIDAD La muestra esta constitulda por los 40 datos, los cuales corresponden @ consumos mensuales de electricidad de cada uno de estos departamentos. BS | i | tee | 15] 123 | tt | ii7 | 97 | 132 | ist | ot | ito | isa [ei | 68 | 59 | 154 | 143 % |i | | 7% | 94 | 6 | m9 | a5 | 132 | 7 | si | 8 | toi | 98 | i25 | 130 | 178 | Intervalos de distintas amplitudes. alos de clase” que, en general son de igual amplitud. Definicién de los intervalos En el ejemplo tenemos : X( maximo) - X(minimo) = 186 - 59 = 127 [kw/hr] La informacién contenida en la Masa de Datos, se clasifica en general, intervalos de Clase, de igual amplitud; sin embargo, también pueden En este caso, la informacién disponible, se va a describir mediante un ro de frecuencias, donde los datos serdn clasificados de acuerdo a CConsideremos una masa de nm datos, asociados a una variable insa. Un procedimiento para determinar el numero k de intervalos, de Jampltud ¢ , para clasificar la informacién disponible, es el siguiente. mero. de intervalos puede ser arbitrario, o usar un numero entero que alrededor dela Jn. Enel ejemplo, n = 40, su raiz cuadrada es imadamente 6,3 . Por lo tanto pademos clasificar los datos de acuerdo 2 6 6 7intervalos de igual amplitud. En este caso usaremos 5. ‘vez que est definido k , debemos determinar el valor de la amplitud ¢ cade intervalo, de la siguiente manera: en la masa de datos, ubicamos el r maximo y el valor minimo. Hacemos la diferencia entre ellos, el resultado el rango real, que describe la variacién total que se observa en la masa de Dividimos el rango real por el nimero_k de intervalos. Definimos ¢ 1 entero inmediatamente superior al cuociente calculado. LUNA VARIABLE DISCRETA 2 Diidimos 127: 5 = 25,4 . Porlo tanto, definimos c= 26. De acuerdo con lo anterior, debemos corregir el rango. Asi, dado que , 5 y c= 26, entonces, el rango corregida es 130. hore bien, la diferencia entre ambos rangos es de 3 unidades . E! corregido es més amplio que e! real en estas 3 unidades, entonces es corregr el valor minimo y / 0 el valor maximo original, para defn los cs de amplitud 26, Esto se hace repartiendo, en ambos extremos, las 3 en forma més 0 menos equitativa. En el ejemplo, tenemos dos para corregir los extremos. X(minimo) = 57 y X(méximo) = 187 ,0, X(minimo) = 58 y X(rméximo) = 188 Usando la primera opcién, podemos definir los intervalos de clase, de tud C= 26. hh = [57 ; 83] ; fe = 183; 109] ; Tb = 1109 ; 135] Y= )135 ; 161) ; Is = 1161 ; 187) Observacién, ‘A modo de ejemplo, vemos que el tercer intervalo describe el conjunto, ores de x mayores que 109 , pero, menores 0 iguales que 135, Hemos definido los 5 intervalos de clase, de amplitud 26 , para clasificar tos disponibles, que nos permitrd descrbir, 0 resumir, lo que tenemos en de datos, obtenidos para este caso, mediante el siguiente cuadro de las, que se generd al asignar cada dato al intervalo correspondiente. ONSUMO MENS. DE ELECTRICIDAD POR DEPARTAM. ENE. 2008 MENS, | DEPARTAM. | PORCENTAIE | DEPARTAM, | PORCENTATES Ihe) (ACUMULADOS) | (ACUMULADOS) = 8 8 20.0 8 20,0 = 108 10 250 18 45,0 = 135 B 325 3 775 161 6 150 a 25 1 187 a 75 40 100,0 Intervalos de Clase se designaran, I, = Ya i wd “JON DE UNA VARIABLE DISCRETA as ‘Amplitud de cada i rvalo I, es G = yi > yur remos Marca de Clase, del intervaio 1, al valor medio, © promedio os valores inferior y superior, 0 sea, Marca de Clase M, Sea c6n, rete, Ia marca de clase corresponde al punto medio del intervalo 1. Interpretacién de resultados Caso 2. 183 ; 109] “algunos departamentos consumen, cada uno, entre 83 y kw/hr de electricidad por mes” 13 Deptos. “Hay 13 departamentos que consumen, cada uno, entre 109 fav/hr de electricidad por mes" 15,0 % “el 15 % de los departamentos consumiria, cada uno, entre 135 wr de electricidad por mes” 31 Deptos. "Hay 31 departamentos que consumen, cada uno, entre 57 y fir de electricidad por mes” 45,0 % "el 45 % de los departamentos consumiria, cada uno, entre S7 y kw/hr de electricidad por mes” Algunas Conclusiones asociadas al Caso 2. consumo mensual de electricidad més frecuente entre los departamentos ria entre 109 y 135 kw/hr. 57.5 % de los departamentos consumirian, cada uno, entre 83 y 135 we de electricidad por mes. 77.5 % de los departamentos consumirian, cada uno, entre 57 y 135 ihr de electricidad por mes. lo el 7.5 % de los departamentos consumirian, cada uno, mas de 161 yr de electricidad por mes. DESCRIPCION DE INFORMACION DE UNA VARIABLE DISCRETA_ 4 GRAFICOS “HISTOGRAMA” Y “OJIVA” La descripcién de la informacién, relacionada con una variable continua, puede hacer, geométricamente, a través de dos gréficos; uno para las jencias absolutas, llamado Histograma, y otro para las frecuencias Jadas, llamado Ojiva. Histograma para al Caso 2. CONSUMO MENSUAL ELECTRICIDAD POR DEPTO. ENE 08. Porcent. 230 150 eels 7 s 108 Bs el Consumo Mensual [ kw/he ] Construccién. Para construir el Histograma, se levanta, en cada intervalo de clase J;, je horizontal, una barra de altura equivalente a la frecuencia absoluta /; En el eje vertical derecho se indican los porcentajes fi, . tra forma de presentacién del Histograma se hace usando las marcas M;. En cada una de ellas se ubica un punto a una altura equivalente a uencia absoluta f. Después éstos se unen mediante lineas rectas ido una poligonal que comienza en 57 y termina en 187. ‘CAPITULO 2. DECRIPCION DE INFORMACION DE-UNA VARIABLE DISCRETA 1s Interpretacién de la cuarta barra. Hay 6 departamentos, de los encuestados, que consumen cada uno entre 135 y 161 Kw/h de electricidad mensual; ellos representarian al 15 % del total de departamentos de la poblacién en estudio CONSUMO MENSUAL DE ELECTRICIDAD POR DEPARTAMENTO (ACUMULADOS) Deptos. Porcent. 1000 ns La Ojna se construye ubicando un punto en el extremo superior de cada Iervalo J, , a una altura equivalente a la frecuencia acumulada /;. Luego se los puntos mediante una poligonal. El cuadro se completa con los Porcentajes acumulados en el eje vertical derecho. Interpretacién del tercer punto. Hay 31 departamentos que consumen, cada uno, entre 57 y 135 Kw/h de lad por mes; ellos representarian al 77,5 % de! total de departamentos la poblacién en estudio. GUIA 1 DE EJERCICIOS Los datos que se dan a continuacién corresponden a algunas caracteristicas medidas a través de una Encuesta Socio Econémica, efectuada en la Poblacién Sica ~ Sica en Arica, en Enero de 2003. Para esto se eligié una muestra aleatoria de 37 familias, elegidas en la poblacién en estudio, constituida por 2500 familias. Describa la informacién obtenida mediante Cuadros de Frecuencias y Geafics. En cada caso indique: variable y poblacién en estudio, muestra, tipo de arecteristica a medir, algunas interpretaciones y conclusiones que se deriven e los resultados. CASO 3: “NUMERO DE HIJOS ESTUDIANTES POR FAMILIA” Masa de Datos Ee Bat aT ef Gal? Se BE 25 lage leslie gos Bolsa [gor tere asm fete eon CASO 4: “INGRESO MENSUAL POR FAMILIA” (en miles de $) Masa de Datos [a5] 1s] 102 | a2] tie | ios | iia | tis | a8 i | 85 | 110 {89 |) a45-{ tort a7 | 126 | 108 87 | 112 | 122 | 136) 130 | 105 | ant [82 [113 | ie Hig | 88 | 146 [132] 148 | i34 |(14e | 139 | 13 CASO 5: “TIPO DE VIVIENDA” A: De ladiilo 0 bloqueta B: De madera C: De material ligero. ~~ ‘CAPITULO 2_DESCRIPCION DE INFORMACION DE UNA VARIABLE DISCRETA 17 Masa de Datos a ATSB Bl A|B|.B a Bic als 8 Cc) ClAl eB 8 a 8 B/C A,B /B|C | CASO 6: “CAPTURA MENSUAL POR GOLETA PESQUERA” 2 siguiente informacién corresponde 2 la Captura Mensual de anchoveta, efectuada en una muestra aleatoria de 45 goletas, de 250 toneladas de ‘epacidad. Los datos estén expresados en miles de toneladas. La muestra proviene de una poblacién de 1300 goletas. Masa de Datos 1540 | 1862 | 2,352 ] 1274 ] 2054] 2345 | 1,465 1347 | 1745 | 1963 | 2147 | 1,662 | 1486 | 1,275 [| 1945] 2,200) 1347 | 1748 | as65 | 678 | 2,345 1865 | 1,476 | i628 | i275 | 1566 | 1627 | 1345 1962 | 1432 | 2021 | i658 | 1830 | 1476 | 1305 147s | 1965 | 1,275 | 1,586 | 1,976 | 2,248 | 1476 135 | 1278 | 1,155 2) Construya un Cuadro de Frecuencias de 6 intervalos de igual amplitud e interprete un valor de cada columna. ) Construya el Histograma y la Ojiva. Interprete la segunda barra del Histograma y e! tercer punto de la Ojiva. ©) Escriba algunas conclusiones acerca de! comportamiento de la variable en «estudio, basdndose en los resultados obtenidos en el Cuadro de Frecuencias. ‘CAPITULO 3. MEDIDAS DE RESUMEN 8 CAPITULO 3 MEDIDAS DE RESUMEN las Medidas de Resumen, son valores (teéricos) de la variable que sirven para caracterizar e| comportamiento de una poblacién en estudio en relacién a dicha variable, principaimente respecto de dos aspectos: la Tendencia y la Variabdad. La Tendencia, tiene que ver con algin valor alrededor del cual se agrupe la mayoria de los datos. La Variablidad, tiene que ver con el hecho que 1a variable toma valores diferentes cuando se observa de elemento en elemento de la Poblacién. Algunas de las medidas de resumen que veremos en este curso, son las siguientes: la media aritmética, la moda, la mediana, los percentiles, la Cesviacin tipica, el coeficiente de variacin y el puntaje tipico. 1, LAMEDIA ARITMETICA. Esta medida de resumen es la de uso més frecuente, Se usa para ‘Gracterzar el comportamiento de la variable en relacién con e| aspecto “Tendencia’, que tiene que ver con la forma como los datos de la variable en studio tenderian @ agruparse alrededor de un valor teérico. Se le llama “Media” se designa generalmente con x. La Media, para datos no agrupados. Consideremos una muestra de n datos de una variable. Es decir, la ra esté constituida por datos, tales como : te, Sieg etree Se define la Media Aritmética de la variable en estudio en la siguiente (CAPITULO 3: MEDIDAS DE RESUMEN, 12 La Media, para datos agrupados por valores puntuales. ‘Supongamos que las n observaciones corresponden a una variable discreta, y estén agrupadas en Kk clases. Entonces, la Media se calcula en la siguiente forma: ‘ Bh ce ” donde J es la frecuencia absoluta con que se presenta cada clase y, en la masa de datos. Ejemplo: Calcular e interpretar la Media en el siguiente caso. Cargasfamilares y: 0 «1-2 «3 4 Empleados f: 36 «10s O3 416 4210 4341 445 _ 3+6+0+N +S 23 Interpretacién: El promedio de cargas familiares, por empleado, ria de 2 cargas. La Media para datos agrupades por intervalos. Supongamas que los 1 datos se refieren a una variable continua y estén dasficados segin k intervalos de clases J, =| y,, ; > J, entonces la Media se calcula de la siguiente manera, & BM donde M, es la Marca de Clase correspondiente al intervalo /,. x Recordemos que, la Marca de Clase, para un intervalo 1, esté dado por la expresion, Lamarca de clase M, es un valor puntual que representa a todos los valores que estén en el intervalo. Geométricamente, representa al punto medio del Intervalo 4, Ejemplo: La distribucién de las edades de una muestra de los empleados de ‘una empresa, se describe en el siguiente cuadro: EDADES [NRO.DE EMPL. j ™, 18-24 10 a oe) 7 30-36 4 a 36-4 it 39 Mas de 42 6 % SUMAS n= 50 14 te = 323 Interpretacién: La edad promedio, por empleado de la empresa, seria de 22 ahs. \ yn Observacion: En certas ocasiones las observaciones de una variable en estudio estén ficadas en clases x; las cueles, tienen dentro de la poblacién en estudio, rente “peso” 0 "ponderacién’, en tal cas0, se puede definir lo que llamaremos jedia Aritmética Ponderada, que se calcula mediante la siguiente férmula: 4 veda Donde, wi es la ponderacién que tiene, cada clase x), dentro de la lacén en estudio (k representa el némero de cases). ‘tras palabras, la ponderacién cuantifica la importa entro de la poblacién en estudio. relativa que tiene cada (CAPITULO3 :MEDIDAS DERESUMEN 2. LA MEDIANA La Mediana, que designaremos Me, se define como aquel valor (te6rico), de la variable en estudio, que deja por debajo de él, como maximo, al 50% del total de observaciones. Osea, la Mediana seria un valor de la variable que, te6ricamente, deberia estar ubicado en el centro de la distribucién ordenada de los datos, que va desde el valor minimo observado al valor maximo. La Mediana, para datos no agrupados. Para calcular la Mediana, en este caso, se ordenan los datos en orden cretiente (0 decreciente). Después se calcula el "valor determinante” 1/2 , siendo nel total de datos. Entonces, la Mediana seré el dato ubicado en el lugar asociado al entero Inmediatamente superior 2 n/2. Ejemplo: Consideremos el siguiente conjunto de datos, los cuales ya $n ordenados. B 5 5 18 B B 2 31 W a2 | 3 7 50 55 Eneste caso,n = 14 y n/2= en ellugar 8, 0 sea, Me = 31 /. Por lo tanto, la Mediana es el valor La Mediana, para datos agrupados por valores puntuales. CConsideremos un conjunto de n datos agrupados en k clases yi. Para Jar la Mediana, en este caso, se procede de la siguiente manera: ‘alculan las Frecuencias absolutas acumuladas F,. Se calcula el valor determinante n/2 , y se ubica la frecuencia acumulada Fy , valor sea inmediatamente superior a n/2, Entonces, la Mediana serd la clase, ,asociada a la frecuencia F) Es decir para este caso, Me = yy Ejemplo: Calcular e interpretar la Mediana para la informacién que se describe en el siguiente Cuadro: - y 5 3 @ 7) a fh nu 15 -, 12 6 Fi a= ee] a] ae | Eneste caso, n/2 = 51/2 = 25,5, esto implica que la frecuencia cumuiada F, = Fy = 26 Lego, la Mediana es el valor de la clase yz , es decir, Interpretacién: £1 50 % de los datos en esta distribucién, toma los Me = 8 res 5 U8. La Mediana, para datos agrupados por intervalos. Para calcula la Mediana en este caso, se procede en forma anéloga 2 mo se hizo en el ejemplo anterior, hasta la determinacién de Fj , que nos ite uicar el intervalo 1, que contiene a la mediana Me. O sea, Mee 1, = [yj 13 95] Una vez que se ha ubicado este intervalo, se procede a calcular la jana, usando la siguiente férmula: Me= y, El valor determinante, para el cdlculo de la Mediana, es n/2 6 0,5n. Este valor permite ubicarF;, y, como consecuencia, el intervalo I, que ne ale Mediana. En a formula yj, es el extremo inferior del intervalo que contiene a jana, mientras que G es a amplitud de dicho intervalo. La frecuencia acumulada F;; corresponde a aquella que, aparece ‘que F; en el cuadro. (CAPITULO 3: MEDIDAS DERESUMEN Ejemplo: Calcular e interpretar la Mediana usando los datos disponibles enelsiguiente cuadro. ‘TIEMPO DE ARMADO DE CARBURADOR POR OPERARIO TIEMPO (MIN) | Nro. Operarios fi | Fi 12-16 13 13 16-20 16 29 20-24 19 48 24-28 15 6 [8-32 3 2 = 75 ‘Aqui, el valor determinante es n/2 = 72/2 = 36 , esto implica que, P48. Luego, la Me 2 1, ~[ 20:28], Entonces, = 36-29 _ Me = 20+ 4 39—5y= 2147 Interpretacién: £1 50% de los operarios emplearian, cada uno, entre 'y21,5 minutos en el armado del carburador. EL PERCENTIL DE ORDEN k. El percentil de orden k (k = 1, 2, 3, snnnuy 99), $€ define como aquel de la variable que deja por debajo de él, 2 lo sumo, al k% del total de datos. designa P\. La Mediana se puede considerar como un caso particular de nti, es el Pao. Hay algunos percentiles que reciben denominaciones especiales como ejemplo: Cuartit 3 Quintit’3s C= Cuartil 15 Prs = C By) =Dy = Decil 9; Pyy = Qs Para calcular el Percentilk, se procede en forma andloga a como se para el célculo de la Mediana, pero cambiando el valor determinante n/2 por /100 6 0.01 nk. Asi, para datos agrupados por intervalos, Ejemplo: Consideremos los datos referentes al Tiempo de armado de carburedor que se describen en el caso de la pagina anterior. Calculemos el % ‘Aqui, el valor determinante es 0.01 nk = 0.01°72°65 = 46,8 ; esto implica que, de acuerdo al cuadro F, = F, = 48 . Por lo tanto, As €1,=[20; 24] +4 468 = 29 05.7 min 48 — 29 Interpretacién: E65 % de los operarios emplearia entre 12 y 23,7 minutos en el armado del carburador. LA MODA 0 Mobo. La Moda, que designaremos Mo, se define como aquel valor de la variable que se presenta con mayor frecuencia en fa distribucién, Una distribucion fe tener mas de una moda. La Moda para datos no agrupados. ‘Cuando los datos no estén agrupados, la moda es aquel dato x, que se ite mas veces en la dstribucién. La Moda para datos agrupados por valores puntuales. Para calcular la Moda, en este caso, se ubica la frecuencia absoluta dxima que llamaremos f. Entonces la Moda es el valor correspondiente a la La Moda, para datos agrupados por intervalos. Tal como en e! caso anterior, para calcular la Moda se ubica primero la cia absoluta maxima f, Entonces, la Moda pertenece al intervalo =|»). J, que lamaremos Intervalo Modal. Luego, la Moda se calcula

Potrebbero piacerti anche