Sei sulla pagina 1di 35

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado

INTRODUCCIN A LA ESTADSTICA

Generalmente cuando se escucha la palabra Estadstica inmediatamente se piensa en datos, cuadros, grficos, etc. En verdad no es una idea equivocada, sino ms bien, una idea popular de sta, pero no es lo nico y en la concepcin de la Estadstica Moderna tampoco el ms importante. Las primeras tcnicas estadsticas consistan principalmente en la organizacin, presentacin grfica y el clculo de ciertas cantidades "sobresalientes de un grupo de datos. Esta parte de la disciplina es lo que, en la terminologa moderna, se conoce como Estadstica Descriptiva. La Estadstica Descriptiva es la rama ms antigua de la Estadstica y tiene por objetivo, presentar informacin de una manera sencilla y esttica y que al mismo tiempo, sea aprehensible al ojo humano, es decir, fcil de entender. Aunque su campo de accin se ha visto reducido, es indudable su utilidad. Para que la Estadstica Descriptiva cumpla su cometido utiliza tres mtodos, Mtodos Tabulares, Mtodos Grficos y Mtodos Numricos. Supngase ahora, que se est interesado en saber cul es el ingreso promedio de las personas que tienen pensin en el mercado los Pozos, de Santa de la Sierra, Bolivia. Supngase adems, que este sector ha crecido de tal forma que se hace imposible estudiarlas en su totalidad. Por tal razn se deduce una muestra de esta poblacin por cualquier mecanismo aleatorio y se realiza la toma de la informacin deseada y se obtiene un dato promedio cualquiera, por ejemplo, Bs 550. A travs del mtodo de razonamiento que conduce a una extensin de este resultado a la poblacin de inters, se podra concluir que las personas que tiene pensiones en dicho mercado, tiene un ingreso promedio de Bs 550. El mismo hecho de que se est estudiando una fraccin de la poblacin, indica que se tiene una informacin incompleta y que es, lo comnmente que pasa en la realidad; pero, qu pasa si el azar proporcion las personas con pensiones que venden ms o bien que venden menos?. Si se da el primer caso se estara sobreestimando y en el caso contrario subestimando el ingreso promedio de estas personas. En este momento surge una duda sobre la informacin que en Estadstica Moderna se la conoce generalmente como Incertidumbre y que siempre estar presente en conclusiones que se deriven por medio del mtodo inductivo.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Ahora la pregunta que surge es la siguiente, qu papel juega la Estadstica en esto?. El papel de
la Estadstica en este proceso es cuantificar la incertidumbre y la rama de la estadstica que se encarga de ello se le llama Estadstica Inferencial que utiliza el mtodo Probabilstico. En conclusin ya sea porque la se dispone de informacin incompleta, o debido a la propia variabilidad de la informacin (naturaleza), es muy comn que se arribe a conclusiones a travs del mtodo inductivo, en el cual las mismas son inciertas. El conjunto de tcnicas que permite realizar inducciones en las que el grado de incertidumbre es cuantificable, integran la rama de la Estadstica conocida como Inferencia Estadstica o Estadstica Inductiva o Inferencial.

POBLACIN, ATRIBUTOS Y VARIABLES Se dice que los estadsticos extraen datos de las muestras y que esta informacin les sirve para hacer inferencia sobre la poblacin que la muestra representa. Es as que, los trminos, muestra y poblacin se consideran relativos. El concepto de poblacin va a variar de acuerdo al campo de la ciencia donde se aplique. Desde un punto de vista estadstico, poblacin; es el conjunto de resultados potenciales de un experimento aleatorio, es decir, todos los valores que puede tomar una caracterstica (variable). En palabras ms sencillas se puede decir que poblacin, es un conjunto de entes con caractersticas propias que los diferencian de otras. Con este concepto se puede tener una poblacin de rboles, de sillas, de tizas, etc. Un aspecto importante a retomar es que desde el punto de vista estadstico una poblacin es importante cuando se requiere verificar (medir) una caracterstica (variable) en ella.

Atributos Supngase el siguiente ejemplo. Se tiene en un aula de clase un grupo de 20 estudiantes y suponga adems, que el estudiante de la primera fila es alto, color de piel blanca, cabello castao, ojos claros, etc. Si a los 20 estudiantes se les considera como una poblacin, se puede decir que los detalles antes mencionados corresponden a caractersticas propias de un miembro de esa poblacin, o sea, son atribuciones propias del estudiante en particular. Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Con el ejemplo antes citado, se puede tratar de deducir un concepto de Atributo, diciendo que es
una caracterstica propia de cada elemento de una poblacin.

Variable Retomando el ejemplo anterior, supngase ahora, que se les pregunta a los cinco primeros estudiante su estatura los cuales responden de la siguiente manera: 1.76, 1.69, 1.83, 1.72, 1.77 De hecho estas alturas corresponde a atributos de los cinco primeros estudiante. Si se observan los datos anteriores, se puede constatar que el atributo estatura cambia de un estudiante a otro. Con esta idea se puede plantear un concepto de variable. Variable es un atributo medible que cambia de un elemento a otro de la poblacin, es decir, es toda caracterstica que cambia y que est sujeta a medida o cuenta. Supngase ahora, que los cincos primeros estudiantes poseen la misma altura, ejemplo, 1.73. Dado que el atributo altura en este caso no cambia, no se puede considerar como una variable, pero s, es un atributo. De lo anterior se puede concluir, que una variable siempre ser un atributo, pero un atributo no siempre es una variable. Las variables siempre se denotan por la letras maysculas del alfabeto y los valores que toman (observaciones) con letras minsculas.

ELEMENTOS DE LAS VARIABLES Siempre que se desee constatar una variable en un elemento de la poblacin de inters, sta debe de poseer cuatro elementos: a.b.c.d.Nombre Definicin Conjunto de categoras o valores que puede tomar la variable Procedimiento que permita clasificarla

Nombre Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Cuando un investigador toma los datos correspondiente a una variable, ste tiene que saber el
nombre de sta de lo contrario cmo va a tomar informacin de una variable si no sabe el nombre de sta. Definicin Todo investigador tiene que definir la (s) variable (s) que va a estudiar. Por ejemplo, supngase que un investigador est tomando el peso a un grupo de nios. El toma los datos cuando los nios no han desayunado y sin ropa alguna. Este investigador tiene que reportar al momento de dar a conocer la informacin cmo lo hizo por que quizs otro investigador lo puede haber tomado con ropa y despus de desayunar. Inclusive debe de especificar el equipo con el cual verific el valor de la variable en los elementos de la poblacin estudiados dado que pueden variar en precisin.

Conjunto de categoras o valores que puede tomar la variable

Esta se refiere a las categoras convencionalmente admitida por la sociedad. Por ejemplo; si en un grupo de personas se mide la variable sexo, de hecho se refiere al sexo anatmico y no al comportamiento sexual de los miembros del grupo, por lo tanto las categoras que puede tomar son masculino femenino o bien macho hembra.

Procedimiento que permita clasificarla Este elemento de las variables en muchos casos es muy complejo, pero se soluciona en parte si existe una adecuada definicin de la variable que el investigador desee medir. Si se retoma el ejemplo anterior donde se quiere medir la variable sexo en un grupo de personas. En este caso la variable se define como sexo anatmico de cada persona que componen al grupo. Ahora bien, el hecho de que una persona diga que es de sexo masculino no implica que no sea homosexual, pero no es la conducta sexual la que se est midiendo, sino el sexo anatmico. Por tal razn, aunque este elemento de la variable es complejo, con una definicin clara de lo que se desea medir se resuelve. De acuerdo a los valores que puede tomar una variable, sta se puede clasificar en:

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Variables cualitativas: no se pueden medir numricamente, representan caractersticas de las
variables (categoras, por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales). Por su parte, las variables cuantitativas se pueden clasificar atendiendo a los valores que pueden tomar en discretas y continuas: Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3...., etc, pero, por ejemplo, nunca podr ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80.3 km/h, 94.57 km/h..., etc.

ESCALAS DE MEDICIN Medir una variable significa constatar la observacin en los elementos de la poblacin que es objeto de estudio. Lo anterior implica que para medir una variable, sta tiene que ser observable en el mundo real, manteniendo el principio fundamental de la construccin de una variable que consiste en que sus categoras deben de ser totalmente inclusivas y mutuamente excluyentes. En Estadstica se definen cuatro niveles o escalas de medicin las cuales son:

a.- Escala Nominal: En esta escala lo nico que puede decirse de una observacin es a cul de un cierto nmero de categoras pertenece. En esta escala de medicin la nica relacin que puede establecerse entre observaciones es la de igualdad y por lo tanto de desigualdad. Dos observaciones son iguales si estn en la misma categora (llamadas tambin clases) y diferente si no lo estn. Como consecuencia de lo anterior, la nica estadstica vlida para este tipo de datos es la frecuencia de cada clase. Ejemplo, supngase que en grupo de personas se desea medir el estado de salud con respecto a una enfermedad en particular. En este caso la constatacin de la variable (medicin) en los miembros de la poblacin debe de concluir en que estn o no afectados por la enfermedad.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado b.- Escala Ordinal: Las observaciones medidas en esta escala pueden ordenarse de menor a
mayor, y en consecuencia no slo se admiten las relacin de igualdad, sino adems la de mayor que y menor que. Muchos de los estudios realizados en las Ciencias Sociales producen observaciones que son medidas bajo esta escala, por lo difcil que es medir actitudes en los seres humanos. En esta escala adems de calcularse frecuencias como en la escala nominal, se puede calcular una medida de tendencia central llamada Mediana. Un ejemplo clsico de esta escala es la jerarquizacin que existe en la iglesia y el ejrcito. Coronel > Teniente > Subteniente > Sargento > Cabo > Soldado

c.- Escala de Intervalo: Con observaciones en esta escala no slo se pueden ordenarse las observaciones, sino que adems puede definirse una unidad de distancia (puede ser arbitraria) entre ellas. La principal diferencia de esta escala con la de Proporciones es que en la escala de Intervalo el cero y la unidad de distancia son arbitrarios y, en particular, el cero no corresponde a una caracterstica fsica de las unidades de medidas. Un ejemplo clsico en esta escala es la medicin de la temperatura. Dado que los requisitos indispensables para efectuar sumas y productos son que existan ceros y una unidad de distancia, con las observaciones medidas bajo esta escala puede calcularse medidas de tendencia central como la media y de dispersin como la varianza. Por tal razn esta escala es ms fuerte que la Nominal. b.- Escala de Proporcin o Razn: En esta escala las observaciones pueden ordenarse y existen un cero y una unidad de distancia que son inherentes al sistema, es decir, que no son arbitrarios. Ejemplos tpicos de caractersticas medidas en esta escala el peso de un individuo, el rendimiento por hectrea de una planta, etc. Esta es la escala de medicin ms fuerte que existe y por lo tanto permite el clculo de cualquier estadstica. En las dos ltimas escalas de medicin descritas anteriormente, las variables medidas bajo stas, tiene que ser cuantificable.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado ORGANIZACIN DE LA INFORMACIN
Resulta de mucha importancia en el campo de la investigacin, utilizar tcnicas que permitan apreciar de una forma rpida y fcilmente aprehensibles un tipo de informacin donde se resalten los aspectos ms sobresalientes. Estas tcnicas o mtodos debern poseer caractersticas propiedades que faciliten lo antes mencionado. Entre estas propiedades se pueden mencionar las siguientes: 1. Que proporcionen la mxima observacin contenida en los datos en forma rpida y fcil de visualizar. 2. 3. Que posean sencillez operativa Que permitan presentar los datos de una manera esttica.

Los mtodos para describir colecciones de datos que integran la Estadstica Descriptiva se pueden categorizar en: Mtodos Tabulares y Grficos y Mtodos Numricos. Entre los mtodos tabulares estn las Tablas de Frecuencias o Tablas de Distribucin de Frecuencias.

NOTACIN DE SUMATORIA. PROPIEDADES Supngase que la variable X, toma los valores de x1, x2, x3, ..., xn. Entonces, la suma de los valores xi de la variable X sera: x1 + x2+ x3 +... xn. Con el objeto de expresar esta suma de una manera ms resumida, se hace uso de la letra griega Sigma mayscula (), la cual es el smbolo utilizado en matemticas para indicar la suma, de tal manera que: n xi i=1 se lee como la suma de i=1 a i=n de x, lo cual indica que la variable x toma valores para i=1, 2, 3, ..., n, o sea: n xi = x1 + x2 + x3 + ..., xn i=1 i se llama ndice de suma y es una variable que toma los valores 1, 2, 3, ..., n.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado La expresin i=1 indica en este caso que 1 es el valor inicial de i (no siempre el valor inicial
comienza de 1). La n arriba del signo, indica el ltimo valor de i. A xi se le llama sumando Propiedades de la sumatoria Sean x1, x2,..., xn y y1, y2,..., yn dos conjuntos de datos, y b y c dos constantes arbitrarias. Entonces: n n a. bxi = bxi i=1 i=1 n c. c = nc i=1 n n b. (xi + yi) = xi + yi i=1 i=1 i=1 n n d. (b + cxi) = nb + c xi i=1 i=1 n

n e. c = (n-m + 1)c i=m La demostracin de cada una de estas propiedades se deja como prctica para el estudiante.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado METODOS TABULARES
Tablas de Frecuencias Relativas y Absolutas Como una antesala de lo que son tablas de frecuencias relativas y absolutas se menciona a continuacin las formas iniciales de presentacin de informacin, sus ventajas y desventajas de tal manera que el estudiante comprenda la lgica de cada uno y por qu se usa uno en vez del otro. Una de las primeras formas de presentacin de informacin es el arreglo de los datos el cual es una de las formas ms sencillas de presentar datos. Pone los valores en orden ascendente o descendente. Por ejemplo, a continuacin se muestran las concentraciones de cloro en partes por milln (ppm) de 30 galones de agua tratada Concentraciones de cloro en ppm de 30 galones de agua tratada 15.6 16.0 16.8 16.0 16.3 16.2 15.7 16.4 15.4 16.4 15.8 16.0 15.2 15.7 16.6 15.8 16.2 15.9 15.9 15.6 15.8 16.1 15.9 16.0 15.6 16.3 16.8 15.9 16.3 16.9

Una forma sencilla de arreglar estos datos es presentarlos en orden ascendente o descendente. Si se arreglan de manera ascendente quedaran de la siguiente forma:

15.2 15.4 15.6 15.6 15.6

15.7 15.7 15.8 15.8 15.8

15.9 15.9 15.9 15.9 16.0

16.0 16.0 16.0 16.1 16.2

16.2 16.3 16.3 16.3 16.4

16.4 16.6 16.8 16.8 16.9

Este arreglo de datos ofrece varias ventajas sobre los datos originales o sin arreglar:

Se pueden localizar rpidamente los valores mnimos y mximos en los datos. En el ejemplo, el valor mnimo es 15.2 y 16.9 el mximo. Los datos se pueden dividir en secciones (clases)

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Fcilmente se puede apreciar que valores se repiten ms de una vez.

Un inconveniente de esta forma de presentacin de informacin es que siempre se sigue manejando toda la masa de informacin y por lo tanto es muy tedioso emplearla en bases datos muy grandes. De aqu que es preferible presentarlos en Cuadro de distribucin de frecuencias.

Al nmero de veces que se repite una observacin dentro de una coleccin de datos se le llama Frecuencia Absoluta (fi). La suma de stas tiene que ser igual al tamao de la coleccin de datos (fi = n), en este caso 18 + 12 = 30 (total de las observaciones). A la relacin de cada frecuencia absoluta con respecto al total, se le llama Frecuencia Relativa (fr = fi/fi), la suma de esta tiene que ser igual a 1 o bien a 100 si se le expresa en porcentaje. Este tipo de arreglo es importante cuando la coleccin de datos es pequea. Los datos anteriores arreglados en un cuadro de distribucin de frecuencia se muestran a continuacin: xi 15.2 15.4 15.6 15.7 15.8 15.9 16.0 Total fi 1 1 3 2 3 4 4 18 fr 3.33 3.33 10.00 6.67 10.00 13.33 13.33 60.00 xi 16.1 16.2 16.3 16.4 16.6 16.8 16.9 Total fi 1 2 3 2 1 2 1 12 fr 3.33 6.67 10.00 6.67 3.33 6.67 3.33 40.00

Hay autores que consideran la siguiente forma de presentacin de cuadros de frecuencia donde incluyen elementos que son propios de las Tablas de Frecuencias Absolutas y Relativas. Esto se muestra a continuacin Variable Frecuencias absolutas Frecuencias relativas

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado xi Simple(fi) Acumulada (fia)
X1 X2 ... Xn-1 Xn f1 f2 ... fn-1 fn f1 f1 + f 2 ... f1 + f2 ++ fn-1 fi= n

Simple (fr) fr1 = f1 / fi fr2 = f2 / fi ... fr-1 = fn-1 / fi frn = fn / fi

Acumulada (fra) Fr1 fr1 + fr2 ... fr1 + fr2 ++ fr-1 1 100

Veamos un ejemplo: Medimos la altura de los nios de una clase con instrumental de precisin y en condiciones adecuadas, escogiendo a todos sus componentes, 30 sujetos, y obtenemos los siguientes resultados (m):

Alumno 1 2 3 4 5 6 7 8 9 10

Estatura 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29

Alumno 11 12 13 14 15 16 17 18 19 20

Estatura 1.23 1.26 1.30 1.21 1.28 1.30 1.22 1.25 1.20 1.28

Alumno 21 22 23 24 25 26 27 28 29 30

Estatura 1.21 1.29 1.26 1.22 1.28 1.27 1.26 1.23 1.22 1.21

Puesto que todas las tallas estn comprendidas entre 1.20 y 1.30 m., podemos agruparlas por centmetros formando 11 grupos indicando cuantos nios presentan cada uno de los valores. Si presentamos esta informacin estructurada (agrupada) en un cuadro de frecuencias obtendramos la siguiente:

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Cuadro de frecuencia
Observacin 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 Total Frecuencias fi 1 4 4 2 1 2 3 3 4 3 3 30 fia 1 5 9 11 12 14 17 20 24 27 30 fr (%) 3.33 13.33 13.33 6.67 3.33 6.67 10.00 10.00 13.33 10.00 10.00 100 fra 3.33 16.66 30.00 36.66 40.00 46.66 56.66 66.66 80.00 90.00 100.00

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos mayores. ya que de otra manera obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis. Supongamos que ahora medimos la estatura de los habitantes de una vivienda (tambin 30 personas) y obtenemos los siguientes resultados (m): Habitante 1 2 3 4 5 6 7 8 9 10 Estatura 1.15 1.48 1.57 1.71 1.92 1.39 1.40 1.64 1.77 1.49 Habitante 11 12 13 14 15 16 17 18 19 20 Estatura 1.53 1.16 1.60 1.81 1.98 1.20 1.42 1.45 1.20 1.98 Habitante 21 22 23 24 25 26 27 28 29 30 Estatura 1.21 1.59 1.86 1.52 1.48 1.37 1.16 1.73 1.62 1.01

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Los datos son menos homogneos (ms dispersos) que en el caso de los nios de un grupo escolar
(todos de la misma edad) y si presentramos esta informacin en un cuadro de frecuencia obtendramos 30 lneas (una para cada valor), cada uno de ellos con una frecuencia absoluta de 1 y con una frecuencia relativa del 3.3%. Esta tabla nos aportara toda la informacin inicial, pero sera muy difcil de manejar si en vez de 30 personas fueran 300. 3000 o ms: en definitiva, de escaso valor prctico. Lo que quiere decir lo anterior, es que si bien es cierto que los cuadros de frecuencias tienen ms capacidad de resumir la informacin, esto no siempre se logra ya que depende de las caractersticas propias de la informacin. En lugar de ello, podramos agrupar los datos por intervalos llamados tambin Tablas de Frecuencias Absolutas y relativas, con lo que la informacin queda ms resumida (se pierde. por tanto. algo de informacin), pero es ms manejable e informativa. Una tabla de frecuencia absoluta y relativa no es ms que la agrupacin de una base de datos en subgrupos llamados clases o intervalos de clases. Cada intervalo de clase o clase posee dos elementos, Lmite inferior y Lmite superior. La semisuma de ambos origina un elemento ms en una tabla de frecuencia absoluta y relativa denominado Punto medio de clase (PMC) o bien Marca de clase. El primer tropiezo que se afronta es decidir cuntas grupos o clases debern establecerse y si stas tendrn la misma anchura. Es recomendable en la prctica utilizar entre 5 y 20 clases inclusive hay autores que recomiendan hasta 25 clase, y normalmente conviene construirla de modo que todas las clases tengan la misma anchura. La anchura de clase recibe tambin el nombre de Intervalo de Clase o bien Amplitud de clase. Una manera de resolver este problema es utilizar la frmula de Stirling (Sturge) K = 1 + 3.3* log(n), donde k es el nmero de clases o intervalos que se deben construir. Para el caso en cuestin sera: k = 1 + 3.3*log(30) = 5.87. Como se puede recordar que nmero de intervalos viene a ser una variable cuantitativa discreta, entonces tiene que tomar valores cerrados. De acuerdo a lo anterior y basado en leyes matemticas se redondea al inmediato superior, es decir, 6. Hay autores que sugieren siempre esto. Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Un segundo problema que se afronta se refiere a la determinacin de la Anchura del Intervalo de
Clase. Este problema se resuelve calculando primeramente la diferencia entre el mayor y el menor valor numrico de los datos, llamado tambin Rango, Recorrido o Amplitud (A). En el caso del ejemplo es: A = 1.98 - 1.01 = 0.97. Esto indica que la suma de los amplitudes de clase de los intervalos de clase deber cubrir al menos esta diferencia. Si 0.97 se divide entre 6, se obtiene un resultado de 0.16. Si se multiplica la anchura de clase ( Ac) determinada por el nmero de intervalos K = 6, (al resultado se le llama Rango Ideal) se tiene el siguiente resultado: 0.16*6 = 0.96. Si se recuerda la amplitud de los datos es de 0.97, por lo tanto esta anchura de clase (Ac) no es suficiente para cubrirla por tal razn, algunos autores recomiendan redondearlo al inmediato superior que en este caso sera de 0.17. Repitiendo el proceso, se tiene que 0.17*6 = 1.02. Un aspecto importante de sealar es que si bien es cierto que se pasa de 1.98 con 3 centsimas, cubre la amplitud de los datos. Por esto se dice que Ac*k = al menos debe ser igual a la amplitud de los datos, es decir, no importa si se pasa del valor mximo. Un tercer aspecto que hay que resolver es por donde iniciar la construccin de los intervalos de clases. Para el caso de variables cuantitativas continuas, se habla de una medida de

desplazamiento (MD) que es igual al Rango ideal (RI) menos la Amplitud de los datos (A), donde RI es igual Ac * k, esto es: MD = RI A, entonces: MD = [(0.17*6) 0.97]/2 =0.025, o aproximadamente 0.03. Este es el desplazamiento que debe tener el valor mnimo para iniciar la construccin de los intervalos. Al construir el primer intervalo, al valor mnimo le restamos el desplazamiento es decir, 1.01 0.03 = 0.98, ste es el lmite inferior del primer intervalo de clase y su lmite superior ser 0.98 + Ac, es decir, 0.98 + 0.17 = 115, Para el caso del segundo intervalo de clase, su lmite inferior es el lmite superior del primer intervalo de clase o sea 115 y el lmite superior ser 1.15 + 0.17 = 1.32 y as sucesivamente hasta llegar al nmero de intervalos definidos. Esto es continuidad, ya que no existe ruptura entre intervalos. Entonces, para este tipo de variable (cuantitativa continua), los intervalos de clases son abiertos por la izquierda y cerrados por la derecha.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Luego se determina los Puntos Medios de Clase o Marcas de Clase en la segunda columna de la
tabla, esto es: PMC = (Li + LS)/2. Posteriormente en una tercera columna se determinan las frecuencias absolutas, que en este caso se define como el nmero de observaciones que caben dentro del intervalo de clase. Para que quepa una observacin dentro de un intervalo de clase en este tipo de variable, ste tiene que ser mayor que el lmite inferior o menor igual que el lmite superior. La tabla antes mencionada quedara de la siguiente forma: Intervalos de Clase 0.98 a 1.15 1.15 a 1.32 1.32 a 1.49 1.49 a 1.66 1.66 a 1.83 1.83 a 2.00 PMC 1.065 1.235 1.405 1.575 1.745 1.915 fi 2 5 8 7 4 4 30 fr 6.67 16.67 26.67 23.33 13.33 13.33 100.00 fia 2 7 15 22 26 30 fra 6.67 23.33 50.00 73.33 86.67 100.00

Para el caso de variables cuantitativas discretas, los intervalos de clases son cerrados por ambos lados.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado METODOS GRAFICOS
Dentro de las representaciones grficas se pueden mencionar las siguientes:

Diagrama de puntos Pictogramas Diagrama de barras sencillas, dobles, mltiples Diagrama de sectores torta o pastel (pie) Histogramas de frecuencias Polgono de frecuencias absolutas relativas Polgono de frecuencia acumulada por la izquierda (menor que) u ojiva Grficos de lnea, etc.

Para efecto de este texto se desarrollarn los principales como son el Diagrama de Puntos por su relacin con el Diagrama de dispersin, Histograma de frecuencia, Polgono de frecuencia, Ojiva y Diagrama de sectores. Diagrama de Puntos Sirve para representar grficamente cuadros de frecuencias en las cuales se consideran nicamente una variable y una cantidad asociada a cada valor de la misma (frecuencias). Existen dos tipos de diagramas de puntos cuya construccin se detalla enseguida. La construccin de los diagramas de puntos se realiza de la siguiente manera:

El primer tipo de diagrama de puntos se construye colocando en el eje horizontal los valores de la variable y en el eje vertical las cantidades asociadas a stos (frecuencias). Finalmente, para cada valor de la variable y cada cantidad asociada se dibuja puntos cuyas alturas corresponde a la magnitud de dicha cantidad.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Para construir el segundo tipo de diagrama de puntos se colocan en el eje horizontal los
valores de la variable y sobre cada valor se dibuja tantos puntos como veces aparecen stos. Para ejemplificar el primer caso se retomar las alturas de los 30 habitantes que han sido mencionados anteriormente. En este caso se puede observar que los valores de la variable altura se encuentran en el eje horizontal y en el vertical, el nmero de habitantes, y el punto est compuesto por las coordenadas (altura, Nmero de habitantes con esa altura).

40 30 20 10 0 0 0.5 1 1.5 2 2.5

A ltura (m)

Histograma Se le llama Histograma a la grfica de barras verticales sin espaciamiento entre ellas, construida colocando en el eje vertical a las frecuencias absolutas relativas y el eje horizontal a los lmites de clase de una tabla de frecuencias. Lo anterior implica que si los intervalos de clases son iguales, sobre cada clase se erigen rectngulos cuyas reas son proporcionales a las frecuencias de clase. Las etapas que se deben de cubrir en la construccin de un histograma son:

Colocar en el eje horizontal los lmites de clases Colocar en el eje vertical las frecuencias relativas o absolutas.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Erigir rectngulos cuya base son las clases y su altura las frecuencias que corresponde a
cada clase Para ejemplificar este mtodo grfico se tomar a la tabla de frecuencia absoluta y relativa y las frecuencias absolutas asociada a cada clase.

Frecuencias absolutas

10 8 6 4 2 0

Intervalos de clases

En este caso, dado que se utiliz la frecuencia absoluta para construir el histograma entonces el histograma toma el nombre de Histograma de Frecuencias Absolutas. Polgono de Frecuencia Un polgono de frecuencia es una grfica de lneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los valores medios (puntos medios) de clases y en el eje vertical a las frecuencias absolutas o relativas. Esto equivale a unir los puntos medios de la cara superior de los rectngulos de un histograma por medio de lneas rectas. Para cerrar el polgono se adiciona una clase tanto inferior como superior para que el polgono cierre.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado


Frecuencias absolutas 10 8 6 4 2 0
5 5 5 5 5 5 0. 89 5 1. 91 2. 08 1. 06 1. 23 1. 40 1. 57 1. 74 5

Puntos Medios de Clases

En este caso al igual que el histograma, el polgono retoma el nombre de la frecuencia que se ha utilizado para construir.

Polgono de Frecuencia Acumulada por la Izquierda o Ojiva

Una Ojiva o Polgono de Frecuencia Acumulada es una grfica construida con segmentos de lneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los lmites superiores de clase y en el vertical a las frecuencias acumuladas absolutas o relativas. Al inicio en el eje horizontal se coloca el lmite inferior de la primera clase y se le asigna una frecuencia acumulada de cero. Asimismo, por su naturaleza una ojiva es no decreciente. Retomando como ejemplo la misma tabla de frecuencia absoluta y relativa, se tomarn las frecuencias absolutas acumuladas por la izquierda o menor que de sta.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado


35 30 25 20 15 10 5 0 0.98 1.15 1.32 1.49 1.66 1.83 2.00 P untos M edios de Clases

Diagrama de Sectores (Torta o pastel) Este tipo de grfico se utiliza para representar datos cualitativos y cuantitativos discretos. Su uso ms frecuente es con el propsito de comparar ya sea las categoras que toma una variable cualitativa o los valores discretos de una variable cuantitativa respecto al total. Para construir este grfico se utiliza una circunferencia, la cual se divide en sectores de tal manera que sus medidas angulares centrales y, por ende la superficie del sector circular sean proporcionales a las magnitudes de los valores de la variable que se trata de representar. Al total de las frecuencias (fi = n) le corresponde el crculo completo, es decir, los 360 0 de la circunferencia y por regla de tres simple se determina el nmero de grados que le corresponde a cada categora o valor discreto en particular. Ejemplo Los datos que se muestran a continuacin corresponden a la distribucin de los docentes de una universidad en particular, respecto al lugar de realizacin de estudios de diplomados. Lugar de realizacin del Diplomado Extranjero Universidad de Inters Otras universidades bolivianas n 19 87 31 % 13.87 63.5 22.63

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado


Total 137 100

Tratando de representar estos datos en diagrama de sectores se tiene lo siguiente: Nmero de grados para la categora Extranjero (19 x 3600) 137

= 49.9 = 50

Del tal manera que quedara de la siguiente forma una vez que se hayan realizado las operaciones correspondiente: Lugar de realizacin del Diplomado Extranjero Universidad de Inters Otras universidades bolivianas Total De forma grfica se vera de la siguiente forma: n 19 87 31 137 Grados 50 229 81 360

Otras universidades bolivianas 23%

Extranjero 14%

Universidad de Inters 63%

MEDIDAS DE TENDENCIA CENTRAL O POSICIN

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Como se pudo observar en la unidad anterior los histogramas o distribuciones de frecuencias
presentan formas muy variadas, por lo que no es fcil de comparar dos conjuntos de datos mediante una inspeccin somera de los histogramas. Por otra parte, una tabla de frecuencia con 15 a 20 clases puede no ser una representacin suficientemente concisa de los datos. Por estas razones y por su importancia en posteriores usos es necesario contar con cantidades que describan sucintamente (rpidamente) el conjunto de datos que se estudia. Son de inters cantidades que localicen el "centro" de las observaciones (o ms bien de su distribucin de frecuencias) y la dispersin o variabilidad de las mismas. A las medidas que localizan el "centro" de los datos se les llama "Medidas de Tendencia Central" y las que miden la variabilidad de las observaciones se les llama "Medidas de Dispersin". Dentro de las medidas de Tendencia Central se pueden mencionar las siguientes: Media o promedio Media ponderada Media Geomtrica Media Armnica Media Cuadrtica Mediana Moda

Por el grado de aplicabilidad sern desarrollada la siguientes medidas de tendencia central: media aritmtica, mediana y moda y, como un caso especial de la media aritmtica, la media ponderada. Media Aritmtica

Tambin llamada media. Def: La media aritmtica de n observaciones de la variable X se denotar

por X, y se define como la suma de ellas dividida por "n". Esto es:
n xi x = ---- = 1,2,3,..., n

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado i=1 n


Ejemplo: Sean los siguientes datos x1=2, x2=12, x3=9, x4=10, x5=7. La media aritmtica de estos datos es: 2 + 12 + 9 + 10 + 7 x = -------------------- = 8 5 Desde un punto de vista geomtrico, la media aritmtica corresponde al punto de equilibrio de los datos. La media aritmtica es la medida descriptiva de tendencia central ms usada. Tiene la ventaja de ser fcil de calcular, adems de poseer propiedades tericas excelente desde el punto de vista de la estadstica inferencia. Su principal desventaja es que, por ser el punto de equilibrio de los datos es muy sensible a la presencia de observaciones extremas. Por otro lado su clculo se vuelve tedioso cuando la base de datos es muy grande. Otra desventaja es que no se puede calcular en datos que tienen intervalos de clases abiertos.

Clculo de la Media Aritmtica en Tablas de Frecuencias En muchas ocasiones se nos presenta el problema de calcular la media a partir de una tabla de frecuencias. Esto se da por dos razones:

Ya se han presentado los datos en forma resumida y no se dispone de las observaciones originales. Cuando se dispone de las observaciones originales, pero su nmero es tan grande que las operaciones aritmticas necesarias para el clculo de la media requieren de mucho trabajo. Entonces el uso de una tabla de frecuencias simplifica considerablemente el trabajo. Se debe de recordar que cuando se tiene una tabla de frecuencias con k clases se da lo

siguiente: k

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado fi = n i=1


En una clase se tienen fi observaciones (frecuencia absoluta), las cuales pueden tener cualquier valor entre el limite superior e inferior de esa clase. Para calcular de una manera aproximada la media, se supone que las observaciones se encuentran uniformemente distribuidas en el intervalo y, por lo tanto, el valor medio de clase (Punto medio de clase o Marca de Clase) es un valor representativo de esa clase. Con esta suposicin el clculo de la suma de las observaciones se simplifica de la siguiente manera: k PMCifi i=1 Esta expresin representara la suma aproximada de las observaciones; por lo tanto, la media aritmtica se determina de la siguiente manera: k

X = PMCifi
i=1

Ejemplo Para ejemplificar la media aritmtica para datos tabulados se retomar la tabla de frecuencias absolutas y relativas que se ha expuesto anteriormente, la cual corresponde a la estatura de 30 personas. Se pide estimar la estatura promedio de estas personas. Es importante ver que lo que se ha solicitado es una estimacin de la estatura y no una determinacin ya que en datos lo nico que se puede hacer es una estimacin ya que la determinacin se la realiza en los datos originales. Retomando la ecuacin de estimacin de la media aritmtica se tiene lo siguiente: k

X = PMCifi
i=1 n

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado n = fi

Intervalos de Clase 0.98 a 1.15 1.15 a 1.32 1.32 a 1.49 1.49 a 1.66 1.66 a 1.83 1.83 a 2.00

PMC 1.065 1.235 1.405 1.575 1.745 1.915

fi 2 5 8 7 4 4 Total Promedio

PMC*fi 2.13 6.175 11.24 11.025 6.98 7.66 45.21 45.21/30 = 1.507

X = 1.507 m/persona
La estimacin proporcion un valor de 1.507 m/persona. La determinacin del promedio en la base de datos original, es de 1.513 m/persona. Siempre se observar una diferencia que es producida por el hecho de en una tabla de frecuencia lo que se realiza es una estimacin y no una determinacin. Propiedades de la Media Aritmtica La media aritmtica tiene muchas propiedades sin embargo, solo expondr una por la relevancia que tiene a nivel de inferencia y es la siguiente:

La suma algebraica de las desviaciones de un conjunto de nmeros respecto a su media aritmtica es cero.

n k (xi - x) = 0; en tablas de frec. fi(PMCi - x) = 0 i=1 i=1

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Mediana


Es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). No presentan el problema de estar influido por los valores extremos. pero en cambio no utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces que se ha repetido). La mediana (Me) de un conjunto de n nmeros, ordenados de menor a mayor, es el nmero central en el arreglo. Si n es un nmero non, slo hay un valor central. Si n es un nmero par, hay dos valores centrales, y la mediana debe tomarse como la media de estos dos valores. Ejemplo.. 1.- Sean la siguiente coleccin de datos: 27, 3.4, 3.2, 3.3, 3.1 El primer paso para determinar la Mediana en datos sin tabular es es ordenar los datos en orden ascendente o descendente de tal forma que: 3.1, 3.2, 3.3, 3.4, 27. Dado que n es un nmero non o impar (n=5), entonces slo hay un valor central (3.3) y ste es el valor de la mediana. Me = 3.3 2.- Calcular la mediana para los siguientes datos y ordenados: 151, 152, 153, 158, 162, 167, 167, 167, 168, 173 En este caso n es par (n=10), por lo que hay dos valores centrales, que son 162 y 167. Entonces partiendo del concepto de Mediana, la Me es la media aritmtica de estos dos valores ya que antes y despus de ella, no existe ms del 50% de los datos. Me = (162 + 167)/2 = 164.5. Entonces cuando este sea el caso la Me, se puede determinar de la siguiente forma: Me = x
(n/2)

+ x 2

[(n/2) +1)

Cuando los datos son simtricos entre la mediana y la media aritmtica no hay mucha diferencia; sin embargo, para datos no simtricos es mejor medida de tendencia central la mediana que la media.

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado


Clculo de la Mediana en datos tabulados Cuando los datos estn agrupados en clases, es decir, cuando existe una tabla de distribucin de frecuencias, para determinar la mediana hay que distinguir, si la variable es discreta o continua. Para el caso de variables discretas se sigue el siguiente procedimiento: Se completa la columna de frecuencias absolutas acumuladas. Se determina la menor frecuencia absoluta acumulada Nj que supera a n/2, es decir:

n/2 < Nj. A la clase que pertenece Nj se le denomina clase de la Mediana. En esta situacin puede ocurrir que n/2 > Nj-1(frecuencia absoluta acumulada antes de Nj). Cuando n/2 > Nj-1, entonces la mediana es: Me(y) = PMC i. (Punto medio de clase de la clase de la Mediana)

Cuando n/2 Nj-1, entonces la Mediana se encontrar entre PMCj-1, PMCj. Entonces: Me(y) = (PMCj-1 + PMCj)/2; donde PMCj-1 es el punto medio de la clase que precede a la clase de la mediana y PMCj es el punto medio de la clase de la mediana.

Ejemplo: Supngase que se tienen los siguientes datos tabulados: PMC 20 30 50 60 70 80 90 Total fi 12 10 20 18 15 10 7 92 fia 12 22 42 60 75 85 92

Siguiendo el procedimiento antes mencionado, ya se presenta completada la columna de las fia y la suma de las fi = n = 92, entonces: n/2 = 46, entonces la < fia que supera a n/2 = 46, es fia = 60, por lo tanto a la clase que pertenece este valor se le llama Clase de la Media y l recibe el nombre

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado de Nj, entonces Nj-1 = 42. En este caso n/2 > Nj-1 (46 > 42), por lo tanto Me = PMCj, entonces Me
= 60. Para el caso de datos tabulados para variables continuas, la Mediana se determina de la siguiente Manera: Me =a + Donde: Me = Mediana a = Lmite inferior de la clase de la Mediana b = Lmite superior de la clase de la Mediana c = Frecuencia relativa acumulada Nj-1 d = Frecuencia relativa de la clase de la Mediana Como se puede observar todos los insumos requeridos para la determinacin de la Me, estn en la misma tabla. Moda La Moda (Mo) de un conjunto de datos es la observacin o valor (si existe) que ocurre con mayor frecuencia. Si es un valor nico se dice que la distribucin de frecuencias es unimodal. Si se tienen dos o ms valores con la misma frecuencia mxima se dice que la distribucin es bimodal, trimodal, etc. Ejemplo: sean los siguientes datos las calificaciones de un examen: 10, 7, 8, 7, 9, 8, 7, 9. En este caso la calificacin que ms se repite es 7 ya tiene una frecuencia fi =3, por lo tanto la Mo es 7. Sean los siguientes datos: 10, 6, 7, 4, 13, 16, 18 Como se puede observar en estos datos todos tienen una frecuencia absoluta igual a 1, por lo tanto no tiene moda este conjunto de datos. Las distribuciones de este tipo se les llaman uniformes. Sean los datos: 4, 3, 4, 7, 2, 7, 5, 4, 7, 5, 9, 7, 4 (b-a)(0.5 - c) d

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado Aqu se puede observar que los valores numricos con mayor e igual frecuencia son los valores 4 y
7 por lo tanto la moda de estos datos es 4 y 7, o sea que una distribucin bimodal. Cuando los datos se encuentran organizados en Cuadros de frecuencia, la Mo es el valor que tiene la mayor frecuencia absoluta. Ejemplo: Los datos que se muestran a continuacin, corresponden a la estatura de 30 personas que conformaron una muestra. Segn el cuadro de frecuencia donde se presenta esta informacin, existe 3 valores que tienen la mayor frecuencia absoluta. Estos son 1.21, 1.22 y 1.28 con fi = 4; por lo tanto existen 3 Modas. stas son: 1.21, 122 y 1.28 m, por lo tanto la distribucin es trimodal. Observacin 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30 Total Frecuencias fi 1 4 4 2 1 2 3 3 4 3 3 30 fia 1 5 9 11 12 14 17 20 24 27 30 fr (%) 3.33 13.33 13.33 6.67 3.33 6.67 10.00 10.00 13.33 10.00 10.00 100 Fra 3.33 16.66 30.00 36.66 40.00 46.66 56.66 66.66 80.00 90.00 100.00

Cuando estn organizados en una tabla de frecuencias absoluta y relativa y si la variable es discreta, se procede de igual manera que la anterior, pero referida a la clase con mayor fi llamada Clase Modal, el punto medio de esta clase viene a ser la Moda. Si los datos estn organizados en una tabla de frecuencia absoluta y relativa y, si la variable es continua la Mo se determina de la siguiente manera: (ficm - ficpm) (ficm - ficpm) + (ficm - ficposm)

Mo = Licm + Acm

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado


Donde: Mo = Moda Licm = Lmite inferior de la clase modal Acm = Amplitud de clase de la clase modal ficm =Frecuencia absoluta de la clase modal ficpm = Frecuencia absoluta de la clase postmodal ficposm = Frecuencia absoluta de la clase postmodal Ejemplo: Sea la siguiente tabla de frecuencia absoluta y relativa correspondiente a la variable estatura de 30 personas. De hecho la variable estatura es una variable cuantitativa continua, adems la tabla lo demuestra ya que entre los intervalos no existe ruptura. Intervalos de Clase (0.98 a 1.15] (1.15 a 1.32] (1.32 a 1.49] (1.49 a 1.66] (1.66 a 1.83] (1.83 a 2.00] PMC 1.065 1.235 1.405 1.575 1.745 1.915 fi 2 5 8 7 4 4

En este caso la clase modal sera aquella que tiene mayor frecuencia absoluta, esta es: (1.32 a 1.49] =8, entonces partiendo de la ecuacin proporcionada anteriormente:

Mo = Licm + Acm

(ficm - ficpm) (ficm - ficpm) + (ficm - ficposm)

Mo = 1.32 + 0.17 [(8 - 5)/((8 - 5) + (8 7)) = 1.1175

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado MEDIDAS DE DISPERSION
Estas son las medidas que miden como se dispersan los datos, generalmente alrededor de una medida de tendencia central. Entre stas se pueden mencionar las siguientes: Rango o Amplitud Desviacin Media y Median Varianza y Desviacin Tpica Dispersin Relativa Generalmente las ms utilizadas son: Varianza, Desviacin tpica y Dispersin relativa o

Coeficiente de Variacin y una que en los mtodos tabulares ya se ha utilizado como es el Rango.

Rango La Amplitud, Rango o Recorrido de un conjunto de datos es la diferencia entre las observaciones de mayor y menor valor numrico en el mismo. R = Valor max. - Valor mn Tiene la ventaja de ser fcil su determinacin, pero no es una buena medida de dispersin ya que solo toma en cuenta dos valores de toda la coleccin y no idea de cmo es la variabilidad dentro de los datos.

Varianza

La varianza retoma un nombre de acuerdo a dnde se determina. Si la determinacin es en una poblacin se la llama Varianza Poblacional () y Muestral (s). La Varianza Poblacin o Variancia de una poblacin finita de N elementos x1, x2, x3, ...xn; se define como la media aritmtica del cuadrado de las desviaciones de las observaciones respecto a su media ; y se determina a travs de la siguiente ecuacin: si es en una muestra se le llama Varianza

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado (xi - ) = n


Para varianza poblacional. En caso de que sea muestral y para datos no organizados en una tabla de frecuencia absoluta y relativa, se determina de la siguiente forma: S = (xi - x) n-1

Para datos tabulados, la varianza se determina de la siguiente manera: PMCfi (PMCfi) n

S =

n-1 Existe una frmula de trabajo mucho ms rpido para determinar la varianza muestral para datos no tabulados que resulta de desarrollar en trinomio cuadrado perfecto de la ecuacin. Esta frmula es: xi(xi) n n-1 Ejemplo: Sean los siguientes datos las estaturas de 30 estudiantes de un saln de clases Alumno 1 2 3 4 5 6 7 8 9 10 S = xiEstatura 1.25 1.28 1.27 1.21 1.22 1.29 1.30 1.24 1.27 1.29 (xi) n Alumno 11 12 13 14 15 16 17 18 19 20 Estatura 1.23 1.26 1.30 1.21 1.28 1.30 1.22 1.25 1.20 1.28 Alumno 21 22 23 24 25 26 27 28 29 30 Estatura 1.21 1.29 1.26 1.22 1.28 1.27 1.26 1.23 1.22 1.21

S =

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado n-1


xi = (1.25 + 1.28 + 1.27 + + 1.21) = 47.1558 xi = (1.25 + 1.28 + 1.27 + + 1.21) = 37.6 n = 30 47.1558 30-1 S = 0.00105 m Dado que la varianza eleva al cuadrado las unidades originales de medicin, no se debe comparar con la media aritmtica ya que sta es medida en unidades lineales. Por esta razn, es que se genera una nueva medida de dispersin llamada Desviacin Tpica. Desviacin Tpica No es ms que la raz cuadrada de la varianza. En este sentido se puede hablar entonces desviacin tpica poblacional y muestral, entonces: = S = S Para el caso del ejemplo anterior, S = 0.00105 = 0.0324 m Coeficiente de Variacin Todas las medidas de dispersin antes descritas son medidas de variacin absoluta. Una medida de la dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el Coeficiente de Variacin. (37.6) 30

S =

Coeficiente de Variacin (C.V): Es una medida de dispersin relativa de un conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto datos entre su media aritmtica. C.V = (S / x) Cuando se multiplica por 100 se expresa en porcentaje indicando tanto por uno se alejan los datos de su media aritmtica. C.V = (S / x)*100

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado


Ejemplificando con los datos anteriores se tendra:

C.V = (0.0324/1.253)*100 = 2.586%, indicando con ello que por cada valor de la media los datos se dispersan en un 2.586% alrededor de ella. Ejemplo. Sean la siguiente tabla de frecuencia absoluta y relativa, las estaturas correspondientes a 30 estudiantes. La tabla es la siguiente

Intervalos de Clase (0.98 a 1.15] (1.15 a 1.32] (1.32 a 1.49] (1.49 a 1.66] (1.66 a 1.83] (1.83 a 2.00]

PMC 1.065 1.235 1.405 1.575 1.745 1.915

fi 2 5 8 7 4 4

Determine la el Coeficiente de Variacin de los datos. Ntese que solo piden CV, entonces necesitamos dos insumos, la desviacin tpica y la media aritmtica de los mismos. Como se necesita S, entonces se necesita de S. Entonces realizando los clculos necesarios en la misma tabla se obtienen todos los insumos para la estimacin del Coeficiente de variacin como se muestra a continuacin. Note que lo que se hizo fue generar los componentes de las ecuaciones a determinar:

Intervalos de Clase (0.98 a 1.15] (1.15 a 1.32] (1.32 a 1.49] (1.49 a 1.66] (1.66 a 1.83]

PMC 1.065 1.235 1.405 1.575 1.745

fi 2 5 8 7 4

PMCfi PMCfi 2.2685 7.6261 15.792 17.364 12.18 2.13 6.175 11.24 11.03 6.98

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Escuela Militar de Ingeniera EMI Santa Cruz Escuela de Postgrado (1.83 a 2.00] 1.915 Totales
(PMCfi) n

4 30

14.669 7.66 69.9 45.21

S =

PMCfi -

n-1 (45.21) 30 30-1 S = 0.0609 S = 0.0780 k

S =

69.9 -

X = PMCifi
i=1 n

X = 45.21/30 = 1.507 C.V = (S / x)*100

C.V = (0.0078/1.507)*100 = 0.5176

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs en Educacin Superior

Potrebbero piacerti anche