Sei sulla pagina 1di 196

ESTADISTICA DESCRIPTIVA

LUIS FERNANDO VILLANUEVA GARCIA MPH, EE Mdico Cirujano CMP 25521

ESTADISTICA DESCRIPTIVA CONCEPTOS BASICOS

DEFINICION DE ESTADISTICA
La Estadstica es parte del mtodo cientfico y se le define como un conjunto de tcnicas usadas para recopilar, organizar, presentar e interpretar datos, con el fin de obtener conclusiones y tomar decisiones sobre determinados hechos o fenmenos en estudios

CLASIFICACION DE LA ESTADISTICA
La estadstica se clasifica de acuerdo a las dos funciones que realiza:
ESTADISTICA DESCRIPTIVA: Es aquella parte de la estadstica que describe y analiza una poblacin, sin pretender sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas son validas slo para dicha poblacin. ESTADISTICA INFERENCIAL: Es aquella parte de la estadstica, cuyo propsito es inferir o inducir leyes de comportamiento de una poblacin, a partir del estudio de una muestra. Es decir las conclusiones obtenidas a partir de una muestra, son validas para toda la poblacin.

POBLACION o UNIVERSO
Es un conjunto grande y completo de individuos, elementos o unidades que presentan caractersticas comunes y observables Ejemplo: Todos los pacientes atendidos con cncer en el ao 2,006 en el Hospital Ollanta

MUESTRA
Es un sub conjunto de la poblacin

Ejemplo: Si la poblacin consiste en un total de pacientes atendidos con cncer en el ao 2,006 en el Hospital Ollanta. Una muestra sera el nmero de pacientes atendidos con cncer en febrero del 2,006

UNIDADES DE OBSERVACION
Constituyen los elementos o cosas observados

OBSERVACIONES
Estadsticamente son los datos que se recolectan para un estudio

Ejemplo: Si una enfermera lleva a cabo una investigacin sobre los menores desnutridos atendidos en el Instituto Nacional de Salud del Nio; para cada nio la enfermera obtendr la edad, peso y talla. En este caso, los nios constituyen las unidades de observacin; y la edad, peso y talla de cada nio vienen a ser las observaciones

VARIABLES
Se definen las variables, como magnitudes que tienden a sufrir modificaciones o cambio dentro de un dominio determinado. Es decir, las caractersticas que varan de individuo a individuo o de objeto a objeto se llaman variables; mientras que las que permanecen inalterables, se llaman constantes. Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X, Y, Z; y los valores de las variables se designan con letras minsculas: x, y z.

Ejemplo: La Universidad Daniel A. Carrin lleva a cabo un estudio para determinar la situacin ocupacional de sus egresadas en la carrera de Enfermera. En relacin a este estudio, identifique las propiedades siguientes como constantes o variables: Sexo. Ingresos anuales. Profesin. Nmero de aos de experiencia. Nivel jerrquico ocupacional.

PROPIEDADES Sexo Ingresos anuales Profesin Aos de experiencia Nivel Jerrquico

ES Constante Variable Constante Variable Variable

POR QUE? Sexo femenino Diferentes ingresos Todas son enfermeras Diferentes aos Diferente nivel

CLASIFICACION DE LAS VARIABLES


POR SU GENERALIZACION O NIVEL DE ABSTRACCION
TEORICAS: Son aquellas que necesitan definirse operacionalmente; porque sus cualidades o caractersticas no son fcilmente observables ni medibles Ejemplo: Desarrollo econmico, estrato socio econmico, rendimiento acadmico, hbitos de consumo, etc.

INTERMEDIAS: Son variables que permiten especificar a las variables tericas, con el fin de hacerlas observables y medibles. EMPIRICAS: Son aquellas variables que no necesitan definirse operacionalmente; porque sus valores se identifican en forma inmediata y son fcilmente medibles. Ejemplo: Edad, sexo, peso, talla, etc.

NOTA: Operacionalizar una variable significa transformar las variables tericas (no observables ni medibles) en variables intermedias y luego en variables empricas (observables y medibles)

VARIABLE TEORICA Rendimiento Acadmico de Las alumnas de Enfermera

VARIABLE INTERMEDIA Calificaciones

Asistencia a clases Practicas pre profesionales

VARIABLE EMPIRICA alta : 17 - 20 media : 11 - 16 baja : 00 - 10 Regular : 81 100 % Media : 61 80 % Baja : Menos de 61% Eficiente : A Regular : B Deficiente: C

POR SU RELACION CAUSAL


INDEPENDIENTES: Generalmente se simbolizan con la letra mayscula X; y son aquellas que no dependen de ninguna variable dentro de un contexto determinado. Indican: causa, antecedente, determinante.

DEPENDIENTES: Generalmente se simbolizan estas variables con la letra mayscula Y; y son aquellas que dependen de otra u otras variables dentro de un contexto determinado. Indica: efecto, resultado, consecuente.
Ejemplo: El escaso fomento de la educacin en la poblacin, genera X mayor desnutricin infantil en las familias con bajo nivel de Y instruccin. Z

POR SU NATURALEZA
VARIABLES CUALITATIVAS: Son aquellas cuyo dominio de variacin son objetos de clasificacin. Ejemplo: VARIABLE DOMINIO DE VARIACION Sexo Masculino, Femenino VARIABLES ORDINALES: Son aquellas cuyo dominio de variacin son objetos de clasificacin y orden. Ejemplo: VARIABLE DOMINIO DE VARIACION Nivel de Instruccin Analfabeto, primaria, secundaria, superior

VARIABLES CUANTITATIVAS: Son aquellas cuyos valores del dominio de variacin son contados o medidos. Se clasifican en: CUANTITATIVAS DISCRETAS: Cuando los valores del dominio de variacin son contados; y por lo tanto slo pueden asumir valores enteros. Ejemplo: VARIABLE DOMINIO DE VARIACION Nmero de alumnos 50, 80, 100 alumnos

CUANTITATIVA CONTINUA: Cuando los valores del dominio de variacin son susceptibles de ser medidos. Pueden asumir valores decimales Ejemplo: VARIABLE DOMINIO DE VARIACION Peso 56.5 Kg. 58.7 Kg. 60.2 Kg.

MEDICION DE LAS VARIABLES


Las variables no slo se clasifican, sino que tambin es necesario medirlas. La medicin se hace necesaria con el fin de diferenciar por comparacin , un elemento de otro, en las caractersticas de la variable. Estas se hacen a travs de niveles o escalas entre los cuales tenemos:

ESCALA NOMINAL: Es el nivel ms simple de medicin donde la variable establece categoras slo se nombran o se enumeran , pero no se comparan. En este nivel las variables pueden ser: DICOTOMICAS: Ejemplo: VARIABLE DOMINIO DE VARIACION Sexo Masculino, Femenino

TRICOTOMICAS: Si tienen tres categoras o clases Ejemplo: VARIABLE DOMINIO DE VARIACION Raza Blanca, Negra, Amarilla

POLITOMICAS: Si tienen ms de tres categoras Ejemplo: VARIABLE DOMINIO DE VARIACION Estado civil Soltero, casado, viudo, divorciado

ESCALA ORDINAL: Es el segundo nivel de medicin donde la variable establece categoras jerarquizadas. Este nivel de medicin no mide las magnitudes de las diferencias, pero si permite apreciar que los valores asignados a los individuos caen ms alto o bajo que otros Ejemplo: VARIABLE DOMINIO DE VARIACION Nivel socio econmico Alto, medio, bajo

ESCALA DE INTERVALO: Es el tercer nivel de medicin, entre cuyos diversos valores que toma la variable existen a la vez, clasificacin, orden y grados de distancia iguales entre las diferentes categoras, es decir, los intervalos son considerados como equivalentes y con un origen convencional (la unidad de medida no necesariamente tiene que partir del valor cero; slo sirve como punto o valor de comparacin) Ejemplo: Temperatura: Un paciente puede llegar a tener 39 c de fiebre, pero ello no significa que su grado de temperatura haya tenido que partir de 0 c.

Rendimiento escolar: Un nio puede obtener calificacin 15 en matemticas, pero ello no nos lleva a pensar que necesariamente para llegar a esa calificacin haya tenido que obtener primero nota de cero. Coeficiente de inteligencia. Presin Arterial.
ESCALA DE RAZON O PROPORCION: Es el nivel ms alto de medicin, y donde la variable supone o comprende a la vez a todos los casos anteriores: clasificacin, orden, distancia y origen nico natural o punto de origen natural (la unidad de medida necesariamente tiene que partir del valor cero). Ejemplo: Edad: un paciente puede tener 30 aos de edad, pero para llegar a esa edad, necesariamente ha tenido que partir de cero aos. Estatura Peso

CUALITATIVAS ORDINALES
VARIABLE CUANTITATIVAS DISCRETAS CONTINUAS

NOMINAL ORDINAL INTERVALO


RAZON o PROPROCION ESCALA DE MEDICION

Las variables que segn su naturaleza son cualitativas, por su medicin pertenecen a la escala nominal; y las ordinales a la escala ordinal. Las variables que segn su naturaleza son cuantitativas, pertenecen a la escala de intervalo o razn

ESTADISTICA DESCRIPTIVA
ETAPA DE RECOLECCION DE DATOS

RECOLECCION DE DATOS
A travs de la recoleccin, se obtienen los datos que requieren para alcanzar los objetivos y demostrar las hiptesis de la investigacin. La obtencin de los datos se hace teniendo en cuenta lo siguiente: FUENTES DE INFORMACION: Cuando se recoge informacin se posible que los datos ya hayan sido obtenidos de las unidades de observacin y publicados o registrados por otros , o que los datos se tengan que obtener directamente de las unidades de observacin en forma personal. Segn los casos, estamos hablando de las fuentes de informacin, que son de dos tipos:

FUENTE PRIMARIA
Si la informacin se obtiene directamente de la misma persona o entidad utilizando ciertas tcnicas (entrevista, cuestionario, etc.) Ejemplo: Aplicar un test a un grupo de estudiantes para determinar el nivel intelectual. Llevar a cabo una encuesta para conocer la situacin socio econmica de los pobladores del asentamiento humano Fuji. Observar la reaccin de un grupo de pacientes con determinada enfermedad.

FUENTE SECUNDARIA
Si la informacin a obtener, ya ha sido recopilada y elaborada por otras personas o instituciones. Este tipo de informacin la encontramos en los informes estadsticos de las Instituciones Pblicas y privadas. En el Per, el Instituto Nacional de Estadstica, publica boletines estadsticos con respecto a la produccin, inversiones, poblacin, migraciones, salud, etc.

SISTEMAS DE RECOLECCION
Los datos pueden ser recogidos a travs de: REGISTROS: Mediante los registros se anotan los datos en forma regular, permanente y obligatoria, obteniendo la informacin total y sistemtica de los hechos ocurridos. Ejemplo: Registro de contribuyentes. Registro Nacional de Identificaciones Registro Civil Etc.

ENCUESTAS: Es la recoleccin de datos en forma temporal y puede ser: Censal: Cuando abarca a toda la poblacin en estudio Ejemplo: Censo de poblacin y vivienda de una localidad o de un pas. Muestral: Cuando abarca una parte de la poblacin en estudio. Ejemplo: Encuesta de fecundidad. Encuesta de nutricin. Etc. TECNICAS DE RECOLECCION: Existen muchos procedimientos para recoger la informacin, entre los cuales el investigador debe elegir los que se adapten a las circunstancias o al tipo de investigacin. Entre las tcnicas ms usadas tenemos: Cuestionario, Observacin, Entrevista, Test, Anlisis de contenidos, etc.

ESTADISTICA DESCRIPTIVA
ETAPA DE ELABORACION DE DATOS

ELABORACION DE DATOS
En la etapa de recoleccin se obtiene gran cantidad de datos, los mismos que se encuentran en formularios, cuestionarios, etc.; y totalmente desordenados. En esta etapa se trata de organizar dichos datos y para ello es necesario cumplir dos actividades: Revisin o crtica y clasificacin de datos.
REVISION O CRITICA DE DATOS: La revisin tiene por objeto: a) Determinar si se han recibido todos los formularios o, cuando menos, en una proporcin que sea suficiente para no invalidar las conclusiones que se podran hacer. b) Verificar que estn registradas todas las respuestas requeridas. c) Localizar posibles incongruencias en la informacin proporcionada

La Revisin de datos constituye lo que se ha dado en llamar Control de Calidad de la Informacin


Entre las posibles causas del envo incompleto de formularios tenemos: formularios o cuestionarios muy extensos, ausencia de instrucciones claras, bajo nivel educativo del informante, dotacin insuficiente o inoportuna de los formularios cuestionarios, etc. Si no se han registrado todas las respuestas requeridas, puede deberse a: Formularios o cuestionarios mal diseados, negligencia del entrevistador ya que no recibi adiestramiento, informante se niega a contestar la pregunta, etc.

Las incongruencias provenientes de respuestas, cuyos valores quedan fuera de lo considerado como posible o probable. Por ejemplo, si se indica que una persona tiene 5 aos de edad y luego aparece su grado de instruccin como educacin Superior, entonces es evidente que existe incongruencia. Las causas de tales incongruencias pueden ser: personal poco calificado e irresponsable, preguntas confusas en el formulario que por su extensin provoca fatiga, informante poco motivado que da como respuesta lo primero que se le ocurre para salir del paso o demasiado complaciente, pues piensa que negar o afirmar determinada cosa va ser recibido con beneplcito por el encuestador.

CLASIFICACION DE DATOS
La clasificacin tiene por objeto organizar los datos en categoras, pero teniendo en cuenta la escala de medicin de las variables.

CLASIFICACION DE LOS DATOS MEDIDOS A NIVEL NOMINAL u ORDINAL: Para elaborar datos que pertenecen a variables nominales y ordinales, es necesario conocer como se clasifica la variable, y luego se procede a la tabulacin.

Grado de Instruccin Frecuencia o cantidad Analfabeto Primaria Secundaria

Superior
TOTAL

CLASIFICACION DE LOS DATOS MEDIDOS A NIVEL DE INTERVALO O DE RAZON: La elaboracin de datos cuyas variables pertenecen a la escala de intervalo o de razn, tienen otro tipo de tratamiento, ya que su organizacin y posterior anlisis, es necesario agruparlos en clases o intervalos. Esta forma de organizacin se conoce con el nombre de DISTRIBUCION DE FRECUENCIAS.
Supongamos que hemos recogido informacin sobre el consumo de protenas (medidos en gramos) en una muestra de 20 nios entre 1 a 6 aos de edad, y que corresponden al estudio de los nios desnutridos de la comunidad Adelante. Los datos son los siguientes: 21, 25, 35, 22, 18, 24, 21, 23, 16, 23, 27, 17, 26, 19, 29, 20, 19, 20, 23, 22.

Al observar los datos podemos apreciar su variabilidad y tambin el desorden en que se encuentran, hacindose difcil el anlisis lo cual no permite destacar los hechos ms importantes para obtener conclusiones acertadas que ayuden en la toma de decisiones. De all que se hace necesario ordenar los datos en una TABLA DE DISTRIBUCION DE FRECUENCIAS. Para elaborar una tabla de distribucin de frecuencias se debe seguir los siguientes pasos: PASO 1: CALCULO DEL RANGO O RECORRIDO (R):El rango se define como la distancia entre el dato mximo y el dato mnimo. Se halla restando el dato mayor (X max) con el dato menor (X min): R = X max - X min Para el ejemplo tenemos: X max: 35; X min: 16; Luego el R = 35 - 16 = 19

PASO 2: DETERMINACION DEL NUMERO DE CLASES (K): Nmero de clases, es el nmero de categoras o intervalos en el que se va a dividir la informacin. El nmero de clases se puede fijar arbitrariamente, dependiendo del nmero de datos que se tenga. Por lo general el nmero de clases a elegir, vara entre 5 a 20. Sin embargo, existe tambin otra forma de determinar el nmero de clases con bastante aproximacin, la cual se le conoce con el nombre de REGLA DE STURGE, y cuyo clculo responde a la siguiente frmula:
K = 1 + 3.3 Log N K = Nmero de clases

N = NUMERO DE DATOS

Para el ejemplo tenemos: K = 1 + 3.3 Log 20 = 5.29 NOTA: El valor de K debe redondearse siempre al entero ms prximo. Esto significa que la informacin se dividir en cinco clases, de la siguiente manera:

CLASES (i) 1 2 3 4 5

PASO 3: DETERMINACION DE LA AMPLITUD DEL INTERVALO (W): Llamado tambin ancho de clase, la amplitud es la cantidad de datos que estn comprendidos en un intervalo de clases. Un intervalo se forma por dos lmites que van a definir una clase. Lmites son los valores extremos de un intervalo y son de dos tipos: lmite superior y lmite inferior. Cuando un intervalo no tiene lmite superior o inferior, se llama intervalo de clase abierto. Luego podemos definir tambin la amplitud del intervalo (w) como la distancia entre el lmite inferior y superior de un intervalo, y se halla a travs de la frmula:
RANGO

AMPLITUD DE INTERVALO

W=R / K

NUMERO DE CLASES

Para el ejemplo tenemos: W = 19 / 5 = 3.8 = 4 NOTA: El valor de W se redondea al entero slo si los datos son enteros o discretos. Si los datos proporcionados estn en decimales, W se redondea de acuerdo al nmero de decimales de la informacin. PASO 4: FORMACION DE LOS INTERVALOS DE CLASE (Ii): Formar los intervalos de clase, significa hallar los lmites inferior y superior de cada intervalo; y para ello se parte del dato menor (X min = 16) y se le suma la amplitud del intervalo (W = 4), de la siguiente manera: W: 1 2 3 4 LIMITE INFERIOR 16 17 18 19 LIMITE SUPERIOR

INTERVALO

Luego 16 constituye el lmite inferior y 19 el lmite superior de la primera clase. Igual procedimiento se sigue con la segunda y hasta la quinta; de tal forma que se obtiene lo siguiente:

CLASES (i)
1 2 3 4 5

INTERVALOS DE CLASES (Ii) 16 19 20 23 24 27 28 31 32 35

Una forma prctica de determinar los intervalos de clase, consiste en hallar primero todos los lmites inferiores de cada clase, sumando el primer limite inferior la amplitud del intervalo. As: X min = 16 Lmite inferior de la primera clase. 16 + 4 = 20 Lmite inferior de la segunda clase. 20 + 4 = 24 Lmite inferior de la tercera clase. 24 + 4 = 28 lmite inferior de la cuarta clase. 28 + 4 = 32 lmite inferior de la quinta clase. Al lmite inferior de la segunda clase, se le resta una unidad para obtener el lmite superior de la primera clase; obtenido ste, se le suma la amplitud del intervalo para obtener los lmites superiores de cada clase.

As: 20 1 = 19 Lmite superior de la primera clase. 19 + 4 = 23 Lmite superior de la segunda clase. 23 + 4 = 27 Lmite superior de la tercera clase. 27 + 4 = 31 lmite superior de la cuarta clase. 31 + 4 = 35 lmite superior de la quinta clase.

NOTA: Cuando se trata de nmeros decimales se le resta un dcimo (0.1), un centsimo (0.01), un milsimo (0.001), segn corresponda al nmero de decimales que contenga la informacin.

Los intervalos no siempre van a tener la misma amplitud. De acuerdo a la investigacin y a la necesidad de presentar la informacin para su anlisis correspondiente, es posible tener tres tipos de intervalos:

Intervalos de igual amplitud


Protenas en gramos

Intervalos de diferente amplitud


Grandes grupos de edad

Intervalos abiertos
Peso de pacientes en Kg.

16 20 24 28 32 -

19
23 27 31 35

0 15 65 -

14
64 85

Menos de 55
55 60 65 59 64 69

70 y ms

PASO 5: FRECUENCIA ABSOLUTA SIMPLE (fi): Es el nmero de veces que se repite los valores dentro de los diferentes intervalos en que se ha dividido la informacin. Para obtener la frecuencia absoluta de cada clase, se efecta la tabulacin o conteo mediante el sistema de palotes. Para nuestro ejemplo hay cinco valores (16,17,18,19,19) que se encuentran en el intervalo 16 a 19; luego la frecuencia absoluta simple para la primera clase es igual a cinco. As mismo, para la segunda clase hay 9 valores (20,20,21,21,22,22,23,23,23) que se encuentran en el intervalo 20 a 23; siendo la frecuencia absoluta simple para dicha clase 9; y as sucesivamente hasta obtener las frecuencias absolutas simples para todas las clases, de la siguiente manera:

INTERVALOS DE CLASES
NUMERO DE CLASES

FRECUENCIAS ABSOLUTAS SIMPLES

i
1 16

Ii
19

fi
5

2
3 4 5

20 24 28 32 -

23
27 31 35

9
4 1 1
20
SUMATORIA

PASO 6: FRECUENCIA ABSOLUTA ACUMULADAS (Fi): Se obtiene sumando y acumulando los valores absolutos clase por clase en orden ascendente. Para nuestro ejemplo tenemos: F1 = 5 F2 = 5 + 9 = 14 F3 = 5 + 9 + 4 = 18 F4 = 5 + 9 + 4 + 1 = 19 F5 = 5 + 9 + 4 + 1+ 1 = 20 PASO 7: FRECUENCIAS RELATIVAS SIMPLES (hi): Es el valor que resulta al dividir cada una de las frecuencias absolutas simples entre el total de frecuencias o datos. As tenemos: hi = fi / N h1 = 5 / 20 = 0.25 h2 = 4 / 20 = 0.20

PASO 8: FRECUENCIA REALTIVAS ACUMULADAS (Hi): Se obtiene sumando y acumulando los valores relativos clase por clase en orden ascendente. As tenemos: H1 = 0.25 H2 = 0.25 + 0.45 = 0.70 H3 = 0.25 + 0.45 + 0.20 = 0.90 H4 = 0.25 + 0.45 + 0.20 + 0.05 = 0.95 H5 = 0.25 + 0.45 + 0.20 + 0.05 + 0.05 = 1.00 NOTA: Por lo general, a las frecuencias relativas las multiplicamos por 100, con el fin de obtener los valores expresados en porcentajes

PASO 9: PUNTO MEDIO O MARCA DE CLASE (Xi): Se define como la semi suma de los lmites inferior y superior de cada intervalo de clase: Xi = (Lmite inferior + Lmite superior) / 2 Para nuestro ejemplo tenemos: X1 = 16 + 19 / 2 = 17.5 X2 = 20 + 23 / 2 = 21.5 As sucesivamente

Luego la tabla completa de distribucin de frecuencias sera la siguiente:

Clase

Intervalo s de clase

Frec. Absolutas simples fi

Frec. Absolutas acumulad as Fi

Frec. Relativas simples hi

Frec. Relativas acumulad as Hi

Marca de clase

Frec. Relativas simples (%) hi%

Frec. Relativas acumulad as (%) Hi%

Ii

Xi

16 - 19

0.25

0.25

17.5

25

25

20 - 23

14

0.45

0.70

21.5

45

70

24 - 27

18

0.20

0.90

25.5

20

90

28 - 31

19

0.05

0.95

29.5

95

32 - 35

20

0.05

1.00

33.5

100

TOTAL

20

1.00

100

PROPIEDADES Y REALCIONES DE LAS FRECUENCIAS: 1. Las frecuencias absolutas son cantidades enteras positivas (o cero en algunos casos) 2. Las frecuencias relativas se pueden expresar en tanto por uno ( nmeros decimales mayor o igual que cero, pero menor que 1); tambin pueden expresarse en porcentaje. Es decir: 0 < = hi < 1 o 0% < = hi < = 100% 3. La suma de las frecuencias absolutas de todas las clases es igual al nmero total de datos. 4. La suma de las frecuencias relativas es igual a 1.00 100% 5. La frecuencia absoluta acumulada de la ltima clase es igual al nmero total de datos. 6. La frecuencia relativa acumulada de la ltima clase es igual a 1 100%.

ETAPA DE ELABORACION DE DATOS

EJERCICIOS RESUELTOS

1. Un investigador social desea determinar en la comunidad Pan y agua el nmero de horas semanales que dedican los nios menores de 6 aos de edad, a ver televisin, Una muestra de 25 nios, arroj los siguientes resultados (en nmero de horas semanales) 10 19 25 19 26 16 19 27 27 25 23 22 17 12 20 15 21 23 26 14 18 25 23 24 21 Se solicita a. Ordenar la informacin en una tabla de distribucin de frecuencias. b. Interpretar algunos valores de las frecuencias halladas

a.

Para ordenar la informacin, utilizaremos la regla de Sturges. Calculo del rango: R = 27 - 10 = 17 Nmero de clases: K = 1 + 3.3 Log 25 = 5.62 Que redondeando al entero ser 6 Amplitud de intervalo: W = 17 / 6 = 2.83 Que redondeando al entero ser 3 Formacin de intervalos y frecuencias:

i 1
2 3 4 5

Ii 10 - 12
13 - 15 16 18 19 21 22 24

fi 2
2 3 6 5

Fi 2
4 7 13 18

hi 0.08
0.08 0.12 0.24 0.20

Hi 0.08
0.16 0.28 0.52 0.72

Hi (%) 8
8 12 24 20

Hi (%) 8
16 28 52 72

25 - 27

7
25

25

0.28
1.00

1.00

28
100

100

Interpretacin: f6 = 7 de los 25 nios, ven televisin entre 25 y 27 horas / semanales, o sea, el 28% de los nios est la mayor cantidad de tiempo viendo televisin. f1 = 2 nios, que equivalen al 8%, ven televisin entre 10 y 12 horas / semanales H4 = 52% = El 52% de los nios de esa comunidad Pan y Agua ven televisin entre 10 y 21 horas / semanales.

2.

Los siguientes datos son los pesos medidos en Kg. De 30 pacientes, atendidos en los meses de enero a marzo del 2,005, en el consultorio de nutricin del Hospital Nacional Fuji - Fuji 75.8 69.3 96.2 86.3 99.8 84.6 72.2 74.1 76.0 86.5 70.2 61.8 58.4 69.2 68.4 68.3 75.0 67.3 82.2 72.1 59.4 65.5 76.4 76.5 81.0 65.0 86.2 68.3 65.9 69.0 Se solicita: a. Organizar los datos en una tabla completa de distribucin de frecuencias. b. Interpretar el valor de algunas frecuencias.

a.

Como la variable peso, por su medicin pertenece a la escala de razn, utilizaremos la regla de sturges para elaborar una tabla de distribucin de frecuencias, detallando los pasos siguientes: Clculo del Rango: R = 99.8 - 58.4 = 41.4 Nmero de clases: K = 1 + 3.3 Log 30 = 5.88 = 6 Amplitud de intervalo: W = 41.4 / 6 = 6.9 (Redondeando a un decimal, porque los datos aparecen con un decimal) Formacin de intervalos:

i 1 2 3 4 5

Ii 58.4 65.2 65.3 72.1 72.2 79.0 79.1 85.9 86.0 92.8

92.9 99.7

El dato mayor 99.8 no se contabiliza dentro de este intervalo y se perdera un dato

Soluciones posibles:

a.

Dejar el limite superior de la ultima clase, abierto, de la siguiente manera: i Ii

1
2 3 4 5 6

58.4 65.2
65.3 72.1 72.2 79.0 79.1 85.9 86.0 92.8 92.9 y ms

b.

Aumentar una clase y formar un nuevo intervalo, de la siguiente forma: i 1 2 3 4 5 6 7 Ii 58.4 65.2 65.3 72.1 72.2 79.0 79.1 85.9 86.0 92.8 92.9 99.7 99.8 106.6

b.

Aumentar un dcimo (0.1) la amplitud del intervalo, con lo cual W = 6.9 + 0.1 = 7.0. Luego los nuevos intervalos seran: i Ii

1
2 3 4 5 6

58.4 65.3
65.4 72.3 72.4 79.3 79.4 86.3 86.4 93.3 93.4 100.3

En este caso adoptaremos la ltima alternativa, por ser la ms conveniente, la tabla completa de distribucin de frecuencias, sera la siguiente:

i
1 2 3 4 5 6

Ii
58.4 65.3 65.4 72.3 72.4 79.3 79.4 86.3 86.4 93.3 93.4 100.3

fi
4 12 5 6 1 2 30

Fi
4 16 21 27 28 30

hi
0.133 0.400 0.167 0.200 0.033 0.067 1.000

Hi
0.133 0.533 0.700 0.900 0.933 1.000

hi (%)
13.3 40.0 16.7 20.0 3.3 6.7 100.0

Hi (%)
13.3 53.3 70.0 90.0 93.3 100.0

b.

F3: 21 = 21 pacientes tienen entre 58.4 y 79.3 Kg. h2: 40% = El 40 % de los pacientes, pesan entre 65.4 y 72.3 Kg. H4: 90% = El 90% de los pacientes, tienen como peso mximo 86.3 Kg.

3.

Se presentan los siguientes datos correspondientes a la cantidad de creatinina en mg / 100 cc., en muestra de orina de un grupo de 40 personas normales atendidos en el Hospital Nacional La Justicia de Salinas 1.51 1.63 1.51 1.56 1.69 1.65 2.18 1.68 1.09 1.46 2.29 1.48 2.29 1.60 1.38 1.56 1.22 1.50 1.58 1.37 1.65 1.67 1.23 1.73 1.65 1.47 1.89 1.61 1.81 1.61 2.01 1.33 1.53 1.60 1.47 1.67 1.66 1.69 1.54 1.83 Se solicita: a. Agrupar la informacin proporcionada, en una cuadro de frecuencias. b. Interpretar algunos valores de las frecuencias obtenidas.

Solucin: La variable en estudio pertenece a la escala de razn y por lo tanto utilizaremos la regla de Sturges, para agrupar los datos en un cuadro de distribucin de frecuencias: Calculo del Rango: R = 2.29 - 1.09 = 1.2 Nmero de clases: K = 1 + 3.3 Log 40 = 6.28 = 6 (redondeando al entero) Amplitud de intervalo: W = 1.2 / 6 = 0.20 (redondeando a dos decimales, ya que los datos proporcionados tienen dos decimales) Formacin de intervalos y frecuencias: La tabla de frecuencias sera la siguiente:

i
1 2 3 4 5 6

Ii
1.09 1.28 1.29 1.48 1.49 1.68 1.69 1.88 1.89 2.08 2.09 2.29

fi
3 7 20 5 2 3 40

Fi
3 10 30 35 37 40

hi
0.075 0.175 0.500 0.125 0.050 0.075 1.000

Hi
0.075 0.250 0.750 0.875 0.925 1.000

hi (%)
7.5 17.5 50.0 12.5 5.0 7.5 100.0

Hi (%)
7.5 25.0 75.0 87.5 92.5 100.0

b.

f3: 20 = 20 personas tienen entre 1.49 y 1.68 mg / 100 cc de creatinina. F4: 35 = 35 personas tienen de 1.09 a 1.88 mg / 100 cc inclusive de creatinina. H1: 75% = El 75% de las personas tienen como mximo 1.68 mg / 100 cc de creatinina.

4.

Los siguientes datos que se presentan en una tabla incompleta de distribucin de frecuencias, corresponden a las calificaciones de un grupo de estudiantes del Diplomado en Epidemiologa, en el mdulo de Estadstica:
i 1 2 3 4 5 Ii 59Hi (%) 20 60 70 85 fi 12 hi (%)

Solucin: a. Sabemos que la ltima frecuencia relativa acumulada es igual al 100% (H5 = 100) b. Para completar las frecuencias relativas simples, decimos: h1: H1: 20 h2: H2 H1: 60 - 20 = 40 h3: H3 H2: 70 - 60 = 10 h4: H4 H3: 85 - 70 = 15 h5: H5 H4: 100 85 = 15 c. Las frecuencias absolutas simples, se obtienen utilizando la frmula: hi = fi / N fi = hi . N

Frecuencias Absolutas

Frecuencias Relativas

Frecuencia Total

Ii

fi

hi (%)

Hi (%)

1
2 3 4 5

14
58 9 12 13 16 17 - 20

12
24 6 9 9 60

20
40 10 15 15 100

20
60 70 85 100

ESTADISTICA DESCRIPTIVA
ETAPA DE PRESENTACION DE DATOS

FORMAS DE PRESENTACION DE DATOS


La presentacin de datos se hace principalmente a travs de dos formas: a travs de tablas o cuadros estadsticos y a travs de grficos.

TABLAS o CUADROS ESTADSTICOS


1.

Concepto: Consiste en la presentacin ordenada de los datos en filas y columnas con el objeto de facilitar su lectura y posterior anlisis e interpretacin.

PARTES DE UNA TABLA ESTADISTICA


1.

a.

Ttulo: Expresa en forma resumida la informacin que contiene y se coloca en la parte superior de la tabla. Debe ser breve, concreto y completo. Un ttulo completo debe obtener lo siguiente: La circunstancia espacial, es decir, debe indicar la institucin o rea geogrfica al que pertenecen los datos. Responde a la pregunta: A DNDE pertenece la informacin?

PARTES DE UNA TABLA ESTADISTICA


b.

c.

d.

El fenmeno que se est tratando, o la naturaleza de los datos Responde a la pregunta: QU contiene la tabla? El criterio de la clasificacin de los datos. Responde a la pregunta: CMO se presentan el contenido de la tabla? El espacio temporal o periodo que abarca la informacin que se presenta. Responde a la pregunta: CUNDO?

EJEMPLO DE UN BUEN TITULO


1.

2.

3.

4.

Qu contiene la tabla?: Pacientes con cncer Cmo se presenta el contenido?: Lugar de residencia. A dnde pertenece la informacin?: Hospital Junn. Provincia Junn. Junn Cundo? 2,005

Tabla N 1.1 Pacientes con cncer segn lugar de residencia. Hospital Junn. Prov. Junn. Junn. 2,005
CIUDAD NUMERO DE PACIENTES PORCENTAJE

J
O C U TOTAL

11
6 7 6 30

36.7
20.0 23.3 20.0 100.0

PARTES DE UNA TABLA ESTADISTICA


2.

3.

4.

5.

Encabezado: Est formado por la primera fila superior y nos indica las caractersticas (variables) del fenmeno en estudio. Matriz: Est formado por la primera columna de la izquierda y nos indica las caractersticas (variables) del fenmeno en estudio. Cuerpo: Es el contenido de la tabla, es decir, es la informacin que se presenta en filas y columnas. Fuente: Se coloca en la parte inferior del cuadro y nos indica el lugar de donde se obtuvieron los datos contenidos en la tabla.

PARTES DE UNA TABLA ESTADISTICA

TITULO
CIUDAD J NUMERO DE PACIENTES 11 6 6 30

ENCABEZADO
PORCENTAJE 36.7 20.0 20.0 100.0

MATRIZ

C
U TOTAL

CUERPO 7 23.3

FUENTE: Archivo de la Oficina de Estadstica del Hospital Junn. Prov. Junn. Junn. 2,005.

FUENTE

TIPOS DE TABLAS ESTADISTICAS


1.

a.

De acuerdo al uso: Tabla General o de Referencia: Son tablas referenciales que se utilizan generalmente como fuente de informacin, ya que contiene datos en detalle sobre diversas variables de un fenmeno.

CUADRO N 2.1 Universidad Nacional Daniel Alcides Carrin Alumnos matriculados por departamento de procedencia, segn datos personales. Provincia Yanacancha, Cerro de Pasco. 2,005

EDAD DEPARTAMENTO DE PROCEDENCIA 16 - 19 20 - 23 24 - 27 27 a ms

ESTADO CIVIL

COLEGIO DE PROCEDENCIA

PROGRAMA ACADEMICO
Soltera Casada Estatal Particula r Religioso

TIPOS DE TABLAS ESTADISTICAS


b.

Tabla de Texto o Resumen: Son tablas que se elaboran en base a la tabla general o de referencia, de donde se seleccionan una o ms variables de inters o que presentan cierta relacin entre si, con el fin de explicar una determinada situacin. En relacin al ejemplo anterior, de todas las variables que contiene la tabla general, se puede elaborar una tabla resumen, seleccionando dos variables

Cuadro N 2.2 Universidad nacional Daniel Alcides Carrin Alumnos matriculados por departamento de procedencia, segn edad. Prov. Yanacancha. Cerro de Pasco. 2,005
DEPARTAMENTO DE PROCEDENCIA 16 19 Arequipa 20 - 23 EDAD 24 - 27 28 a ms TOTAL

Junn

Cuzco

TIPOS DE TABLAS ESTADISTICAS


Desde el punto de vista de su disposicin: a. Tablas de una entrada o entrada simple: Son tablas en cuyo orden presentan una sola variable, anlisis o caracterstica y su clasificacin va definida en columna matriz.
2.

Cuadro N 2.1 Pacientes atendidos por Tuberculosis Pulmonar por nivel de instruccin. Hospital Daniel Alcides Carrin. Lima. Marzo 2004 NIVEL DE INSTRUCCION NUMERO PORCENTAJE

Analfabeto Primaria
Secundaria Superior TOTAL

38 63
16 3 120

31.7 52.5
13.3 2.5 100.0

FUENTE: Archivo de la Oficina de Estadstica del Hospital Daniel Alcides Carrin. Lima. Marzo 2,004.

TIPOS DE TABLAS ESTADISTICAS


b. Tablas de dos entradas o entrada doble: Son tablas que presentan simultneamente dos variables, anlisis o caractersticas relacionadas, donde una va definida en columna matriz (vertical) y la otra en encabezado (horizontal)

Cuadro N 2.2 Pacientes atendidos de Tuberculosis Pulmonar por nivel de instruccin, segn sexo. Hospital Daniel Alcides Carrin. Lima. Marzo 2004 NIVEL DE INSTRUCCION Analfabeto 28 SEXO MASCULINO FEMENINO 10 38 TOTAL

Primaria Secundaria
Superior TOTAL

32 9
1 70

31 7
2 50

63 16
3 120

FUENTE: Archivo de la Oficina de Estadstica del Hospital Daniel Alcides Carrin. Lima. Marzo 2,004.

TIPOS DE TABLAS ESTADISTICAS


c. Tablas Complejas: Son tablas que presentan en forma simultnea tres o ms variables, anlisis o caractersticas relacionadas que van definidas unas en columna matriz (vertical) y otras en encabezado (horizontal).

GRAFICOS o DIAGRAMAS
Es la representacin en dibujo que permite destacar la magnitud o modificacin de las caractersticas de una variable, o comparar las diversas relaciones entre variables, ofreciendo una visin panormica y rpida del fenmeno en estudio. Los grficos constituyen un complemento del anlisis descriptivo y en su presentacin pueden ir acompaados de la tabla o cuadro que le dio origen, ya que sta presenta detalles que no aparecen en el grfico.

IMPORTANCIA
Los grficos son importantes por lo siguiente: Son esenciales en el estudio y presentacin de trabajos estadsticos. Los datos transformados en dibujo permite un examen visual que constituye, muchas veces, la primera etapa de una anlisis e interpretacin de datos. Permiten observar en forma instantnea el comportamiento de la variable o variables materia de estudio. Permite formar una idea bastante aproximada sobre la tendencia de las variables en el futuro.

PARTES DE UN GRAFICO O DIAGRAMA


1.

2.

Ttulo: Expresa el contenido del grfico y por lo general, es igual o parecido al ttulo del cuadro estadstico que sirvi de referencia. Escalas: Para graficar se utiliza el sistema cartesiano, compuesto por dos ejes: uno horizontal llamado abcisa; y otro vertical llamado ordenada. Ambos ejes se cortan en un punto llamado origen. Las escalas vienen a ser la graduacin de ambos ejes, segn la naturaleza de las variables y frecuencias correspondientes.

PARTES DE UN GRAFICO O DIAGRAMA


Cuerpo: Es el grfico en s, y constituye la representacin en dibujos de los datos. 4. Fuente: Indican el origen de los datos estadsticos que se est representando en el grfico.
3.

PARTES DE UN GRAFICO
ESCALAS (EJE DE LAS ORDENADAS)

TITULO

CUERPO

ESCALAS (EJE DE LAS ABCISAS)

FUENTE

TIPOS DE GRAFICOS ESTADISTICOS


1.

a.

Cuando los datos son medidos a nivel nominal u ordinal: Grfico de barras: Es usado generalmente para representar hechos o fenmenos son continuidad, sin movimiento, de tal forma que permite visualizar la magnitud y comparar los elementos en que se clasifican las variables. Los grficos de barras, pueden ser de los siguientes tipos:

TIPOS DE GRAFICOS ESTADISTICOS


a.1. Grfico de barras simple: Para su elaboracin se debe contar con una tabla o cuadro de entrada simple. En su construccin se debe observar lo siguiente: Todas las barras tienen el mismo ancho. El espacio entre barra y barra debe ser la misma y constituye la mitad del ancho de la barra. El ancho de la barra debe ser el doble del espacio que se deja entre barra y barra. En el eje de las ordenadas, la longitud entre escala y escala debe ser la misma que la longitud entre escala y escala del eje de las abcisas. El nmero de escalas en cada eje deben ser proporcionales Preferentemente construir las barras en orden decreciente de magnitud, en orden alfabtico, cronolgico, etc.

75 60

45

30

15

AN AL F AB ET O

PR IM AR IA SE CU ND AR IA SU PE RI O R

E 2E

C1

Tabla N 1.2 Pacientes atendidos de Tuberculosis Pulmonar por grado de instruccin. Hospital Loayza. Lima. Marzo 2,004

GRADO DE INSTRUCCIN ANALFABETO PRIMARIA SECUNDARIA SUPERIOR TOTAL

NUMERO DE PACIENTES 38 63 16 3 120

PORCENTAJE 31.67 52.50 13.33 2.50 100.00

FUENTE: Hospital Loayza. Oficina de estadstica.

1.

2.

3.

En el eje de las abcisas, se representa la variable y a cada categora le corresponde una barra. Si asumimos que el espacio entre barra es de 0.5 cm. Entonces el ancho de cada barra es de 1 cm. En el eje de las ordenadas, debemos tener entre 4 a 6 escalas, a fin de que guarden proporcin con las escalas del eje de las abcisas. La longitud entre escala y escala en el eje de las ordenadas, debe ser la misma que aparece entre escala y escala del eje de las abcisas (1 cm.). El valor de cada escala se calcula aproximadamente dividiendo la frecuencia ms alta entre el nmero de categoras de la variables (63 / 4 = 15.75), donde el resultado se redondea al nmero entero ms prximo y de fcil manejo. En nuestro ejemplo, redondeamos a un valor de 15. Cada barra alcanzar la altura que indique la frecuencia que aparece en la tabla correspondiente.

4.

5.

Para graficar el porcentaje de pacientes por grado de instruccin, se sigue el mismo procedimiento; slo se debe tener en cuenta que en el eje de las ordenadas ya no se mide cantidad, si no porcentaje y para hallar el valor en porcentaje de cada escala, dividimos el porcentaje ms alto entre el nmero de categoras de la variable (52.5 / 4 = 13.13) y el resultado se redondea al nmero entero ms prximo y de fcil manejo. En nuestro ejemplo redondeamos a 10. Las barras alcanzarn la altura que indique el porcentaje que aparece en la tabla correspondiente.

a.2. Grfico de barras compuestas: Para su elaboracin se debe contar con una tabla o cuadro de entrada doble.
Tabla N 1.3 Pacientes atendidos de Tuberculosis Pulmonar por grado de instruccin segn sexo. Hospital Loayza. Lima. Marzo 2,004

GRADO DE INSTRUCCIN ANALFABETO PRIMARIA SECUNDARIA SUPERIOR TOTAL

SEXO MASCULINO FEMENINO


13 35 9 2 59 15 28 7 1 51

TOTAL
28 63 16 3 110

1.

2.

3.

4.

Hallamos las escalas del eje de las abcisas siguiendo el mismo procedimiento que en el caso de las barras simples. Si asumimos que el espacio entre barra y barra es de 0.5 cm. Entonces el ancho de la barra ser de 1 cm. El ancho de cada barra se divide en dos partes iguales, donde una representa al sexo masculino y la otra al femenino. El valor de las escalas del eje de las ordenadas, se calcula aproximadamente ubicando la mxima frecuencia entre los dos sexos (masculino y femenino) y dividiendo dicha frecuencia entre el nmero de categoras de la variable (35 / 4 = 8.75) el valor hallado redondeamos al entero ms prximo y de fcil manejo (en este ejemplo 10). Las barras alcanzarn la altura que indique las frecuencias de la tabla respectiva.

40

30

20

10

0
ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

SEXO MASCULINO

SEXO FEMENINO

a.3. Grfico de barras superpuestas: La informacin representada a travs de barras compuestas, tambin puede representarse en barras superpuestas.

GRADO DE INSTRUCCIN ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

SEXO MASCULINO (%) 46.43 55.56 56.25 66.67 FEMENINO (%) 53.57 44.44 43.75 33.33

TOTAL (%) 100.00 100.00 100.00 100.00

1.

2.

3.

4.

Para hallar las escalas del eje de las abcisas se sigue el mismo procedimiento que el caso de las barras simples. Asumimos un valor de 0.5 cm. Para el espacio entre barra y barra y por lo tanto el ancho de la barra ser de 1 cm. Para hallar las escalas del eje de las ordenadas, se ubica la ms alta frecuencia en el total. En nuestro ejemplo: 63 / 4 = 15.75 que se redondea al entero ms prximo y de fcil manejo; y se tendra lo mismo que en el caso del grfico de barras simple. En el segundo caso se necesita traducir los valores absolutos del cuadro en porcentajes. El valor de cada escala ser de 100 / 4 = 25 Las barras correspondientes a la variable grado de instruccin, alcanzarn la altura segn lo indique la frecuencia total. Asimismo, cada barra se cortar su altura en dos, segn lo indique la frecuencia de la variable sexo.

100.00

75.00

50.00

25.00

0.00 ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

masculino

femenino

75

60

45

30

15

0 ANALFABETO PRIMARIA SECUNDARIA SUPERIOR

masculino

femenino

b. GRAFICO CIRCULAR: Se usa para representar y comparar la dimensin de las partes de un fenmeno con el fenmeno total. Para su elaboracin se utiliza la circunferencia, siendo necesario que los valores absolutos y/o porcentuales, sean traducidos en GRADOS. A cada elemento de la variable le corresponde un sector de la circunferencia.

Tabla N 1.2 Pacientes atendidos de Tuberculosis Pulmonar por grado de instruccin. Hospital Loayza. Lima. Marzo 2,004

GRADO DE INSTRUCCIN ANALFABETO PRIMARIA SECUNDARIA SUPERIOR TOTAL

NUMERO DE PACIENTES 38 63 16 3 120

PORCENTAJE 31.67 52.50 13.33 2.50 100.00

FUENTE: Hospital Loayza. Oficina de estadstica.

Teniendo en cuenta el cuadro anterior, graficar los datos utilizando un grfico circular. Solucin: Sabemos que la circunferencia tiene un total de 360, utilizando la regla de tres simple, se hallan los grados para cada clase: 100 % - 360 31.7% - X X = 360 x 31.7 / 100 = 114

Analfabeto: 360 x 31.7 / 100 = 114 Primaria: 360 x 52.5 / 100 = 189 Secundaria: 360 x 13.3 / 100 = 48 Superior: 360 x 2.5 / 100 = 9 Total de grados: 360 Utilizando un transportador se disean los sectores, partiendo de cualquier punto de la circunferencia, pero se recomienda partir del punto donde el reloj marca las 12, luego siguiendo la direccin de las manecillas del reloj determinar los grados para cada sector.

INICIO

9 48 114
CONTINUACION

189

ANALFABETO

PRIMARIA

SECUNDARIA

SUPERIOR

1.

a.

Cuando los datos son medidos a nivel de intervalo o razn: Histograma: Es un grfico que se utiliza para representar la distribucin de frecuencias absolutas o relativas simples. Consiste en un grupo de rectngulos adyacentes que tienen sus bases en el eje de las abcisas (donde se representan los intervalos de clase de la variable) y altura igual a las frecuencias de cada clase.

b. Polgono de frecuencias: Tambin es un grfico que se utiliza para representar la distribucin de frecuencias absolutas o relativas simples. Consiste en un grfico lineal que se obtiene uniendo los puntos hallados, mediante el par de valores de marca de clase y frecuencia correspondiente. Para fines de grfico, se hace necesario incrementar un intervalo de clase en cada extremo, con frecuencia cero.

Cuadro N 2.1 Edad de personas detenidas por delito de robo Comisaria "Madre Ma". Lima. Mayo 2,003 Edad (en aos) Edad (en aos) 5 9 4.5 - 9.5 10 14 9.5 - 14.5 15 19 14.5 - 19.5 20 24 19.5 - 24.5 25 29 24.5 - 29.5 30 34 29.5 - 34.5 35 39 34.5 - 39.5 Total Nmero 0 20 35 30 18 12 0 115

35

30

25

20

15

10

0 4.5 - 9.5 9.5 - 14.5 14.5 - 19.5 19.5 - 24.5 24.5 - 29.5 29.5 - 34.5 34.5 - 39.5

Solucin:
Para su elaboracin hallamos las marcas de clase o punto medio de cada intervalo, incrementando una anterior a la primera clase y otra posterior a la ltima clase, ambas con frecuencias cero. Luego se procede a la unin de los puntos, los mismos que se unen a travs de una lnea recta.

c. Ojivas: Son grficos que se utilizan para representar las frecuencias acumuladas absolutas o relativas, y consiste en un grfico lineal que nos permite observar la cantidad de elementos que quedan por encima o por debajo de determinados valores.

120

100

80

60

40

20

10

15

20

25

30

35

ETAPA DE ANALISIS E INTERPRETACION DE DATOS: MEDIDAS DE RESUMEN


Introduccin Se ha estudiado los cuadros y grficos como formas para ordenar y describir un conjunto de datos para tomar decisiones. Sin embargo, el anlisis resulta todava un tanto incompleto, pues se hace necesario que todos los datos contenidos en la tabla de distribucin de frecuencias, se puede resumir an ms para facilitar al anlisis e interpretacin de la informacin, utilizando ciertos indicadores. Estos indicadores, llamados tambin medidas de resumen o ESTADIGRAFOS, permita hablar un solo valor numrico, el mismo que representa a toda la poblacin o muestra en estudio.

Las medidas de resumen o estadgrafos ms importantes son: De tendencia central: Medida aritmtica, mediana, moda, media geomtrica, etc. De posicin: Deciles, cuartiles, percentiles. De dispersin: Rango, desviacin media, desviacin estndar, varianza, coeficiente de variacin.

6.2.- Medidas o Estadgrafos de Tendencia Central


6.2.1.- Concepto Son estadgrafos que permiten hallar un solo valor numrico e indica al centro de un conjunto de datos. Este nico valor describe al conjunto de datos, sealando la caracterstica que destaca de la informacin. 6.2.2 Descripcin de las Medidas o Estadgrafos de Tendencia Central. Los estadgrafos de Tendencia Central son los ms importante y son: (A) Media Aritmtica o Promedio Aritmtico ( X ) Es la media de tendencia central ms estable y se obtiene de acuerdo a lo siguiente:

a) Media aritmtica para datos no agrupados


i)

Promedio aritmtico simple.Se halla sumando todos los datos de la distribucin y dividiendo dicha suma entre el total de los datos. Se expresa mediante la siguiente frmula:

Ejemplo: El coeficiente de inteligencia ( CI ) de 5 personas si el siguiente: 100, 95, 102, 115 y 98. El CI promedio ser:

Interpretacin: El coeficiente de inteligencia promedio es de 102. ii) Promedio aritmtico ponderado.Es aquel promedio que se utiliza cuando prevalece cierto peso, importancia o repeticin de los datos en el estudio. Se halla mediante la siguiente frmula:

Ejemplo: Es una Universidad, 28 profesores tiene 5 aos de servicios, 16 profesores tiene 10 y 11 profesores tiene 15. Hallar el tiempo promedio de servicios de los docentes. Solucin: Ordenamos la informacin en el siguiente cuadro y hallamos los datos parciales que pide la frmula:

Luego:

Interpretacin: El tiempo de servicios promedio de los docentes en esta Universidad es de 8 aos

d) Media aritmtica para datos agrupados.Cuando los datos estn agrupados en una tabla de distribucin de frecuencias, el promedio puede ser calculado principalmente a travs de dos mtodos. i) Mtodo largo.Por este mtodo el promedio se obtiene sumando el producto de las marcas de clase por la frecuencia correspondiente y dividiendo la suma entre la frecuencia absoluta total. La frmula es:

Ejemplo: El consumo semanal de carne vacuno en la muestra de 80 familias en la comunidad X, es como sigue:

Hallar el consumo promedio


Solucin: Se hallan las marcas de clase (X), se multiplica con su frecuencia respectiva (X . F); y se suma los productos. El siguiente cuadro ayuda a efectuar estas operaciones:

Segn frmula:

Reemplazando:

Interpretacin: La muestra de familias de la comunidad X, consume en promedio 4.2 kg. Semanal de carne vacuno.

Ventajas de la Media Aritmtica: Es til cuando los datos siguen aproximadamente una progresin aritmtica o estn distribuidos en forma normal o simtrica. Es un estadgrafo de gran estabilidad, porque toma en cuenta todos los datos. Nos permite estimar o probar parmetros en estadstica inferencial.

Desventajas de la Media Aritmtica: Como incluye todos los datos, puede ser afectado por valores extremos. Cuando los datos agrupados tienen clase abierta en los extremos no es recomendable calcular la media aritmtica. Mediana (Me): Es el estadgrafo que representa el punto medio de los datos, en el cual cae el 50% de las puntuaciones. Se obtiene de la siguiente manera:

Mediana para datos no agrupados.La Mediana es el valor medio (cuando la serie es impar) o la media aritmtica de los dos valores medios (cuando la serie es par), del conjunto de datos previamente ordenados en forma creciente o decreciente. Ejemplo: Hallar la media de las edades de 5 personas: 12, 15, 13,48, 10 aos.

Solucin: Ordenamos los datos en forma creciente y la media es el dato que ocupa el valor central, ya que la serie es impar

Interpretacin: El 50% de las personas tiene mximo 13 aos de edad.

Ejemplo: Hallar la media de las edades de 6 personas: 48, 52, 05, 50, 53, 55 aos. Solucin:

Ordenemos los datos en forma creciente:

Observemos que 50 y 52 ocupan el centro del conjunto de datos ordenados, entonces la mediana es el promedio aritmtico simple de esos dos valores.

As:

Interpretacin: El 50% de las personas tiene como mximo 51 aos de edad. La Mediana se utiliza tambin en variables ordinales. As por ejemplo, supongamos la siguientes informacin sobre el nmero de alumnos remitentes por aos de estudios secundarios en 1992 para el colegio X.

Solucin: Se halla la frecuencia acumulada F (ver tabla) Se divide la frecuencia total entre 2 : 56 /2 = 28 Se busca dentro de la frecuencia acumulada, el primer valor que contiene a 28; en este caso 39, por tanto la clase media se ubica en la segunda clase y la media corresponde a la categora segundo.

Luego:

Interpretacin: La mitad de los estudiantes repitentes (50%) lo hacen como mximo hasta segundo de secundaria. Aproximadamente la otra mitad repite categoras superiores al segundo de secundaria.

Media para datos agrupados.Cuando los datos se encuentran agrupados en la tabla de distribucin de frecuencias, la mediana se halla utilizando la siguiente formula:

donde:
Me L f/2 (f )1 = mediana = Lmite inferior del intervalo de la clase media = Semisuma de las frecuencia absoluta simple. = Suma de todas las frecuencias absoluta anterior a la clase media f Me = Frecuencia de la clase media W = Amplitud del intervalo Ejemplo: Continuando con el problema anterior, sobre el consumo semanal de carne de vacuno en una muestra de 80 familias en la comunidad X, la media se calcula siguiendo los pasos siguientes: 1) Se halla frecuencia acumulada (Fi). (ver Tabla) 2) Se ubica la clase madia: La clase en el cual estar incluida la mediana, se determina mediante:

La clase mediana ser aquella en donde la primera frecuencia acumulada contenga el valor. Para este caso la primera frecuencia acumulada que contiene a 40, es como 41 se encuentra en la segunda clase, entonces dicha clase ser la clase media.

i 1

Ii 0 - 1.9

fi 15

Fi

2
3 4 5

2 - 3.9
4 - 5.9 6 - 7.9 8 - 9.9

26
20 13 6 80

15 41
61 74 80

Otros datos: Li = 2; Reemplazando en la formula:

= 15;

fme = 26; W = 2

Me = 2 + (80/2 15 / 26) x 2 Me = 2 + 1.9 = 3.9 Kg. Interpretacin: En la muestra en estudio, el 50% de las familias consumen como mximo 3.9 Kg. / semana de carne de vacuno. El restante 50% de las familias consume ms de 3.9 Kg. / semana.

VENTAJAS DE LA MEDIANA
La mediana es un estadgrafo que no est afectada por valores extremos, y por lo tanto es ms representativa que la media aritmtica cuando alguno de los valores de la variable se aleja mucho de los dems o cuando las series son simtricas. Es til cuando los datos agrupados tienen clases abiertas en los extremos. Se aplica tambin a variables que pertenecen a la escala ordinal.

MODA
Es un estadgrafo que nos indica el valor o cualidad que se presenta con ms frecuencia dentro de una variable. Se halla de acuerdo a lo siguiente: a. Moda para datos no agrupados: La moda es el valor ms frecuente o el valor que ms se repite dentro de una serie de datos.

Ejemplo: Calcular la moda del coeficiente intelectual de un grupo de alumnos: 100, 95, 105, 100, 110, 100 Solucin: Observamos que el dato que ms se repite es 100. Luego la moda ser 100. Interpretacin: Se interpreta como que la mayora de los alumnos tienen un CI aproximado de 100. En este caso la serie es Uni modal, porque tiene una sola moda.

Ejemplo: Calcular la moda del coeficiente intelectual del siguiente grupo de alumnos: 95, 100, 105, 110, 95, 100, 115, 95. Solucin: Se observa que existen dos valores que se repiten. Luego la moda ser 95 y 100. Y se interpreta como que el CI ms frecuente en el grupo de alumnos es de 95 y 100.

En este caso la serie es Bimodal, porque tiene dos modas: Cuando la serie tiene tres o ms modas se el conoce con el nombre de Multimodal. La moda tambin es til cuando la variable en estudio pertenece a la escala nominal. Ejemplo: Hallar la moda para la siguiente informacin que consiste en una muestra de consumidores segn preferencias por marca de mantequilla:

MARCA DE MANTEQUILLA ASTRA DORINA CREMA DE ORO LAIVE NINGUNO TOTAL

CONSUMIDORES 20 32 18 12 5 87

Solucin: Observamos que la marca de mantequilla de mayor preferencia es Dorina, por lo tanto: La moda es Dorina.

MODA PARA DATOS AGRUPADOS

En este caso la moda se halla mediante la formula: d . W Mo = Li + ---------------d + d Li = Lmite inferior de la clase modal. d = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase anterior a ella. d = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase siguiente a ella.

Ejemplo: Con respecto al problema anterior sobre el consumo semanal de carne vacuno en una muestra de 80 familias, la moda se calcula de acuerdo al siguiente procedimiento:

1 Ubicacin de la clase modal.- La clase modal se ubica en aquella clase que tiene la mayor Frecuencia, En nuestro ejemplo la mayor frecuencia es 26 y corresponde a la segunda clase; por consiguiente la segunda clase constituya la clase modal.
i
1 2 3 4 5

I,
0 - 1.9 2 - 3.9 4 - 5.9 6 - 7.9 8 - 9.9

F,
15 26 20 13 6

Clase Modal

2) Clculo d: d = 26 15 = 11 3) Clculo d: d = 26 20 = 6 4) Otros datos: L = 2; w = 2.

5) Aplicando la formula:
Mo = L + d . w d + d Mo = 2 + (11) (2).= 22 = 2 + 1.29 = 3.29 11 + 6 17

Mo = 3.3 kg

Interpretacin: Las familias en

estudio consumen con mayor frecuencia 3.3 kg./semana de carne de vacuno.

Ventajas de la Moda.- Al igual que la mediana, no est afectada por valores externos.
- Puede usarse cuando los datos agrupados tiene clases abiertas en los extremos. - Se usa tambin para variables que pertenecen a la escala nominal.

Desventajas de la moda: No es representativa a menos que la distribucin contenga un gran nmero de datos y exista significativa repeticin de alguno de ellos. Muchas veces la serie no tiene moda porque ningn valor se repite. Cuando la serie tiene dos, tres o ms modas, se hace difcil su interpretacin y comparacin

Medidas de Posicin o Cuantiles. Concepto.Son estadgrafos que dividen a una distribucin de frecuencias en cuatro,

diez o cien partes iguales. Descripcin de los Cuantles.A) Cuartiles.Son estadgrafos que dividen a la informacin en cuatro (04) partes iguales donde cada uno de ellos incluye el 25% de las observaciones.

Si se estudia el 25% de las observaciones se dice que est analizando el cuartil 1 (Q ). Si se estudia el 50% de las observaciones, se dice que se est analizando el cuartil 2 (Q2). Si se estudia al 75% de las observaciones, se dice que se est analizando el cuartil 3 (Q3). Q1 se interpreta como el limite mximo del 25% de la observaciones inferiores; o como el limite mnimo del 75% de la observacin superiores, Q2 se interpreta como el limite que divide a la distribucin en dos partes iguales (50%) en este caso: Q2 = Me. Q3 se interpreta como limite mximo del 75% de la observacin inferiores; o como limite mnimo de 25% de la observacin superiores.
1

Esquemticamente se tiene:
Informacin 25% Primer Cuartil (Q1) 25% 25% 25% TOTAL 100% Segundo Cuartil (Q2) Tercer Cuartil (Q3)

Los Cuartiles se calcula de la siguiente manera:

Donde: i = 1,2,3; Segn se trate de hallar el primero, segundo, tercero cuartil. L = Lmite inferior de la clase cuartlica. f = Suma de todos las frecuencias absoluta simples. ( f )1 = Suma de las frecuencia absoluta simple de toda las clases anteriores de la clase cuartlica. fp= Frecuencia que corresponde a la clase cuartlica.

Ejemplo: Teniendo en cuenta la informacin del cuadro sobre el consumo de carne vacuno, hallar el cuartil 1. Solucin: Para hallar el Q1, se siguen los siguientes pasos: 1) Se halla la frecuencia acumulada F). (ver Tabla) 2) Se ubica la clase cuartlica: Para el cuartil i = 1, luego se utiliza parte de la frmula: 1 x 80 / 4 = 20

La clase cuartlica ser aquella en donde la primera frecuencia acumulada contenga el valor de 20. En esta caso la primera frecuencia acumulada que contiene a 20 es 41;observamos que 41 se encuentra en la 2da. Clase, entonces dicha clase ser la clase cuartlica.

Reemplazando en la frmula: Q1 = 2 + (1x80/4 15 / 26) 2 Q1 = 2,4 Kg. Interpretacin: El 25% de las familias en estudio consumen como mximo 2.4 Kg. / semana de carne vacuno. El 75% de las familias restantes, consume ms de 2.4 Kg. / semana.

DECILES
Son estadgrafos que dividen la informacin en diez (10) partes iguales, donde cada uno de ellos incluye el 10% de las observaciones. Si se estudia el 10% de las observaciones, se dice que se est analizando el decil 1 (D1) Si se estudia el 20% de las observaciones, se dice que se est analizando el decil 2 (D2).

D1 se interpreta como el lmite mximo del 10% de las observaciones inferiores; o como el lmite mnimo del 90% de las observaciones superiores. D2 se interpreta como el lmite mximo del 20% de las observaciones inferiores; o como el lmite mnimo del 80% de las observaciones superiores; y as sucesivamente hasta el D9 que se interpreta como el lmite mximo del 90% de las observaciones inferiores, o como el lmite mnimo del 10% de las observaciones superiores.

Los deciles se calculan utilizando la frmula:

i fi / 10 - F i - 1 Di = Li + -------------------------- x W fi Donde: i = 1, 2, 3, . 9 segn se trate de hallar el primer, segundo. Noveno decil. Li = limite inferior. F i 1 = Suma de todas las frecuencias absolutas simples de todas las clase declica.

3 Otros datos:

( f = Suma de las frecuencias absolutas de todas las clase anteriores a la clase declica. F = Frecuencia que corresponde a la clase declica.
Ejemplo: Teniendo en cuenta la informacin sobre el consuma de la carne de vacuno por

parte de 80 familias; hallar el 8 decil.

Solucin: Para hallar el decil 8, se emplea el siguiente procedimiento: 1) Se halla la frecuencia acumulada (F). 2) Se ubica la clase declica: Parte el 8 decil: i =, luego: (8) ( i )= 8 x 80 = 64 10

La clase declica ser aquella en donde la primera frecuencia la acumulada contenga al valor 64. En este caso la frecuencia acumulada que contiene a 64 es 74; se observa que 74 se ubica en la 4ta clase, entonces dicha clase constituye la clase declica

3 Otros Datos:

4 Reemplazando valores en la formula:

i fi / 10 - F i - 1 Di = Li + --------------------- x W fi
D8 = 6.5

Interpretacin: El 80% de las familias en estudio consuma como mximo 6.5 kg/semana de carne de vacuno. El 20% restante de las familias consumen ms de 6.5 kg/semana. C) Percentiles: Son estadgrafos que dividen a la informacin en cien (100) partes iguales, donde cada uno de ellos incluye al 1% de las observaciones. Cuando se estudia el 1% de las observaciones, se dice que se est utilizando el percentil 1 (P ).
1

Si se estudia al 2% de las observaciones , se dice que se est analizando el percentil 2 (P2); y as sucesivamente se puede estudiar hasta el 99% de las observaciones, donde se dice que se est analizando al 99 (P99) P1 se interpreta como el lmite mximo del 1% de las observaciones inferiores, o como el lmite mnimo del 99% de las observaciones superiores. . . .

P15 se interpreta como el lmite mximo del 15%

de

las observaciones inferiores; o como el lmite mnimo del 85% de las observaciones superiores; y as sucesivamente hasta al P99 que se interpreta como el lmite mximo del 99% de las observaciones inferiores; o como el lmite mnimo del 1% de las observaciones superiores

Esquemticamente se tiene:
1% Primer Percentil (P1) 1% 1% 1% Tercero Percentil (P3) 1% Segundo Percentil (P2)

TOTAL

100%

Es necesario tener en cuneta que se puede utilizar los percentiles para calcular cualquier cualrtil o decil, pues, segn lo que hemos analizado llegamos a la siguientes igualdades.
Q1 = P25 D1 = P10 Q2 = D5 = Me = P50 D2 = P20 Q3 = P75 D9 = P90

Los percentiles se obtienen utilizando la frmula: i fi / 100 - F i - 1 Pi = Li + --------------------------- W fi Donde:

i=1,2,3,.99, segn se trate de hallar el primer, segundo, .noventinueveavo percentil. L=Lmite inferior del a clase percentilica. f= Suma de frecuencias absoluta simple F i 1 = Suma de las frecuencias absolutas simples, de todas las clases anteriores a la clase percentilica. Fi =Frecuencia que corresponde a la clase percentilica. Ejemplo: En base a la informacin del cuadro sobre consumo semanl de carne vacuno, calcular el 60Percentil. Solucin: Par calcular el percentil 60, se sigue el siguiente procedimiento.

1)Se halla la frecuencia acumulada (F) 2) Se ubica en la clase percentilica: 60 x 80 / 100 = 48 La clase percentilica ser aquella donde la primera frecuencia acumulada contenga el valor 48. Para nuestro caso la primera frecuencia acumulada que contiene a 48 es 61; se observa en el cuadro que 61 se encuentra ubicado en la 3era clase, luego dicha clase constituye a la clase percentilica.

Otros datos: Li = 4; F i 1 = 41; Fi = 20; W = 2 Reemplazando en la frmula tenemos: P60 = 4.7 Interpretacin: El 60% de las familias en estudio consumen carne hasta 4.7 kG. / semana de carne vacuno. El 40% de familias restantes, consume ms de 4.7 Kg. / semana.

Medidas de Dispersin Introduccin En los temas anteriores hemos estudiados las medidas de tendencia central, que tiene como objeto ubicar un solo valor que represente o describa la totalidad de los elementos. Estas medidas, al igual que los cuantiles, son solo parte de las tcnicas necesarias para describir las caractersticas de un conjunto de observaciones o datos. Si para el anlisis e interpretacin de la informacin slo consideramos a las medidas de tendencia central, podramos llegar a conclusiones errneas o equivocadas. Por ejemplo, supongamos que estamos evaluando o comprobando el tiempo en minutos que tardan 6 nias y 6 nios de igual edad para desarrollar la misma tarea. El tiempo promedio obtenido por los dos grupos fue la siguiente:

Nias: 15.2 minutos Nios: 14.7 minutos Al analizar e interpretar los datos, podramos concluir que las nias utilizan mayor tiempo para desarrollar la tarea. Sin embargo si analizamos el tiempo utilizando, por cada nio tenemos: Nias: 14,16,13,15,17,16 X = 15.17 Nios: 16,12,15,18,13,14 X = 14.67 Observamos que la conclusin a la que habamos arribado es equivocada porque el tiempo utilizado por un nio( 18 minutos), es mas alto que el tiempo utilizado para cualquiera de las nias.

Si seguimos analizando las puntuaciones individuales podemos observar que el tiempo utilizado por los nios estn mas dispersos, distantes o separados entre si (al menor tiempo es 12 minutos. Y el mayor es 18 minutos.); mientras que el tiempo utilizado para las nias estn mas concentrados ( el menor tiempo es de 13 minutos y el mayor de 17 minutos.). De all que para el anlisis e interpretacin de datos, se hace necesario de otros estadgrafos que nos permitan apreciar el grado de variabilidad o de dispersin de las observaciones.

Definicin de Medidas de Dispersin Son estadgrafos que miden la dispersin o desviacin de los datos con respecto al valor central.

Descripcin de las medidas de Dispersin.a. Rango (R) Para datos no agrupados.

R = Vmax - Vmin
El Rango es la diferencia entre el dato mayor y el dato menor, es decir.

Ejemplo: El tiempo que utilizan 6 nios de igual edad para desarrollar una misma tarea fue el siguiente, 16, 12, 15, 18, 13, 14 minutos. El Rango ser: R= 18 12 R= 6 minutos.

Para datos agrupados.El rango es la diferencia entre el limite superior de la ultima clase y el lmite inferior de la primera clase. As:

R = L sup clase k - Linf. clase 1


Los datos agrupados son intervalos abiertos en los extremos, no tienen rango.

EDAD (aos) 0-2 3-5 6-8 9 - 11 12 - 14 Total

NUMERO 5 12 20 10 6 53

PORCENTAJE 9.43 22.64 37.74 18.87 11.32 100.00

R = 14 0 = 14

El Rango es un estadgrafo de clculo fcil, pero de uso limitado, ya que no considera a todas las observaciones, sino solo a los datos ,mnimos y mximos. Por lo tanto, esta fuertemente influenciado por los datos extremos. Solo debe usarse cuando se desea saber la informacin inmediata la dispersin de datos , sin ninguna precisin estadstica. DESVIACION ESTNDAR O DESVIACION TIPICA: a. Para datos no agrupados: La desviacin estndar es la raz cuadrada del promedio de la suma de las desviaciones de cada observacin o dato con respecto a su media aritmtica. As

DS =

2 (X1 - X) --------------------N

En la desviacin estndar las desviaciones negativas con respecto a la media, se hacen positivas, elevando al cuadrado y extrayndole la raz cuadrada. Ejemplo: Si el tiempo que utilizan 6 nios de igual edad para desarrollar la misma tarea es: 16,12,15,18,13,14 minutos

Para calcular la desviacin estndar, seguimos los siguientes pasos: 1. Se halla la media aritmtica: 14.7 2. Cada dato se resta de la media aritmtica, elevando al cuadrado dicha diferencia. Luego sumamos los resultados, tal como se aprecia en el siguiente cuadro:

DATO (Xi) 16 12 15 18 13 14

(Xi - X)2 (16 - 14.7)2 = 1.69 (12 - 14.7)2 = 7.29 (15 - 14.7)2 = 0.09 (18 - 14.7)2 = 10.89 (13 - 14.7)2 = 2.89 (14 - 14.7)2 = 0.49 23.34

Aplicando la frmula: La DS = 2 minutos. Interpretacin: El tiempo utilizado por los nios para desarrollar la tarea, se dispersa en promedio 2 minutos con respecto al valor central. PARA DATOS AGRUPADOS: La desviacin estndar, es la raz cuadrada del promedio de la suma de las desviaciones de cada marca de clase con respecto a su media aritmtica, multiplicado por la frecuencia respectiva
3.

EDAD (aos) 0-2 3-5 6-8 9 - 11 12 - 14 Total

fi 5 12 20 10 6 53

Xi 1 4 7 10 13

(Xi - X)2 (1 -7 )2 = 36 (4 - 7)2 = 9 (7 - 7)2 = 0 (10 - 7)2 = 9 (13 - 7)2 = 36

(Xi - X)2 . fi 36 x 5 = 180 9 x 12 = 108 0 x 20 = 0 9 x 10 = 90 36 x 6 = 216 594

Con base a siguiente informacin calcular la desviacin estndar: Solucin: 1. Calculamos su media aritmtica. 2. Restamos cada marca de clase menos el promedio y los resultados, elevados al cuadrado, se multiplican por la frecuencia de clase.

DS =

2 (Xi - X) - fi -----------------------fi

3. Aplicando la frmula: la DS ser 3.3 Interpretacin: La edad de los pacientes con leucemia aguda atendidos en el Hospital Fuji, se dispersa en promedio 3.3 aos con respecto al valor central.

VARIANZA
La varianza es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media. As: 2 (Xi - X) V = -----------------N

En la practica, la varianza ser obtiene elevando al cuadrado la desviacin estndar tanto para datos agrupados como no agrupados. En la interpretacin debemos tener en cuenta que las unidades tambin han sido elevadas al cuadrado. Por lo tanto, los resultados sern aos al cuadrado, etc. Ejemplo: Si se sabe que la DS == 2 minutos, del tiempo que utilizan 6 nios para desarrollar la misma tarea, entonces la varianza ser: 4 minutos al cuadrado. Interpretacin: El tiempo utilizado por los nios para desarrollar la tarea se dispersa en promedio en 4 minutos al cuadrado con respecto al valor central.

COEFICIENTE DE VARIACION:

El coeficiente de variacin (CV) es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje. As: DS CV = ------------ x 100 X

El coeficiente de variacin es un indicador de la dispersin relativa de los datos, y la unidad de medida est expresado en porcentaje. Es muy til cuando se desea comparar dos o ms distribuciones, donde las unidades de medidas son diferentes (por ejemplo peso en Kg. Y edad en aos) Ejemplo: En el caso del tiempo utilizado por los nios para desarrollar la tarea, sabemos que, la desviacin estndar es 2 minutos y su promedio era de 14.7 minutos. Su CV ser de 13.6% Interpretacin: El tiempo utilizado por los nios para desarrollar la tarea, se dispersa en promedio en 13.6% con respecto al valor central.

CARACTERISTICAS DE LAS MEDIDAS DE DISPERSION


1.

2.

3.

4.

Si se desea exactitud estadstica en un estudio, se debe aplicar los estadgrafos de acuerdo al siguiente orden: Desviacin estndar, rango. Si se desea llevar a cabo un trabajo rpido sin que la exactitud estadstica importe demasiado, se debe aplicar los estadgrafos anteriores, pero en sentido contrario. La desviacin estndar es el estadgrafo de dispersin ms importante y de mayor uso. Un valor grande de DS, significa que la generalidad de los datos estn alejados de la media; un valor pequeo de la DS significa que la mayora de los datos estn concentrados en las proximidades de la media aritmtica. La varianza tiene gran aplicacin en el campo del muestreo y la inferencia estadstica.

Potrebbero piacerti anche