Sei sulla pagina 1di 27

MEDIDAS ESTADSTICA UNIVARIABLES

Bioestadstica Escuela de Salud IPP Chile

Yukiko Arancibia Uehara

OBJETIVO DE LA CLASE
Calcular e interpretar las medidas de tendencia central.

Ordenar y agrupar datos en una tabla.

DISTRIBUCIN DE FRECUENCIAS
Uno de los primeros pasos a realizar en un estudio estadstico es la tabulacin de resultados, es decir , recoger la informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados nmeros que representan el numero de veces que ha aparecido. Estos nmeros se denominan frecuencias. La tabla presenta los valores de los datos y su frecuencia de aparicin , enumerados en orden donde por lo general el valor del dato menor aparece en la parte inferior. Muestra los datos de una manera que facilite su comprensin e interpretacin

TIPOS DE FRECUENCIAS
FRECUENCIA ABSOLUTA (fi o ni)
Es el nmero de veces que se repite un determinado valor de la variable (xi). Se designa por fi.

PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de


observaciones (n). O tamao de la muestra Esta frecuencia es una medida que esta influida por el tamao de la muestra : al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para comparar por esto es necesario introducir el concepto de frecuencia relativa.

FRECUENCIA RELATIVA (hi): Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el nmero total de datos. Las frecuencias relativas se designan con las letras hi. Se calcula :

La frecuencia relativa es un tanto por uno, sin embargo se puede escribir en tanto por ciento. PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.

DISTRIBUCIN DE FRECUENCIAS
FRECUENCIA ACUMULADA (Fi): Para poder calcular este tipo de frecuencia hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. La frecuencia absoluta acumulada es el nmero de observaciones que hay desde el valor menor de la variable hasta un valor determinado de ella. Esta frecuencia tiene como propiedades: 1. La primera frecuencia absoluta acumulada es igual a la primera frecuencia absoluta : Fi = fi 2. La ltima frecuencia absoluta acumulada es igual al tamao de la muestra es decir, Fn=n PORCENTAJE La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.

DISTRIBUCIN DE FRECUENCIAS
FRECUENCIA RELATIVA ACUMULADA (Hi): Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre nmero total de datos. Es el porcentaje de observaciones que hay desde el valor menor de la variable hasta un valor determinado de ella. Se designa con las letras Hi . Se calcula;
1.

La primera frecuencia relativa acumulada es igual a la primera frecuencia relativa H1=h1

2.

La ltima frecuencia relativa acumulada es igual a uno Hn= 1

DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS


Es la representacin estructurada en forma de tabla de toda la informacin que se ha recogido sobre la variable que se estudia, es decir, es una tabla que presenta de manera ordenada los distintos valores de una variable y sus correspondientes frecuencias. Su forma mas comn es la siguiente :

Ejemplo
Al preguntar a 20 individuos por el nmero de personas que viven en su casa, hemos obtenido las siguientes respuestas:
5 4 3 4 4 3 4 5 1 4 2 3 4 2 4 4 5 5 3 3

Elabora una tabla de frecuencias

xi
1
2 3 4 5 n

fi
1
2 5 8 4 20

Frecuencia f. Acumulada Variable

Porcentajes

Xi 1

fi 1

Fi 1

hi (1/20) = 0,05

pi (0,05x 100)= 5%

Hi 0,05

Pi 5%

2
3 4 5

2
5 8 4 n= 20

3
8 16 20

(2/20) =0,1
0,25 0,4 0,2

10%
25% 40% 20% 100%

0,15
0,4 0,8 1

15%
40% 80% 100%

Relativ a

Relativa acumulad a

DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS


Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentran ordenados en clases y con la frecuencia en cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

Se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20 Tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva.

La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad Errores Al agrupar los datos en una distribucin de frecuencia de clase se pierde parte de la informacin. La reduccin o agrupamiento a que son sometidos los datos de una serie de valores cuando existen muchos valores diferentes, originan los denominados errores de agrupamiento; sin embargo, estos errores son en general muy pequeos, razn por la cual la distribucin de frecuencia de clase tiene una validez estadstica prctica.

Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas generales: El nmero de intervalos de clase se toma entre 5 y 15 dependiendo de los datos. Cada observacin debe estar incluida en una y solo una clase o intervalo. El valor mas pequeo y mas grande deben entrar en la clasificacin. No deben existir brechas o vacos entre clases sucesivas. Los intervalos no se deben sobreponer. En la medida de lo posible, se debe utilizar la misma amplitud para todos los intervalos.

COMPONENTES DE UNA DISTRIBUCIN DE FRECUENCIAS DE CLASES


1.- Clase o Intervalo de clase.- Son divisiones o categoras en las cuales se agrupan un conjunto de datos ordenados con caractersticas comunes. Para organizar los valores de la serie de datos hay que determinar un nmero de clases que sea conveniente. En otras palabras, que ese nmero de intervalos no origine un nmero pequeo de clases ni muy grande. Un nmero de clases pequeo puede ocultar la naturaleza natural de los datos y un nmero muy alto puede provocar demasiados detalles como para observar alguna informacin de gran utilidad en la investigacin. A las fronteras del intervalo, la llamaremos, lmites inferior y superior de la clase y los denotaremos por Li-1, Li.

2.- Punto medio o Marca de clase (X&).- Es la semisuma del

lmite inferior y superior de una clase, tal como lo indica la siguiente formula:

3.- Amplitud , Longitud o Tamao del Intervalo.- Los intervalos

de clases pueden ser de tres tipos: Clases de igual tamao, clases de tamaos desiguales y clases abiertas. En trminos generales, las clases de igual tamao son los mas utilizados y recomendados para los clculos estadsticos. Se designa por las letras Ic.
Nota: Al nmero de observaciones de una clase se le llama

frecuencia de clase, si dividimos esta frecuencia por el nmero total de observaciones, se llama frecuencia relativa de clase, y del mismo modo que lo hacamos para datos sin agrupar definiramos Hi, y Fi.

PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIN DE FRECUENCIAS AGRUPADA EN INTERVALOS 1. Determinar el mximo y mnimo entre los valores que tenemos en la muestra y calcular el recorrido de la variable o rango, es decir, R=Xmax-Xmin 2. Calcular el nmero de clases a utilizar. Existen diversos criterios para determinar el numero de clases, ante tanta diversidad de criterios, se ha considerado que lo mas importante es dar un ancho o longitud de clases a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica. Existe una forma para determinar el numero de clases y la misma puede ilustrarse en el siguiente cuadro:

Cuando se tenga dudas en determinar el numero de intervalos de clases, es de gran utilidad utilizar el mtodo sugerido por Hebert A. Sturges, el cual establece que: K= 1+3,322 log(n) = numero de intervalos. En este curso se utilizar este mtodo siempre y cuando el mismo sea aplicable. 3. Determinamos la amplitud o tamao de los intervalos travs de la siguiente formula

EJEMPLO
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitacin de 40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron: 3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2 4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5 4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1 5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1 Procedimiento: 1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8. 2.- K= 1+3,322 log(40) = 6.3 6 nmeros de intervalos 3.- Ic = 2.8 / 6 = 0.467 0.5 tamao de los intervalos As pues la tabla sera:

Cuantos hoteles tienen un precio entre 3.3 y 3.8? 3 Cuantos hoteles tienen un precio superior a 4.8? 15 Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 %

MTODOS GRFICOS
La forma de la distribucin de frecuencias se percibe ms rpidamente si la representamos grficamente. Se resume la informacin de la muestra de forma grafica con fines clarificadores o para enfatizar y descubrir determinadas caractersticas que de otra manera seria muy difcil de apreciar. Un grafico siempre es mas inmediato de comprender que un conjunto de datos estadsticos. Las representaciones graficas varan segn el tipo de variable:
a. Grficos para variables Discretas y Categricas( Cualitativas)

DIAGRAMA DE BARRAS: Es la representacin grfica usual para variables


cuantitativas discretas o para variables cualitativas. En el eje de ordenadas representamos los diferentes valores de la variable (xi). Sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa). 100% 80% 60% 40% Serie 3 20% Serie 2 0% Serie 1

DIAGRAMA DE SECTORES O DE PASTEL: Es el ms usual en


variables cualitativas. Se representan mediante crculos. A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia. Ejemplo: Los siguientes datos corresponden a una encuesta referente a elecciones locales de un partido poltico:

Para construir el diagrama de sectores partimos del hecho de que un circulo encierra un total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados en distintos sectores, de acuerdo con cada porcentaje; tenemos as que para determinar el sector correspondiente al 50%, resolvemos la ecuacin:
Esto es, el 50% corresponde a un sector circular de medida 180 grados. A continuacin, con ayuda de un transportador, sealaremos el sector circular de medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10% se tiene 36 grados. La siguiente figura muestra la representacin grafica.

Ventas

1er trim.

2 trim.

3er trim.

4 trim.

B. GRFICOS PARA VARIABLES CONTINUAS


HISTOGRAMA: Es la representacin grfica de las frecuencias agrupadas de una variable continua sobre intervalos. A diferencia de los diagramas de barras, los histogramas dibujan rectngulos unidos entre si, lo que significa que existe continuidad en la variable cuyos valores se representan en el eje horizontal que se haya dividido en intervalos de igual amplitud. Las reas de los rectngulos son proporcionales a las frecuencias que representan.
Ejemplo

El histograma o diagrama de barras proporcionan mucha informacin respecto a la estructura de los datos, nos permite evidenciar fundamentalmente tres caractersticas: 1. Forma de la distribucin. 2. Acumulacin o tendencia posicional (valor central de la distribucin). 3. Dispersin o variabilidad. Cuando nos encontramos en distribuciones donde los intervalos no tienen la misma amplitud, las barras del histograma tienen que tener un rea proporcional a la frecuencia que queramos representar

Grficos lineales : adecuado para analizar la existencia de asociacin entre dos variables continuas con nivel de medicin en escala de intervalos o razn. Grficos de correlacin y diagramas de dispersin : adecuados para analizar la existencia de asociacin entre dos variables continuas ( X, Y) con nivel de medicin en escala de intervalos de razn. Pictogramas : se usan para presentaciones en publico o para fines publicitarios todos estos tipos de grficos se pueden resumir en el siguiente cuadro:

Potrebbero piacerti anche