Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
OBJETIVO DE LA CLASE
Calcular e interpretar las medidas de tendencia central.
DISTRIBUCIN DE FRECUENCIAS
Uno de los primeros pasos a realizar en un estudio estadstico es la tabulacin de resultados, es decir , recoger la informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados nmeros que representan el numero de veces que ha aparecido. Estos nmeros se denominan frecuencias. La tabla presenta los valores de los datos y su frecuencia de aparicin , enumerados en orden donde por lo general el valor del dato menor aparece en la parte inferior. Muestra los datos de una manera que facilite su comprensin e interpretacin
TIPOS DE FRECUENCIAS
FRECUENCIA ABSOLUTA (fi o ni)
Es el nmero de veces que se repite un determinado valor de la variable (xi). Se designa por fi.
FRECUENCIA RELATIVA (hi): Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el nmero total de datos. Las frecuencias relativas se designan con las letras hi. Se calcula :
La frecuencia relativa es un tanto por uno, sin embargo se puede escribir en tanto por ciento. PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.
DISTRIBUCIN DE FRECUENCIAS
FRECUENCIA ACUMULADA (Fi): Para poder calcular este tipo de frecuencia hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. La frecuencia absoluta acumulada es el nmero de observaciones que hay desde el valor menor de la variable hasta un valor determinado de ella. Esta frecuencia tiene como propiedades: 1. La primera frecuencia absoluta acumulada es igual a la primera frecuencia absoluta : Fi = fi 2. La ltima frecuencia absoluta acumulada es igual al tamao de la muestra es decir, Fn=n PORCENTAJE La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.
DISTRIBUCIN DE FRECUENCIAS
FRECUENCIA RELATIVA ACUMULADA (Hi): Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre nmero total de datos. Es el porcentaje de observaciones que hay desde el valor menor de la variable hasta un valor determinado de ella. Se designa con las letras Hi . Se calcula;
1.
2.
Ejemplo
Al preguntar a 20 individuos por el nmero de personas que viven en su casa, hemos obtenido las siguientes respuestas:
5 4 3 4 4 3 4 5 1 4 2 3 4 2 4 4 5 5 3 3
xi
1
2 3 4 5 n
fi
1
2 5 8 4 20
Porcentajes
Xi 1
fi 1
Fi 1
hi (1/20) = 0,05
pi (0,05x 100)= 5%
Hi 0,05
Pi 5%
2
3 4 5
2
5 8 4 n= 20
3
8 16 20
(2/20) =0,1
0,25 0,4 0,2
10%
25% 40% 20% 100%
0,15
0,4 0,8 1
15%
40% 80% 100%
Relativ a
Relativa acumulad a
Se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20 Tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva.
La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad Errores Al agrupar los datos en una distribucin de frecuencia de clase se pierde parte de la informacin. La reduccin o agrupamiento a que son sometidos los datos de una serie de valores cuando existen muchos valores diferentes, originan los denominados errores de agrupamiento; sin embargo, estos errores son en general muy pequeos, razn por la cual la distribucin de frecuencia de clase tiene una validez estadstica prctica.
Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas generales: El nmero de intervalos de clase se toma entre 5 y 15 dependiendo de los datos. Cada observacin debe estar incluida en una y solo una clase o intervalo. El valor mas pequeo y mas grande deben entrar en la clasificacin. No deben existir brechas o vacos entre clases sucesivas. Los intervalos no se deben sobreponer. En la medida de lo posible, se debe utilizar la misma amplitud para todos los intervalos.
lmite inferior y superior de una clase, tal como lo indica la siguiente formula:
de clases pueden ser de tres tipos: Clases de igual tamao, clases de tamaos desiguales y clases abiertas. En trminos generales, las clases de igual tamao son los mas utilizados y recomendados para los clculos estadsticos. Se designa por las letras Ic.
Nota: Al nmero de observaciones de una clase se le llama
frecuencia de clase, si dividimos esta frecuencia por el nmero total de observaciones, se llama frecuencia relativa de clase, y del mismo modo que lo hacamos para datos sin agrupar definiramos Hi, y Fi.
PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIN DE FRECUENCIAS AGRUPADA EN INTERVALOS 1. Determinar el mximo y mnimo entre los valores que tenemos en la muestra y calcular el recorrido de la variable o rango, es decir, R=Xmax-Xmin 2. Calcular el nmero de clases a utilizar. Existen diversos criterios para determinar el numero de clases, ante tanta diversidad de criterios, se ha considerado que lo mas importante es dar un ancho o longitud de clases a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica. Existe una forma para determinar el numero de clases y la misma puede ilustrarse en el siguiente cuadro:
Cuando se tenga dudas en determinar el numero de intervalos de clases, es de gran utilidad utilizar el mtodo sugerido por Hebert A. Sturges, el cual establece que: K= 1+3,322 log(n) = numero de intervalos. En este curso se utilizar este mtodo siempre y cuando el mismo sea aplicable. 3. Determinamos la amplitud o tamao de los intervalos travs de la siguiente formula
EJEMPLO
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitacin de 40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron: 3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2 4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5 4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1 5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1 Procedimiento: 1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8. 2.- K= 1+3,322 log(40) = 6.3 6 nmeros de intervalos 3.- Ic = 2.8 / 6 = 0.467 0.5 tamao de los intervalos As pues la tabla sera:
Cuantos hoteles tienen un precio entre 3.3 y 3.8? 3 Cuantos hoteles tienen un precio superior a 4.8? 15 Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 %
MTODOS GRFICOS
La forma de la distribucin de frecuencias se percibe ms rpidamente si la representamos grficamente. Se resume la informacin de la muestra de forma grafica con fines clarificadores o para enfatizar y descubrir determinadas caractersticas que de otra manera seria muy difcil de apreciar. Un grafico siempre es mas inmediato de comprender que un conjunto de datos estadsticos. Las representaciones graficas varan segn el tipo de variable:
a. Grficos para variables Discretas y Categricas( Cualitativas)
Para construir el diagrama de sectores partimos del hecho de que un circulo encierra un total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados en distintos sectores, de acuerdo con cada porcentaje; tenemos as que para determinar el sector correspondiente al 50%, resolvemos la ecuacin:
Esto es, el 50% corresponde a un sector circular de medida 180 grados. A continuacin, con ayuda de un transportador, sealaremos el sector circular de medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10% se tiene 36 grados. La siguiente figura muestra la representacin grafica.
Ventas
1er trim.
2 trim.
3er trim.
4 trim.
El histograma o diagrama de barras proporcionan mucha informacin respecto a la estructura de los datos, nos permite evidenciar fundamentalmente tres caractersticas: 1. Forma de la distribucin. 2. Acumulacin o tendencia posicional (valor central de la distribucin). 3. Dispersin o variabilidad. Cuando nos encontramos en distribuciones donde los intervalos no tienen la misma amplitud, las barras del histograma tienen que tener un rea proporcional a la frecuencia que queramos representar
Grficos lineales : adecuado para analizar la existencia de asociacin entre dos variables continuas con nivel de medicin en escala de intervalos o razn. Grficos de correlacin y diagramas de dispersin : adecuados para analizar la existencia de asociacin entre dos variables continuas ( X, Y) con nivel de medicin en escala de intervalos de razn. Pictogramas : se usan para presentaciones en publico o para fines publicitarios todos estos tipos de grficos se pueden resumir en el siguiente cuadro: