Sei sulla pagina 1di 22

ESTADSTICA

CONCEPTO:
Rama de las matemticas aplicadas, que estudia los hechos
econmicos, sociales y fsicos a base de datos numricos; entre las
estadsticas ms antiguas cuentan los censos de poblacin, el clculo de
ganados y cosechas, etctera.
La estadstica es una ciencia, pues aplica el Mtodo Cientfico al
ocuparse de la toma, organizacin, recopilacin y anlisis de datos,
tanto para la deduccin de conclusiones, para la toma de decisiones
razonables de acuerdo a tales anlisis.
POBLACIN:
Se le llama poblacin o universo, al conjunto total de individuos u
objetos que se desean investigar.
MUESTRA:
Es un grupo de una poblacin. Se utiliza cuando la poblacin es muy
numerosa, infinita o muy difcil de examinar.
ESTADSTICA DESCRIPTIVA:
Es la parte de la estadstica que trata solamente de describir y analizar
un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a
partir de ella. La estadstica descriptiva incluye las tcnicas que se
relacionan con el resumen y la descripcin de datos numricos. Estos
datos pueden ser grficos o pueden incluir anlisis computacional.
ESTADSTICA INDUCTIVA:
Cuando una muestra es representativa de una poblacin se pueden
deducir importantes conclusiones acerca de esta, a partir de su anlisis.
La inferencia estadstica comprende aquellas tcnicas por medio de las
cuales se toma decisiones sobre una poblacin estadstica basadas solo
en la muestra observada. Debido a que dichas decisiones se toman en
condiciones de incertidumbre, entonces estas sern confiables con
cierto grado de probabilidad. Considerando que las caractersticas
medidas de una muestra se denominan estadsticas de la muestra, las
caractersticas medidas de una poblacin estadstica, o universo se
llaman parmetros de la poblacin.

288625409.doc

ANALISIS ESTADISTICO
Distribucin de Frecuencias
Las distribuciones de frecuencias, son series estadsticas ordenadas por
intervalos de clases, y por lo tanto, corresponden a la clasificacin de
grupo de datos, de acuerdo a una caracterstica cuantitativa.
Esta distribuciones se elaboran cuando se tiene una masa de datos, para
reducirla a grupos homogneos y poco numerosos, con fines de
descripcin, anlisis y obtencin de indicadores.
Serie simple o arreglo
Es un simple listado de la informacin obtenida de una fuente de datos.
La siguiente tabla muestra los salarios diarios pagados a 20 trabajadores
de la fbrica "El Cometa", ordenados en forma ascendente.
SALARIOS DIARIOS PAGADOS A 20 TRABAJADORES
(Quetzales)
2.10

3.00

4.00

5.50

2.50

3.00

4.50

6.00

2.50

3.50

4.50

6.00

2.80

3.50

5.00

7.00

2.80

4.00

5.50

7.50
serie simple

Como el salario es mnimo es 2.10 y el mximo 7.50, el RANGO


RECORRIDO de los salarios es: 7.50-2.10 igual a 5.40.
Como esta tabla no permite tener un idea de la distribucin de los
salarios, hay que clasificarlos en un cuadro de frecuencias.
Serie de frecuencias sin clase (datos no agrupados):

288625409.doc

Los datos de la tabla anterior se pueden resumir, al registrarse el


nmero de trabajadores, de acuerdo a su salario.
SALARIOS DIARIOS PAGADOS A 20 TRABAJADORES
DE LA FABRICA "EL COMETA"

SALARIO Q.

Nmero de Obreros
(Frecuencias)

2.10

2.50

2.80

3.00

3.50

4.00

4.50

5.00

5.50

6.00

7.00

7.50

Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Serie de frecuencias con clase (con datos agrupados):
La informacin anterior se puede resumir ms, si la agrupamos en
clases:
SALARIOS DIARIOS PAGADOS A 20 TRABAJADORES
DE LA FABRICA "EL COMETA"
288625409.doc

SALARIO Q.

Nmero de Obreros
(Frecuencias)

2.10 a 2.99

3.00 a 3.99

4.00 a 4.99

5.00 a 5.99

6.00 a 6.99

7.00 a 7.99

Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
La serie anterior se elabor con frecuencias absolutas, estas frecuencias
son las que se obtienen directamente del conteo, pero, tambin se
pueden hacer con frecuencias relativas o porcentajes, y su patrn de
variacin seguir siendo el mismo.
Las frecuencias relativas se obtienen, dividiendo 100 entre el total de
trabajadores, y multiplicando luego por frecuencia absoluta, as:
100 = 5
20

5 trabajadores: . . . . . . . . . . . . . . . . . . . . .5 x 5 = 25%
4 trabajadores: . . . . . . . . . . . . . . . . . . . . .4 x 5 = 20%
4 trabajadores: . . . . . . . . . . . . . . . . . . . . .4 x 5 = 20%
3 trabajadores: . . . . . . . . . . . . . . . . . . . . .3 x 5 = 15%
2 trabajadores: . . . . . . . . . . . . . . . . . . . . .2 x 5 = 10%
2 trabajadores: . . . . . . . . . . . . . . . . . . . . .2 x 5 = 10%
Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100%
288625409.doc

SALARIOS DIARIOS PAGADOS A 20 TRABAJADORES


DE LA FABRICA "EL COMETA"

SALARIOS

NUMERO DE TRABAJADORES

En Quetzales

Frecuencia
Absoluta

Frecuencia
Relativa

De 2.00 a 2.99

25

De 3.00 a 3.99

20

De 4.00 a 4.99

20

De 5.00 a 5.99

15

De 6.00 a 6.99

10

De 7.00 a 7.99

10

20

100.00

Total................
Terminologa:

Para explicar la terminologa usada en las distribuciones de frecuencias,


haremos referencia a la distribucin del punto anterior.

CLASES: Es cada uno de los grupos que se forman en la distribucin, por ejemplo,
De 2.00 a 2.99 (1ra. Clase), de 3.00 a 3.99 (2da. Clase), etc.

FRECUENCIAS: Es el nmero que seala cada clase, o bien es el


nmero de casos que hay en cada clase. Por ejemplo, en la 1ra.
Clase hay 5, en la 2da. Clase hay 4, etc.

LIMITES O FRONTERAS DE CLASE: Son los nmeros que


delimitan a cada una de las clases, en sus extremos inferior y
superior. Por ejemplo, para la primera clase:
Q. 2.00 es el lmite inferior
Q. 2.99 es el lmite superior

288625409.doc

LIMITES O FRONTERAS DE LA DISTRIBUCION: Son los nmeros que


delimitan a toda la serie en sus dos extremos. El lmite inferior de la distribucin es
Q 2.00 y el superior es: Q. 7.99.

AMPLITUD, TAMAO O ANCHURA DEL INTERVALO DE CLASE:


Es la diferencia entre los dos lmites de una clase. Para la primera
clase es:
Q. 2.99
Q. 2.00
Q. 0.99
Hay que hacer notar que la distribucin que se ha tomado como
referencia es de amplitud constante, porque la diferencia entre los
lmites siempre va a ser Q. 0.99.

PUNTO MEDIO O MARCA DE CLASE: Es un valor caracterstico


que seala el punto central de una clase, y es usado en el anlisis,
para representar los distintos valores contenidos en cada grupo. Es
igual a la semisuma (mitad de la suma) de los dos limites de la
clase. Para la primera clase es:
2.00 + 2.99 = 2.495
2
Para la segunda clase es:

3.00 + 3.99 = 3.495


2
RECOMENDACIONES PARA LA ELABORACIN DE UNA
DISTRIBUCIN DE FRECUENCIAS:
Nmero de clases:
Nunca deben ser menos de 5 ni ms de 20, porque en el primer caso la
informacin se resume o condensa demasiado y no se puede tener una
idea exacta del patrn de variacin; y en el segundo se pierde
efectividad para el anlisis.
Limites de clase:
Cuando se hace una distribucin de frecuencias, se debe procurar que
la marca de clase, coincida hasta donde sea posible, con el punto en que
se concentran los valores originales. Para facilitar los clculos, el punto
288625409.doc

medio debe ser ENTERO. Esto debe tomarse como una recomendacin y
no en forma absoluta.
Deben evitarse lmites de clases ambiguos, sin caer en duplicaciones o
traslapes, ni en omisiones.
Tamao de intervalos:
Las distribuciones de frecuencias se clasifican, de acuerdo al tamao de
los intervalos de clase en:
1. De igual tamao o de amplitud constante
2. De diferente tamao o de amplitud variable
3. Con clases abiertas
Lo ideal es que las clases sean de igual tamao o de amplitud constante,
porque eso facilita su interpretacin y se simplifican los clculos.
Ejemplo:
De 20 a 29.99
De 30 a 39.99
De 40 a 49.99 el intervalo es 9.99
Cuando los valores son extremadamente variables, es necesario usar
clases de diferente amplitud, aunque no es recomendable. En tal caso,
debe procurarse ir incrementando el intervalo de trecho en trecho, en
forma constante.
Las distribuciones con clase abierta, carecen de uno de sus lmites,
algunas veces es el inferior y otras el superior. Tienen la desventaja de
que no se puede precisar el punto medio de las clases extremas (la
primera y la ltima). Sin embargo, este sistema es necesario cuando se
desean considerar algunos valores muy pequeos o muy grandes;
siempre se debe indicar por medio de una llamada, cul es el valor
mnimo o mximo que se incluye.
Determinacin de intervalo de clase
La frmula de STURGES, permite determinar con cierta aproximacin, el
intervalo de clase con que debe elaborarse una distribucin de
frecuencias.
FORMULA DE STURGES
i = Valor Mximo Valor Mnimo
1 + (3.322 x log. N)
Siendo:
i = intervalo de clase
N = Total de casos u observaciones
3.322 = Constante que siempre debe utilizarse
Log. = Logaritmo
Por ejemplo, si se tiene una muestra de 200 obreros, en los cuales
estamos estudiando la situacin de salarios, se encontr que fluctuaban
entre Q150 y Q180 por mes. Con qu intervalos de clase se debera
elaborar la distribucin de frecuencias. En este caso, se desconoce "i", N
es igual a 200, el valor mximo es Q180, y el valor mnimo es Q150.
288625409.doc

Aplicando la frmula de Sturgess, tendremos:


i

180 150
1 ( 3,322 * log 200)

Si leemos el logaritmo de 200 en una tabla o en una calculadora,


tendremos: 2.30103, este valor se sustituye en la frmula:
i = 180 - 150 _
1+(3.322x2.30103)
i = 30 _
1+ 7.6667
i = 30 = 3.461
8.6667
i = 3.461
Como los intervalos siempre deben ser ENTEROS, el valor obtenido por
medio de la frmula, se aproxima a 3, por lo tanto, el intervalo que debe
tomarse es 3.
Las clases en la distribucin quedan as:
Salarios (Q)
De 150 a 152
153 a 155
156 a 158
159 a 161
162 a 164
165 a 167
168 a 170
171 a 173
174 a 176

288625409.doc

177 a 179
180 a 182
No se recomiendan reglas generales para la elaboracin de las
distribuciones de frecuencias ya que ello depende del tipo de
informacin disponible.
REPRESENTACIN GRFICA:
Antes de hace anlisis de las distribuciones de frecuencia, deben
representarse en forma grfica para tener una idea general sobre sus
rasgos caractersticos, lo cual se puede lograr por cuatro grficas:
HISTOGRAMA DE PEARSON
POLIGONO DE FRECUENCIAS
CURVA DE FRECUENCIAS
CURVA ACUMULATIVA DE FRECUENCIAS
El penltimo sistema es el ms utilizado porque permite tener en un
mismo grfico, dos o ms distribuciones.
HISTOGRAMA:
Elaborar un histograma de los salarios pagados en la fbrica el Cometa,
enero 1998.
SALARIOS (Q) Clases

NUMERO DE OBREROS

100 a menos de 125

125 a menos de 150

10

150 a menos de 175

20

175 a menos de 200

25

200 a menos de 225

15

225 a menos de 250

8
83

HISTOGRAMA DE PEARSON POLIGONO DE FRECUENCIAS

288625409.doc

CURVA DE FRECUENCIAS
Se toma como referencia el polgono de frecuencias, y sobre el se hace
coincidir la curva.
SALARIOS DE LA FBRICA EL COMETA
ENERO 1998

CURVA ACUMULATIVA DE FRECUENCIAS (OJIVA)


Cuando las frecuencias de una distribucin se acumulan su
representacin grfica se llama OJIVA (de Galton)
SALARIOS PAGADOS EN LA FABRICA EL COMETA
ENERO DE 1998
SALARIO
100 a menos de
125
125 a menos de
150
150 a menos de
175
175 a menos de
200
200 a menos de
288625409.doc

No. Obreros
Frecuencias

Frecuencias
Acumuladas

10

5+10=15

20

15+20=35

25

35+25=60

15

60+15=75

75+8=83

225
225 a menos de
250
TOTAL

83
OJIVA

MEDIDAS DE TENDENCIA CENTRAL


La Media Aritmtica
La Mediana
La Moda o Modo
Los Cuartiles, Deciles y Percentiles

LA MEDIA ARITMETICA
La media aritmtica es un determinado valor de una serie de valores,
comprendido entre el valor mayor y el valor menor y que los representa
a todos.
La media aritmtica de una serie de valores, es igual al cociente que
resulta de dividir la suma de todos los valores entre el nmero total de
casos.
CALCULO DE LA MEDIA ARITMETICA CON DATOS NO AGRUPADOS
Y AGRUPADOS
En el clculo de la media aritmtica, se pueden presentar tres casos:
1. Media Aritmtica de una serie simple de valores.
2. Media Aritmtica de una distribucin de frecuencias de valores sin agrupar.
3. Media Aritmtica de una distribucin de frecuencias de valores agrupados.
CALCULO DE LA MEDIA ARITMETICA DE UNA SERIE SIMPLE
El clculo se hace mediante la siguiente expresin matemtica o
frmula:
= Xi
N
Donde:
288625409.doc

= media aritmtica
Xi = Representa los valores de la variable o valores a promediar

= Es la letra griega sigma, y se lee suma o sumatoria

N = Es el nmero total de casos o nmero de valores a


promediarse

Ejemplo:
Cul fue el ingreso medio diario de un comerciante durante la ltima
semana?

DIA DE LA
SEMANA

INGRESO
DIARIO (Q)

Lunes

75

Martes

225

Mircoles

175

Jueves

300

Viernes

180

Sbado

400

TOTAL . . . . . . . . . . . . .1355
Xi = 1355
N=6
APLICANDO LA FORMULA
= 1355 = 225.83
6
INTERPRETACION
Es como si el comerciante hubiera vendido diariamente, de lunes a
sbado Q.225.83.
Ejemplo:
Cul fue la produccin media diaria de una fbrica? si en la ltima
semana produjo:

288625409.doc

DIA DE LA
SEMANA

INGRESO
DIARIO (Q)

Lunes

100

Martes
150
Mircoles
125
Jueves
110
Viernes
90
Sbado
115
TOTAL . . . . . . . . . . . . . 690
Xi = 1355
N=6
APLICANDO LA FORMULA
= 690 = 115
6
INTERPRETACION
Si la fbrica trabajara a igual ritmo todos los das de la semana,
producira 115 unidades diarias.
Ejemplo:
Cul es la media aritmtica de los nmeros 8, 3, 5, 12, 10.
SOLUCION: La media aritmtica es la suma de todos los valores,
dividida entre el nmero de valores.
= 8 + 3 + 5 + 12 + 10 = 38 = 7.6
1. 5
MEDIA ARITMETICA DE UNA DISTRIBUCION DE FRECUENCIAS DE
VALORES SIN AGRUPAR.
Este promedio tambin se llama promedio ponderado o media
aritmetica ponderada. La caracterstica de este promedio es que cada
trmino tiene diferente pero, al contrario del promedio aritmtico simple,
en que cada trmino slo se escribe una vez.
Este promedio se calcula por medio de la siguiente frmula:
= (f.Xi)
N
En donde (f.Xi) es igual a la suma de los productos de los valores por
su respectiva frecuencia.
Ejemplo:
En una empresa hay 5 trabajadores que ganan Q.200; 4 que ganan
Q.250; 8 que ganan Q.175 y 3 que ganan Q.300. Cul es el promedio de
salarios de la empresa?
No. Trabajadores
SALARIO (Q)
288625409.doc

Totales

f.Xi

200

5x200 = 1000

250

4x250 = 1000

175

8x175 = 1400

300

3x300 = 900

N = 20 (f.Xi) = 4300
APLICANDO LA FORMULA
= (f.Xi)
N
= (5x200)+(4x250)+(8x175)+(3x300)
20
= 4300
20
= 215
RESPUESTA: El promedio de salarios de la empresa es de Q.215.
MEDIA ARITMETICA DE DISTRIBUCION DE FRECUENCIAS DE
VALORES AGRUPADOS EN INTERVALOS DE AMPLITUD CONSTANTE
O VARIABLE.
Para calcular la media aritmtica de valores que estn agrupados en
intervalos de amplitud constante o variable, es necesario antes calcular
la marca de clase o punto medio de cada intervalo y multiplicarla por la
frecuencia respectiva. La frmula a aplicar es la misma que uso en el
clculo anterior, teniendo presente que Xi representa la marca de clase.
Ejemplo:
Calcular la media aritmtica de los siguientes valores agrupados en
intervalos de amplitud constante.
Intervalos

Marca de
clase Xi

f.Xi

10 - 19

(10+19)/2 =
14.5

4x14.5 = 58.0

20 - 29

(20+29)/2 =
24.5

7x24.5 = 171.5

30 - 39

(30+39)/2 =

9x34.5 = 310.5

288625409.doc

43.5
40 - 49

10

(40+49)/2 =
44.5

10x44.5 =
445.0

50 - 59

(50+59)/2 =
54.5

5x54.5 = 272.5

N = 35

f.Xi = 1257.5

OBSERVACION:
Las dos primeras columnas corresponden a los datos, las otras
columnas son calculadas.
PROCEDIMIENTO:
1. Primero calculamos las marcas de clase o puntos medios. Para eso sumamos los dos
intervalos y al resultado le sacamos mitad.
2. Multiplicamos las frecuencias absolutas por las marcas de clase y obtenemos as, la
columna f.Xi.
3. Sumamos la columna de frecuencias por puntos medios. Esta suma da como
resultado: 1257.5.
4. Calculamos la media artimtica por medio de la frmula correspondiente:
= (f.Xi)
N
SUSTITUYENDO VALORES EN LA FORMULA:
= 1257.5
35
EFECTUANDO LA DIVISION
= 35.928
APROXIMANDO EL RESULTADO A DOS DECIMALES:
= 35.93 Media Aritmtica
PROBLEMAS PARA RESOLVER
PROBLEMA 1
En dos pruebas estndar y normalmente distribuidas, Eva obtuvo las
calificaciones:

Prueba A:
o Media = 220
o Desviacin tpica = 50

288625409.doc

Calificacin = 245
Prueba B:
o Media = 150
o Desviacin tpica = 25
o Calificacin = 175
o

En cul de las dos pruebas obtuvo Eva mejor calificacin?


PROBLEMA 2
Calcule la Media de los siguientes datos Agrupados:

288625409.doc

Marca de Clase

Frecuencia

70

74

78

16

82

28

86

45

90

66

94

85

98

72

102

54

106

38

110

27

114

18

118

11

122

126

Utilice el mtodo Corto


PROBLEMA 3
Encuentre el Coeficiente Correlacin entre los siguientes punteos:
Alumno

Test X

Test Y

83

160

46

38

92

143

81

67

70

124

70

117

75

132

88

143

74

121

79

113

PROBLEMA 4
Calcule la mediana de los salarios de los 70 trabajadores de una fbrica:

288625409.doc

Salarios

Trabajadores

70 - 89

31

90 - 109

18

110 - 129

130 - 149

150 - 169

170 - 189

PROBLEMA 5
Calcula los Cuartiles 1, 2 y 3 de la tabla anterior (PROBLEMA 04)
SOLUCION PROBLEMA 1
RESPUESTA: Obtuvo mejor calificacin en la prueba B
z=(X-X)/S
Prueba A
z = (245-220)/50
z = 0.5
Percentil = 50.00
Prueba B
z = (175-150)/25
1.00
Percentil = 100.00
SOLUCION PROBLEMA 2
RESPUESTA: Media=95.97
Calcula la Media de los siguientes datos Agrupados:
Media = Marca Arbitraria + Suma ( Frecuencia * Desviacin
Posicional ) / Numero Datos * Intervalo
Marca Arbitraria = 98
Suma ( Frecuencia * Desviacin Posicional ) = -244
Numero Datos = 480
Intervalo = 4
Media = 98 + ( -244 / 480 ) * 4
Media = 95.9666667
288625409.doc

Marca de
Clase

Frecuencia

Desviacin
Posicional

fd

70

-7

-28

74

-6

-54

78

16

-5

-80

82

28

-4

-112

86

45

-3

-135

90

66

-2

-132

94

85

-1

-85

98

72

102

54

54

106

38

76

110

27

81

288625409.doc

114

18

72

118

11

55

122

30

126

14

Sumas: 480 - 244


SOLUCION PROBLEMA 3
RESPUESTA: Existe una correlacin positiva de 0.64
Coeficiente Correlacin = 1 - ( 6 * Suma Diferencia Entre Rangos
2
) / Numero Datos ( Numero Datos 2 -1 )
Suma Diferencia Entre Rangos

= 60

Numero Datos = 10
Numero Datos

= 100

Coeficiente Correlacin = 1 - ( 6 * 60 ) / 10 ( 100 - 1 )


Coeficiente Correlacin = 0.64
SOLUCION PROBLEMA 4
RESPUESTA: La mediana es 94.44
Posicin de la mediana = ( 70 / 2 ) = 35
Interpolacin = 89.5 + ( ( 4 / 18 ) * 20 )
Interpolacin = 93.9444444
Calcule la mediana de los salarios de los 70 trabajadores de una
fbrica:
288625409.doc

SALARIOS

TRAB.

LIMITES
REALES

FRECUENCIA
ACUMULADA

70 - 89

31

69.5 - 89.5

31

90 - 109

18

89.5 - 109.5

49 <- 35>
MEDIANA

110 - 129

109.5 - 129.5

57

130 - 149

129.5 - 149.5

63

150 - 169

149.5 - 169.5

67

170 - 189

169.5 - 189.5

70

SUMAS

70

SOLUCION PROBLEMA 5
RESPUESTA: Los cuartiles corresponden a:
o
o
o

C1 = 80.79
C2 = 93.94
C3 = 118.25

SALARIOS

TRAB.

LIMITES
REALES

FRECUENCIA
ACUMULADA

70 - 89

31

69.5 - 89.5

31 <- Cuartil 1 >

288625409.doc

90 - 109

18

89.5 - 109.5

49 <- Cuartil 2 >

110 - 129

109.5 - 129.5

57 <- Cuartil 3 >

130 - 149

129.5 - 149.5

63

150 - 169

149.5 - 169.5

67

170 - 189

169.5 - 189.5

70

SUMAS

70

INTERPOLANDO
Cuartil 1 = 70 / 4 = 17.50
Cuartil 1 = 69.5 + ( 17.5 / 31 ) * 20 = 80.79
Cuartil 1 = 80.79
Cuartil 2 = ( 70 / 4 ) * 2 = 35.00
Cuartil 2 = 89.5 + ( 4 / 18 ) * 20 = 93.94
Cuartil 2 = 93.94
Cuartil 3 = ( 70 / 4 ) * 3 = 52.50
Cuartil 3 = 109.5 + ( 3.5 / 8 ) * 20 = 118.25
Cuartil 3 = 118.25

288625409.doc

Potrebbero piacerti anche