Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadistica Aplicada
Ing. Fatima Reyes
INDICE
INDICE...................................................................................................................................2
INTRODUCCION..................................................................................................................3
Objetivos.................................................................................................................................4
Objetivo General:................................................................................................................4
Objetivos Especificos:.........................................................................................................4
Marco Teorico.........................................................................................................................5
Estadistica Aplicada:...........................................................................................................5
1.
Generalidades de la estadstica.............................................................................5
1.1.
1.2.
Distribucion de Frecuecias:..........................................................................................7
2.1.
Medidas de Centralizacion.........................................................................................12
3.1. Promedio y medidas de centralizacin media aritmtica media aritmtica
ponderada propiedades de la media aritmtica.............................................................12
4.
Medidas de dispercion........................................................................................21
4.1.
4.2.
4.3.
Varianza..............................................................................................................22
Pgina 2
INTRODUCCION
La Estadistica Aplicada es la ciencia que estudia el campo de los datos numricos finitos e
infinitos convertidos en datos generales, es una herramienta muy importante para poder
usar los parmetros que nos permitan llegar a un resultado real y concreto
La Investigacion de la metales pesados en el agua necesita una regularizacin por lo que
usaremos los datos de la estadstica aplicada para poder definir los rangos en los que se
encuentran 50 muestras de aguas con relacin a la cantdad de Mercurio que posean dichas
muestras de aguas.
Pgina 3
Objetivos
Objetivo General:
Establecer datos Estadisticos sobre la determinacin de metales pesados en el agua.
Objetivos Especificos:
Establecer fundamentos tericos con relacin a la Estadistica
Investigar sobre los metales pesados que posee el agua
Obtener una informacin veraz y autentica mediante la practica
Pgina 4
Marco Teorico
Estadistica Aplicada:
1. Generalidades de la estadstica
1.1. Definicin, caractersticas y limitaciones de la estadsticas:
86,385 en centsimas nos hallamos ante un dilema, yua que esta equidistante
de 86.38 y de 86.39. se adopta en tales casos la costumbre de lledondear al
entero par que prece al 5. Asi pues 86.385 se redondea a 86.38 y 36.375 se
redonde a 36.38.
1.3.5. Notacion Cientifica: al escirbir nmeros, especialmente los que tiene
muchos ceros antes o despus del punto decimal, es utilizada la notacin
cientfica mediante potencias de 10.
Ejemplo: 864,000,000 = 8.64
x 108
5
y 0.00003416 = 3.416 x 10
Frecuencias.
2.1.1. Filas de datos: Una Fila de datos consiste ne datos recogidos que no han
sido organizados numricamente, por ejemplos, el peso de 150 personas
diabticas.
2.1.2. Ordenacion: Una Ordenacion es un conjunto de datos numricos en orden
creciente o decreciente. La diferencia entre el mayor y el menor se llama rango
de ese conjunto de datos. Asi, si el mayo peso entre los 150 diabeticos es 230
lbs y el menor es 200 lbs, el rango es 230 200 = 30 lbs.
2.1.3. Tabla de Distribucion de Frecuencias: al resumir grandes colecciones de
datos, es til distribuirlos en clases o categoras, y determinar el numero de
individuos que pertenecen a cada clase, llamado frecuencia de clase, se llama
distribucin de frecuencias.
Ejemplo:
Pesos en (lb)
100- 110
111- 121
122-132
133-143
Numero de
Personas
10
20
34
16
Pgina 7
60
En el primer intervalo de 100-110 lbs, hay 10 personas, esto es lo que corresponde a la
frecuencia- 10.
Este tipo de agrupacin de datos se les denomina datos agrupados. Tambin existen los
datos no agrupados que se realizan simplemente detallando cada clase o categora.
2.1.4. Intervalo de clase y limites de clase: Un intervalo de clase se representa
como 100-110 como se muestra en la tabla anterior. Aqu podemos encontrar
los limites que son limite inferiro (100) y k limite superior (120).
2.1.5. Fronteras de Clase: Si se dan pesos de 1 lb, el intervalo de clase de 100-110
incluye tericamente todas las mediadas desde 99.50 a 110.50. Estos nmeros,
indicados mas brevemente por los nmeros exactos 99.5 y 110.5, se llaman
Limite inferior real y Limite superior real, respectivamente o Frontera
inferior de clase y Frontera superior de clase.
Este numero se obtiene de un promedio entre el limite superior de una clase
con el inferior de la siguiente dividido para dos.
2.1.6. Tamao o Anchura de un intervalo de clase.- El tamao o anchura de un
intervalo de clase es la diferencia entre las fronteras de clase superior e
inferiro. Si todos los intervalos de clase de una distribucin de frecuencias
tienen la misma anchura denotado por c. en tal caso, c es igual a la diferencia
entre dos limites inferiores o superios de calses sucesivas. Para los datos de la
tabla anterios, por ejemplo la anchura del intervalo de clase c= 110.5 99.5 =
121.5 110.5 = 11.
2.1.7. Marca de Clase.- la marca de clase es el punto medio del intervalo de clase
y se obitene preomediando los limites inferior y superior de clases. Asi que las
marcas de clase del intervalo 100-110 es (100+110)/2= 105. Denominado
tambin punto medio de la calse.
2.2. Presentacin de las tablas de distribucin de frecuencia, Grficos:
polgonos e histogramas de frecuencias, Centrogramas frecuencias
relativas y acumuladas u ojivas.
Pgina 8
2.2.2.1.
Un histograma o Histograma de Frecuencias, consiste en un conjunto de
rectngulos con : a) Base en el eje X horizontal; centros en las marcas de clase y
losgitudes iguales a los tamaos de los intervalos de clase y b) reas
proporcionales a las frecuencias de las clases.
Si los intervalos de clase tienen todos las misma anchura, las alturas de los
rectngulos son proporcionales a las frecuencias de clase, y entonces es
costumbre tomar las alturas iguals a las frecuencias de clase. En caso contrario,
deben ajustarse las alturas.
N personas
40
30
20
10
99
100
110
111
121
122
132
133
143
144
Peso en Lb
2.2.2.2. Un polgono de frecuencia es un grafico de trozos de la frecuencia de
clase con relacin a la marca de clase. Puede obtenerse conectando los
puntos medios de las partes superiores.
N personas
40
30
20
Pgina 9
10
99
100
110
111
121
122
132
133
143
144
Peso en Lb
Histograma y poligno de Frecuencias correspondientes a la distribucin de freciencias de
pesos en la tabla expuesta. Se indican sobre los mismos ejes de la figura. Suelen aadirse
las longitudes PQy RS a las marcas de clase extremas como asociadas a una frecuencia de
clase cero. En tal caso la suma de las reas de los rectngulos del histograma es igual al
rea total limitada por el poligno de frecuencias y el eje X.
2.2.3.
Distribuciones de Frecuencias Relativas.- la frecuencia Relativa de
una Clase es su freceuncia dividida por la frecuencia total de todas las cases
yuse expresa generalmente como un porcentaje. Por ejemplo, la frecuencia
relativa de la clase 100-110 de nuestra tabla es = 10/80= 0.13%. la suma de las
frecuencias relativas de todas las cases obviamente es 1 o sea 100 por 100.
Si se sustituyen las frecuencias de la tabla de pesos por las correspondientes
frecuencias relativas, la tabla resultante se llama una distribucin de
frecuencias relativas, distribucin de porcentajes o tablas de frecuencias
relativas.
La representacin graficas de distribuciones de frecuencias relativas se puede
obtener del histograma o del polgono de frecuencias sin mas que cambiar la
escala vertical de freceuncias a frecuencias relativas, manteniendo
exactamente el mismo diagrama. Los graficos resultantes se llaman
histogramas de frecuencias relativas y polgonos de frecuencias relativas.
2.2.4. Distribuciones de Frecuencias Acumuladas y Ojivas.
La frecuenica total de todos los valores menores que la frontera de clase
sumerior de un intervalo de clase dado se llama frecuencia acumulada hasta
que ese intervalo de clase inclusive. Por ejemplo, la frecuencia acumulada
hasta el intervalo de clase 122-132 = 10+20+34 = 64.
Una tabla que presente tales frecuencias acumuladas se llama una distribucin
de frecuencias acumuladas, tabla de fecuencias acumuladas , o brevemente una
distribucin acumulada, y se muestra en la siguiten tabla2.3.
Tabla 2.3
Menor
que
109.5
110.5
121.5
132.5
Fa
0
10
30
64
Pgina 10
143.5
80
Un grafico que recoja las frecuencias acumuladas por debajo de cualquiera de las fronteras
de clase superiores respecto de dicha frontera se llama un polgono de frecuencias
acumuladas y ojiva, y se ilustro en la figura 2.3.
A ciertos efectos, es deseable considerar una distribucin de frecuencias acumuladas de
todso los valores mayores o iguales que la frontera de clase inferior de cada intervalo de
clase. Como eso hace considerar pesos de 109.5 o mas, de 110.5 o mas etc, se le suele
llamar una distribucin acumulada o mas, mientras que la antes considerada es una
distribucin acumulada menor que. Es fcil deducir una de otra. Las correspondientes
ojivas se conocen con los mismos apodos. Siempre que nos refiramos a distribucines
acumuladas u ojivas sin mas, estaremos hablando del caso menor que.
2.2.5. Distribucion de Frecuencias Relativas y Ojivas de porcentajes.
La frecuencia acumulada relativa o Frecuencia acumulada de porcentanjes, es
la drecuencia acumulada dividida por la frecuencia total.
Si se usan frecuencias acumuladas relativas en la tabla en vez de frecuencias
acumuladas, los resultados se llaman distribuciones de frecuencias acumuladas
relativas y poligomos de frecuencias relativos, respectivamente.
2.2.6.
Curvas de freceuncia y Ojivas suavizadas.- los datos recogidos
pueden considerarse usualmente como pertenecientes a una muestra de una
poblacin grande. Ya que son posibles muchas observaciones sobre esa
poblacin, es tericamente posible escoger intervalos de clase muy pequeos y
tener todava nmeros razonables de observaciones en cada clase. Asi que
cabe esperar que el polgono de freceuncias o el polgono de frecuencias
relativas para una gran poblacin tenga tantos pequeos segmentos
queaparezcan como casi una curva continua, a las que nos referimos como
curva de frecuencias o curva de frecuencias relativas, respectivamente.
Es sensato esperar que dichas curvas tericas sean aproximables suavizando
los polgonos de frecuencias o los polgonos de frecuencias relativas de la
muestra, tanto mejor la aproximacin cuanto mayor sea el tamao de la
muestra. Por esa razn, una curva de frecuencias se cita a veces como un
polgono de frecuencias suavizado.
De forma anloga, se obtienen ojivas suavisadas de polgonos de frecuencias
acumuladas u ojivas. Suele ser mas fcil suavizar una ojiva que un polgono de
frecuencias.
2.3. Tipos de Curvas de Frecuencias.
Pgina 11
3. Medidas de Centralizacion.
3.1. Promedio y medidas de centralizacin media aritmtica media
Eje mpl o:
Pgina 12
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
ag ru pa do s
en
fi
xi fi
[ 1 0, 20 )
15
15
[ 2 0, 30 )
25
200
[ 3 0, 4 0 )
35
10
350
[ 4 0, 50 )
45
405
[5 0 , 6 0
55
440
[ 6 0, 7 0 )
65
260
[ 7 0, 80 )
75
150
42
1 820
3.1.4. Mediana: Es el valor que ocupa el lugar central de todos los datos
cuando stos estn ordenados de menor a mayor. La mediana se
representa por M e . La mediana se puede hallar slo para variables
cuantitativas.
Pgina 13
Calculo de la mediana:
Ordenamos los datos de menor a mayor.
Si la serie tiene un nmero impar de medidas la mediana es
la puntuacin central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
Si la serie tiene un nmero par de puntuaciones la mediana es
la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12
M e = 9.5
3.1.4.1. Clculo de la mediana para datos agrupados: La mediana se
encuentra en el intervalo donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias absolutas .
Es decir tenemos que buscar el intervalo en el que se encuentre
Pgina 14
fi
Fi
[6 0 , 6 3 )
[6 3 , 6 6 )
18
23
[6 6 , 6 9 )
42
65
[6 9 , 7 2 )
27
92
[7 2 , 7 5 )
100
100
100 / 2 = 50
Clase modal: [66, 69)
a i es la amplitud de la clase.
Tambin se utiliza otra frmula de la moda que da un valor
aproximado de sta:
Pgina 16
Ejemplo
Cal cul ar
la
mo da
[ 6 3, 66 )
18
[ 6 6, 69 )
42
[ 6 9, 72 )
27
[ 7 2, 75 )
8
100
Pgina 17
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y
sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.
fi
hi
[0 , 5 )
15
[5 , 7 )
20
10
[7 , 9 )
12
[ 9, 1 0)
50
3.1.6. Cuartiles: Los cuartiles son los tres valores de la variable quedividen a
un conjunto de datos ordenados en cuatro partes iguales.
Q 1 , Q 2 y Q 3 determinan los valores correspondientes al25%, al 50% y
al 75% de los datos. Q 2 coincide con la mediana.
Clculo de los cuartiles
1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa cada cuartil mediante la
expresin
.
Nmero impar de datos
2, 5, 3, 6, 7, 4, 9
Pgina 18
, en
, en la tabla de
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
Pgina 19
[100, 110)
63
[110, 120)
65
65
Clculo del primer decil
, en
Pgina 20
Ejercicio de percentiles
Calcular el percentil 35 y 60 de la distribucin de la tabla:
fi
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65
Percentil 35
Percentil 60
4. Medidas de dispercion
4.1. Dispercion o variacin de rango: Las medidas de dispersin nos
La
des vi aci n me di a
es la
me di a ari tm ti c a
de los
val or es a bs ol utos d e l as
La
des vi aci n me di a
se representa por
Pgina 21
Ejemplo
Calcular la
de la distribucin:
9, 3, 8, 8, 9, 8, 9, 18
de s vi a ci n medi a
Ejercicios de varianza
Calcular la varianza de la distribucin:
9, 3, 8, 8, 9, 8, 9, 18
xi
fi
xi fi
xi2 fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
Pgina 23
Pgina 24
18
21
23
25
20
20
29
28
14
22
12
18
17
25
23
19
18
20
20
25
14
16
24
18
25
16
15
23
22
25
20
16
18
20
25
16
18
17
19
20
De acuerdo a estos datos realizar los respectivos Anlisis Estadsticos con los conceptos
conocidos:
Frecuencias en orden numrico:
x
12
14
15
16
17
18
19
20
21
22
23
24
25
28
29
f
1
3
2
5
2
8
2
9
1
2
4
1
7
1
2
Rango: (29-11)+1=18
Ancho de clase:
18
=3
6
Datos Agrupados:
Pgina 25
x
12 15
16 - 18
19 - 21
22- 24
25- 27
28 - 30
f
6
15
12
7
7
3
50
Pgina 26
50
POLIGONOS E HISTOGRAMA DE FRECUENCIA
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 39
f
6
15
12
7
7
3
50
fia
6
21
33
40
47
50
fr
0,12
0,3
0,24
0,14
0,14
0,06
1
fra
0,12
0,42
0,66
0,8
0,94
1
Mc
13
16
19
22
25
28
20
15
10
11
12
14
15
17
18
20
21
23
24
26
27
29
30
Lir - Lsr
Menor
que
11,5
fia
fr
fra
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
6
15
12
7
7
3
50
11,5 - 14,5
14,5 - 17,5
17,5 - 20,5
20,5 - 23,5
23,5 - 26,5
26,5 - 29,5
14,5
17,5
20,5
23,5
26,5
29,5
6
21
33
40
47
50
0,12
0,3
0,24
0,14
0,14
0,06
1
0,12
0,42
0,66
0,8
0,94
1
50
40
0,8
30
0,6
20
0,4
10
0,2
11
14
17
20
23
26
12
15
18
21
24
27
Elaborado por: Mendoza Vicky y Macias Ana
Fuente: Niveles de Mercurio de 50 Muestras de Agua
MEDIA ARITMETICA
Metodo largo
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
f
6
15
12
7
7
3
Mc
13
16
19
22
25
28
f* Mc
78
240
228
154
175
84
29
30
50
959
959
=19,18
50
Metodo Corto:
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
A=16
=16 +
f
6
15
12
7
7
3
50
Mc
13
16
19
22
25
28
d=McA
-3
0
3
6
9
12
F*d
-18
0
36
42
63
36
159
159
=19.18
50
METODO DE COMPILACION
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
=16 +3
f
6
15
12
7
7
3
50
Mc
13
16
19
22
25
28
F*U
-1
0
1
2
3
4
53
53
=19.18
50
MEDIA ARMONICA:
x
12 14
15-17
18 - 20
21- 23
f
6
15
12
7
-6
0
12
14
21
12
Mc
13
16
19
22
F/Mc
0,46
0,94
0,63
0,32
24- 26
27 - 29
7
3
50
25
28
0,28
0,11
2,74
Mc
13
16
19
22
25
28
Mc2
169
256
361
484
625
784
50
=18.24
2,74
A=
MEDIA CUADRATICA
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
x 2c =
f
6
15
12
7
7
3
50
F*Mc2
1014
3840
4332
3388
4375
2352
19301
19301
19301
x c=
=19,64
50
50
Mediana
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
=17,5+3
f
6
15
12
7
7
3
50
Mc
13
16
19
22
25
28
Lir - Lsr
11,5 - 14,5
14,5 - 17,5
17,5 - 20,5
20,5 - 23,5
23,5 - 26,5
26,5 - 29,5
fia
6
21
33
40
47
50
Lir - Lsr
fia
=18.5
( 2521
12 )
QUARTIL 3
Q 3=
3 ( 50 )
=37.5
4
Mc
6
15
12
7
7
3
50
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
Q3=20,5+3
13
16
19
22
25
28
11,5 - 14,5
14,5 - 17,5
17,5 - 20,5
20,5 - 23,5
23,5 - 26,5
26,5 - 29,5
6
21
33
40
47
50
Lir - Lsr
11,5 - 14,5
14,5 - 17,5
17,5 - 20,5
20,5 - 23,5
23,5 - 26,5
26,5 - 29,5
Fia
6
21
33
40
47
50
( 37.533
)=22,42
7
PERCENTIL 30
P30=
30 ( 50 )
=15
100
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
Q3=14,5+3
f
6
15
12
7
7
3
50
Mc
13
16
19
22
25
28
=16.3
( 156
15 )
DESVIACION MEDIA:
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
=19.18
f
6
15
12
7
7
3
50
Mc
13
16
19
22
25
28
|Mc X|
6,18
3,18
0,18
2,82
5,82
8,82
F|Mc-X|
37,08
47,7
2,16
19,74
40,74
26,46
173,88
MD=
173,88
=3.47
50
RANGO INTER-QUARTILES:
Q 1=14.5+3
(12.56 )
=15.8
15
Q3=14,5+3
=16.3
( 156
15 )
Q=
16.3+15.8
16.05
2
VARIANZA
x
12 14
15-17
18 - 20
21- 23
24- 26
27 - 29
s 2=
f
6
15
12
7
7
3
50
Mc
13
16
19
22
25
28
|Mc - X|
6,18
3,18
0,18
2,82
5,82
8,82
58881,20
=1177.62
50
DESVIACION TIPICA
S=
58881,20
= 1177.62=34.31
50
|Mc-X|
37,08
47,7
2,16
19,74
40,74
26,46
173,88
McX FMcX
1374,93
2275,29
4,67
389,67
1659,75
700,13
8249,56
34129,35
55,99
2727,67
11618,23
2100,39
58881,20
CONCLUSIONES
La Estadistica Aplica es una herramienta de gran ayuda para mostrar los datos reales
mediante formulas establecidas
La Estadistica Aplicada simplifica pasos para llegar a los resultados que se quieren
obtener.
RECOMENDACIONES