Sei sulla pagina 1di 29

Unidad I

DISTRIBUCIONES DE FRECUENCIA
DEFINICION DE LA ESTADISTICA
UNIDAD I ESTADSTICA DESCRIPTIVA
El trmino Estadstica se deriva del latn status que significa estado. Aunque en
realidad la palabra estadstica tiene dos significados bsicos:
En primer lugar, el trmino se utiliza para referirse a nmero reales y
especficos derivados de datos. Por ejemplo, en una encuesta de 1000 personas
a las que se les pregunt que marca de pasta dental usaban, el 15% respondi que
ellas nunca iban al dentista.
Otro significado que se le da al del trmino estadstica, es el que la considera
como un mtodo de anlisis. Por ejemplo, cuando se trata de determinar si un
nuevo frmaco realmente es un elemento efectivo para el tratamiento de una
enfermedad.
Pero debemos de entender que la estadstica en realidad es mucho ms que
simplemente trazar grficas y calcular promedios. Por lo que es conveniente
analizar con detenimiento la siguiente definicin:
La Estadstica es una coleccin de mtodos para planear experimentos, obtener
datos y luego organizar, resumir, presentar, analizar, interpretar y llegar a
conclusiones con base en esos datos
Para comprender la definicin anterior analicemos el significado de cada trmino
relevante que interviene en ella.
Experimento:
Determinacin voluntaria de un fenmeno u observacin
del mismo en determinadas condiciones, como medio de
investigacin cientfica.

Datos:

Antecedentes necesarios para llegar al conocimiento


exacto de una cosa.

Organizar:
Establecer o reformar algo, sujetando a reglas el nmero,
orden, armona y dependencia de sus partes.

Resumir:
Reducir a trminos breves y precisos lo esencial de un
asunto o material.

Presentar:
Poner una cosa en la presencia de uno, mostrarla.

Analizar:
Distinguir y separar las partes de un todo hasta llegar a
conocer los principios o elementos de ste.

Interpretar:
Explicar el sentido de una cosa especialmente el de los
textos faltos de claridad. Atribuir una accin a
determinado fin o causa.

Concluir:
Decidir, formar juicios sobre lo que se ha tratado. Dar
remate a una cosa, acabar, dar fin.

Actualmente la estadstica, es una rama de las matemticas aplicadas,


que colecciona, clasifica, evala o analiza datos para inferir (sacar
conclusiones), poder tomar decisiones y resolver problemas.
Probabilidad: es el estudio de fenmenos puramente aleatorios, que
nos permiten disear estrategias para lograr un fin deseado y poder

predecir la Estadstica y la Probabilidad, puede constituirse como una


herramienta poderosa para ayudar a los cientficos e ingenieros a:
- Disear nuevos productos o perfeccionar los existentes.
- Desarrollar y mejorar los procesos de la produccin.
- Aumentar la calidad en sus productos
Una mala calidad de un producto, ya sea por: defectos de fabricacin o
baja confiabilidad en su rendimiento, se ve reflejado en la Productividad
en el mercado, posicin competitiva, rentabilidad de la empresa.
Si se mejoran los aspectos de la calidad puede eliminarse el
desperdicio
- Disminuir la cantidad de material de desecho y la necesidad de
volver a maquinar piezas.
- Disminuir la inspeccin y pruebas.
- Prdida por garanta.
- Mejorar la satisfaccin del consumidor.
- Permite que la empresa se convierta en un productor de alta
calidad y bajo costo en el mercado.
La estadstica es un elemento decisivo en el incremento de la calidad
en virtud de que las tcnicas estadsticas pueden emplearse para
describir y comprender la variabilidad.

Porque se presenta la variabilidad?


Variabilidad es el resultado de los cambios en las condiciones donde se
hacen las observaciones.
Para conocer la variabilidad es necesario seguir el mtodo cientfico.
Observacin y
Experimentacin
Formulacin
de Teoras
Deduccin de
predicciones
Nuevos
Experimentos
Si
Concuerdan las predicciones
con el experimento
No

Ejemplos:
Proceso de manufactura:
- Propiedades de los materiales
- Forman en que trabajan los obreros
- Variables del proceso tales como temperatura, presin, tiempo,
Voltaje, amperaje.
- Sistemas de medicin
-El muestreo puede ser la causa de la variabilidad
- Se lanz una moneda tres veces; primero sali guila, luego sol y
despus tambin sol.

- En un tubo de ensayo se mezcl agua con cido sulfrico, la mezcla


se calent y hubo una disminucin de un 10%.
- Durante 10 aos consecutivos, en el mes de diciembre se registr una
precipitacin pluvial entre 100 y 200 mm, en los aos2003, 2004,2006
en el resto no.
- Se midi la temperatura de un paciente durante 10 das consecutivos
al medioda, registrndose las siguientes lecturas (en C)
38.7, 37.9, 40.0, 39.5, 38.2, 37.0, 36.8, 37.1, 36.9, 37.0
EXPERIMENTACION
Se pueden plantear las siguientes interrogantes: al lograrse tales
o cuales condiciones, se observan tales o cuales resultados.
Pero ser que siempre que se den las mismas condiciones, se
producirn idnticos efectos? Qu pasa si se cambian dichas
condiciones por otras?

Ramas de la Estadstica
- Estadstica descriptiva: estudia las caractersticas de un grupo de
datos para conocer los valores que lo describen.
Medidas de tendencia central: Media, Mediana, Moda
Medidas de dispersin: Rango y variancia
Medidas de asociacin: Covarianza y coeficiente de correlacin
- Estadstica inferencial: analiza los datos de una muestra para que a
partir de stos, conocer las caractersticas de la poblacin.
COMPARACIN ENTRE PROBABILIDAD Y ESTADSTICA
La probabilidad y la estadstica son dos campos ajenos pero relacionados de las
matemticas. Se ha dicho que la probabilidad es el vehculo de la estadstica. Es
decir, que si no fuera por las leyes de la probabilidad, la teora de la estadstica no
sera posible.
A continuacin se ilustrar la relacin y la diferencia entre estas dos ramas de las
matemticas mediante la observacin de dos cajas. Se sabe que la caja de
probabilidad contiene fichas de pquer: cinco azules, cinco rojas y cinco blancas.
La probabilidad intenta responder preguntas como si se extrae una ficha de la
caja, cul es la posibilidad de que sea azul? En la caja de estadstica se ignora
cul es la combinacin de fichas. Se extrae una muestra y, con base en los
resultados obtenidos en sta, se hacen conjeturas sobre lo que se cree que hay

en la caja. Observe la diferencia: la probabilidad pregunta sobre la posibilidad de


que ocurra algo especfico (seleccionar una ficha azul) cuando se conocen las
posibilidades (es decir, que se conoce la poblacin). Por otra parte, la estadstica
pide extraer una muestra, describirla (estadstica descriptiva) y luego hacer
inferencias sobre la poblacin con base en la informacin que se obtuvo en la
muestra. (Estadstica inferencial).

Clasifique cada una de las siguientes afirmaciones como problema de


probabilidad o de estadstica.
a. Determinar si un nuevo medicamento reduce el tiempo de recuperacin de
cierta enfermedad.
b. Determinar la posibilidad de obtener cara cuando se lanza urja moneda.
c. Determinar el tiempo de espera necesario para pagar y salir de una tienda.
d. Determinar la posibilidad de obtener una mano de veintiuno.
Clasifique cada una de las siguientes afirmaciones como problema de
probabilidad o de estadstica.
a. Determinar cunto tiempo es necesario para manejar un sondeo telefnico
tpico en una oficina de bienes races.
b. Determinar la duracin de la vida de los focos de 100 watts producidos por una
empresa.
c. Determinar la posibilidad de extraer una bola azul de un tazn que contiene 15
bolas, de las cuales 5 son azules.
d. Determinar la resistencia al corte de los remaches recientemente adquiridos
por una Compaa pan construir aviones.
Agrupacin de datos

Clasificacin
Los datos en bruto conocidos tambin son los datos recopilados que no han sido
clasificados u organizados numricamente. Un ejemplo es la lista de estaturas de
100 alumnos obtenida de los registros alfabticos de la universidad.
Un arreglo o datos agrupados es una lista ordenada, donde se ha efectuado un
acomodo de los datos numricos en bruto tomando en cuenta algn orden
(ascendente o descendente) de sus magnitudes. La diferencia entre los nmeros
mayor y menor se llama rango de los datos. Por ejemplo, si la mayor estatura de
100 alumnos es 174 centmetros y la menor es 160 centmetros, el rango es 174 160 = 14 centmetros.
Cuando se recopilan grandes cantidades de datos en bruto, con frecuencia resulta
til distribuir los datos en clases o categoras y determinar el nmero de
individuos que pertenecen a cada clase, lo cual recibe el nombre de frecuencia

de clase. Una disposicin tabular de los datos reunidos por clases, con las
correspondientes frecuencias para cada clase, se denomina tabla de frecuencia o
distribucin de frecuencia. La siguiente tabla es una distribucin de frecuencia
para las estaturas (redondeadas al centmetro ms cercano) de 100 estudiantes
de la Universidad ABC.
Tabla 1
Estatura
(centmetros)

Nmero de
alumnos

160-162
163-165
166-168
169-171
172-174

5
18
42
27
8

Total

100

La primera clase (o categora), por ejemplo, consiste de estaturas de 160 a 162


centmetros y est indicada por el smbolo de intervalo 160-162. Como cinco
estudiantes tienen estaturas que pertenecen a esta clase, la correspondiente
frecuencia de clase es 5. Los nmeros 160 y 162 se llaman lmites o extremos de
la clase; el nmero menor (160) es el lmite inferior de la clase, y el nmero ms
grande (162) es el lmite superior de la clase. Frecuentemente, los trminos
clase e intervalo de clase se usan indistintamente.
Un intervalo de clase que no tiene lmite superior o lmite inferior (al
menos, tericamente) se denomina intervalo de clase abierto. Por ejemplo,
al referirnos a grupos de edad en personas, el intervalo de clase "65 aos o
ms de edad" es un intervalo de clase abierto.
El punto medio de un intervalo de clase (el promedio o media aritmtica de los
lmites inferior y superior) se denomina marca de clase. Para fines de anlisis
matemtico posterior, todas las observaciones o puntajes que pertenecen a un
intervalo de clase dado, se asume que coinciden con la marca de clase. As, se
considera que todas las estaturas en el intervalo de clase 160-162 son de 161
centmetros.
Si las estaturas se registran hasta el centmetro ms cercano, el intervalo de
clase 160 -162 tericamente incluye todas las medidas entre 159.5 y 162.5
centmetros. Estos nmeros se denominan fronteras de clase o lmites de clase
verdaderos. En la prctica, las fronteras de clase se obtienen promediando el
lmite superior de un intervalo de clase y el lmite inferior del siguiente intervalo.
Algunas veces, las fronteras de clase se emplean para simbolizar las clases. Por
ejemplo, las diferentes clases en la primera columna de la Tabla 1 se pueden
indicar por 159.5-162.5, 162.5-165.5, etctera.

Ejercicio 1
Cul es la marca de clase del intervalo 64-66 de un conjunto de medidas de
peso, en kilogramos, de los alumnos de una universidad?
64
65
66
A los datos organizados y resumidos, como en la Tabla 1, se les conoce
comnmente como datos agrupados. Aunque el proceso de agrupamiento
destruye, por lo general, mucho del detalle original de los datos, una ventaja
importante es que se gana en claridad y en que se hacen evidentes algunas
relaciones en ellos.

Cuntas clases?
Mientras en el caso de tratamiento individual la tabla queda perfectamente
determinada por los posibles valores de los datos, en el caso de tratamiento por
clases est claro que no sucede as, pues hay libertad para elegir el nmero de
clases y los lmites de las mismas.
Para decidir el nmero de clases que se deben tomar conviene tener en cuenta
que si ste es excesivo con respecto al nmero de datos, pueden aparecer
irregularidades accidentales provenientes de pocas observaciones en algunas
clases. Sin embargo, si se toma el nmero de clases demasiado reducido se
producir una prdida importante de informacin.
Un criterio que ayuda a decidir cuntas clases se deben tomar lo proporciona la
siguiente frmula emprica, debida a Sturges:

Donde E(x) representa la parte entera de x, n es el tamao de la muestra y p es el


nmero de clases recomendable.
Algunas evaluaciones de la frmula anterior se dan en la Tabla 2.
Tabla 2
Tamao de muestra Nmero de clases
6 a 11
4
12 a 22
5
23 a 45
6
46 a 90
7
91 a 181
8

182 a 362
363 a 724
725 a 1448
1449 a 2896
2897 a 5792
5793 a 11585

9
10
11
12
13
14

En la eleccin de los lmites de clase es conveniente que stos no coincidan con


el valor de ningn dato; no obstante, si fuera necesaria tal coincidencia sera
preciso adoptar un criterio para decidir en qu clase se contabiliza el dato
coincidente.
Por otra parte, tambin sera deseable que las clases elegidas abarcaran los datos
sin que quedaran clases vacas (sin datos). Para ello, el lmite inferior de la
primera clase no debe ser muy lejano del dato menor y el lmite superior de la
ltima clase no muy lejano del dato mayor. En esta situacin, lo correcto es
tomar clases que abarquen la muestra con un pequeo exceso y que tengan,
como lmites, valores con pocas cifras significativas.
Es usual tomar todas las clases con igual amplitud por razones de facilidad
operativa. Sin embargo, puede ser preferible tomar amplitudes diferentes si ello
redunda en una mayor claridad de la representacin de los datos (intervalos
pequeos donde las frecuencias sean mayores e intervalos ms grandes donde las
frecuencias sean menores).

Ejercicio 2
Cuntas clases sera apropiado usar para agrupar un conjunto de 100 datos,
segn la frmula de Sturges?
25
8
10

Grficas de datos agrupados


Se acostumbra dibujar grficas de barra para representar la frecuencia con que
ocurre cada clase; tales tipos de grficas se denominan histogramas. Tambin se
utiliza el polgono de frecuencias.
Frecuencias absolutas y relativas

Para referencia, presentaremos nuevamente la tabla de frecuencias utilizada en


el tema anterior.
Tabla 1

Estatura
(centmetros)

Nmero de
alumnos

160-162
163-165
166-168
169-171
172-174

5
18
42
27
8

Total

100

Las frecuencias que indican el nmero de ocurrencias de una clase, como las
dadas en la Tabla 1, se denominan frecuencias absolutas. La frecuencia relativa
de una clase es su frecuencia absoluta dividida por la frecuencia total y
generalmente se expresa como un porcentaje. Por ejemplo, la frecuencia relativa
de la clase 166-168 de la Tabla 1 es 42/100 = 0.42 = 42%.
La frecuencia relativa de una clase representa la fraccin del total o
porcentaje de los datos que pertenecen a esa clase. La suma de las
frecuencias relativas es, obviamente 1, equivalente al 100%.
Si las frecuencias absolutas de la Tabla 1 se reemplazan con las frecuencias
relativas correspondientes, la tabla resultante se denomina una distribucin de
frecuencias relativas o tabla de frecuencias relativas.

Tabla 2
Estatura
(centmetros)

Frecuencia
relativa

160-162
163-165
166-168
169-171
172-174

0.05
0.18
0.42
0.27
0.08

Total

1.00

Ejercicio 1
En un examen de Estadstica, 15 alumnos, de un total de 30, obtuvieron
calificaciones en el intervalo 6-8. Cul es la frecuencia relativa de la clase 6-8?

15
0.15
0.5

Ejercicio 2
Cunto suman las frecuencias relativas de la distribucin de frecuencias del
Ejercicio 1?
1
15
30, el nmero total de datos

Tablas estadsticas

En Estadstica, es necesario ordenar, agrupar, reducir o condensar los datos que se


obtienen de un conjunto de mediciones para que sean de utilidad, por lo que a
veces se requiere presentarlos en forma tabular, es decir, como tablas
estadsticas.
Para entender esto, se analizan algunos ejemplos de colecciones de datos:
1.- Se determinaron al azar las estaturas (en metros) de cincuenta estudiantes de
la carrera de odontologa y se obtuvieron los datos siguientes:
1.65

1.62

1.72

1.67

1.68

1.60

1.66

1.55

1.65

1.70

1.61

1.57

1.63

1.70

1.64

1.58

1.71

1.58

1.57

1.69

1.68

1.63

1.64

1.69

1.67

1.56

1.58

1.55

1.60

1.57

1.65

1.60

1.68

1.62

1.61

1.60

1.56

1.59

1.61

1.62

1.64

1.57

1.59

1.66

1.60

1.63

1.58

1.67

1.63

1.66

Sin embargo esta presentacin no dice mucho de la coleccin de datos, por lo


que se construye una tabla como la siguiente:

Estaturas

1.55

No. de
Repeticiones o
Frecuencia
Marcas

No.

II

Frecuencia Frecuencia
Relativa
Acumulada
0.04

Frecuencia
Relativa
Acumulada
0.04

1.56

II

0.04

0.08

1.57

IIII

0.08

0.16

1.58

IIII

0.08

12

0.24

1.59

II

0.04

14

0.28

1.6

IIIII

0.1

19

0.38

1.61

III

0.06

22

0.44

1.62

III

0.06

25

0.50

1.63

IIII

0.08

29

0.58

1.64

III

0.06

32

0.64

1.65

III

0.06

35

0.70

1.66

III

0.06

38

0.76

1.67

III

0.06

41

0.82

1.68

III

0.06

44

0.88

1.69

II

0.04

46

0.92

1.7

II

0.04

48

0.96

1.71

0.02

49

0.98

1.72

0.02

50

50

Sumatorias

2.- En un estudio de dos semanas sobre la productividad de los trabajadores, se


obtuvieron los siguientes datos sobre el nmero total de piezas aceptables que
produjeron 100 trabajadores:

65
43
88
59
35
76
21
45
62
41

36
78
50
48
62
60
35
53
65
74

49
37
60
76
52
48
61
34
55
82

84
40
56
74
63
55
45
67
61
58

79
68
57
70
32
51
33
42
73
26

56
72
46
51
80
54
61
69
50
35

28
55
39
40
64
45
77
52
53
47

43
62
57
75
53
44
60
68
59
50

67
22
73
56
74
35
85
52
41
38

Tabla Estadstica

No. de
Piezas

No. de
Frecuencia
Repeticiones
Frecuencia Frecuencia
Relativa
o Frecuencia
Relativa Acumulada
Acumulada
Marcas No.

21

0.01

0.01

22

0.01

0.02

26

0.01

0.03

28

0.01

0.04

32

0.01

0.05

33

0.01

0.06

34

II

0.02

0.08

35

IIII

0.04

12

0.12

36

II

0.02

14

0.14

37

0.01

15

0.15

38

0.01

16

0.16

39

0.01

17

0.17

40

II

0.02

19

0.19

36
82
65
45
34
51
68
47
54
70

41

II

0.02

21

0.21

42

0.01

22

0.22

43

II

0.02

24

0.24

44

0.01

25

0.25

45

IIII

0.04

29

0.29

46

0.01

30

0.30

47

II

0.02

32

0.32

48

II

0.02

34

0.34

49

0.01

35

0.35

50

III

0.03

38

0.38

51

III

0.03

41

0.41

52

III

0.03

44

0.44

53

III

0.03

47

0.47

54

II

0.02

49

0.49

55

III

0.03

52

0.52

56

III

0.03

55

0.55

57

II

0.02

57

0.57

58

0.01

58

0.58

59

II

0.02

60

0.60

60

III

0.03

63

0.63

61

III

0.03

66

0.66

62

III

0.03

69

0.69

63

0.01

70

0.70

64

0.01

71

0.71

65

III

0.03

74

0.74

67

II

0.02

76

0.76

68

III

0.03

79

0.79

69

0.01

80

0.80

70

II

0.02

82

0.82

72

0.01

83

0.83

73

II

0.02

85

0.85

74

III

0.03

88

0.88

75

0.01

89

0.89

76

II

0.02

91

0.91

77

0.01

92

0.92

78

0.01

93

0.93

79

0.01

94

0.94

80

0.01

95

0.95

82

II

0.02

97

0.97

84

0.01

98

0.98

85

0.01

99

0.99

88

0.01

100

100

Sumatorias

Distribucin de frecuencias

La capacidad humana para comprender al mismo tiempo grandes cantidades de


datos es muy limitada; por otra parte, la mayora de los anlisis estadsticos
incluyen un gran nmero de datos, los cuales sera casi imposible utilizar si no se

les compactara mediante un sencillo procedimiento conocido como Tabla de


Distribucin de Frecuencias.
Una distribucin de frecuencias, es una tabla que presenta el nmero de
elementos que pertenecen a cada una de las clases o categoras, en las que se
haya dividido para su estudio un grupo de datos.
Las distribuciones de frecuencias son la forma ms comn de organizar un gran
nmero de datos, por ejemplo, las calificaciones de los alumnos de primer
semestre, y a partir de ellas lograr conclusiones que no eran visibles
originalmente, por ejemplo, la concentracin de calificaciones en sus niveles
bajo, medio y alto; incluso permiten definir lneas de decisin, como los precios
al mayoreo de cierto artculo, las tarifas de agua potable para una ciudad o las
tablas del impuesto sobre la renta.
Procedimiento para su construccin:
1. Clculo del rango
2. Designacin del nmero de clases
3. Clculo de la amplitud
4. Clculo de los limites de clase
5. Clculo de los lmites reales de clase
6. Encontrar la marca de clase o punto medio
7. Conteo y frecuencia absoluta
8. Frecuencia relativa
9. Frecuencias absolutas y relativas acumuladas
Para describir el procedimiento de construccin de la tabla de distribucin de
frecuencias, tomemos el siguiente ejemplo.
El conjunto de datos presentados en seguida, corresponden a las edades de 30
profesores de la UNICACH.
Construye la tabla de distribucin de frecuencias para ellos.
32 38 26 29 32 41 28 31 45 36
45 35 40 30 31 40 37 33 28 30
30 41 39 38 33 35 31 36 37 32
1. Clculo del rango.

Datos del problema


32 38 26 29 32 41 28 31 45 36
45 35 40 30 31 40 37 33 28 30
30 41 39 38 33 35 31 36 37 32
Del conjunto de datos en bruto, se busca el de mayor magnitud (VM) y el de
menor magnitud (Vm). Con ellos se calcula el rango.

Rango = VM -Vm

45 - 26 = 19

2. Designacin del nmero de clases.


Datos del problema.
32 38 26 29 32 41 28 31 45 36
45 35 40 30 31 40 37 33 28 30
30 41 39 38 33 35 31 36 37 32
Una vez calculado el rango, se procede a designar el nmero de clases, a
travs de cualquiera de los dos mtodos siguientes:
a) Primer mtodo.

en donde:
K: es el nmero de clases
n: es el nmero de datos por agrupar.
b) Segundo mtodo.
n

n < 50

5a7

50 <= n < 100

6 a 10

100 <= n < 250

7 a 12

n >= 250
10 a 20
Usando el primer procedimiento tenemos que:
Para nuestro ejemplo, K = ln 30/ ln 2 = 4.907 que al redondear a enteros,
quedara una K = 5.
Si usamos el segundo mtodo, podremos observar que n = 30 es menor que
50 y se nos recomienda, de acuerdo a la tabla, que tomemos de 5 a 7
clases, por lo tanto K = 5 es una buena asignacin.
3. Clculo de la amplitud.
La amplitud se calcula redondeando el cociente del rango entre el nmero
de clases (R/K) a la unidad ms pequea (u) inmediata superior en que se
encuentran los datos brutos. Como los datos de nuestro ejemplo estn en
enteros, la unidad ms pequea es un entero u = 1, de tal manera que la
amplitud ser, R/K = 19/5 = 3.8 que al redondearlo al entero inmediato
superior, nos dar la amplitud.
Amplitud: A = 4.
4. Clculo de los lmites de clase.
Datos del problema.

32 38 26 29 32 41 28 31 45 36
45 35 40 30 31 40 37 33 28 30
30 41 39 38 33 35 31 36 37 32
Para construir los lmites de clase, (lmite inferior Li y lmite superior Ls)
se coloca como lmite inferior de la primera clase al valor ms pequeo de
los datos brutos, 26 para nuestro ejemplo, y cuatro enteros (la unidad ms
pequea es un entero) ms adelante, incluyendo el 26, tendremos el
lmite superior de la primera clase, 26 + 3 = 29 ( se suma solo tres enteros
porque el 26 est incluido).
Clases Li - Ls
1 26 - 29
Para calcular el lmite inferior de la segunda clase, hay que agregarle un
entero al lmite superior de la primera clase, esto es 29 + 1 = 30. El lmite
superior es 4 enteros adelante, incluyendo al 30, esto es 29 + 4 = 33. Este
proceso se repite iterativa mente hasta completar la clase nmero 5.
Clases
Li - Ls
1

26 - 29

30 -33

34 - 37

38 - 41

42 - 45

5. Clculo de los lmites reales de clase.

En seguida se calculan los lmites reales de clase, llamados tambin


fronteras de clase. Estos se calculan a partir de los lmites de clase,
restndole media unidad (u/2) a los lmites inferiores de clase y sumndole
la misma cantidad a los lmites superiores. u/2 = 1/2 = 0.5
Clases Li - Ls Lri - Lrs
1

26 - 29 25.5 - 29.5

30 - 33 29.5 - 33.5

34 - 37 33.5 - 37.5

38 - 41 37.5 - 41.5

42 - 45 41.5 - 45.5

6. Encontrando la marca de clase o punto medio.

Para calcular la marca de clase o punto medio vamos a promediar, para


cada clase, el lmite inferior y superior de clase o en su defecto los lmites

reales. Para la clase uno, X1 = (26 + 29)/2 = (25.5 + 29.5)/2 = 27.5 Para las
siguientes clases se procede de la misma forma o simplemente se le suma
la amplitud a la marca de clase anterior, por ejemplo, X2 = X1 + 4 = 27.5 + 4
= 31.5, y as para el resto de las clases.
Clases Li - Ls Lri - Lrs
x
1

26 -29 25.5 - 29.5 27.5

30 -33 29.5 - 33.5 31.5

34 - 37 33.5 - 37.5 35.5

38 - 41 37.5 - 41.5 39.5

42 - 45 41.5 - 45.5 43.5

7. Conteo y Frecuencia Absoluta.


El conteo es la asignacin de cada dato en la clase que le corresponde. La
frecuencia absoluta es el nmero de datos que se encuentran ubicados en
cada clase. Para nuestro ejemplo, tenemos:
Datos brutos
32 38 26 29 32 41 28 31 45 36
45 35 40 30 31 40 37 33 28 30
30 41 39 38 33 35 31 36 37 32
Tabla de frecuencias absolutas
Clases Li - Ls

Lri - Lrs

26 -29 25.5 - 29.5 27.5 4

30 -33 29.5 - 33.5 31.5 11

34 - 37 33.5 - 37.5 35.5 6

38 - 41 37.5 - 41.5 39.5 7

42 - 45 41.5 - 45.5 43.5 2

8. Frecuencia Relativa.

La frecuencia relativa es la proporcin de los datos que se encuentran en


cada clase. Se calcula dividiendo la frecuencia absoluta entre el total de
los datos y se puede expresar como una fraccin o en forma de porcentaje.
Clases Li - Ls Lri - Lrs
x f
fr
1

26 -29 25.5 - 29.5 27.5 4 4/30, 13.33%

30 -33 29.5 - 33.5 31.5 11 11/30, 36.67%

34 - 37 33.5 - 37.5 35.5 6 6/30, 20.00%

38 - 41 37.5 - 41.5 39.5 7 7/30, 23.33%

42 - 45 41.5 - 45.5 43.5 2

2/30, 6.67%

9. Frecuencias Absolutas y Relativas Acumuladas.

Para agregar a la tabla de distribucin de frecuencias las frecuencias


acumuladas, tanto absolutas como relativas, hay que generar la columna
menor que (<). Dicha columna est formada por todos los limites reales de
clase y quedara de la siguiente manera:
<
Clases Li - Ls

Lri - Lrs

fr

25.5

26 -29 25.5 - 29.5 27.5 4 13.33% 29.5

30 -33 29.5 - 33.5 31.5 11 36.67% 33.5

34 - 37 33.5 - 37.5 35.5 6 20.00% 37.5

38 - 41 37.5 - 41.5 39.5 7 23.33% 41.5

5 42 - 45 41.5 - 45.5 43.5 2 6.67% 45.5


Para generar la frecuencia absoluta acumulada, nos debemos de preguntar
cuntos datos son menores que los limites reales?. Por ejemplo: Cuntos
datos son menores que 25.5? La respuesta es ninguno, ya que todos son
mayores que esa cantidad. Cuntos datos son menores que 29.5? La
respuesta es 4. A la pregunta, cuntos datos son menores que 33.5? La
respuesta es 4 + 11 = 15, y as sucesivamente hasta terminar con la
columna menor que.
< Fi
Clases Li - Ls

Lri - Lrs

fr

25.5 0

26 -29 25.5 - 29.5 27.5 4 13.33% 29.5 4

30 -33 29.5 - 33.5 31.5 11 36.67% 33.5 15

34 - 37 33.5 - 37.5 35.5 6 20.00% 37.5 21

38 - 41 37.5 - 41.5 39.5 7 23.33% 41.5 28

42 - 45 41.5 - 45.5 43.5 2

6.67% 45.5 30

Para generar la frecuencia relativa acumulada nos debemos de preguntar:


Qu porcentaje de los datos son menores que los limites reales?. Por
ejemplo: Qu porcentaje de los datos son menores que 25.5? La respuesta
es ninguno, ya que todos son mayores que esa cantidad. Qu porcentaje
de los datos son menores que 29.5? La respuesta es 13.33%. A la pregunta:
Qu porcentaje de los datos son menores que 33.5? La respuesta es 13.33
+ 36.67 = 50%, y as sucesivamente hasta terminar con la columna menor
que.
< Fa Fra

Clases Li - Ls

Lri - Lrs

fr

25.5 0

0%

26 -29 25.5 - 29.5 27.5 4 13.33% 29.5 4 13.33%

30 -33 29.5 - 33.5 31.5 11 36.67% 33.5 15 50.00%

34 - 37 33.5 - 37.5 35.5 6 20.00% 37.5 21 70.00%

38 - 41 37.5 - 41.5 39.5 7 23.33% 41.5 28 93.33%

42 - 45 41.5 - 45.5 43.5 2 6.67% 45.5 30 100%


Grficos estadsticos

En estadstica existen diferentes tipos de grficas o representaciones grficas,


utilizando cada una de ellos de acuerdo al tipo de informacin que se maneja y
los objetivos que se persiguen al presentar la informacin.
Grfico de barras
Grfico de barras horizontales
Grfico de lneas
Grfico circular
Histograma y polgono de frecuencias
Distribucin acumulada

Grfico de barras
Este tipo de grfica se elabora con rectngulos, sus bases son del mismo ancho y
sus alturas equivalentes con las frecuencias. A diferencia del histograma, no es
necesario tener una escala horizontal continua, por lo que los rectngulos (o
barras) no tienen que aparecer juntas entre si. Adems, se pueden representar en
la misma grfica utilizando las mismas escalas horizontales y verticales, varios
datos correspondientes a las mismas variables producto de distintas
observaciones.
Como ejemplo, se presenta el comportamiento de tres calificaciones parciales de
cuatro alumnos de topografa. Las series (cada una de las calificaciones parciales)
estn coloreadas de diferente color para mostrar el comportamiento tanto
individual, como de cada uno de los alumnos con respecto a los dems. Observa
que la escala horizontal no es continua (es nominal) y se refiere a cada alumno.

tambin se construyen grficos compuestos de una manera ""tridimensional", es


decir, con grficos que poseen no solo dos ejes sino tres; y en los que los
rectngulos son sustituidos por prismas de base rectangular. Por ejemplo, si se
representa el porcentaje del PIB gastado en docencia e investigacin por cinco
pases en el lapso de 1988 a 1990.

Grfico de barras horizontales:


Se utilizan para ilustrar propiedades de ciertos segmentos de una poblacin
determinada, por ejemplo la poblacin de una ciudad dividida por edades se
representa con el grfico que se conoce como pirmide de edades.

Grficas de lneas:
Estas grficas se utilizan para datos relacionados, donde existe cierta continuidad
entre las observaciones, como por ejemplo, el crecimiento poblacional, la
evolucin del peso o estatura de una persona a travs del tiempo, el desempeo
acadmico de un estudiante a lo largo de su instruccin escolar, las variaciones
presentadas en la medicin realizada en algn experimento cada segundo o
minuto; y consisten en una serie de puntos trazados en las intersecciones de las
marcas de clase y las frecuencias de cada una, unindose consecutivamente con
lneas:

Grfico circular:
Cuando lo que se desea es resaltar las proporciones que representan algunos
subconjuntos con respecto al total, es decir, cuando se est usando una escala
categrica, conviene utilizar una grfica llamada de pastel o circular.
Por ejemplo, para ilustrar la matrcula en licenciatura (en Mxico) por reas de
conocimiento en el ao de 1992 se puede usar algo as como sigue

De hecho, si se desea resaltar una de las categoras que se presentan, es vlido


tomar esa "rebanada" de la grfica y separarla de las dems:

Histograma
La representacin grfica ms comn es histograma aplicado a las distribuciones
de frecuencias.
Por ejemplo, para representar el nmero de accesos a la pgina web del Instituto
Tecnolgico de Tuxtla Gutirrez, registrado en un da de la semana es:

En las abscisas se representan los intervalos de los datos, marcndose de manera


continua las fronteras entre cada uno de los intervalos. As, el histograma est
compuesto por rectngulos, cuyo nmero coincide con la cantidad de intervalos
considerados, el ancho de la base de cada uno de esos rectngulos es la misma
siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la
frecuencia de cada intervalo.
La representacin de un histograma puede variar cuando vara la amplitud de los
intervalos. Por ejemplo: la grfica que sigue, fu construida con los mismos datos
que la grfica anterior.

Para construir tus propios histogramas y variar la amplitud, presiona aqu.

Polgono de frecuencias:
Es muy parecido a las grficas de lneas pero, en el polgono de frecuencias se
aaden dos clases con frecuencia cero: una antes de la primera clase con datos
y otra despus de la ltima.
Por ejemplo el polgono de la grfica de arriba quedara de la siguiente manera:

Distribucin acumulada:
Este tipo de grfica, tambin conocida como ojiva, es una grfica similar al
polgono de frecuencias, que se obtiene de a partir de las frecuencias
acumuladas. y de igual manera existen las ojivas mayor que y las ojivas menor
que.
Las siguientes grficas son ejemplos de ojivas, a la izquierda la mayor que, a la
derecha la menor que, utilizando los datos que se usaron para ejemplificar el
histograma.

La ojiva mayor que (lado izquierdo), se le denomina de esta manera, porque


viendo el punto que est sobre la frontera de clase "4:00" se ven las visitas que se
realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se
dira: despus de las 4:00 horas).
De forma anloga, en la ojiva menor (lado derecho) que la frecuencia que, se
representa en cada frontera de clase, son el nmero de observaciones menores
que la frontera sealada, (en caso de tiempos sera el nmero de observaciones
antes de la hora que seala la frontera).
Si se utiliza una distribucin porcentual acumulativa, entonces se obtiene una
ojiva (mayor que o menor que segn sea el caso) cuyo eje vertical tiene una
escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que,
que se acaba de usar, pero con una distribucin porcentual:

MEDIDAS DE TENDENCIA CENTRAL

Un promedio es un valor tpico o representativo de un conjunto de datos. Debido


a que esos valores tpicos tienden a quedar en la posicin central, dentro de un
conjunto de datos ordenados segn su magnitud, los promedios tambin se
denominan medidas de tendencia central.
Se pueden definir varios tipos de promedios, los ms comunes son la media
aritmtica, la mediana y la moda. Cada tipo de promedio, dependiendo de los
datos y del propsito proyectado, presenta ventajas y desventajas (esto significa
que, para cada situacin, puede ser ms apropiado el uso de alguno de ellos). Sin
embargo, la media aritmtica es la que se emplea con mayor frecuencia y, como
se ver ms adelante, es fundamental en muchos otros clculos estadsticos.

Potrebbero piacerti anche