Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
EL SIGNIFICADO DE ESTADÍSTICA
La palabra estadística tiene fundamentalmente dos significados. El primero de ellos se refiere a datos
clasificados, especialmente numéricos a cerca de una clase de objetos. En un segundo significado, se
llama estadística a la ciencia que trata de la recolección, análisis, interpretación y representación de datos.
CLASIFICACIÓN DE ESTADÍSTICA
Los problemas asociados a la descripción, resumen y análisis de los datos ha dado lugar al desarrollo de
métodos que constituyen una de las partes de la estadística que más ha sido estudiada, la estadística
descriptiva.
CONCEPTOS IMPORTANTES
Población
Si un conjunto de datos consta de todas las observaciones concebiblemente posibles (o hipotéticamente
posibles) de cierto fenómeno, lo llamamos población.
Muestra
Si un conjunto de datos contiene únicamente una parte de estas observaciones, lo llamamos muestra.
Entidad
Se refiere a un elemento o miembro individual de un grupo de personas, lugares o cosas.
Variable
Es el conjunto de características de las entidades que interesan en una investigación.
Variable Aleatoria
Si los valores numéricos que toma una variable provienen de factores fortuitos y si un determinado valor
no se puede predecir exactamente con anticipación, esa variable se denomina variable aleatoria.
Variable Continua
Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores. La estatura de
los niños de secundaria, el peso de los adultos mayores en la Ciudad de México, el tiempo que tarda en
desplazarse una persona de su casa al trabajo, son ejemplos de variables continuas.
Variable discreta
Cuando los valores que puede tomar una variable están separados entre sí, por una determinada cantidad,
la variable se llama variable discreta. Ejemplos de variables discretas son es número de integrantes de las
familias en el estado de Veracruz, la matrícula en las primarias de la zona norte del estado, el número de
nacimientos en el mes del Julio del 2007.
La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un punto
“central” y por lo general es posible elegir algún valor promedio que describa todo un conjunto de datos.
Un valor típico descriptivo como ese es una medida de tendencia central o “posición”.
Con frecuencia se utilizan tres tipos de promedios como medidas de tendencia central, que son:
media aritmética, mediana y moda.
Media aritmética
∑x
i =1
i
x=
n
Ejemplo 1. Se desea conocer la calificación final del alumno Juan Alvarado Cancino, cuando obtuvo
durante el curso las siguientes calificaciones parciales: 8, 7, 9, 8.
8+7+9+8
x= =8
4
Por lo tanto la calificación final de Juan es 8.
Ejemplo 2. Una guardería es una institución elegible para recibir el subsidio, destinado a los servicios
sociales del condado, a condición de que la edad promedio de sus niños no llegue a 9. Si los datos
siguientes representan la edad de todos los niños que actualmente asisten a ella: 8, 5, 9, 10, 9, 12, 7, 12,
13, 7, 8. ¿Llena los requisitos para recibir el subsidio?
8 + 5 + 9 + 10 + 9 + 12 + 7 + 12 + 13 + 7 + 8
x= = 9.09
11
Por lo tanto al rebasar la edad promedio requerida, la guardería no recibirá el subsidio.
Mediana
Para calcular la mediana a partir de un conjunto de datos colectados en su forma natural, primero
se deben ordenar en forma creciente o decreciente, y el dato central es el resultado; en caso de que queden
dos datos centrales se determina un promedio.
Ejemplo 1: Los siguientes datos son el número de minutos que en 15 días laborales una persona tiene que
esperar el autobús que la llevará a su trabajo: 10, 1, 13, 9, 5, 9, 2, 10, 3, 8, 6, 17, 2, 10, y 15. Determine
que tiempo en promedio debe esperar la persona su autobús.
46816 + 52472
la mediana será: = 49644 unidades.
2
Moda
Los datos que más se repiten son: 20:00 y 12:00 hrs, por eso es el horario recomendado para transmitir el
programa según los comentaristas.
MEDIDAS DE DISPERSIÓN
Una segunda propiedad importante que describe a un conjunto de datos es la dispersión. Dispersión
es el grado de variación o diseminación de los datos. Estas medidas se emplean para saber si los valores
están cercanos uno del otro. Existen tres medidas de dispersión importantes: rango, varianza y desviación
estándar.
Rango
Varianza
Dos medidas de dispersión que se utilizan con frecuencia y que sí toman en consideración la
forma en que se distribuyen todos los valores son la varianza y su raíz cuadrada, la desviación estándar.
Estas medidas establecen la forma en que los valores fluctúan con respecto a la media.
Varianza muestral
n
∑ ( x − x)
i
2
S2 = i =1
n −1
∑ ( x − x) i
2
S= i =1
n −1
Ejemplo: Se realiza un estudio de los efectos de fumar sobre los patrones del sueño. La medición que se
observa es el tiempo, en minutos, que toma el quedar dormido. Se obtienen los siguientes datos:
Fumadores 69.3 56.0 22.1 47.6 53.2 48.1 52.7 34.4 60.2 43.8 23.2 13.8
No 28.6 27.0 26.4 34.9 29.8 28.4 38.5 30.2 30.6 31.8 41.6 21.1 36.0 37.9 13.9
fumadores 1
a)
69.3 + 56.0 + 22.1 + 47.6 + 53.2 + 48.1 + 52.7 + 34.4 + 60.2 + 43.8 + 23.2 + 13.8
xF = = 43.7 min
12
28.6 + 27.01 + 26.4 + 34.9 + 29.8 + 28.4 + 38.5 + 30.2 + 30.6 + 31.8 + ... + 13.9
x NF = = 30.45 min
15
b)
(69.3 − 43.7) 2 + (56.0 − 43.7) 2 + (22.1 − 43.7) 2 + (47.6 − 43.7) 2 + .... + (13.8 − 43.7) 2
SF = = 16.92 min
12 − 1
(28.6 − 30.45) 2 + (27.01 − 30.45) 2 + (26.4 − 30.45) 2 + (34.9 − 30.45) 2 + ...(13.9 − 30.45) 2
S NF = = 7.04 min
15 − 1
c) De acuerdo a los resultados anteriores se considera que el fumar si aumenta el tiempo para quedar
dormido.