Sei sulla pagina 1di 6

HERRAMIENTAS ESTADÍSTICAS

LA ESTADÍSTICA COMO UNA HERRAMIENTA EN LA INVESTIGACIÓN.


La investigación es un proceso en el que se vinculan diferentes niveles de abstracción, se cumplen
determinados principios metodológicos y se cubren diversas etapas lógicamente articuladas, apoyando
dicho proceso en teorías, métodos, técnicas e instrumentos adecuados y precisos para poder alcanzar un
conocimiento objetivo, es decir verdadero, sobre determinados procesos o hechos sociales.

EL SIGNIFICADO DE ESTADÍSTICA
La palabra estadística tiene fundamentalmente dos significados. El primero de ellos se refiere a datos
clasificados, especialmente numéricos a cerca de una clase de objetos. En un segundo significado, se
llama estadística a la ciencia que trata de la recolección, análisis, interpretación y representación de datos.

CLASIFICACIÓN DE ESTADÍSTICA
Los problemas asociados a la descripción, resumen y análisis de los datos ha dado lugar al desarrollo de
métodos que constituyen una de las partes de la estadística que más ha sido estudiada, la estadística
descriptiva.

La mayoría de la información estadística proviene de observaciones efectuadas a una pequeña proporción


del conjunto total. Como resultado de esto, la estadística inferencial ha desarrollado técnicas que
permiten hacer predicciones a partir de datos conocidos, o bien, obtener información a cerca de una
población conociendo únicamente a algunos representantes de ella,

CONCEPTOS IMPORTANTES
Población
Si un conjunto de datos consta de todas las observaciones concebiblemente posibles (o hipotéticamente
posibles) de cierto fenómeno, lo llamamos población.

Muestra
Si un conjunto de datos contiene únicamente una parte de estas observaciones, lo llamamos muestra.

Entidad
Se refiere a un elemento o miembro individual de un grupo de personas, lugares o cosas.

Variable
Es el conjunto de características de las entidades que interesan en una investigación.

Variable Aleatoria
Si los valores numéricos que toma una variable provienen de factores fortuitos y si un determinado valor
no se puede predecir exactamente con anticipación, esa variable se denomina variable aleatoria.
Variable Continua
Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores. La estatura de
los niños de secundaria, el peso de los adultos mayores en la Ciudad de México, el tiempo que tarda en
desplazarse una persona de su casa al trabajo, son ejemplos de variables continuas.

Variable discreta
Cuando los valores que puede tomar una variable están separados entre sí, por una determinada cantidad,
la variable se llama variable discreta. Ejemplos de variables discretas son es número de integrantes de las
familias en el estado de Veracruz, la matrícula en las primarias de la zona norte del estado, el número de
nacimientos en el mes del Julio del 2007.

MEDIDAS DE TENDENCIA CENTRAL

La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un punto
“central” y por lo general es posible elegir algún valor promedio que describa todo un conjunto de datos.
Un valor típico descriptivo como ese es una medida de tendencia central o “posición”.

Con frecuencia se utilizan tres tipos de promedios como medidas de tendencia central, que son:
media aritmética, mediana y moda.

Media aritmética

La media aritmética (también denominada media) es el promedio o medida de tendencia central


que se utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de datos,
dividiendo después ese total entre el número total de elementos involucrados.

MEDIA PARA DATOS NO AGRUPADOS.

∑x
i =1
i
x=
n

Ejemplo 1. Se desea conocer la calificación final del alumno Juan Alvarado Cancino, cuando obtuvo
durante el curso las siguientes calificaciones parciales: 8, 7, 9, 8.
8+7+9+8
x= =8
4
Por lo tanto la calificación final de Juan es 8.

Ejemplo 2. Una guardería es una institución elegible para recibir el subsidio, destinado a los servicios
sociales del condado, a condición de que la edad promedio de sus niños no llegue a 9. Si los datos
siguientes representan la edad de todos los niños que actualmente asisten a ella: 8, 5, 9, 10, 9, 12, 7, 12,
13, 7, 8. ¿Llena los requisitos para recibir el subsidio?

8 + 5 + 9 + 10 + 9 + 12 + 7 + 12 + 13 + 7 + 8
x= = 9.09
11
Por lo tanto al rebasar la edad promedio requerida, la guardería no recibirá el subsidio.

Mediana

La mediana es el valor es el valor que se encuentra en el centro de una secuencia ordenada de


datos. Si no hay empates, la mitad de las observaciones serán menores y la mitad serán mayores. La
mediana no se ve afectada por observaciones extremas en un conjunto de datos. Por ello, cuando se
presenta alguna observación extrema, resulta apropiado utilizar la mediana, para describir el conjunto de
datos.

Para calcular la mediana a partir de un conjunto de datos colectados en su forma natural, primero
se deben ordenar en forma creciente o decreciente, y el dato central es el resultado; en caso de que queden
dos datos centrales se determina un promedio.

Ejemplo 1: Los siguientes datos son el número de minutos que en 15 días laborales una persona tiene que
esperar el autobús que la llevará a su trabajo: 10, 1, 13, 9, 5, 9, 2, 10, 3, 8, 6, 17, 2, 10, y 15. Determine
que tiempo en promedio debe esperar la persona su autobús.

Al ordenar quedan: 1, 2, 2, 3, 5, 6, 8, 9, 9, 10, 10, 10, 13, 15, 17.


La mediana es 9.
Ejemplo 2: La producción de automóviles Chrysler para el mercado nacional en el periodo 1991-1996,
está dada por la siguiente tabla:
AÑO 1991 1992 1993 1994 1995 1996
PRODUCCIÓN 52 472 83 724 57 636 46 816 15 624 13 205

¿Cuál es la producción promedio durante este periodo?


Al ordenar: 13205, 15624, 46816, 52472, 57636, 83724, vemos que hay dos datos centrales, por la tanto

46816 + 52472
la mediana será: = 49644 unidades.
2

Moda

En ocasiones, cuando se describe o se resume un conjunto da datos, se utiliza la moda como


medida de tendencia central. La moda es el valor de un conjunto de datos que aparece con mayor
frecuencia. La moda puede existir o n o existir, si existe puede ser unimodal, bimodal o multimodal. A
diferencia de la media aritmética, la moda no se afecta ante la ocurrencia de valores extremos. Sin
embargo, sólo se utiliza para propósitos descriptivos porque es más variable.

Ejemplo 1: En los siguientes datos determine cuál es la moda.


a) 7, 15, 12, 19, 13, 8, 10 moda: no existe.
b) 32, 19, 42, 30, 19, 40, 28 moda: 19 , unimodal.
c) 14, 5, 17, 12, 10, 5, 17, 8 moda: 5 y 17, bimodal.

Ejemplo 2: Se entrevistó a 20 comentaristas deportivos sobre el horario que recomendaban a TV


Azteca para el reality show deportivo. Su opinión fue;
23:00, 13:00, 16:00, 20:00, 12:00, 20:00, 19:00, 14:00, 16:00, 20:00, 12:00, 16:00, 13:00, 12:00, 20:00,
8:00, 18:00, 18:00, 20:00, 23:00.
Usando la moda ¿cuál es el horario más recomendable?

Los datos que más se repiten son: 20:00 y 12:00 hrs, por eso es el horario recomendado para transmitir el
programa según los comentaristas.

MEDIDAS DE DISPERSIÓN

Una segunda propiedad importante que describe a un conjunto de datos es la dispersión. Dispersión
es el grado de variación o diseminación de los datos. Estas medidas se emplean para saber si los valores
están cercanos uno del otro. Existen tres medidas de dispersión importantes: rango, varianza y desviación
estándar.

Rango

Es la diferencia entre el valor mayor y valor menor de una serie de datos.


Ejemplo. Determine el grado de dispersión de la edad de un conjunto de personas.

15, 25, 34, 18, 40 años. Rango: 40 – 15 = 25 años.

Varianza

Dos medidas de dispersión que se utilizan con frecuencia y que sí toman en consideración la
forma en que se distribuyen todos los valores son la varianza y su raíz cuadrada, la desviación estándar.
Estas medidas establecen la forma en que los valores fluctúan con respecto a la media.

Varianza muestral
n

∑ ( x − x)
i
2

S2 = i =1
n −1

Desviación estándar muestral

∑ ( x − x) i
2

S= i =1
n −1

Ejemplo: Se realiza un estudio de los efectos de fumar sobre los patrones del sueño. La medición que se
observa es el tiempo, en minutos, que toma el quedar dormido. Se obtienen los siguientes datos:
Fumadores 69.3 56.0 22.1 47.6 53.2 48.1 52.7 34.4 60.2 43.8 23.2 13.8
No 28.6 27.0 26.4 34.9 29.8 28.4 38.5 30.2 30.6 31.8 41.6 21.1 36.0 37.9 13.9
fumadores 1

a) Encuentre la media de la muestra para cada grupo.


b) Determine la desviación estándar para cada grupo.
c) Comente que clase de imparto produce el fumar sobre el tiempo que se requiere para quedar dormido.
Solución:

a)
69.3 + 56.0 + 22.1 + 47.6 + 53.2 + 48.1 + 52.7 + 34.4 + 60.2 + 43.8 + 23.2 + 13.8
xF = = 43.7 min
12
28.6 + 27.01 + 26.4 + 34.9 + 29.8 + 28.4 + 38.5 + 30.2 + 30.6 + 31.8 + ... + 13.9
x NF = = 30.45 min
15
b)
(69.3 − 43.7) 2 + (56.0 − 43.7) 2 + (22.1 − 43.7) 2 + (47.6 − 43.7) 2 + .... + (13.8 − 43.7) 2
SF = = 16.92 min
12 − 1
(28.6 − 30.45) 2 + (27.01 − 30.45) 2 + (26.4 − 30.45) 2 + (34.9 − 30.45) 2 + ...(13.9 − 30.45) 2
S NF = = 7.04 min
15 − 1

c) De acuerdo a los resultados anteriores se considera que el fumar si aumenta el tiempo para quedar
dormido.

Potrebbero piacerti anche