Sei sulla pagina 1di 18

Modelos de procesamiento

de datos con el uso de


herramientas estadsticas

Distribucin de frecuencias

Una distribucin de frecuencias es un

conjunto de puntuaciones presentadas en


una tabla de manera ordenada, segn
caractersticas definidas por el investigador.

Nivel de desempleo en la ciudad KIO,


segn sexo y nivel acadmico de la
poblacin

Histogramas

Las distribuciones de frecuencia se

presentan muy a menudo en forma de


figuras grficas denominadas
histogramas (grficas de barras) o en
grficas circulares

Medidas de tendencia central

Las medidas de tendencia central son

cantidades tpicas o representativas de


un conjunto de datos; las principales
medidas son: moda, mediana, y media o
promedio.

La moda es la categora o puntuacin que ocurre con

mayor frecuencia en un registro de datos.


2, 3, 3, 4, 4, 4, 5, 5
La mediana es el valor que divide una distribucin de
frecuencias por la mitad, una vez ordenados los
datos de manera ascendente o descendente.
2, 3, 4, 4, 5, 5, 5, 6,6
La media o el promedio es la medida de tendencia
central ms utilizada, en si es la suma de es la suma
de todos los valores de una medicin dividida por el
nmero de mediciones
40/9= 4.4

Medidas de dispersin

Las medidas de dispersin que se emplean

con mayor frecuencia incluyen la desviacin


estndar, la varianza y el rango. Las medidas
de dispersin indican cun dispersos o
separados se encuentran los datos, respecto
a un valor central.

Rango o intervalo es la ms elemental de las

medidas de tendencia central; consiste simplemente


en la distancia entre los dos valores ms extremos
de una medicin.
Ejemplo: Se toma el valor mayor de litros de cerveza
consumido en un mes y se le resta el valor menor de
todos los entrevistados; en este caso, los valores
son: 17 litros de cerveza - 6 litros de cerveza = 11
litros de cerveza.
La desviacin estndar permite medir el grado de
homogeneidad (igualdad) o heterogeneidad
(variedad) de los datos de la poblacin objeto de
medicin. Cuanto mayor sea la dispersin de los
datos respecto a la media, mayor ser la desviacin
estndar, lo cual significa mayor heterogeneidad en
las mediciones.

Formula:

donde:S=desviacin estndar Xi= valor de


la muestra X= media aritmtica N= tamao de la
muestra
Ejemplo: Se tiene la siguiente muestra
Xi (Xi-m) (Xi-m)^2 S=4.81
V= 23.2
2
-2.2
4.84
6

-6.2

38.44

-.2

.04

10

1.8

3.24

15

6.8

46.24

Varianza, se define la varianza como la desviacin


estndar elevada al cuadrado.

Prueba Z, es una prueba de distribucin normal que


tiene como finalidad comparar los puntajes de
distribuciones que son diferentes entre s. El valor de
Z es el resultado de dividir la desviacin de un
puntaje individual respecto a la media, entre la
desviacin estndar, utilizando la frmula siguiente
para calcular la prueba Z.
Formula:

Suponga que un habitante de la ciudad A gasta en promedio al

mes, para alimentacin, $270 000 (la media de gasto para esta
ciudad es de $305 000 y la desviacin estndar de $39 000); a la
ciudad B, otro habitante gasta
$295 000 por mes (el promedio
de gasto mensual per cpita de los habitantes de la ciudad B es
$285 000 con una desviacin estndar de
$30 000).
Est en mejores condiciones de gasto en alimentacin el
habitante de la ciudad B respecto al de la ciudad A?

Prueba de hiptesis

Una hiptesis es una suposicin respecto al

problema de investigacin, esta determina si


la proposicin es consistente con los datos
obtenidos una vez realizada la investigacin.
Si la hiptesis o proposicin no es consistente
con los datos obtenidos, se rechaza la
hiptesis.

Pasos para probar las hiptesis


1. Formular la hiptesis. Las hiptesis se plantean de dos maneras
fundamentales: la hiptesis nula Ho y la hiptesis alterna HA.
Por ejemplo, el gerente del Banco XPQ considera que sus
procedimientos operativos garantizan que el cliente promedio slo
tiene que esperar siete minutos en la fila de los cajeros antes de ser
atendido.
La hiptesis nula y la hiptesis alterna se formulan de la siguiente
manera: Hiptesis nula Ho : tiempo promedio de espera en la fila
para ser atendido = 7 minutos. Hiptesis alterna HA: tiempo medio
de espera en la fila para ser atendido 7 minutos.
2. Elegir la prueba estadstica adecuada. Es muy importante saber
que para la prueba de hiptesis existen varias pruebas estadsticas,
por lo que el investigador debe elegir la apropiada teniendo en
cuenta las caractersticas del caso que va a investigar.

2. Elegir la prueba estadstica adecuada. Es muy importante

saber que para la prueba de hiptesis existen varias pruebas


estadsticas, por lo que el investigador debe elegir la
apropiada teniendo en cuenta las caractersticas del caso que
va a investigar.
3. Definir el nivel de significancia. Por ejemplo: a = 0,05.
4. Recolectar los datos con una muestra representativa. En el
caso del estudio del tiempo de espera por los clientes del
Banco XPQ, se lleva a cabo una investigacin con base en la
observacin en momentos aleatorios de 850 clientes en
oficinas del banco elegidas aleatoriamente. El tiempo
promedio de espera de los clientes fue de 8,2 minutos y la
desviacin estndar de 2,6 minutos.
5. Estimar la desviacin estndar de la distribucin muestral
de la media. Se utiliza la siguiente frmula:

5. Estimar la desviacin estndar de la distribucin muestral

de la media. Se utiliza la siguiente frmula:


Donde: Sx : desviacin estndar de la distribucin muestral
de la media. S : desviacin estndar de la muestra. n :
tamao de la muestra. Entonces: Para transformar la media
de la muestra en una puntuacin Z, en el contexto de la
distribucin muestral: Entonces, se compara el valor
calculado (en este caso Z = 13) con el valor crtico de la
prueba estadstica (tomada de la tabla para valores Z), segn
el nivel de significacin elegido. Si el valor calculado (Z = 13)
es menor que el valor crtico (Z = 1,96 con nivel de
significancia a = 0,05), no se rechaza la hiptesis nula. Si el
valor calculado es mayor que el valor crtico, se rechaza la
hiptesis nula.

6. Decisin estadstica. Para el caso referido, como el valor

calculado Z = 13 es mayor que el valor crtico (vase tabla Z)


1,96, entonces se rechaza la hiptesis nula.
7. Conclusin. Con un nivel de significancia del 0,05 95% de
confianza, no es adecuado afirmar que el tiempo promedio de
espera en la fila por un cliente del Banco XPQ es de 7
minutos.

Potrebbero piacerti anche