Sei sulla pagina 1di 5

1

ESTADSTICA GENERAL
TEMA 3. ESTADSTICA DESCRIPTIVA. RESUMEN Y FORMULARIO

UNIVERSIDAD RAFAEL URDANETA

CDIGO:

VICE-RECTORADO ACADMICO

H. C.:

FACULTAD DE CS. POLTICAS, SOCIALES Y ADMINISTRATIVAS

CARCTER:

OBLIGATORIA

ESCUELA DE PSICOLOGA

UBICACIN:

2. SEMESTRE

PROFESOR: JUAN DIEGO HERNNDEZ LALINDE

PRELACIN:

MATEMTICA

CTEDRA: ESTADSTICA GENERAL

CURSO(S):

REA CURRICULAR: MATEMTICA

SECCIN(ES):

CARRERAS ASOCIADAS: PSIC., ADMN., CONTADURA Y CS. POLTICAS

PERIODO:

323T12
4 H. T.

VARIOS
A, B, C y H
2015-A

TEMA 3. ESTADSTICA DESCRIPTIVA. RESUMEN Y FORMULARIO


Unidad 3.1. Medidas de tendencia central para datos no agrupados
Las medidas de tendencia central o centralizacin, son las que reflejan la disposicin de los datos de
concentrarse en torno a un centro. Cuando los datos no se presentan en intervalos o tablas de frecuencia, estas
se calculan con base en toda la informacin disponible. La tabla 3.1 presenta las medidas de centralizacin ms
importante para datos no agrupados.

Tabla 3.1. Medidas de centralizacin ms importantes para datos no agrupados


Media muestral
Media poblacional

, donde n es el tamao de la muestra.

, donde N es el tamao de la poblacin.

Mediana muestral

Se determina la posicin i que ocupa la mediana ( ) dentro del grupo ordenado y


(
) .
luego se calcula su valor dependiendo de si i es entero o no, donde:

Mediana poblacional

Se determina la posicin i que ocupa la mediana ( ) dentro de la poblacin ordenada


(
) .
y luego se calcula su valor dependiendo de si i es entero o no, donde:

Moda muestral

La moda muestral ( ) es el valor que ms se repite dentro de la muestra.

Moda poblacional

La moda poblacional ( ) es el valor que ms se repite dentro de la poblacin.

Unidad 3.2. Medidas de dispersin para datos no agrupados


Las medidas de dispersin tambin llamadas de variabilidad son aquellas que indican la heterogeneidad u
homogeneidad de un conjunto de datos. En la proporcin en que las diferencias entre cada observacin sean
elevadas, la dispersin ser mayor, indicando un grado importante de heterogeneidad en la informacin que se
analiza. En caso contrario, cuando los datos tienden a agruparse unos cerca de los otros, la variabilidad

PREPARADO POR: JUAN DIEGO HERNNDEZ LALINDE

2
ESTADSTICA GENERAL
TEMA 3. ESTADSTICA DESCRIPTIVA. RESUMEN Y FORMULARIO

disminuye y la concentracin aumenta, hecho que reflejara cierto nivel de homogeneidad. Son muchas las
medidas de variabilidad para datos no agrupados, la tabla 3.2 resea las ms comunes.

Tabla 3.2. Medidas de dispersin ms importantes para datos no agrupados


Rango muestral

Se ubican el mximo y el mnimo en la muestra y luego se aplica:

Rango poblacional

Se ubican el mximo y el mnimo en la poblacin y luego se aplica:

Varianza muestral
Varianza muestral
Varianza poblacional
Varianza poblacional

, frmula general para la varianza muestral.

, frmula desarrollada para la varianza muestral.


, frmula general para la varianza poblacional.
, frmula desarrollada para la varianza poblacional.

D. E. muestral

D. E. poblacional

C. V. muestral

( )

( )

C. V. poblacional

( )

( )

Unidad 3.3. Medidas de posicin para datos no agrupados


Permiten ubicar valores dentro de un conjunto ordenado segn la posicin relativa que ocupan. En este sentido,
las medidas de posicin dividen en partes proporcionales a un grupo de observaciones. As pues, un cuantil
ser un valor de orden , tal que el 100( )
)

de los datos se encontrarn en l o por debajo de l, y el

estar en l o por encima de l. Los cuantiles ms importantes son tres: cuartiles, deciles y percentiles;

aunque, en algunos casos, tambin se utilizan los sextiles.


Para determinar cualquier medida de localizacin, debe calcularse primeramente la i-sima posicin que esta
ocupa dentro del conjunto ordenado de valores y luego especificar el valor del cuantil segn sea el caso,
dependiendo de si i es un nmero entero o no. Una forma simple de calcular i es mediante:
es el porcentaje expresado en nmero decimales (

), donde

).

PREPARADO POR: JUAN DIEGO HERNNDEZ LALINDE

3
ESTADSTICA GENERAL
TEMA 3. ESTADSTICA DESCRIPTIVA. RESUMEN Y FORMULARIO

Unidad 3.4. Medidas de forma para datos no agrupados


Como su nombre lo indica, son medidas de resumen que facilitan la identificacin de la forma que tiene una
distribucin de datos, enfocndose especficamente en la concentracin a un lado u otro de la media (asimetra)
y en el apuntamiento en torno a esta (curtsis). Por lo general, la intencin es la de comparar la forma de la
distribucin estudiada con la campana de Gauss. La tabla 3.3 presenta las medidas de forma ms usadas, en
especial en programas de cmputo o paquetes estadsticos.

Tabla 3.3. Medidas de forma ms importantes para datos no agrupados


Coef. de asimetra de Fisher

es el tercer momento central.

( )(

)(

)(

, valores normales entre el intervalo [

estandarizado

Coef. de curtsis de Fisher

)(

)(

Cuarto momento central


Coef.

, donde

Tercer momento central


Coef.

)(

( )(

estandarizado

(
)

)
)(

, donde

)(

)
].

es el cuarto momento central.


)(

) (

, valores normales entre el intervalo [

)(

].

Unidad 3.5. Medidas de asociacin


En muchas situaciones el anlisis descriptivo se hace sobre datos bivariados, es decir, sobre pares ordenados
de la forma (

). En estos casos, el inters recae en determinar en qu medida X y Y estn relacionadas,

estableciendo aspectos como la magnitud y el sentido de esta asociacin. La tabla 3.4 presenta dos medidas
relevantes de asociacin. Vale la pena enfatizar que estas solo miden relaciones de tipo lineal.

Tabla 3.4. Medidas de asociacin ms importantes

Covarianza muestral
Correl. muestral de Pearson

, donde

)(

son las sumas de cuadrados de X y Y, resp.

Suma de cuadrados en X

) , donde n es el tamao muestral.

Suma de cuadrados en Y

) , donde n es el tamao muestral.

PREPARADO POR: JUAN DIEGO HERNNDEZ LALINDE

4
ESTADSTICA GENERAL
TEMA 3. ESTADSTICA DESCRIPTIVA. RESUMEN Y FORMULARIO

Tabla 3.4. (Cont.). Medidas de asociacin ms importantes


Modelo de R. L. S.

Pendiente estimada

Intercepto estimado

Errores del modelo

Unidad 3.6. Tablas de frecuencia agrupadas en intervalos


Al momento de agrupar informacin, es til hacerlo mediante herramientas grficas y tabulares que simplifiquen
la lectura y el anlisis del fenmeno estudiado. Una tabla de frecuencias es la ordenacin tabular de una
variable de inters, en la que se registran las frecuencias absolutas y relativas, puntuales y acumuladas, con las
que los datos son observados. El siguiente procedimiento resulta prctico cuando se desea construir una
distribucin de frecuencias.

Paso 1: ordenar los datos ascendentemente.

Paso 2: calcular el rango.

Paso 3: calcular el nmero de intervalos. Esto puede realizarse de diferentes formas, aunque las ms
recomendadas son:

Regla de Sturges:

Regla de la raz cuadrada:

Se recomienda redondear por exceso.

Paso 4: calcular el ancho de cada intervalo mediante:


o
o

.
Se recomienda redondear por exceso.

Paso 5: construir finalmente la tabla de frecuencias empezando por el dato ms pequeo. El ancho
determinar el lmite superior del primer intervalo, y, a su vez, el lmite inferior del segundo. Tome en cuenta
que el lmite superior no debe incluirse en la primera desigualdad, pero s en la siguiente. Por otro lado, las
columnas de las frecuencias absolutas y relativas, se completan contando cuntas ocurrencias hay en cada
intervalo, en tanto que las columnas de las frecuencias acumuladas se completan sumando sucesivamente
las frecuencias puntuales. Por ltimo, las marcas de clase corresponden a la mitad de cada intervalo, de
modo que para obtenerlas, basta con sumar los lmites y dividirlos entre dos.

PREPARADO POR: JUAN DIEGO HERNNDEZ LALINDE

5
ESTADSTICA GENERAL
TEMA 3. ESTADSTICA DESCRIPTIVA. RESUMEN Y FORMULARIO

Unidad 3.7. Histogramas y polgonos de frecuencias, ojivas porcentuales


Una consecuencia directa de las distribuciones de frecuencias son los histogramas y polgonos, y ojivas
porcentuales. Los histogramas son representaciones grficas en las que, cada barra, es directamente
proporcional a la frecuencia observada, ya sea en trminos relativos o absolutos. As, si el ancho de cada
intervalo es constante, una barra con mayor altura indicar una mayor concentracin de observaciones. Este
diagrama es especialmente til para evaluar la forma de la distribucin, constituyndose en una interesante
herramienta de soporte a las medidas de forma. Por su parte, el polgono de frecuencias es un histograma
construido a travs de lneas que se conectan en cada marca de clase, razn por la cual es, en esencia, el
mismo diagrama. Por ltimo, la ojiva porcentual permite identificar las frecuencias acumuladas, de modo que su
forma es creciente, partiendo desde cero (0 %) hasta uno (100 %).

En lneas generales, se recomienda tomar en cuenta los siguientes aspectos al momento de construir las
grficas anteriormente mencionadas:

Trabajar con papel milimetrado.

Construir las escalas tomando en cuenta el dato mximo y el mnimo.

Representar en el eje X la variable de inters.

Representar en el eje Y las frecuencias, sean absolutas o relativas, puntuales o acumuladas.

PREPARADO POR: JUAN DIEGO HERNNDEZ LALINDE

Potrebbero piacerti anche