Sei sulla pagina 1di 18

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER

FACULTAD DE CONTABILIDAD

FACULTAD DE
CONTABILIDAD
JI-CUADRADA
Y ANALISIS DE
CONFIANZA

CATEDRA

: METODOS CUANTITATIVOS

CATEDRTICO

: ELSA LAGOS QUISPE

INTEGRANTE

: CARDENAS CASALLO Kevin Romn

SEMESTRE

: QUINTO A

Pgina
1

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD
HUANCAYO PERU
2015

1. CHI O JI CUADRADA

1.1. DEFINICION
Una medida muy extendida para medir la dependencia e independencia, es el estadstico
Chi-cuadrado, que da una medida de la diferencia entre las frecuencias observadas en la
tabla y las frecuencias esperadas en caso de independencia. Recordamos el clculo de
dichas frecuencias esperadas eij:
fi . f . j

eij

Con el estadstico Chi-cuadrado se obtiene una medida de diferencia entre las frecuencias
esperadas y las frecuencias observadas. El estadstico se calcula en la forma siguiente:
2
exp

i

( f ij eij ) 2

1.2. PROPIEDADES DE ESTE ESTADSTICO


Pgina
2

eij

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

Si todas las frecuencias observadas son iguales a la correspondiente frecuencia


esperada,

f i , j ei , j

entonces

2
exp

( f ij eij ) 2
eij

( f ij f ij ) 2
eij

Esto ocurre slo cuando las dos variables de la tabla son independientes; Por tanto, si
2
exp
0
hay independencia entre las dos variables de la tabla,

Cuanto mayor sea la diferencia entre las frecuencias observadas y esperadas en la tabla,
el valor de Chi cuadrado ser mayor. Es decir, a mayor intensidad de la asociacin entre
las variables, Chi-cuadrado ser mayor.

El valor de Chi-cuadrado siempre es positivo o cero (pues es suma de nmeros positivos,


ya que los denominadores de la suma son todos positivos al ser suma de nmeros
elevados al cuadrado.

En general, a mayor nmero de sumandos, se obtendr un valor mayor.

Los grados de libertad de un estadstico calculado sobre un conjunto datos se refieren al


nmero de cantidades independientes que se necesitan en su clculo, menos el nmero de
restricciones que ligan a las observaciones y el estadstico. El nmero de grados de libertad
del estadstico Chi-cuadrado se calcula de la siguiente forma:

Se calcula, en primer lugar el nmero de sumandos, es decir m x n, siendo n y m el


nmero de filas y nmero de columnas en la tabla.

A esta cantidad se debe restar el nmero de restricciones impuestas a las frecuencias


observadas. Observamos que podemos cambiar todas las frecuencias de la tabla sin
cambiar los totales por filas y columnas, excepto los datos en la ltima fila y la ltima
columna de la tabla, pues una vez que fijemos todos los valores excepto estos, quedan
automticamente fijados. Por tanto, si la tabla tiene m filas y n columnas, el nmero de
grados de libertad es (m-1) x (n-1). Expresamos esta dependencia en la siguiente forma:
2
exp

i

( f ij eij ) 2
eij

1.3. OBJETIVOS
Pgina
3

(2n1)( m1)

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD
El objetivo de este e-block es el estudio de varias cuestiones en relacin con v.a. cualitativas
cuantitativas cuyos datos estn recogidos en forma de tabla de frecuencias. El
denominador comn a todas ellas es que su tratamiento estadstico est basado en la misma
distribucin terica: la distribucin 2 (chi-cuadrado ji-cuadrado). En esencia se van a
abordar tres tipos de problemas:
a) Prueba de Bondad de Ajuste, consiste en determinar si los datos de cierta muestra
corresponden a cierta distribucin poblacional. En este caso es necesario que los
valores de la variable en la muestra y sobre la cual queremos realizar la inferencia
est dividida en clases de ocurrencia, o equivalentemente, sea cual sea la variable
de estudio, deberemos categorizar los datos asignado sus valores a diferentes clases
o grupos.
b) Prueba de Homogeneidad de varias muestras cualitativas, consiste en comprobar si
varias muestras de una carcter cualitativo proceden de la misma poblacin (por
ejemplo: estas tres muestras de alumnos provienen de poblaciones con igual
distribucin de aprobados?. Es necesario que las dos variables medibles estn
representadas mediante categoras con las cuales construiremos una tabla de
contingencia.
c) Prueba de Independencia, consistente en comprobar si dos caractersticas
cualitativas estn relacionadas entre s (por ejemplo: el color de ojos est
relacionado con el color de los cabellos?). Aunque conceptualmente difiere del
anterior, operativamente proporciona los mismos resultados. Este tipo de contrastes
se aplica cuando deseamos comparar una variable en dos situaciones o
poblaciones diferentes, i.e., deseamos estudiar si existen diferencias en las dos
poblaciones respecto a la variable de estudio.

1.4. CONCEPTOS FUNDAMENTALES


Muestra: Parte de una poblacin que se toma cuando es imposible acceder a toda ella. La
eleccin de la muestra se hace con la intencin de, a partir de la informacin que ella
proporciona, extender sus resultados a toda la poblacin a la que representa.
Muestra aleatoria: (Muestra elegida al azar) Aquella muestra tomada de la poblacin en la
que todo individuo tiene la misma probabilidad de resultar elegido para ella, y esto con
independencia entre individuos.

Pgina
4

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD
Funcin de Distribucin: Funcin que hace corresponder a cada uno de los valores de
una variable aleatoria la probabilidad de que tal variable aleatoria tome un valor igual o
inferior al dado.
Funcin de Probabilidad: Funcin que hace corresponder a cada uno de los valores de la
variable aleatoria discreta su probabilidad.
Contraste de hiptesis: Conjunto de reglas tendentes a decidir cul de dos hiptesis la
nula la alternativa- debe aceptarse en base al resultado obtenido en una muestra. Es de
dos colas cuando la alternativa es la negacin de la nula. De una cola en caso contrario.
Variable aleatoria: Toda funcin que toma diversos valores numricos, dependiente de los
resultados de un fenmeno aleatorio, con distintas probabilidades.
Variable aleatoria discreta. Las variables aleatorias discretas son aquellas que presentan
un nmero finito de valores, constituyen una sucesin numerable.
Variable aleatoria continua. Las variables aleatorias continuas pueden tomar un nmero
infinito de valores en un intervalo determinado.
Variable categrica. Una variable categrica es una variable que clasifica cada individuo
de una poblacin en una de las varias clases mutuamente excluyentes en que sta se divide.
Variable numrica. Corresponde a los datos expresados en una escala continua numrica.

1.5. TABLA DE LA DISTRIBUCIN CHI CUADRADA

Pgina
5

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

1.6. USO LA TABLA DE LA DISTRIBUCIN CHI CUADRADA


Supongamos un riesgo del 5% (con un nivel de confianza del 95%), =0.05, y grados de
libertad V=10.
Cul es el valor de X2 0.95, 10? Se busca la interseccin y el resultado es 18.307. ste es
el valor crtico para rechazar la hiptesis alternativa.

Pgina
6

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

1.7. EJECICIOS RESUELTOS


1.7.1. SUPERVIVENCIA EN EL TITANIC

Pgina
7

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD
El 10 de abril de 1912, el Titanic zarpaba con 1317 pasajeros a bordo, ante la
admiracin de una muchedumbre de curiosos que contemplaban atnitos como
aquella mole de acero se alejaba majestuosamente del puerto. Cinco das despus
los medios de comunicacin de todo el mundo se hicieron eco de la increble noticia:
el barco ms grande jams construido yaca a casi cuatro mil metros de profundidad.
La tabla 3.1 muestra la distribucin de pasajeros, segn supervivencia y clase social
Tabla 3.1. Distribucin de pasajeros en el Titanic segn supervivencia y clase social
Sobrevive
No
Total
sobrevive
Primera
322
194
128
clase
Segunda
280
119
161
clase
Tercera
711
138
573
clase
Total
451
862
1313

Calculemos en el ejemplo las frecuencias esperadas en caso de independencia. Observamos


que, una vez calculados los datos de la primera columna, los de la segunda se deducen
automticamente (es decir no son libres). Lo mismo ocurre con la ltima fila, una vez
calculadas las dos primeras, queda automticamente fijada. Por tanto los grados de libertad
son (3-1)x(2-1)=2=k (denotamos como k. los grados de libertad)
e1,1

f1. f .1 322 451

110 ,6
n
1313

En la tabla mostramos las frecuencias esperadas en caso de independencia. Observamos


que los grados de libertad son slo 2, pues una vez calculadas una frecuencia esperada en
la primera fila y otra en la segunda, las dems se deducen automticamente, si no queremos
variar los totales de filas y columnas.
Frecuencias esperadas en el Titanic segn supervivencia y clase social
Primera clase
Segunda clase
Tercera clase
Total

Sobrevive
110,6
96,2
244,2
451

No sobrevive
211,4
183,8
466,8
862

Total
322
280
711
1313

Observamos, al comparar las tablas que en primer clase hay mayor frecuencia observada
que la esperada de supervivencia si no hubiese relacin entre supervivencia y clase social.
Mientras en segunda clase hay unos pocos ms de lo esperado y en tercera casi la mitad de
Pgina
8

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD
lo esperado. El salvamento no fue entonces equitativo! A continuacin llevamos a cabo los
clculos del estadstico Chi- cuadrado:
Clculo de Chi cuadrado
Sobrevive
Primera clase
Segunda clase
Tercera clase

2
exp

No sobrevive

(194 110 ,6)


62 ,9
110 ,6

(128 211,4) 2
32 ,9
211,4

(119 96,2) 2
5,4
96,2

(181 183 ,8) 2


2,8
183 ,8

(138 244 ,2) 2


46,2
244 ,2

(573 466 ,8) 2


24 ,2
466 ,8

( f ij eij ) 2
eij

= 62,9+32,9+5,4+2,8+46,2+24,2 = 174,4

Los grados de libertad, en este caso son k= (3-1)x(2-1) = 2.


En la figura mostramos la forma que toma el estadstico Chi-cuadrado, en caso de variables
independientes, para diverso nmero de grados de libertad. Como hemos indicado, a mayor
nmero de grados de libertad el valor ser mayor. As, para 4 grados de libertad la moda
(valor ms probable) se sita cerca del valor 5, mientras que para 32 grados de libertad se
sita cerca de 39.
El valor obtenido 174,4 es muy poco probable en caso de independencia, pues observamos
que para 2 grados de libertad los valores mayores que 10 apenas aparece. De hecho la
probabilidad de obtener un valor mayor que 10,6 es slo 0,005. Deducimos que el
salvamento de los viajeros en el Titanic no fue independiente de su clase social.
Forma del estadstico Chi-cuadrado

Pgina
9

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

Probabilidad de un valor superior - Alfa ()


Grados libertad

0,1

0,05

0,025

0,01

0,005

2,71

3,84

5,02

6,63

7,88

4,61

5,99

7,38

9,21

10,60

6,25

7,81

9,35

11,34

12,84

7,78

9,49

11,14

13,28

14,86

9,24

11,07

12,83

15,09

16,75

10,64

12,59

14,45

16,81

18,55

12,02

14,07

16,01

18,48

20,28

13,36

15,51

17,53

20,09

21,95

Pgina
10

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

14,68

16,92

19,02

21,67

23,59

10

15,99

18,31

20,48

23,21

25,19

11

17,28

19,68

21,92

24,73

26,76

12

18,55

21,03

23,34

26,22

28,30

13

19,81

22,36

24,74

27,69

29,82

14

21,06

23,68

26,12

29,14

31,32

15

22,31

25,00

27,49

30,58

32,80

16

23,54

26,30

28,85

32,00

34,27

17

24,77

27,59

30,19

33,41

35,72

18

25,99

28,87

31,53

34,81

37,16

19

27,20

30,14

32,85

36,19

38,58

20

28,41

31,41

34,17

37,57

40,00

21

29,62

32,67

35,48

38,93

41,40

Pgina
11

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

22

30,81

33,92

36,78

40,29

42,80

23

32,01

35,17

38,08

41,64

44,18

24

33,20

36,42

39,36

42,98

45,56

25

34,38

37,65

40,65

44,31

46,93

26

35,56

38,89

41,92

45,64

48,29

27

36,74

40,11

43,19

46,96

49,65

28

37,92

41,34

44,46

48,28

50,99

29

39,09

42,56

45,72

49,59

52,34

30

40,26

43,77

46,98

50,89

53,67

En el ejemplo llevado a cabo un contraste de independencia Chi-cuadrado, que nos permite


determinar si existe una relacin entre dos variables categricas.
Recordars que un contraste de hiptesis es un procedimiento estadstico, con una serie de
pasos que lleva a la aceptacin o rechazo de una hiptesis estadstica. Los pasos a realizar
en un contraste de hiptesis son los siguientes:
1. Fijar las hiptesis que se quieren contrastar: La hiptesis nula H 0 y la hiptesis alternativa
H1. Estas hiptesis son complementarias una de otra.
Pgina
12

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD
2. Fijar el nivel de significacin, o probabilidad mxima de rechazar la hiptesis nula H 0, en
caso de que sea cierta. Recordemos que el nivel de significacin es la probabilidad de
Error Tipo I (probabilidad de rechazar la hiptesis nula, cuando de hecho es cierta).
3. Elegir un estadstico de contraste, que tenga alguna relacin con la hiptesis. Formacin
a partir del estadstico de una regla de decisin, dividiendo los posibles valores del
estadstico en dos regiones: (a) Si el estadstico cae en la regin crtica (o de rechazo), se
rechaza la hiptesis nula; (b) si el estadstico cae en la regin de aceptacin, no se puede
rechazar la hiptesis nula.
4. Se comprueba el valor del estadstico y se toma la decisin de rechazar o no la hiptesis.
En el contraste de independencia, se desea decidir si las dos variables en una tabla de
contingencia estn o no asociadas. Siguiendo los pasos anteriores, se tendra
1. Fijar las hiptesis que se quieren contrastar. Estas hiptesis son las siguientes:
H0: Las variables en filas y columnas de la tabla son independientes
H1: Hay asociacin entre las filas y columnas de la tabla
2. Fijamos el nivel de significacin; lo ms usual es elegir un valor =0,05. Esto quiere decir
que la probabilidad mxima que fijamos para el error tipo I (rechazar la hiptesis de
independencia cuando sea falsa) es 0,05.
3. Elegir un estadstico de contraste, que tenga alguna relacin con la hiptesis. En este
caso, elegimos el estadstico Chi cuadrado
2
exp

i

( f ij eij ) 2
eij

(2n1)( m 1)
,

que tiene relacin con la hiptesis nula, pues se basa en la comparacin de frecuencias
observadas y frecuencias esperadas en caso de independencia. Si la hiptesis nula H0 es
cierta (hay independencia entre filas y columnas) es de esperar un valor del Chi cuadrado
ser pequeo y si, por el contrario es falsa, ser grande. Formaremos una regla decisin,
dividiendo los posibles valores de Chi- cuadrado en dos regiones:

2
exp

Si el valor calculado
tiene una probabilidad menor que
(nivel de significacin)
rechazamos la hiptesis nula H0 (hay independencia entre filas y columnas), pues el
valor obtenido es improbable para una tabla con filas y columnas independientes. En
este caso, suponemos que las variables estn asociadas.
2
exp

Si el valor calculado
tiene una probabilidad igual o mayor que
(nivel de
significacin) no podemos rechazar la hiptesis nula H0. En este caso no tomamos
ninguna decisin.
Pgina
13

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

Nota: Observamos que el rechazo de la hiptesis nula tiene ms fuerza que su aceptacin,
pues nos basamos en una situacin muy poco probable: De ser cierta la independencia de
las variables es muy poco probable obtener un alto valor de Chi- cuadrado. Por tanto, si
obtenemos un alto valor de Chi-cuadrado, rechazamos que la hiptesis sea cierta.
Pero un valor pequeo de Chi cuadrado puede ser debido a varias causas: Puede ser que
las variables sean independientes; puede ser que estn asociadas, pero la asociacin sea
muy pequea; o puede ser que el tamao de la muestra de datos sea pequeo y no permita
ver la asociacin. En este caso (cuando no podemos rechazar la hiptesis nula) tendramos
que estudiar mejor los datos para ver por qu se obtiene este valor pequeo de Chicuadrado.

1.7.2. EJERCICIO 2
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos
en una ciudad grande forman una distribucin normal con una desviacin estndar
=1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.
Solucin: Primero se encontrar el valor de ji-cuadrada correspondiente a s 2=2 como sigue:

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de libertad y se


encuentra que a este valor le corresponde un rea a la derecha de 0.01. En consecuencia, el
valor de la probabilidad es P(s2>2)

1. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una


poblacin normal con varianza
, tenga una varianza muestral:
a. Mayor que 9.1
b. Entre 3.462 y 10.745

Solucin.
Pgina
14

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD
a. Primero se proceder a calcular el valor de la ji-cuadrada:

Al buscar este nmero en el rengln de 24 grados de libertad nos da un rea a la derecha de


0.05. Por lo que la P(s2 >9.1) = 0.05
1. Se calcularn dos valores de ji-cuadrada:
y

Aqu se tienen que buscar los dos valores en el rengln de 24 grados de libertad. Al buscar el
valor de 13.846 se encuentra un rea a la derecha de 0.95. El valor de 42.98 da un rea a la
derecha de 0.01. Como se est pidiendo la probabilidad entre dos valores se resta el rea de
0.95 menos 0.01 quedando 0.94.Por lo tanto la P(3.462 s2 10.745) = 0.94

Estimacin
de
la
Varianza
Para poder estimar la varianza de una poblacin normal se utilizar la distribucin jicuadrada.

Al despejar esta frmula la varianza poblacional nos queda:

Los valores de X2 dependern de nivel de confianza que se quiera al cual le


llamamos
. Si nos ubicamos en la grfica se tiene:

Pgina
15

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

1.7.3. EJERCICIO 3
Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto
distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46.
Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de
semillas de pasto que distribuye esta compaa, suponga una poblacin normal.
Solucin: Primero se calcula la desviacin estndar de la muestra:

Al elevar este resultado al cuadrado se obtiene la varianza de la muestra s 2= 0.286. Para


obtener un intervalo de confianza de 95% se elige un
= 0.05. Despus con el uso de la
tabla con 9 grados de libertad se obtienen los valores de X 2.

Se puede observar en la grfica anterior que el valor de X 2 corre en forma normal, esto es de
izquierda a derecha. Por lo tanto, el intervalo de confianza de 95% para la varianza es:

Pgina
16

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

Grficamente:

Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La
interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un
nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los
paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
1. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la
variabilidad de los resultados que producen muestras estndar. En un estudio de la
cantidad de calcio en el agua potable, el cual se efecta como parte del control de
calidad, se analiz seis veces la misma muestra en el laboratorio en intervalos
aleatorios. Los seis resultados en partes por milln fueron 9.54, 9.61, 9.32, 9.48, 9.70
y 9.26. Estimar la varianza de los resultados de la poblacin para este estndar,
usando un nivel de confianza del 90%.
Solucin: Al calcular la varianza de la muestra se obtiene un valor de s 2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obtenindose dos
resultados.
Para
X2(0.95,5)=
1.145
y
para
X2(0.0,5)=
11.07.
Entonces
el
intervalo
de
confianza
esta
dado
por:
y

Pgina
17

UNIVERSIDAD NACIONAL DEL CENTRO DEL PER


FACULTAD DE CONTABILIDAD

Pgina
18