Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
PARAMETRICAS
INSTITUTO TECNOLOGICO DE LAZARO CARDENAS
Introduccin
Cuando se analizan datos medidos por una variable cuantitativa continua, las
pruebas estadsticas de estimacin y contraste frecuentemente empleadas se
basan en suponer que se ha obtenido una muestra aleatoria de una distribucin de
probabilidad de tipo normal o de Gauss. Pero en muchas ocasiones esta
suposicin no resulta vlida, y en otras la sospecha de que no sea adecuada no
resulta fcil de comprobar, por tratarse de muestras pequeas. En estos casos
disponemos de dos posibles mecanismos: los datos se pueden transformar de tal
manera que sigan una distribucin normal, o bien se puede acudir a pruebas
estadsticas que no se basan en ninguna suposicin en cuanto a la distribucin de
probabilidad a partir de la que fueron obtenidos los datos, y por ello se
denominan pruebas no paramtricas(distribution free), mientras que las pruebas
que suponen una distribucin de probabilidad determinada para los datos se
denominan pruebas paramtricas.
Dentro de las pruebas paramtricas, las ms habituales se basan en
la distribucin de probabilidad normal, y al estimar los parmetros del modelo
se supone que los datos constituyen una muestra aleatoria de esa distribucin, por
lo que la eleccin del estimador y el clculo de la precisin de la estimacin,
elementos bsicos para construir intervalos de confianza y contrastar hiptesis,
dependen del modelo probabilstico supuesto.
Cuando un procedimiento estadstico es poco sensible a alteraciones en el modelo
probabilstico supuesto, es decir que los resultados obtenidos son
aproximadamente vlidos cuando ste vara, se dice que es un
procedimiento robusto.
Las inferencias en cuanto a las medias son en general robustas, por lo que si el
tamao de muestra es grande, los intervalos de confianza y contrastes basados en
la t de Student son aproximadamente vlidos, con independencia de la verdadera
distribucin de probabilidad de los datos; pero si sta distribucin no es normal, los
resultados de la estimacin sern poco precisos.
INDICE
Introduccin .....................................................................................1
PRUEBAS PARAMETRICAS .................................................................3
Ventajas del empleo de pruebas no paramtricas .........................3
EL CONTRASTE DE SIGNOS .............................................................4
Tabla ............................................................................................6
PRUEBA DE WILCOXON ..................................................................8
PRUEBA U DE MANN - WHITNEY ....................................................9
EJERCICIOS ......................................................................................12
Ejemplo 1.- ................................................................................12
Ejemplo 2.- ................................................................................15
CONCLUSION ..................................................................................18
Bibliografa......................................................................................19
PRUEBAS PARAMETRICAS
Los mtodos paramtricos se basan en el muestreo de una poblacin con
parmetros especficos, como la media poblacional, la desviacin estndar o la
proporcin p. Adems deben de reunir ciertos requisitos como lo es, que los datos
mustrales provengan de una poblacin que se distribuya normalmente. Las
pruebas paramtricas se emplean con datos en una escala ordinal, de intervalo o
de razn.
EL CONTRASTE DE SIGNOS
La prueba de los signos es quiz la prueba no paramtrica mas antigua. En ella
est, basadas muchas otras. Se utiliza para contrastar hiptesis sobre el
parmetro de centralizacin y es usado fundamentalmente en el anlisis de
comparacin de datos pareados. Consideremos una muestra aleatoria de tamao
n tal que sus observaciones estn o puedan estar clasificadas en dos categoras:
0 y 1, + y -, ... etc.
Podemos establecer hiptesis acerca de la mediana, los centiles, cuartiles, etc.
Sabemos que la mediana deja por encima de s tantos valores como por debajo;
Considerando que Xi - Mdn > 0 , darn signos positivos (+) y Xi - Mdn < 0 signos
negativos (-) , en la poblacin original tendremos tantos (+) como (-). Se tratara de
ver hasta que punto el numero de signos (+) esta dentro de lo que cabe esperar
que ocurra por azar si el valor propuesto como mediana es verdadero. Lo mismo
se puede decir respecto a los cuartiles, centiles, o deciles.
Teniendo en cuenta que se trabaja con dos clases de valores, los que estn por
encima y los que estn por debajo, es decir, los (+) y los (-) , los estadsiticos de
contraste seguirn la distribucin binomial, si se supone independencia y
constancia de probabilidad en el muestreo.
La mejor forma de entender este apartado es mediante un ejemplo practico; De
modo que en la tabla que pondremos a continuacin se pueden ver los resultados
de un experimento sobre comparacin de sabores. Un fabricante de alubias esta
considerando una nueva receta para la salsa utilizada en su producto. Eligio una
muestra aleatoria de ocho individuos y a cada uno de ellos le pedio que valorara
en una escala de 1 a 10 el sabor del producto original y el nuevo producto. Los
resultados se muestran en la tabla, donde tambin aparecen las diferencias en las
valoraciones para cada sabor y los signos de estas diferencias. Es decir,
tendremos un signo + cuando el producto preferido sea el original, un signo cuando el preferido sea el nuevo producto y un 0 si los dos productos son
valorados por igual. En particular en este experimento, dos individuos han
preferido el producto original y cinco el nuevo; Uno los valoro con la misma
puntuacin.
La hiptesis nula es que ninguno de los dos productos es preferido sobre el otro.
Comparamos las valoraciones que indican la preferencia por cada producto,
descartando aquellos casos en los que los dos productos fueron valorados con la
misma puntuacin. As el tamao muestral efectivo se reduce a siete, y la nica
informacin muestral en que se basara nuestro contraste ser la de los dos
individuos de los siete que prefirieron el producto original.
La hiptesis nula puede ser vista como aquella en la que la media poblacional de
las diferencias sea 0. Si esta hiptesis fuese cierta, nuestra sucesin de
diferencias + y - podra ser considerada como una muestra aleatoria de una
poblacin en la que las probabilidades de + y - fueran cada una 0,5. En este caso,
las observaciones constituiran una muestra aleatoria de una poblacin con una
distribucin binomial, con probabilidad de + 0,5. Es decir, si p representa la
verdadera proporcin en la poblacin de +,la hiptesis nula ser:
H0: p = 0,5
Podemos querer contrastar esta hiptesis bien frente alternativas unilaterales, bien
frente a alternativas bilaterales. Supongamos que en el ejemplo de preferencias
por los sabores la hiptesis alternativa es que en la poblacin, la mayora de las
preferencias son por el nuevo producto. Esta alternativa se expresa como:
H1: p < 0,5
Tabla:
INDIVIDUO
VALORACION
DIFERENCIA
SIGNO DE LA
DIFERENCIA
PRODUCTO
ORIGINAL
PRODUCTO
NUEVO
-2
-5
-6
-3
-4
PRUEBA DE WILCOXON
Sea X una variable aleatoria continua. Podemos plantear cierta hiptesis sobre la
mediana de dicha variable en la poblacin, por ejemplo, M=M0. Extraigamos una
muestra de tamao m y averigemos las diferencias Di = X - M0. Consideremos
nicamente las n diferencias no nulas (n " m). Atribuyamos un rango u orden (0i) a
cada diferencia segn su magnitud sin tener en cuenta el signo.
Sumemos por un lado los 0+i , rangos correspondientes a diferencias positivas y
por otro lado los 0-i , rangos correspondientes a diferencias negativas.
La suma de los rdenes de diferencias positivas sera igual a la suma de los
rdenes de diferencias negativas, caso que la mediana fuera el valor propuesto
M0. En las muestras, siendo M0 el valor de la verdadera mediana, aparecern por
azar ciertas discrepancias, pero si la suma de los rangos de un ciclo es
considerablemente mayor que la suma de los rangos de otro signo, nos har
concebir serias dudas sobre la veracidad de M0.
La prueba de Wilcoxon va a permitir contrastar la hiptesis de que una muestra
aleatoria procede de una poblacin con mediana M0. Adems, bajo el supuesto de
simetra este contraste se puede referir a la media, E(X). Esta prueba es mucho
mas sensible y poderosa que la prueba de los signos; como se puede apreciar
utiliza mas informacin, pues no solo tiene en cuenta si las diferencias son
positivas o negativas, sino tambin su magnitud.
El contraste de Wilcoxon puede ser utilizado para comparar datos por parejas.
Supongamos que la distribucin de las diferencias es simtrica, y nuestro
propsito es contrastar la hiptesis nula de que dicha distribucin est centrada en
0. Eliminando aquellos pares para los cuales la diferencia es 0 se calculan los
rangos en orden creciente de magnitud de los valores absolutos de las restantes
10
11
12
EJERCICIOS
Ejemplo 1.-
13
DEPENDIENTE B
VENTAS RANGO
VENTAS RANGO
197
190
194
180
188
175
185
172
10
182
167
13
173
166
14
169
11
160
17
169
12
157
18
DEPENDIENTE B
VENTAS
RANGO
VENTAS
RANGO
164
15
155
19
166
16
150
21
154
20
146
23
14
149
22
145
24
142
26
143
25
139
28
140
27
137
29
135
30
130
35
135
31
134
32
133
33
131
34
122
36
120
37
118
38
109
39
98
40
95
41
15
16
T - T
La distribucin de Z = ---------- cuando la hiptesis nula de que la distribucin
T de las diferencias est centrada en 0 es cierta y la alternativa es unilateral, a
nivel de significacin 0,123.
17
Y varianza
n (n + 1)(2n + 1) (31)(32)(63)
T2 = ------------------------- = ------------------ = 2.064
24
De manera que la desviacin tpica es
T = 51,03
Si T es el valor observado del estadstico, la hiptesis nula frente a la alternativa
unilateral ser rechazada si:
T - T
--------- < -Z
T
Aqu, T = 198, y
T - T 189 - 248
--------- = ---------------- = -1,16
T 51,03
El valor de correspondiente a Z = 1,16 es (1 - 0, 8760) = 0,123. Por tanto, la
hiptesis nula ser rechazada a niveles de significacin superiores al 12,3%. Los
datos sugieren una modesta evidencia de que las empresas sin un procedimiento
sofisticado de post-auditora tienen mejor rendimiento.
18
CONCLUSION
Este tema present cuatro mtodos estadsticos de uso comn para extraer
informacin til de datos nominales u ordinales. Estos mtodos tambin se usan
cuando no se satisfacen las suposiciones fundamentales o cuando no se pueden
usar mtodos paramtricos ms poderosos. Los mtodos no parametritos se
estudian con ms profundidad en libros que se dedican exclusivamente a este
tema. Tales libros contienen muchas tcnicas estadsticas diseadas para datos
cualitativos.
La prueba del signo de una muestra se present primero como una forma no
paramtrica de probar una media poblacional supuesta. Despus se analiz la
prueba U de Mann - Whitney. Esta tcnica est diseada para detectar si dos
medidas hechas en una escala ordinal estn sacadas de la misma poblacin.
19
Bibliografa
Canavos, G. C. (1996). Probabilidad y Estadstica Metodos. Montecarlo: EPM.
EFD. (s.f.).
http://dme.ufro.cl/clinicamatematica/images/Libros/Estadistica_y_Probabilidad/Estadistic
a%20y%20Probabilidad.pdf.
Maibaum, G. (1986). Teora de Probabilidades y Estadstica Matemtica. Espaa: Limufa.
S., N. G. (2000). Curso de Estadistica Aplicada. Montecarlo: PMG.