Sei sulla pagina 1di 27

Universidad Experimental de Guayana

Vice-Rectorado Acadmico
Coordinacin de Pregrado
Proyecto de Carrera: Ingeniera Industrial
Asignacin: Estadstica II

Integrantes:
Profesora:
Alba Jess C.I: 20.285.522
Liliana Salomn.
Longart Mara C.I: 21.248.717
Lpez Gilmar C.I:19.302.827
Rojas Ernesto C.I:

Puerto Ordaz, agosto de 2012

ndice
Pag
Introduccin

Prueba No Paramtrica
Definicin
Caractersticas de la Prueba no Paramtrica
Ventaja y Desventajas
Comparacin de las pruebas Paramtrica y no Paramtrica

4
4
5
6

Tipos de Pruebas no Paramtricas

Prueba de los Signos


Prueba de corrida o racha
Prueba Wilcoxon
Prueba de Kruskal-Wallis
Prueba con tabla de contingencia
Prueba de los signos pareados

Prueba de bondad de ajuste

Prueba de Corrida o Racha

Definicin
Caracterstica
Procedimiento Especficos
Estudio 1

12

Estudio 2
Estudio 3
Estudio 4
Conclusin
Bibliografia
2

INTRODUCCIN
Como ya se ha demostrado en el curso de estadstica I y por
consecuencia en el curso de estadstica II, la estadstica es considerada como el
conjunto de procedimientos utilizados para clasificar, calcular, analizar y resumir
los datos obtenidos de manera sistemtica.
Dentro de los principales anlisis estadsticos que se pueden llevar a
acabo se encuentran las pruebas estadsticas paramtricas y las pruebas
estadsticas no paramtricas.
Estas ltimas, son el principal objetivo de estudio en este trabajo, en
realidad son poco utilizadas a pesar de la potencia y certeza de sus resultados.
Normalmente se utilizan cuando no se dispone de informacin suficiente de la
poblacin de la cual se extrajeron los datos, careciendo entonces de un soporte
para la realizacin de una inferencia con base a una muestra observada.
Partiendo de la base de que algunos contrastes de hiptesis dependen del
supuesto de normalidad, muchos de estos contrastes siguen siendo
aproximadamente vlidos cuando se aplican a muestras muy grandes, incluso si la
distribucin de la poblacin no es normal. Sin embargo, muchas veces se da
tambin el caso de que, en aplicaciones prcticas, dicho supuesto de normalidad
no sea sostenible. Lo deseable entonces ser buscar la inferencia en contrastes
que sean vlidos bajo un amplio rango de distribuciones de la poblacin. Tales
contrastes se denominan no paramtricas.

PRUEBA NO PARAMTRICA
Las pruebas no paramtricas son aquellas que no presuponen una
distribucin de probabilidad para los datos, por ello se conocen tambin como de
distribucin libre. En la mayor parte de ellas los resultados estadsticos se derivan
nicamente a partir de procedimientos de ordenacin y recuento, por lo que su
base lgica es de fcil comprensin. Cuando trabajamos con muestras pequeas
(n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos,
conviene utilizar pruebas no paramtricas, al menos para corroborar los resultados
obtenidos a partir de la utilizacin de la teora basada en la normal.
En estos casos se emplea como parmetro de centralizacin la mediana,
que es aquel punto para el que el valor de X est el 50% de las veces por debajo y
el 50% por encima.

Caractersticas:

Las pruebas no paramtricas pueden referirse nicamente a los contraste


que no plantean hiptesis sobre parmetros y que se limitan a analizar las
propiedades nominales u ordinales de los datos, y aaden el trmino de
distribucin libre para referirse a los contraste que no necesitan establecer
supuestos sobre las poblaciones originales de las que se extraen las
muestras.

Cuando los requisitos de la distribucin de una poblacin son satisfechos,


las pruebas no paramtricas son generalmente menos eficientes que sus
contrapartes paramtricas, pero la reduccin de eficiencia puede ser
compensada por un aumento en el tamao de la muestra.

Hay una gran abundancia de pruebas no paramtricas, y a menudo se


puede elegir entre varias, dada a una situacin; sin embargo muchas
pruebas no paramtricas tienen carcter especializado y se adaptan a un
trabajo en especfico.

Las pruebas experimentales son rpidas y fciles. Los clculos suelen ser
muy simples y, en condiciones caractersticas, los datos necesarios se
obtienen sin costos grandes.

Las suposiciones necesarias para utilizar las tcnicas no paramtricas


contienen habitualmente menos restricciones que las pruebas paramtricas.

Ventajas
1. Las Pruebas No paramtricas pueden ser aplicados a una amplia variedad
de situaciones porque ellos no tienen los requisitos rgidos de los mtodos
paramtricos correspondientes. En particular, los mtodos no paramtricos
no requieren poblaciones normalmente distribuidas.
2. Las pruebas no paramtricas pueden frecuentemente ser aplicados a datos
no numricos, tal como el gnero de los que contestan una encuesta.
3. Las pruebas no paramtricas usualmente involucran simples
computaciones que los correspondientes en los mtodos paramtricos y
son por lo tanto, ms fciles para entender y aplicar.
4. Se pueden usar con muestras pequeas

Desventajas
1. Los mtodos no paramtricos tienden a perder informacin porque datos
numricos exactos son frecuentemente reducidos a una forma cualitativa.
2. Las pruebas no paramtricas no son tan eficientes como las pruebas
paramtricas, de manera que con una prueba no paramtrica generalmente
se necesita evidencia ms fuerte (as como una muestra ms grande o
mayores diferencias) antes de rechazar una hiptesis nula.
3.

Llevan a una mayor probabilidad de no rechazar una hiptesis nula falsa


(incurriendo en un error de tipo II).

COMPARACIN DE LAS PRUEBAS PARAMTRICAS Y NO PARAMTRICAS


Aplicacin

Prueba
Paramtrica

Prueba No
Paramtrica

Valor de
eficiencia de la
prueba
paramtrica con
poblacin normal

Pares
pareados Prueba t o Prueba Prueba del signo
0.63
de datos de la z
Prueba
de 0.95
muestra
Wilcoxon
de
rangos con signo
Dos
muestras Prueba t o Prueba Prueba
de 0.95
independientes
z
Wilcoxon
de
rangos sumados
Varias
muestras Anlisis
de Prueba
independientes
varianzas (Prueba Wallis
F)

Kruskal- 0.95

Correlacin

Correlacin lineal

Prueba
correlacin
rangos

Aleatorio

Ninguna
prueba Prueba Runs
paramtrica

de 0.91
de
No hay base para
comparacin

TIPOS DE PRUEBAS NO PARAMTRICAS

Prueba de los Signos


La prueba de los signos es quiz la prueba no paramtrica ms antigua.
En ella est, basadas muchas otras. Se utiliza para contrastar hiptesis sobre el
parmetro de centralizacin y es usado fundamentalmente en el anlisis de
comparacin de datos pareados.
Se usa para hacer pruebas de hiptesis acerca de la mediana de una
poblacin de una variable continua.

Prueba de corrida o racha


El contraste de rachas permite verificar la hiptesis nula de que la muestra
es aleatoria, es decir, si las sucesivas observaciones son independientes. Este
contraste se basa en el nmero de rachas que presenta una muestra. Una racha
se define como una secuencia de valores mustrales con una caracterstica
comn precedida y seguida por valores que no presentan esa caracterstica. As,
se considera una racha la secuencia de k valores consecutivos superiores o
iguales a la media muestral (o a la mediana o a la moda, o a cualquier otro valor
de corte) siempre que estn precedidos y seguidos por valores inferiores a la
media muestral (o a la mediana o a la moda, o a cualquier otro valor de corte).

Prueba Wilcoxon
La prueba de Wilcoxon va a permitir contrastar la hiptesis de que una
muestra aleatoria procede de una poblacin con mediana M0. Adems, bajo el
supuesto de simetra este contraste se puede referir a la media, E(X). Esta prueba
es mucho ms sensible y poderosa que la prueba de los signos; ya que utiliza ms
informacin, pues no solo tiene en cuenta si las diferencias son positivas o
negativas, sino tambin su magnitud.

Prueba de Kruskal-Wallis
Para la comparacin de una misma variable cuantitativa en ms de tres
grupos. Es la prueba no paramtrica considerada ms potente para comparar >2
variables continuas independientes. Es el similar al test de ANOVA para un
factor.
8

Prueba con tabla de contingencia


A travs de este contraste pretendemos probar si existe independencia
entre dos variables o atributos (en el conjunto de la poblacin) a partir de las
observaciones de las dos caractersticas (en una muestra).

Prueba de los signos pareados


Es usada para hacer pruebas de hiptesis acerca de la mediana. La
prueba estadstica se basa en el estadstico de Wilcoxon (1945), el cual se calcula
de la siguiente manera:
Se resta de cada dato el valor de la mediana que se considera en la
hiptesis nula.
Se calcula los rangos de las diferencias sin tomar en cuenta el signo de las
mismas (o sea en valor absoluto). En el caso de haber empate se asigna un
rango promedio a todas las diferencias empatadas es decir; se les asigna el
rango

Prueba de bondad de ajuste


Es considerada como una prueba

no paramtrica que mide la

discrepancia entre una distribucin observada y otra terica, indicando en qu


medida las diferencias existentes entre ambas, de haberlas, se deben al azar.
Nota:
La prueba de bondad de ajuste es una de las pruebas no paramtricas
ms utilizadas.
Puede usarse para cualquier nivel de datos.
9

Como lo indica el nombre completo el objetivo lo indica el nombre


completo, el objetivo de la prueba de bondad de ajuste es comparar un
conjunto de frecuencias observado con un conjunto de frecuencias
esperado.

PRUEBA DE CORRIDA O RACHA


Una corrida o racha se define como una secuencia de valores mustrales
con una caracterstica comn precedida y seguida por valores que no presentan
esa caracterstica.
El contraste de rachas permite verificar la hiptesis nula de que la muestra
es aleatoria, es decir, si las sucesivas observaciones son independientes. Este
contraste se basa en el nmero de rachas que presenta una muestra. Una racha
se define como una secuencia de valores mustrales con una caracterstica
comn precedida y seguida por valores que no presentan esa caracterstica. As,
se considera una racha la secuencia de k valores consecutivos superiores o
iguales a la media muestral (o a la mediana o a la moda, o a cualquier otro valor
de corte) siempre que estn precedidos y seguidos por valores inferiores a la
media muestral (o a la mediana o a la moda, o a cualquier otro valor de corte).
El nmero total de rachas en una muestra proporciona un indicio de si hay
o no aleatoriedad en la muestra. Un nmero reducido de rachas (el caso extremo
es 2) es indicio de que las observaciones no se han extrado de forma aleatoria,
los elementos de la primera racha proceden de una poblacin con una
determinada caracterstica (valores mayores o menores al punto de corte)
mientras que los de la segunda proceden de otra poblacin. De forma idntica un
nmero excesivo de rachas puede ser tambin indicio de no aleatoriedad de la
muestra.
Si la muestra es suficientemente grande y la hiptesis de aleatoriedad es
cierta, la distribucin muestral del nmero de rachas, R, puede aproximarse
mediante una distribucin normal de parmetros:

Donde n1 es el nmero de elementos de una clase, n2 es el nmero de


elementos de la otra clase y n es el nmero
10 total de observaciones.

Caractersticas:
La prueba de corrida o racha mide hasta que punto en una variable
dicotmica la observacin de uno de sus atributos puede influir en las
siguientes observaciones
Se observa la secuencia de un mismo atributo o cualidad.
Serie de datos en los que hay muchas o pocas rachas.

PROCEDIMIENTOS

Paso 1. Ho: la disposicin de los datos es aleatoria


H1: La disposicin de los datos NO es aleatoria
Se ordenan los datos de la muestra en orden ascendente.

Paso 2: Calcule la media de la muestra tomando en consideracin si se tienen


datos pares o impares.

Paso 3: Pasando por la secuencia de la muestra, substituya cualquier


observacin con +, - dependiendo si esta por debajo o por arriba de
la media. Deseche cualquier lazo.

Paso 4: Calcule R, n1 y n2.


Se establece n1 como el nmero de elementos de la muestra por
encima de la mediana
Se establece n2 como el nmero de elementos de la muestra por
debajo de la mediana
Si ambos elementos de la combinacin (n 1, n2) >10 se puede utilizar la
prueba de corrida.
11

Si la tabla Utilizada para la prueba e rachas aparece la combinacin


(n1, n2) se procede a la tabla.

Paso 5: Calcule la media y la varianza esperada de R, como sigue:

u=

=
2
u

2n 1n2
+1
n1+ n2

2n 1n2 ( 2n1n 2n 1n 2 )
( n 1+n 2 )2( n1+ n21 )

Paso 6: Calcule Z

Z=

Ru
u

Paso 7: Anlisis :
Si Z>Za, entonces debera tener un comportamiento cclico y con
estacionalidad (sub mesclada)
Si Z < -Za, debera tener una pendiente.

Esta prueba es vlida para los casos en las cuales n 1 y n2 son grandes, al
menos > 10. Para muestras de pequeas de tamao, las tablas especiales deber
ser utilizadas.

12

13

ESTUDIO N 1

Una muestra de 48 laminas producidas por una maquina en rea de


colado, mostro la siguiente secuencia de buenas G y defectuosas D

G G G G G G |D D| G G G G G G G G
G G |D D D |G G G G G G |D |G G G
G G G G G G| D D| G G G G G| D| G G
Pruebe la aleatoriedad de la secuencia al nivel de significancia
Datos
n1 D= 10
n2 G= 38
V= 11

Ho: Se acepta la hiptesis si -1.96 Z 1.96


H1: se rechaza la hiptesis si sucede lo contrario

v=

2 ( n 1 ) (n 2)
( n 1 ) (n2) +1=

v=

2 ( 10 ) (38)
( 10 )( 38) +1= 16.38

14

0.05

v=

2n 1n2 [2n 1n 2n1n 2]


( n 1+n 2 )2(n 1+ n 21)

v=

21038[2(1038)1038]
= 4.997
( 10+38 )2(10+381)

De manera que

=2.235

V=11

Z=

V v
v

Z=

1116.36
2.235

Anlisis
-2.61< -1.96 la hiptesis Ho se rechaza, las pruebas muestra que hay muy
pocas corridas, lo que indica un amontonamiento de laminas defectuosas, por lo
tanto existe un patrn en la produccin de laminas defectuosas. Se recomienda la
observacin posterior del proceso de produccin. Todo esto a un nivel de
significancia de 0.05

15

ESTUDIO N2
Se ajusta una mquina para despachar adelgazante de pintura acrlica en
un recipiente. Dira que la cantidad de adelgazante que est siendo despachada
por esta mquina vara aleatoriamente? Si los contenidos de los siguientes quince
recipientes se miden y se encuentra que son
3.6, 3.9, 4.1, 3.6, 3.8, 3,7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0, 3.8, 4.2 y 4.2

0.1

Ho: si es > 0.1 la secuencia es aleatoria


H1: la secuencia no es aleatoria
Parmetro de prueba: el nmero total de corrida
x

: 3.9

Si cae arriba de 3.9 + , por el smbolo , si cae por debajo y omitimos


los dos 3.9

++++

n1: 6
n2: 7
Lo ubicamos en la tabla = 0.296
P= 2(P (V 6 cuando Ho es verdadera)
P= 0.592 > 0.1

Anlisis
Se acepta la hiptesis Ho que dice que la secuencia de mediciones varia
aleatoriamente.
16

Statgraphics
Pronsticos - Col_1
Datos/Variable: Col_1
Nmero de observaciones = 15
Indice Inicial = 1,0
Intervalo de Muestra = 1,0
Resumen de Pronsticos
Modelo de pronstico seleccionado: Caminata aleatoria
Nmero de pronsticos generados: 12
Nmero de periodos retenidos para validacin: 0
Periodo
de
Estadsti Estimaci
co
n
RMSE
0,310353
MAE
0,264286
MAPE
6,86597
ME
9,5162E17
MPE
0,303025

Periodo
de
Validaci
n

El StatAdvisor
Este procedimiento pronostica futuros valores de Col_1. Los datos cubren 15
periodos de tiempo. Actualmente, se ha seleccionado el modelo de una caminata
aleatoria. Este modelo asume que el mejor pronstico para datos futuros est
dado por el valor del ltimo dato disponible. Cada valor de Col_1 ha sido ajustado
de la siguiente forma, antes de ajustar el modelo:
Puede seleccionar un modelo diferente de pronsticos pulsando el botn
secundario del ratn y seleccionando Opciones de Anlisis.
Esta tabla tambin resume el desempeo del modelo actualmente seleccionado
en ajustar datos histricos. Se muestra:
(1) la raz del error cuadrado medio (RMSE)
(2) el error absoluto medio (MAE)
(3) el porcentaje de error absoluto medio (MAPE)
(4) el error medio (ME)
(5) el porcentaje de error medio (MPE)
17

Cada uno de los estadsticos est basado en los errores de pronstico unoadelante, los cuales son las diferencias entre los datos al tiempo t y el valor
pronosticado al tiempo t-1. Los primeros tres estadsticos miden la magnitud de
los errores. Un mejor modelo dara un valor ms pequeo. Los ltimos dos
estadsticos miden el bias. Un mejor modelo dara un valor ms cercano a 0.

Comparacin de Modelos
Variable de datos: Col_1
Nmero de observaciones = 15
Indice Inicial = 1,0
Intervalo de Muestra = 1,0
Modelos
(A) Caminata aleatoria
(B) Media constante = 3,86667
(C) tendencia curtva-S = exp(1,36882 + -0,0816043 /t)
(D) Promedio mvil simple de 3 trminos
(E) Suavizacin exponencial simple con alfa = 0,1665
Ajuste matemtico:
Periodo de Estimacin
Model RMSE MAE
MAPE ME
o
(A)
0,31035 0,26428 6,8659 9,5162E3
6
7
17
(B)
(C)

MPE

0,30302
5
0,22572 0,18222 4,7795 -1,18424E- 6
2
8
16
0,32814
8
0,22017 0,16647 4,3581 0,0055511 18

7
(D)
(E)

0,14716
6
0,22566 0,19444 5,0459 0,0222222 0,2857
8
4
5
0,23097 0,18995 4,9245 0,0489177 0,94808
2
8
9
4

Model RMSE
o
(A)
0,31035
3
(B)
0,22572
6
(C)
0,22017
7
(D)
0,22566
8
(E)
0,23097
2

RUN RUNM AUTO MEDIA VAR


S
OK
OK
OK
OK
OK
OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

OK

Clave:
RMSE = Root Mean Squared Error (Raz del Cuadrado Medio del Error)
RUNS = Prueba corridas excesivas arriba y abajo
RUNM = Prueba corridas excesivas arriba y abajo de la mediana
AUTO = Prueba de Box-Pierce para autocorrelacin excesiva
MEDIA = Prueba para diferencia en medias entre la 1 mitad y la 2 mitad
VAR = Prueba para diferencia en varianza entre la 1 mitad y la 2 mitad
OK = no significativo (p >= 0,05)
* = marginalmente significativo (0,01 < p <= 0,05)
** = significativo (0,001 < p <= 0,01)
*** = altamente significativo (p <= 0,001)
El StatAdvisor
Esta tabla compara los resultados de cinco diferentes modelos de pronsticos.
Puede cambiar cualquiera de los modelos pulsando el botn secundario del ratn
y seleccionando Opciones de Anlisis. Viendo las estadsticas del error, el modelo
con la menor raz cuadrada del error cuadrado medio (RMSE) durante el periodo
de estimacin del modelo es el modelo C. El modelo con el menor error medio
absoluto (MAE) es el modelo C. El modelo con el menor porcentaje del error
medio absoluto (MAPE) es el modelo C. Puede usar estos resultados para
seleccionar el modelo ms apropiado para sus necesidades.
La tabla tambin resume los resultados de cinco pruebas para determinar si cada
modelo es adecuado para los datos. Un OK significa que el modelo pasa la
prueba. Un * significa que no pasa la prueba al nivel de confianza del 95%. Dos
*'s significa que no pasa la prueba al nivel
19de confianza del 99%. Tres *'s significa

que no pasa la prueba al nivel de confianza del 99,9%. Note que el modelo
actualmente seleccionado, el modelo A, pasa 5 pruebas. Puesto que ninguna
prueba es estadsticamente significativa con un nivel de confianza del 95% o ms,
el modelo actual probablemente es adecuado para los datos.

20

ESTUDIO N3
El fabricante PQR sostiene que el tiempo de vida de un tipo de batera
que se fabrica es de ms de 250 horas. Un defensor de los
consumidores, que desea determinar si la afirmacin es justifica, mide
los tiempos de vida media de 24 de las bateras de la compaa.
Determine si los tiempo de vida de las muestra de la batera
producidas por el fabricante PQR son aleatorias. =0.05
271
253
264

230
216
295

198
262
211

275
288
252

282
236
294

225
291
243

284
253
272

219
224
268

Ho= se acepta si -1.95 z 1.96


H1= se rechaza si pasa loo contrario
datos
n1=12
n2=15
V=15
x

:257.5

v=

2(12)(12)
( 12 ) (12) +1= 13

v=

21212[2(1212)1212]
= 5.739
(12+12 )2(12+121)

21

v=

2.396

Z=

1513
2.396 = 0,835

Podemos aceptar la hiptesis de aleatoriedad si 1.95

z 1 .96

. dado que

0.835 cae en este rango, concluimos que la muestra es aleatoria

22

ESTUDIO N4
12 nios y 12 nias de 4 aos de edad observados durante
dos sesiones de juego de 15 minutos, el juego fu calificado
por incidencia y grado de agresin. con estos puntajes es
posible probar la hiptesis que hay diferencias sexuales en la
cantidad de agresin exhibida.

23

Ho: LA INCIDENCIA Y EL GRADO DE AGRESIN SON LOS


MISMOS EN LOS NIOS DE CUATRO AOS DE AMBOS SEXOS.
Ha: LOS NIOS Y NIAS DE CUATRO AOS DE EDAD MUESTRAN
DIFERENCIAS EN LA INCIDENCIA Y EL GRADO DE AGRESIN.
alfa=0.05 N1 = 12 NMERO DE NIOS N2 = 12 NMERO DE NIAS

24

SI VALOR OBSERVADO DE R ES IGUAL O MENOR QUE EL


VALOR TABULADO DE N1 =12 Y N2 =12, Ho SE RECHAZA A UN
NIVEL DE SIGNIFICACIN 0.05
LA TABLA MUESTRA QUE PARA LOS VALORES DE n1=12 Y n2=12,
UNA R DE 7 ES SIGNIFICATIVA AL NIVEL DE 0.05.
YA QUE EL VALOR DE R ES MENOR QUE EL TABULADO, SE
PUEDE RECHAZAR LA HO, CONCLUYENDO QUE LOS NIOS Y
LAS NIAS MUESTRAN DIFERENCIAS EN LA AGRESIN EN LA
SITUACIN DE JUEGO LIBRE

CONCLUSION
Las pruebas no paramtricas son procedimientos estadsticos para prueba
de hiptesis que no requieren de la suposicin de la normalidad de la poblacin de
la cual fue extrada la muestra y se pueden aplicar a datos de tipo cuantitativo y
cualitativo. Como ya sabemos hay diferentes tipos de pruebas no paramtricas
pero este trabajo se baso en la prueba de corrida o racha la cual es una secuencia
de sucesos observables de la interaccin entre elementos iguales.
25

BIBLIOGRAFIA

Es.scribd.com/doc./56657598/PRUEBA-DEALEATORIEDAD
26

Http:/Biblo.una.edu.ve/docu.7/base/Marc/texto/t34486
.pdf
www.ucm.es/info/socivmyt/paginas/D_departamento/
materiales/analisis_datosyMultivariable/19nparam_SP
SS.pdf

27

Potrebbero piacerti anche