Sei sulla pagina 1di 5

DEPARTAMENTO DE CIENCIAS BASICAS PRACTICA DE-3

AREA DE ESTADISTICA
ESTADISTICA NO
DISEÑO DE EXPERIMENTOS
PARAMETRICA

Objetivo: Que el alumno conozca y aprenda a usar algunos de los métodos no paramétricos
mas importantes.

ESTADISTICA NO PARAMETRICA

La estadística Inferencial estudiada en los temas anteriores está clasificada dentro de la llamada Estadística
Paramétrica; mientras que las pruebas de bondad de ajuste, pruebas de independencia, pruebas de
homogeneidad, Kruskal-Wallis, Friedman y Kolmogorov-Smirnov están consideradas dentro de la Estadística
noparamétrica o pruebas de distribución libre.
Cual es la diferencia entre las dos Estadísticas? En la estadística paramétrica nuestro interés era siempre hacer
estimaciones y pruebas acerca de uno o más parámetros de la población. Además, en todas estas estimaciones
y pruebas de hipótesis se establece como suposición general que la población o poblaciones de donde
provienen las muestras deben estar distribuidas normalmente, aunque sea en forma aproximada.
La Estadística no paramétrica en contraste con la Estadística paramétrica no se ocupa de hacer estimaciones y
pruebas de hipótesis acerca de parámetros y no depende del conocimiento de cómo se distribuye la población.
De esto se deduce que los métodos no parametritos son convenientes si no se conoce la distribución de la
población, por ejemplo, en una investigación exploratoria. Más aún, otra ventaja es que, por lo general, los
cálculos necesarios son más sencillos.

Los métodos no parametritos pueden ser usados para analizar datos de tipo cualitativo, ya sean ordinales o
jerarquizados o nominales; así como también para datos cuantitativos, mientras que los métodos parametritos
solo pueden usarse para datos cuantitativos.

PRUEBA DEL SIGNO (ALTERTATIVA DE LA PRUEBA T):


Se sabe que en el pasado, la captura promedio de langostas en cada trampa colocada en una región particular
del Caribe ha sido de 30.31 libras. Una muestra de 20 trampas colocadas recientemente dio las siguientes
capturas (en libras).
17,4 18,9 39,6 34,4 19,6
33,7 37,2 43,4 41,7 27,5
24,1 39,6 12,2 25,5 22,1
29,3 21,1 23,8 43,2 24,4
Presentan estos datos suficiente evidencia a favor de la afirmación de que la captura promedio por trampa ha
disminuido?

Defina una variable con el nombre de CAPTURA y siga la Ruta: Describe → Numeric data → One variable
analysis → Data: CAPTURA,Ok.tabular options :hipothesis test,Ok.

Hypothesis Tests for CAPTURA


El programa suministra tres pruebas, la prueba t (paramétrica) y las pruebas noparamétricas: prueba del signo y
prueba del signo banqueado.

Sample mean = 28,935


Sample median = 26,5
t-test
------
Null hypothesis: mean = 30,31
Alternative: less than

Computed t statistic = -0,646782


P-Value = 0,262755
Do not reject the null hypothesis for alpha = 0,05.
sign test
---------
Null hypothesis: median = 30,31
Alternative: less than
Number of values below hypothesized median: 12
Number of values above hypothesized median: 8
Large sample test statistic = 0,67082 (continuity correction applied)
P-Value = 0,251166
Do not reject the null hypothesis for alpha = 0,05.

signed rank test


----------------
Null hypothesis: median = 30,31
Alternative: less than
Average rank of values below hypothesized median: 9,83333
Average rank of values above hypothesized median: 11,5
Large sample test statistic = 0,466699 (continuity correction applied)
P-Value = 0,320356
Do not reject the null hypothesis for alpha = 0,05.

PRUEBA DEL SIGNO (ALTERNATIVA A LA PRUEBA T, PARA MUESTRAS PAREADAS)


Se realizo un estudio para comparar el contenido de sodio en el plasma de las focas peleteras australes
jóvenes, con el nivel de sodio en la leche de las focas. Se obtuvieron las siguientes observaciones sobre el
contenido de sodio (en milimoles por litro de leche o plasma) en 10 focas seleccionadas aleatoriamente:

Sujeto 1 2 3 4 5 6 7 8 9 10
Leche 93 104 95 81.5 95 95 76,5 80,5 79,5 87,0
plasma 147 157 142 141 142 147 148 144 144 146

Hay pruebas de que exista alguna diferencia?


Defina las variables LECHE y PLASMA, Ruta: Compare → Two samples → Paired sample
comparison → sample1:LECHE,sample2:PLASMA,Ok.tabular options,hypothesis test,Ok.

El programa suministra tres pruebas, la prueba t (paramétrica) y las pruebas noparamétricas: prueba del signo y
prueba del signo ranqueado.

Hypothesis Tests for LECHE-PLASMA


Sample mean = -57,1
Sample median = -56,5

t-test
------
Null hypothesis: mean = 0,0
Alternative: not equal
Computed t statistic = -22,7112
P-Value = 2,95107E-9
Reject the null hypothesis for alpha = 0,05.

sign test
---------
Null hypothesis: median = 0,0
Alternative: not equal
Number of values below hypothesized median: 10
Number of values above hypothesized median: 0

Large sample test statistic = 2,84605 (continuity correction applied)


P-Value = 0,00442664
Reject the null hypothesis for alpha = 0,05.

signed rank test


----------------
Null hypothesis: median = 0,0
Alternative: not equal
Average rank of values below hypothesized median: 5,5
Average rank of values above hypothesized median: 0,0
Large sample test statistic = 2,75388 (continuity correction applied)
P-Value = 0,00588937
Reject the null hypothesis for alpha = 0,05.

PRUEBA COMPARACION DE MEDIANAS-MANN-WHITNEY (WILCOXON): (ALTERNATIVA DE LA


PRUEBA T PARA MUESTRAS INDEPENDIENTES)

Los desechos industriales y la basura que se descargan en los ríos absorben oxigeno y por lo tanto reducen la
cantidad de oxigeno disuelto disponible para los peces y otras formas de vida acuática. Un inspector de
contaminación sospecha que cierta comunidad esta descargando desperdicios semitratados en el río. Para
verificar su teoría, obtuvo cinco muestras de agua del río seleccionadas aleatoriamente en una ubicación
anterior a la ciudad y otras cinco en una ubicación posterior a la ciudad. Las cantidades de oxigeno disuelto en
partes por millón, fueron:

ANTES DE CIUDAD 4,8 5,2 5,0 4,9 5,1


DESPUES DE LA CIUDAD 5,0 4,7 4,9 4,8 4,9
Ruta: Defina las variables ANTES,DESPUES, Ruta: Compare → Two samples → Two sample
comparison → sample1:ANTES,sample2:DESPUES,Ok.tabular options,COMPARISON OF MEDIANS,
Kolmogorov-smirnov test,Ok.

Comparison of Medians
---------------------
Median of sample 1: 5,0
Median of sample 2: 4,9
Mann-Whitney (Wilcoxon) W test to compare medians
Null hypothesis: median1 = median2
Alt. hypothesis: median1 < median2
Average rank of sample 1: 6,8
Average rank of sample 2: 4,2
W = 6,0 P-value = 0,899162

Kolmogorov-Smirnov Test (Bondad de ajuste)


-----------------------
Estimated overall statistic DN = 0,6
Two-sided large sample K-S statistic = 0,948683
Approximate P value = 0,331344

Compara la distribución de las dos muestras. En este caso no hay diferencias significativas entre las dos
distribuciones.

COEFICIENTE DE CORRELACION POR RANGOS DE SPEARMAN


Cuando se obtienen datos en parejas, tales como observaciones de dos variables para un mismo individuo, se
pueden usar los rangos para medir la correlación entre las parejas de datos con la ventaja de que no se hacen
suposiciones sobre la distribución de Xy Y.

Ejemplo. Estamos interesados en investigar si hay o no correlación entre el peso de un cuerpo y la


concentración de colesterol en la sangre. Seleccionamos aleatoriamente 15 sujetos de una población de
varones adultos entre 50 y 55 años de edad con una estatura entre 1,75 y 1,78 m. Medimos entonces, el peso y
la concentraron de colesteroles cada sujeto, obtuvimos la siguiente información:
sujeto Peso(lbs) Colesterol(mg/100ml)
1 146 181
2 205 228
3 157 182
4 165 249
5 184 259
6 153 201
7 220 339
8 181 224
9 151 112
10 188 241
11 181 225
12 163 223
13 198 257
14 193 337
15 157 197

Ruta: Describe → Numeric data → Multiple variables analysis, Data: PESO,COLESTEROL,Ok. Tabular
optin,Rank correlations,Ok.

Spearman Rank Correlations

COLESTEROL PESO
--------------------------------------------------------------------------------
COLESTEROL 0,8801
( 15)
0,0010

PESO 0,8801
( 15)
0,0010
--------------------------------------------------------------------------------

Correlation
(Sample Size)
P-Value
Indica una moderada relación positive entre las variables.

PRUEBA DE ALEATORIEDAD
Supongamos que tenemos una muestra de 26 observaciones reunidas en el siguiente orden:
DATOS
97
89
25
81
11
83
16
96
44
32
98
19
68
33
25
54
74
82
17
49
33
22
62
20
92
80

Ruta: Special → Time series analysis → Descriptive methods → Data: DATOS,Ok.Tabular options, test
for randomness,Ok.

Tests for Randomness of DATOS

Runs above and below median


---------------------------
Median = 51,5
Number of runs above and below median = 17
Expected number of runs = 14,0
Large sample test statistic z = 1,0008
P-value = 0,316922

Runs up and down


---------------------------
Number of runs up and down = 19
Expected number of runs = 17,0
Large sample test statistic z = 0,723364
P-value = 0,469454

Box-Pierce Test
---------------
Test based on first 8 autocorrelations
Large sample test statistic = 13,1885
P-value = 0,105525

Tres pruebas han sido corridas para determinar si o no DATOSD es una secuencia de números aleatorios. La
primera, nos dice que no podemos rechazar la hipótesis de que la serie es aleatoria con un 90%, al igual que
las dos pruebas siguientes.

Potrebbero piacerti anche