Sei sulla pagina 1di 2

Ked:

No s si entend bien eso de la "funcin que te dice qu nmero va a aumentar sus ocurrencias", pero, si asumes que los datos son aleatorios, no
debera haber ningn tipo de tendencias.
Para comprobar si pueden suponerse aleatorios los datos puedes realizar tests de aleatoriedad. Los que conozco son el test de Rachas (runs up &
down test) y el test de rangos de Spearman (detecta tendencias crecientes o decrecientes en los datos). Ambos tests son realmente muy sencillos de
hacer en, por ejemplo, una planilla Excel.
Saludos.
Ked:
La verdad no he encontrado ningn material decente en la web, as que lo explicar lo mejor que pueda. Asumo que tienes nociones bsicas de excel
como para poder implementarlo (es bastante sencillo).
Sea [texx]X_i[/texx] el dato i-simo
TEST DE RACHAS
Definimos [texx]U_i[/texx] como 1 si [texx]X_i \leq X_{i+1}[/texx] y 0 en caso contrario. Armamos una tabla de esta pinta:
[texx]
\begin{tabular}{|c|c|}
\hline
$X_i$
\hline
1
3
2
7
\hline
\end{tabular}
[/texx]

&

$U_i$
&
&
&
&

\\
1\\
0\\
1\\
-\\

Luego contamos cada una de las rachas. En el ejemplo anterior hay 3 rachas (es la cantidad de "cambios" de 1 a 0, +1). Para datos aleatorios el
valor esperado de la cantidad de rachas es [texx]\displaystyle R = \frac{2n-1}{3}[/texx].
Si trabajas con un nivel de error de [texx]\alpha = 10\% = 0.10[/texx], rechazars que los datos sean aleatorios si [texx]\alpha > \alpha^*[/texx]
donde [texx]\alpha^*[/texx] es el p-valor del test.
Para ms de 25 datos se puede usar la siguiente aproximacin normal (R es la cantidad de rachas que contamos en tu muestra y n es la cantidad de
datos):
- Si [texx]\displaystyle R < \frac{2n-1}{3}[/texx] el p-valor de la prueba es [texx]\alpha^* = P(Z \leq z_L)[/texx] con [texx]Z \sim N(0,1)[/texx] (Z
distribucin Normal 0,1) donde [texx]\displaystyle z_L = \frac{R + 0.5 - \frac{2n-1}{3}}{\sqrt{\frac{16n-29}{90}}}[/texx]

- Si [texx]\displaystyle R > \frac{2n-1}{3}[/texx] el p-valor de la prueba es [texx]\alpha^* = P(Z \geq z_R)[/texx] con [texx]Z \sim N(0,1)[/texx]
donde [texx]\displaystyle z_R = \frac{R - 0.5 - \frac{2n-1}{3}}{\sqrt{\frac{16n-29}{90}}}[/texx]
En resumen, calculas [texx]z_R[/texx] o [texx]z_L[/texx] segn corresponda, y luego para ver la probabilidad en una normal 0,1 dispones de la
funcin DISTR.NORM.ESTAND
TEST DE SPEARMAN
Definimos [texx]R_i[/texx] como el rango de [texx]X_i[/texx] (el rango es la posicin cuando la muestra est ordenada). Armamos una talba de la
siguiente pinta:
[texx]
\begin{tabular}{|c|c|c|c|}
\hline
$i$
&
\hline
1
&
2
&
3
&
4
&
\hline
\end{tabular}
[/texx]

$X_i$

&
3.5
2.6
3.4
5.1

$R_i$
&
&
&
&

&

$(i
3
1
2
4

&
&
&
&

R_i)^2$\\
4\\
1\\
1\\
0\\

El estadstico del test para n datos es [texx]\displaystyle r_s = 1 - 6\frac{\sum_{i=1}^n (i-R_i)^2}{n(n^2-1)}[/texx] (calcular la sumatoria es sumar
la ltima columna de la tabla). [texx]r_s[/texx] siempre deber darte un valor entre -1 y 1, cerca de 1 significar tendencia creciente, cerca de -1,
tendencia decreciente. Si es cercano a 0 los datos pasan este test de aleatoriedad.
Al igual que en rachas, si trabajas con un nivel de error de [texx]\alpha = 10\% = 0.10[/texx], rechazars que los datos sean aleatorios si [texx]\alpha
> \alpha^*[/texx] donde [texx]\alpha^*[/texx] es el p-valor del test.
Para ms de 30 datos se puede usar la siguiente aproximacin normal:
- Si [texx]r_s < 0[/texx] el p-valor de la prueba es [texx]\alpha^* = P(Z \leq z_L)[/texx] con [texx]Z \sim N(0,1)[/texx] donde [texx]\displaystyle z_L =
r_s\sqrt{n-1}[/texx]
- Si [texx]r_s > 0[/texx] el p-valor de la prueba es [texx]\alpha^* = P(Z \geq z_R)[/texx] con [texx]Z \sim N(0,1)[/texx] donde [texx]\displaystyle z_R =
r_s\sqrt{n-1}[/texx]
Saludos

Potrebbero piacerti anche