Sei sulla pagina 1di 11

Aplicacin de Cadenas de Markov para Analizar

y Predecir las Brechas de los Resultados en


Matemtica entre los Estudiantes
Estadounidenses Afrodescendientes y Blancos
Marco Antonio Ospina Ruiz
Facultad de Matemticas,
Universidad Nacional de Colombia, Manizales, Caldas.
maaospinaru@unal.edu.co
10 de octubre de 2016
Resumen
En este trabajo se presenta el desarrollo y las conclusiones obtenidas
en el artculo de nombre original Application of Markov Chains to Analyze
and Predict the Mathematical Achievement Gap between African American and White American Students 1 , en el cual se utiliza las cadenas de
Markov discretas para estimar la probabilidad de que la brecha de los
logros en matemtica en el exmen nacional de progreso educacional estadounidense (NAEP) 2 entre los afrodescendientes y los blancos se cierre
durante los prximos 50 aos, haciendo uso de las propiedades Markovianas y la existencia de una medida de probabilidad estacionaria xs . Los
autores han hecho uso de informacin histrica de NAEP para examinar
las tendencias de los resultados entre afrodescendientes y blancos durante
los aos acadmicos de 1973 - 2012.

1.

Introduccin

Haciendo uso de informacin histrica de NAEP, varios investigadores 3 han


advertido un alarmante dficit en los resultados obtenidos por la comunidad
afrodescendiente jven en Estados Unidos, de edades 9, 13 y 17 aos, con respecto a las pruebas de matemtica, en comparacin con la comunidad blanca
estadounidense. Como lo sealan los autores, se ha hecho nfasis en reformas
1 Vivian

R. Moody y Kanita K. DuCloux, Western Kentucky University, KY, USA


Assesment of Educational Progress
3 Johnson ML (1984) Blacks in mathematics: A status report. Journal for Research in
Mathematics Education 15: 145-153.
2 National

educativas enfocadas a desarrollar pensamiento crtico matemtico en estas comunidades, sin embargo, a pesar de estos esfuerzos, los estudiantes afrodescendientes continan exhibiendo bajo rendimiento.

1.1.

Modelamiento matemtico

Para crear un modelo matemtico en esta investigacin, los autores harn uso
de las cadenas de Markov discretas, pero surge entonces una pregunta natural,
Por qu implementar este tipo de proceso estocstico?
Como este artculo busca determinar la probabilidad de que la brecha del rendimiento en matemtica entre afrodescendientes y blancos se cierre, en un nmero
finito de aos, una cadena de Markov con parmetro de tiempo discreto ser
apropiada para modelar este fenmeno, como lo veremos ms adelante en el desarrollo matemtico del modelo; adems, los puntajes de los exmenes de NAEP
tienden ms a comportarse como un modelo estocstico que como un modelo
determinista, ya que en este ltimo, el estado futuro del proceso dependera
completamente de todos los estados pasados del proceso.
Los autores harn uso de las siguientes propiedades de las cadenas de Markov
discretas en marco del desarollo del modelo matemtico:
El nmero de posibles resultados o estados es finito
Los resultados en un ao dado dependen nicamente de los resultados del
ao pasado
Las probabilidades son constantes a lo largo del tiempo

2.

Conceptos Previos

Matemticamente, se describe una cadena de Markov con la siguiente expresin


M {S (t+1) = j|S t = i, S (t1) = it1,... } = M {S (t+1) = j|S t = i} = mij
en la frmula, t denota tiempo discreto, en este caso t estar dado en aos,
y tenemos el conjunto de estados S = {S1 , S2 , . . . , Sn }. El proceso comienza
en uno de estos estados y se mueve sucesivamente de un estado a otro, cada
movida se llama paso, si la cadena de Markov est en el estado Si , entonces
se mover al estado Sj en el siguiente paso con probabilidad denotada mij ,
esta probabililidad no depende respecto a cul estado la cadena estaba antes del
estado actual. Las probabilidades mij son llamadas probabilidades de transicin,
y la matriz Mt = |mij | es la matriz de transicin en un paso, la cual satisface
P
n
j mij = 1 (matriz estocstica) y mij 0 para todo i y j.
Ahora, se har uso del siguiente teorema: sea M la matriz de transicin de
la cadena de Markov discreta descrita anteriormente, tal que M k tiene solo
entradas positivas para algn k, entonces existe una medida de probabilidad
2

estacionaria xs , tal que M xs = xs y ms an, lmk M k x0 = xs para cualquier


vector inicial de probabilidad x0 .
Ahora, se puede determinar qu vector ser explcitamente el vector de probabilidad estacionaria, considrese lo siguiente: primero reescribamos xs a travs
de las siguientes equivalencias:
M xs = xs M xs xs = 0 M xs Ixs = 0 (M I)xs = 0 xs Ker(M I)
Por tanto, xs es un vector en el espacio nulo de (M I); si M k tiene todas sus
entradas positivas para algn k, entonces Dim(Ker(M I)) = 1 y cualquier
vector en el espacio nulo de (M I) ser un mltiplo escalar de xs .
Comparando la ecuacin anterior M xs = xs con la definicin de autovector
(que nos dice que v es un autovector asociado al autovalor si se satisface
M v = v ) podemos notar que estos dos conceptos estn relacionados ya que,
si en particular tomamos otro vector x = (x1 , x2 , . . . , xn ) (mltiplo escalar de
xs ) en el ncleo de (M I) entonces
xs = Pn

i=1

xn

Pn
esto es, xs ser un vector normalizado ( j=1 (xj )s = 1, es decir, la suma de
cada una de las entradas del vector xs ser 1) asociado al autovalor 1

3.

Desarollo

Ahora, se ver cmo se utilizaron los resultados de los exmenes NAEP que
estarn representados por una serie de grficas, para analizar la brecha entre los
resultados obtenidos por los afrodescendientes y los blancos.
En la figura 1, estn las tendencias de los resultados de NAEP con respecto
a los puntajes en matemtica para los jvenes afrodescendientes y blancos de
9 aos de edad, la informacin revela una brecha muy amplia durante 1970 y
comienzos de 1980, sin embargo, la brecha se estrecha durante 1990 pero vuelve
a ampliarse durante comienzos del 2000.

Similarmente, como se observa en las figuras 2 y 3 para las edades de 13 y


17 aos respectivamente, a pesar de que existe una brecha persistente en los
resultados en matemticas entre los afrodescendientes y los blancos, se puede
ver que la brecha se ampla y se estrecha durante ciertos periodos particulares
de tiempo.

Con ayuda de est informacin, se procedi a manipular los datos matemticamente de la siguiente manera:

3.1.

Modelando los resultados del exmen NAEP

El proceso que se llevar acabo a continuacin en los pasos 1,2,3, y 4 ser el


mismo para los tres grupos de estudiantes de 9, 13 y 17 aos de edad, se
explicar detalladamente para el primer grupo, el de 9 aos de edad, y los dos
siguientes se harn de manera anloga.
Para analizar la informacin de NAEP, los autores desarrollaron tablas con los
resultados entre los afrodescendientes y los blancos de edades de 9, 13 y 17 aos,
durante los aos de evaluacin de 1973 - 2012. Para crear el modelo matemtico,
se define g como la variable aleatoria que representa la diferencia de los puntajes
(brechas) entre los estudiantes afrodescendientes y los blancos (aparece en los
grficos como Score gap). Como se ha establecido en el trabajo de Anderson
y Goodman 4 , el modelo est creado asumiendo que g puede ser agrupado en
clases que se definen como los estados de la cadena. Cada una de estas clases o
estados representan el rango de posibles valores para g. Estos rangos aparecern
en las figuras 1, 2 y 3.
Cul ser la cadena de Markov utilizada entonces y por qu es una
cadena de Markov? Como se dijo anteriormente, se tendr que la diferencia
entre los puntajes (brechas) entre los afrodescendientes y los blancos estarn
registrados en 4 rangos distintos {s1 , s2 , s3 , s4 } y que g es la variable aleatoria
que toma valores en estos rangos (o estados), la probabilidad de ir de una brecha
a otra solo depender de la brecha inmediatamente anterior, y no de las que haya
de ah hacia atrs, y si se define xij como la probabilidad de transicin de ir del
4 Anderson TW, Goodman LA (1957) Statistical Inference about Markov Chains. The Annals of Mathematical Statistics 28: 89-110.

estado si al estado sj , se cumplir la propiedad Markoviana


M {g (t+1) = j|g t = i, g (t1) = it1,... } = M {g (t+1) = j|g t = i} = xij
Para verificar lo anteriomente dicho, vamos a proceder entonces a manipular los
datos matemticamente

3.2.

Paso 1. Definir las tablas de puntajes, las tablas de


estados para g y la probabilidad de transicin xij

Figura 1: Diferencia entre puntajes en matemtica entre afrodescendientes y


blancos de 9 aos de edad.

Figura 2: Estados de transicin y clases de g para estudiantes de 9 aos de edad.


Vamos a proceder con el grupo de los estudiantes de 9 aos. Como se observa en la tabla 2, se crearon cuatro estados {s1 , s2 , s3 , s4 } para g, teniendo en
cuenta que la brecha entre puntajes se ha movido histricamente entre estos
rangos. Ahora tomando xij como se defini anteriormente, y haciendo uso de
los resultados que obtuvimos en los conceptos previos, se tendr que:
M = xij = M xs = xs =

xin
4
P
n=1

xin

3.3.

Paso 2. Se establece que g es estadsticamente independiente, haciendo uso del test Chi-cuadrado

Para completar el desarrollo del modelo de cadena de Markov discreta, los autores establecen que g es estadsticamente independiente. De acuerdo a Billingsley
5
, el test Chi-cuadrado provee una manera sistemtica para hacer el anlisis
estadstico de cadenas de Markov para tal propsito

3.4.

Paso 3. Se establece la matriz de transicin M

Haciendo uso entonces de la probabilidad de transicin xij en el paso 1, para


el grupo de 9 aos de edad, vamos a calcular cada una de las probabilidades
de transicin de la matriz de transicin y con estas armaremos la matriz de
transicin.
para calcular la probabilidad de transicin del estado s1 a los estados s1 ,s2 ,s3
y s4 tenemos que
xij =

xin
4
P
xin

donde n = 1, . . . , n

n=1

es decir,
x1n =

x1n
1
=
(x11 , x12 , x13 , x14 )
4
P
x11 + x12 + x13 + x14
x1n
n=1

1
(3, 2, 0, 0) = (3/5, 2/5, 0, 0)
3+2+0+0

As, obtendremos la primera fila de la matriz, recordemos que las probabilidades


de transicin xij han sido determinadas de la tabla 1 contando las veces que
salimos de la brecha si y nos trasladamos a la brecha sj .
para determinar la probabilidad de transicin del estado s2 a los estados s1 ,s2 ,s3
y s4 tenemos que
x2n =

x2n
4
P

1
(x21 , x22 , x23 , x24 )
x21 + x22 + x23 + x24

1
(3, 1, 0, 0) = (3/4, 1/4, 0, 0)
4+4+0+0

x2n

n=1

que ser la segunda fila de la matriz de transicin.


5 Billingsley P (1960) Statistical Methods in Markov Chains. Santa Monica, CA: RAND
Corporation.

De manera anloga se proceder a calcular las otras filas de la matriz de transicin, por tanto se tendr

3/5 2/5 0 0
3/4 1/4 0 0

M =
0
1 0 0
0
0 1 0

3.5.

Paso 4. Se calcula la matriz de transicin M a largo


plazo

Se ver entonces como eventualmente, las probabilidades de transicin de la


matriz M se estabilizarn o alcanzarn un estado de equilibrio, y convergern a
lo largo del tiempo. Para generar la probabilidad estadstica para predecir si
la brecha entre los puntajes se cerrar en 50 aos para los estudiantes
de 9 aos de edad, primero hallamos la matriz de transicin para un nmero
particular de pasos menores que 50, escogiendo 10 aos o pasos (los autores encontraron que con este nmero era suficiente) y haciendo los clculos respectivos
de las potencias de M , se obtiene:

0,652174 0,347826 0 0
0,652174 0,347826 0 0

M 10 =
0,652174 0,347826 0 0
0,652174 0,347826 0 0
Se observa que despus de 10 aos la matriz de transicin alcanza un estado de
equilibrio (se estabiliza), en la cual todas las filas de la matriz son la misma, y
concluimos, que la brecha de los puntajes tender a cerrarse en los prximos 10
aos para los estudiantes de 9 aos de edad.

3.6.

Procediendo para las edades de 13 y 17 aos de manera anloga

Como se mencion, el proceso para crear un modelo de cadena de Markov discreta basada en los datos de NAEP para los estudiantes de 13 aos de
edad ser el mismo, as que se dar de ahora en adelante solo los resultados que
se van a obtener. Se mostrar entonces las tablas y sus respectivos resultados:
La matriz de transicin para el grupo de 13 aos estar dada por:

6/7 1/7 0 0
1
0 0 0

M =
0
1 0 0
0
0 1 0
y la matriz luego de 10 pasos, ser

0,875 0,125 0 0
0,875 0,125 0 0

M 10 =
0,875 0,125 0 0
0,875 0,125 0 0
8

Figura 3: Diferencia entre puntajes en matemtica entre afrodescendientes y


blancos de 13 aos de edad.

Figura 4: Estados de transicin y clases de g para estudiantes de 13 aos de


edad.
Se concluye que la brecha entre los puntajes tender a cerrarse en lo prximos
10 aos, para los estudiantes de 13 aos.
Finalmente, se tendr, para los estudiantes de 17 aos:
La matriz de transicin estar dada por

2/3 1/3 0 0
1/3 2/3 0 0

M =
0
1 0 0
0
0 1 0
y la matriz luego de 10 pasos, ser

0,500008 0,499992 0 0
0,499992 0,500008 0 0

M 10 =
0,499995 0,500025 0 0
0,499924 0,500076 0 0
En este caso se encontr que la matriz de transicin no se estabiliza despus de
9

Figura 5: Diferencia entre puntajes en matemtica entre afrodescendientes y


blancos de 17 aos de edad.

Figura 6: Estados de transicin y clases de g para estudiantes de 17 aos de


edad.
10 pasos, as que los autores probaron con ms nmero de pasos, y encontraron
que

0,5 0,5 0 0
0,5 0,5 0 0

M 15 =
0,5 0,5 0 0
0,5 0,5 0 0
despus de 15 pasos la matriz alcanzaba estabilidad, por tanto se concluye que
la brecha entre los puntajes para los estudiantes de 17 aos tender a cerrarse
en los prximos 15 aos.

4.

Conclusiones

El modelamiento con cadenas de Markov discretas en este tipo de escenario


resulta ser til para analizar la naturaleza estadstica y probabilstica de los
resultados recoletados por NAEP a lo largo de los aos en los cuales se ha
realizado este exmen, dando una aproximacin viable acerca del momento en
10

el cual las brechas entre los puntajes de los afrodescendiente y los blancos se
ir cerrando, pero, as mismo, la manera en la que se model el problema, y la
determinacin de la variable aleatoria g en este caso particular, conlleva a que
el anlisis sea limitado, ya que no se tiene en cuenta factores como el esttus
socioeconmico, la manera en cmo se educaron los estudiantes, los diferentes
niveles de estrs que pueden implicar este tipo de exmenes, y muchos otros
factores que podran ser determinantes para obtener una aproximacin ms real
de la problemtica de los bajos niveles en los puntajes de los afrodescendientes
con respecto a la comunidad blanca estadounidense.

5.

Bibliografa

[1] Moody VR, DuCloux KK (2014) Application of Markov Chains to Analyze


and Predict the Mathematical Achievement Gap between African American and
White American Students. J Appl Computat Math 3:161 doi: 10.4172/21689679.1000161

11

Potrebbero piacerti anche