Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
El abandono escolar siempre ha estado relacionado con factores Vamos a discutir las ventajas que proporciona este tipo de mode-
sociales, econmicos y psicolgicos. Se ha intentado, a partir de lado sobre los modelos estadsticos tradicionales. Primeramente,
ciertos estudios y usando distintas metodologas, identificar el pro- estn diseados para ser capaces de manejar un nmero muy gran-
ceso de un alumno con riesgo de fracaso escolar. En este caso, la de de variables de prediccin, en algunos casos, ms all de lo que
minera de datos, junto con el uso de un modelo basado en rboles permitira el correspondiente modelo paramtrico estadstico. Otra
de decisin, nos ayudar a investigar las correlaciones existentes en ventaja, es que muchos modelos basados en rboles son comple-
los casos de fracaso escolar. tamente no-paramtricos y pueden capturar relaciones que los mo-
delos paramtricos comunes no podran manejar, o al menos no
facilmente.
5.1. Estudios previos
5.3. Anlisis CHAID
Hess y Copeland, en 2001 ya midieron el uso de estrategias de
copia por los estudiantes para construir un modelo de prediccin Chi-Squared Automatic Interaction Detection, en castellano De-
con un anlisis discriminante, ya que bsicamente, era un proceso teccin Automtica de Interaccin basada en Chi-Cuadrado, es un
de clasificacin personal. Se dieron cuenta de que el uso de ciertas mtodo estadstico heurstico basado en arboles que examina las
estrategias de copia predecan con bastante acierto un fracaso en relaciones entre muchas variables de prediccin categricas, ordi-
el instituto. De igual manera, Street y Franklin en 1991 se dieron nales, o continuas, y la variable objeto de estudio. El programa em-
cunenta que los estudiantes con un estatus socio-econmico bajo, pleado (Answer Tree, SPSS, 2001), proporciona un diagrama re-
eran ms propensos a abandonar prematuramente el instituto que sumen (rbol), detallando las categoras que proporcionan mayor
los de un nivel socio-econmico ms elevado. dependencia en nuestro objeto de estudio. Tambin suministra una
Pursley y Lan en 2003, elaboraron un excelente estudio sobre este tabla para reportar qu nodos tienen la mayor concentracin segn
tema, referenciando el abandono desde diferentes perspectivas, in- un anlisis de ganancias, y una tabla de informacin desclasificada
cluyendo los logros acadmicos, la motivacin en el trabajo de la segn un anlisis de riesgo.
escuela, la participacin en actividades, las aspiraciones educacio-
nales, las percepciones de la escuela, las relaciones con los compa- 5.4. Anlisis del estudio
eros, y la autoestima.
Estos anlisis descritos en la seccin anterior, a la vez sofisticados
Otro estudio reciente sobre las correlaciones existentes en este tema
y elegantes, tienen una pega importante: es muy dificil explicar-
es el de Wayman en 2001. Se trata de un estudio muy tcnico que
lo a personas sin conocimiento de estadstica. Los individuos que
toma muchas medidas de los estudiantes, a travs de un modelo de
posean poco o ningn entrenamiento de estadstica, encuentran la
regresin logstica y de imputacin mltiple1 . Gracias a este estudio
regresin y sus otros primos paramtricos, unas metodologas un
se econtr un conjunto muy potente de predictores basados en la
tanto desalentadoras para interpretarlas. Sin embargo, este sistema
recompensa del estudio, el nivel socio-econmico, y la edad.
es sencillo y muy asequible para nefitos, ya que el anlisis CHAID
no abarca nada ms complicado que un anlisis frecuencial y de
5.2. rboles de decisin densidad, y el procedimiento de Chi-Cuadrado de Pearson es ami-
gable y ampliamente conocido.
Aplicando un modelo basado en rboles de decisin al sector de la
educacin, podremos identificar los estudiantes que requieran ma- CHAID realiza comparaciones en pares para encontrar la variable
yor ayuda en un rea en particular. Tambin, nos ayudarn a deter- de prediccin ms altamente relacionada con la variable raiz. En
minar el grupo de variables de prediccin que estn ms relacio- sistemas de muchas variables, tener esta funcin implementada en
nadas con nuestra variable final, el ndice de fracaso escolar. En el un ordenador es esencial para picar amplios conjuntos de datos.
sector de los institutos de secundaria, las aplicaciones existentes de Los datos empleados en este estudio fueron tomados de otros con-
este tipo de estudios son escasas, y a menudo son proporcionadas juntos de datos anteriores. No se emple ninguna valoracin adi-
nicamente en estudios post-secundaria. En amrica, es dificil cional ni dato demogrfico. Todas las variables empleadas fueron
tomadas de bases de datos electrnicas del distrito. Los alumnos
1 En la imputacin mltiple, los valores que falten para estimar cualquier
variable, se predicen usando valores existentes para otras variables. Estos 2 K-12 viene de Kindergarden (guardera, 4-6 aos) hasta el 12 grado
valores predichos se llaman imputaciones, y constituyen el conjunto de (16-19 aos). Son el primer y ltimo grado de educacin gratuita en Estados
datos imputados. Unidos, Australia, y la Canad inglesa.
que estaban registrados como que haban abandonado el instituto crtica (vista como un fracaso clasificado como un graduado), se
durante un curso acadmico fueron comparados con una muestra mantiene en un mnimo (slo 65 estudiantes) con este modelo.
aleatoria de alumnos que haban permanecido estudiando. A pesar
de que alguna investigacin sobre fracasos escolares, coomo la de Cuadro 2. Matriz de clasificacin errnea
Barrington y Hendricks, en 1989, encuentran poca relacin entre
Categora Actual
el abandono y el sexo del alumno, tambin se incluy en este ex-
perimento una variable que identificara el sexo del estudiante. A Fracaso Graduado Total
continuacin mostramos una lista de las variables empleadas:
Categoria Fracaso 562 116 678