Sei sulla pagina 1di 10
La falta de restricciones en la percepcién de correlaciones y semejanzas inca- pacita a estas teorias para explicar la adquisiclon de conceptos. Pero este proble- ‘ma no es nuevo. De hecho, la dificultad mas seria a la que se enfrenta cualquier teorfa del aprendizaje basada en la abstraccién o induccién es la de poner limites al proceso inductivo (BOLTON, 1977; HOLLAND y cols., 1986; KeiL, 1981). El fdsofo Charles PEIRCE (1931-1995, vol. 1, pg. 121) presenta un ejemplo de esa diffcultad ‘que se ha hecho ya clasico: ‘Supongamos que a un ser de alguna parte remota del universo, donde las condiciones de existencia sean inconcebiblemente distintas de las nuestras, ‘80 le presenta el Informe del Cenzo de los Estados Unidos, que para nos: ‘otros es una mina de inducciones valiosas ...Tal vez emplece comparando la raz6n entre deudas y muertes por isis en regiones cuyos nombres emplecen con distintas letras de! alfabeto. No hace falta decir que acabaré encontran- do que esa razén es siempre la misma y que, por tanto, su investigacién no conduciré a ninguna parte... El extraterrestre puede seguir haciendo durante algén tiempo preguntas inductivas, quo ol Conso responder siempre con ‘exactitud, sin aprender nada excepto que clertas condiciones son indepen- dientes de otras... La naturaleza es un repertorio de hechos bastanto mas vasto y sin ducia menos ordenado que un informe del Censo; y sf el hombre no se hubjese acercado a ella cor actitudes especiales para hacer buenas conjeturas puede dudarse de que en los diez o veinte mil arios que lleva existiondo, la mente mas ldcida de la Humanidad hubjera llegado a alcanzar a cantidad de conocimiento que posee en realidad el mayor de los idiotas. La pesadila de! extraterrestre onfrentado al Censo de los Estados Unidos ti. ne cierto paralelismo con alguna otra pesadilla que se ha deslizado ya en estas, mismas paginas. Nos recuerda la histotia del hombre encerrado en aquella habi- tacién tlena de simbolos chinos (SeAntE, 1984). Ambos sores tiene algo en co- mtin: no aprenden nada. Ambos, ademés, son victimas del «problema humea- no», el mal que aqueja a su enfoque asociacionista de solventar los problemas. Como sabemos, este mal consiste en a falta de principios organizadores de la realidad. Por eso, PEIRCE recurre a unas «actitudes especiales» dol sujeto que, ‘segiin él, serfan conocimiento innatos. FOOOR (1975, 1980, 1981) también resolvia asf la ausencia de limites en la inducci6n. Sin embargo, desde las propias posicio: thes del asociacionismo han surgido diversos intentos de enfrentarse a este pro- bblema basados todos ellos en la metafcra del ordenador. Son las teorlas COmpU- tacionales del aprendizaje. A ellas esta dedicado el préximo capitulo. | | | CAPITULO VI Teorias computacionales Los ojos. Ada y sus ojos casteto os:u10, Pero, despuds de todo, Zqub son los ‘ojos? (pregunta Ada) Dos agujeros en ta méseara de In vids, LOvé podtan sir flicar (pregunta Ada) para un heminculo venido de oro globo, de otra Bur buja Léctea, y cuyo érgano de wisi uese (algamnos) un padi ntrno pact: do a Is forma oserta de Ia palabra Cojo? Que tepresentarfan para i dos ‘ojos, dos bellos ojos (de hombre, ce lomérido, de lechuza) que encontraras Sbandonadas.en el asionte do un tax? adlimie Nabokov, Ada ol ardor 4 El auge de las teorias computacionales del aprendizaje En ol Capitulo il analizamos las relaciones entre procesamiento de informa- cién y aprendizaje. All sefalabamos que, aurque el aprendizaje ha sido uno de los mas clamorosos olvidos del enfoque del procesamiento de informacién on los Ultimos afios, estén aumentando considerablemente los esfuerzos por olaborar teorias del aprendizaje basadas en los supuesios computacionales. Este auge es: 16 vinculado al propio fracaso de los sistemas de procesamiento de propésitos Generales. Los primoros modelos producidos por el procosamiento de informa- ién, como por ejomplo el Solucionador Genaral de Problomas de NEWELL y Si MON (1972), partian de sistemas de procosamiento dotados do una gran ca- pacidad sintactica general quo les permitiasuruestamente enfrentarse a cualquier area sin necesidad de conocimisntos especticgs. Pero ese supuesto resullé ser errénoo. Ademds de una capacidad sintactica, los sistemas de procesamiento, sean artilclales © humanos, necesitan una clerta cantidad de conocimientos es: pociticos para enfrentarse a un problema complejo, «semanticamente rico» (Graskas y SIMON, 1977). Se pas6 ast al disefio de sistemas expertos en dreas te- mmaticas especticas, dotados de grandes conocimientos en esa rea que les per- miten resolver problemas enormemente complejos con una gran efcacia, siempre que pertenezcan a ese dominio de conocimientos. Buena parte de los es{uerzos Toon connate do la Intetigencta Atfcial estan actua mente dirigidos al disefio de sistemas ex- portos (por ., CUENA, 1986; Hanr, 1985; MuMPOWER y cols., 1987). Pero el hecho de tener que cargar de contenidos seménticos @ esos sistemas plantea la necesidad, no sélo teérica sino también técnica, de proporcionarles una eierta capacidad para adquirir esos conocimientos. De esta forma, el apren- dizaje se constituye en un problema rdevante para la clencia cognitiva. Desde un unto de vista tedrico, es necesario rostular mecanismos que expliquen la ad- quisicion de esos conocimientos por los sistemas humanos de procesamiento, Desde un punto de vista técnico, sino se quiore seguir toda la vida dandoles el ‘conocimiento cucharada a cucharada, regla a regla, es necesario dotar a los ‘computadores de la capacidad para adquirr por s{ mismos conocimientos com- pilejos, includos los conceptos. En los itimos afios se han realizado numerosos y Cerecientes esfuetz0s por proporcionar a los sistemas de procesamiento humanos. Y artiticiates de un ciorto poder de automodificacién (por e., ANDERSON, 1981, 1983; BOLC, 1987 HOLLAND y cols., 1986; KLAHB. LANGLEY y NECHES, 1987; MCCLELLAND, RUMELHART y grupo PDF, 1986; MICHALSH, CAREONELL y MITCHELL, 1986; MITCHELL, CARBONELL y MICHALSC, 1986; SCHANK, COLLINS y HUNTER, 1986; ‘SHUELL, 1986; SieGLeR y KLAaHA, 1982; V03S, 1984). Estos esfucrzos han desembo: ‘cado en una sere de teorfas computaconaias del aprendizaje que, sl bien diforen tentre sf en aspectos importantes, comparten un niicleo conceptual comtin (véase Cap. Ill). En esencia, todas allas se basan en la posibllidad de reducir la semén- tica a reglas sintécticas. Por tanto, la aquisicién de conceptos debera también cexplicarse sintécticamente. Pero, a partir de ese nticleo comiin, existen ciertas diferencias entre unas teo- tias y otras. Aqui no vamos a detenernos en analizar esas diferencias, como tam- poco nos ocuparemos de todas las teorias. Unicamente sefialeramos qué tipo dle teorias, de entre las existontes, serén analizadas a continuacion, de acuerdo con los intereses de este libro. Aunque comparten importantes puntos en comin, al {gunas do las tooras computacionales ee desarrolian en el fimbito de la Inteligen: la Artificial (por 6}, BOLC, 1987; MICHALSKL, CARBONEL y MITCHELL, 1986), mion- tras que otras tienen un atigen psicolégico (por @}., ANDERSON, 1983; HOLLANO y cols,, 1986; RUMELHART y NORMAN, 1978). La diferencia reside en que, mientras la Inteligencia Artificial s6l0 se preocupa de que los sistemas funcionen, sin buscar 8ti compatibilidad con los datos psicoldgicos, las otras teorlas, respetando tos If mites de la metéfora computacional, intentan ser psicolégicamente relevantes, adecudndose a los datos que co conocon aobro ol procesamicnte humana do In: formacién. Ast, se intenta dotar a las teorlas de una plausibilclad psicolégica, pro- poniendo un procesamiento en paraielo en lugar de serial, una memoria de traba- Jo de capacidad limitada o un aprendizaje en tiempo real. Ademés se intenta que las teorias expliquen los datos psicolégicos relevantes sobre el aprendizaje per- Ceptivo (RUNELHART y ZIPSER, 1985), de destrezas (ANDERSON, 1962, 1983) 0 de ‘conceptos (ANDERSON, KLINE y BEAS.EY, 1979; ELIO y ANDERSON, 1981, 1984; HOLLAND y cols., 1986). Por titimo algunas teorias intentan incluso adecuarse a los datos conocidos sobre la neurofisiologia humana (MCCLELLAND, RUMELHART, Y ‘orupo POP, 1986). ‘Nuestra exposicién so centrara obviaments en estas teotfas computacionales do origen psicctégico, que suelen caractorizarse por sor teorias generalos del pro- cesamionto en las que el aprondizaje es uno mas de los procesos relavantes. De hecho, el aprendizaje suele sere! dtimo de los procesos incorporados al sistema, ya que en muchos casos las teorlas del aprendizaje surgen con el finde valiar un modelo de procesamionto estatico (ANDERSOA, 1987). Por allo, estas teofas sue- len partir de un marco representacional, no sie-npre colnedente. Esto supone una Vontaja; ya qu, a diferencia de lo que sucodia on buona medida con las teorlas analizaiias en los capitulos anteriores, el aprendizaje se relaciona con el resto do los procesos psicolégioos. Junto a su inclusin en una teoria mas general, estas teorias suelen paradojicamente aplicarse a dominios de conocimiento expect cos. Aqui nos ocuparemos tan sdlo de las teorias aplicables a la adquisicion de signficados por un sistema de procesamiento, dejando a un lado otro tipo de teo: rias ccupadas, por ejemplo, en aprendizaje perceptivo (RUMELHART y ZIPSER, 1985) 0 en Ia adquisici6n de destrezas especiticas (véase por e}., ANDERSON, 1981) Dentro do las toorias dol aprendizaje computacional psicotégicamento rele vvantes que se ocupan de la adquisicion de conceptos, presentaremos tan s6lo tros do sus ejemplos mas prototipicos, como son las teorlas ACT" (Adaptive Control of Thought: Control Adaptativo del Pensamiento) de ANDERSON (1982, 1983), la teorfa do los esquemas de RUMELHART y NORMAN (1978) ya reciente mente formulada teorla de la Inducci6n pragmatica de HOLLANO y cols. (1980). De- jaremos a un lado otras teorlas, como por ejemplo la teorla de la instruccion de Gane (1975, 1985) la teorfa de la induccién pragmatica de SCHANK, COLLINS y HUNTER (1906), las teorlas "microestructurales" del aprendizaje (MCCLELLAND, RUMELHART y grupo PDP, 1986) u otras formulaciones de la teorla de los esque ‘mas (véase por e., BREWER y NAKAMURA, 1904; SIERRA, 1985). En cuslquior caso, las teorias que analizamos a continuactén recegen la mayor parte de los mecanis- ‘mos del aprendizaje postulados en esas otras ieorias. Enfoque sintdctico: la teoria ACT de Anderson El sistema computacional ACT desarrollado por John R. ANDERSON constituye posibiemente el mas ambicloso y completo intanto de elaborar una teoria psicols- ica goneral y unitaria desde los supuestos computacionales de la ciencia cogniti va. Anie todo, el ACT es una teoria unitaria de procesamiento de informacion, ya que la klea basioa que subyace a la teorla es que «todos los procesos cognitivos ‘superiores, como memoria, lenguaje, solucién de problemas, imagenes, deduc- Ci6n e induccién son manifestaciones diferentes de un mismo sistema subyacen- tem (ANDERSON, 1983, pag. 1). Por tanto, los mecanismos de aprendizaje estén en el ACT estrechamente relacionados con el resto de los procesos, especialmente con la forma en que se representa la informacién en el sistema, En realidad, el ACT no es una teorla sino una familia de teorias que se suce. den en el tiempo. A partir det sistema de memoria asociativa desarrolado por AN- ofa cops narine iS vi DERSON y BOWER (1973), ANDERSON (1976, 1983) ha ido elaborando versiones su- ceesivas de su propia teoria, acomodandola a los nuevos datos y convirtléndola en una teorla capaz de enfrentarse a Areas exporimontales cada vez més diversas. Las sucesivas versiones de la teoria han kio flexibilizando poco a poco el ACT, de forma que se adecuara mas a los datos y a los conocimiontos psicolégicos actua- les. La titima versién de la teorfa, el ACT* (ANDERSON, 1983), que, al igual quo sus hermanas precedentes esté totalmente treducida a un programa de computador, incorpora una teorfa det aprendizaje que estaba ausente en formulaciones an: lerlores de! ACT. Nuestra exposicién estara basada en este titimo ACT®, si bien tendremos en cuenta también algunas corracciones que recientemente ANOERSON (1987) ha considerado conveniente introduc en su teorla del aprendizaje (para luna comparacién de las distintas versiones del ACT véase ANDERSON, 1983). Da- do ol cardcter unitario dela teoria, antes deabordar las procesos de aprendizaje 0s hnecesario exponer los principios generales del ACT, aunque sea brevemente (para tuna exposicion mas extensa ademas de ANDERSON, 1983, véase DE VEGA, 1984) ACT como teoria gonoral EI ACT es un sistema de procesamiento compuesto por tres memorias rela: clonadas (véase Figura 6.1.): una memoria declarativa, una memoria de produc- clones y una memoria de trabajo. Adomas, el sistema consta de varios procesos (coditicacién, actuacién, emparejamiento, ejecuct6n, ete.) que requleren general- ‘mente el uso de la memoria de trabajo. El «supuesto arquiteoténico basicom del sistema, que le diferencia de otras teorfas computacionales, es, no obstante, la existencia de dos tipos de memoria a larco plazo: una memoria declarativa, que Gontiene conocimiento descriptive sobre 21 mundo, y una memoria procedural 0 [ ciate mG wae a toes ~P tconace | T a FIGURA 6.1. £1 marco goneral de procesamiento dal ACT, incluyendo sus principales componentes estruourales y los procesas que los conectan, eagin Andsraon (1982, pig. 19). eat aio de producciones, que contiene informacion para la ejecucién de las destrezas que posee el sistema, Por tanto, esas dos memcrlas almacenan dos tipos distin. tos de conocimiento que se corresponden respectivamente con ia distintichnfilo- Solica (RYLE, 1949) entre ef «saber qué» declarativo y el «saber como» procedu. ral. Aunque el aprendizaje en el ACT es sobre todo procedural, es necesario co- nocer antes el funcionamiento de la memoria declarativa, ya que ambos tipos do conocimiento interactan en la memoria de trabajo. El conocimiento declarativo consiste en informacién sobre cémo esté organi: zado el mundo y lo que en él sucede. Asi, la frase «la noche esta estrellada y tri tan azules los astros a lo lejos» declara algo sobre e! mundo, pero no necesaria- ‘mente implica una accl6n por parte del sistema. El conocimiento declarativo nun- ca dasdencadena acciones sobre ef mundo directamente sino que, como vere- mos, puede llegar a activar el conocimiento procedural responsable de esas ac- GFones. La memoria dectarativa esté organizada en forma de red jerdrquica (véase por oj, Figura 6.2.). En realidad, segtin ANDERSON (1983, pag. 25), tiene forma ms bien de «jerarquia enmarafiada». Como suele suceder en los modelos de ‘memoria seméntica, esa jerarqufa se compone de «unidades cognitivas» 0 0. dos, y eslabones entre osos nodos. En las primeras versiones del ACT (ANDERSON, 1976) esas unidades cognitivas estaban constituldas tinicamente por proposiciones. Sin embargo, en su mas reciente versién, ANDERSON (1983, cap. 2) distingue tres tipos de unidades cognitivas 6 nodos en la memoria declarativa, con propiedades diferenciadas: cadenas temporales, imdgenos espaclales y pro: peninee Se rut IA PE con ry )( ether Spear Compote ser Sane) Shen FIGURA 6.2. Ejemplo do «jorarquia enmarafada>> del conasimiento necesavio para sentar a un ‘estauranto>, 2eg6n Anderson (1983, pla. 25). Una conduc'a aparentomente tan simple requlr® luna ced decltatva compuosta por diversas uniades cogaitvas jertrquicamonts oidenades, El conocimiento declarativo es estable y normalmente inactive. S6lo los no- dos que se hallan activados en la memoria de trabajo tendran lnfluencia sobre ol conocimiento procedural. Por ello, el concepto de activacién es central en el ACT. Toca cogs spntie como lo 0s en las teorlas de la memoria seméntica. La activacién puede proceder bien de los estimulos externos o bien del propio sistema, como consecuencia de la ejecucién de una accion. A diferencia de otras versiones anteriores, en las que Ia activacion de un nodo era un proceso todo o nada, la vitima version del ACT considera que el proceso de activacion es continuo, por lo que un nodo puede estar mas o menos activado. Sin embargo, como la memoria de trabajo tiene una capacidad limitada, ol ndimero de nodes que pueden estar activos simulténea- mente en elka vs también limltado. Los nodos que accederén a Ia memoria de tra bajo y podran tener influencia sobre ol procesamiento serén aquellos que tengan tuna mayor fuerza de activaci6n. La activacién de un nodo depende de la frecuen- ‘ola con que se use y de su emparejamiento o correspondencia con la informacién ‘contenida en la memoria de trabajo. De esta forma, «la activacién cumple en el ACT la funcién de un heuristico asociatvo relevante. Es decir, la activacién mide lo estrechamente asociada que una pieza de informacién esté con respecto a la Jnformacién actualmente usada» (ANDERSON, 1983, p&g. 27). ‘Cada nado tendrla una fuerza asociada que seria basicamente funcién de su frecuencia de uso. Al ser limitada la memoria de trabajo (segtin ANDERSON, 1983, ‘ho admitira mas de diez nodos simulténeamente), los riodos mas fuertes son los ‘que tendran mas probabilidad de estar activos. Pero, dado que los nodos estan ‘conectados entre sf mediante eslabones, la activacién de un nodo se propagard a través de la red Jerérquica. Cuanto mas fuerte sea un nodo, mayor serd la canti- dad de activacién que propague. Cuando la fuente externa 0 interna de la activa- clén desaparezca, ésta decaora paulatinamente. En dofinitiva, ios conocimiontos declarativos més frecuentemente usados e- rn los que tengan mayor probabilidad de estar activos en la memoria de trabajo. Esos conocimiontos aetivos acitian sobre el conacimiento procedural. Si la me moria doclarativa del ACT se asemeja a los modelos de memoria semantica, la ‘memoria procedural se basa en los sistemas de produccién desarrollados por NE- WELL y SIMON (1972). La idea basica de estos sistemas es que el conocimiento se almacena en forma de produccfones 0 pares condicién-accién, Las produccio- rnes adoptan la forma de un condicional «si... entonces...», La primera parte de la produccién es la condicién mientras que la segunda refleja la accion que debe realizarse al satisfacerse la condici6n. Una ejemplo simple y un tanto trivial de produccién seria el siguiente: Condicién: «si aparece un tigre» Accion: «salir corriendo» Cuando el conocimiento declarative activo en la memoria de trabajo satisfaga ‘0 «se empareje» con la condicién de una produccién, se ejecutara inmediatamen- te la accién correspondiente. Ast, si una forma rayada y con patas activa el nodo ‘atigre» en la memoria de trabajo, ol sujeto saldra corriendo autométicamente. ‘Tanto la parte de la condicién como la dela accién de una produccién pueden con- tener més de un elemento, De hecho, lo mas frecuente es que sea asl. En el caso anterior, el «sistema» saldrd corriendo aunque esté presenciando una sesién de clrco 0 dl tigre esté disecado. Eso no sucederia sila condicién fuera més compleja: «sl aparece un tigre yesta vivo y no est encerrado» Acclon: —_«galir corriendo»» ‘Ademds, las producciones no suelen almacenarse-aisladamente. Para que el cconocimiento que contlane. sea eficaz, deben encadenarse unas a ote, do tal ma que la accién de una produccién satistaga la condicion de la siguiente. De este modo, el conocimiento se convierte en procedimienios electivos de accién La Tabla 6.1. muestra un ejemplo de produccionas encadenadas para la solucién de un problema, en este caso el conocido problema de la Torre de Hanoi, repre sentadio en la Figura 6.3. SSITUACION iNIcIAL, FIGURA 6.3. Ene problema dea Tons de Hanoi hayes pies (A 8 yC) y cinco deoe de dt feptes maton que ienen un sgujera en el canto pn per inane et os patos En In {tén inn (ods tos dlacos estan suados en ef pivots A formance una prkmige Lo que debe aoe suet, mat es fawn, en tua todos lan discs on trma do peamie ona) peste eine fora Boe dace slo punden movers ‘mover fs dacos que no tengan oto olaco ensimay nunca puede ponsice un ci thks paaueno. La Tabla rovege un euler de procuciondsehoge para ero SITUACION-META TABLA. sna de produced pra toh polo de Tore de Hao nde, 18 (pags. 158-159.) ian : . cin aceiin (SLENTONCES). Tanto Ins condi ‘compursias de vation lamenios, et dear, 200 lcs eon generales oabsiactas, por lo que sive para solu jproblema de Torre de Hanol(nolldo el dela Figura 6.3), ndepandlentomente de ‘numero de discos que contonga. Sogin Andercon (1083) pe Pa Pa Ps Pr ‘Sta mota es transfect Ia piece N ol pote Z yl pidmide N consiste on Ni URTONCES estabtecer como submotas {TancteirfapianicenN a pore Sra da ‘Transl la pedi Wo alse Z liam pickmidaN al ceco Z ylappramige Nes.n sola eco. ENVONGESTa mela es mover Naz Sila mata sa mover ago Naz at Zn conte dacs renares que ANOMGES mover el isco Nal pwote 2 Ya mata se habra saath poroment Samael Yinguna meta tlalsco tno esl caco'mis grande unre del pivote meta ENTONGES establecer como mets siguiente mover el disco N al pivote meta meta es move el daco Nal phate Z yo hay si phote 2 Mt ERVENGES entabocar ome submats Sila meta 02 mover a deco Nal pvote Z yeldisco.més grande en Z-¢3 M qlee: ben pot ween \ablocar como submelas ERipices facie cone 2 Mover el disco Nal vote Z Sllameta os mover el disco Nal pvote Z Yyeliuco més grande an Zes M }Neemés grande quo M. Velasco mids grands en Nes Yites mae grande que L 4 Noctd on at pote piveta no ee XniZ TTONCES astablocer coma cubmotas Puede sucoder que ta informacion existente on la memoria de trabajo no sa- tistaga plonamente la condicién de ninguna produccin. En ose caso, segin el tl. timo modelo del ACT, y a diferencia de los anteriores, podrdn activarse aquellas producciones cuyas condiciones estén parclalmente satistechas. Por ejemplo, si ‘nos encontramos un tigre tumbado en une acera, aunque no sepamos si esté muerto o durmiendo, probablemente serd ura condicin sulcionte para salir co- rriendo. Tanto en el caso de emparelamionto parcial como total, las producciones existentes en la memoria procedural, a igual que sucode con los nodos doclarat: vos, compiten entre sf por ser activadas. Cuanto mas frecuentemente se active tuna producci6n, mayor sera su fuerza asociada. La producciones més fuortes ce activan mas répidamente, por lo que tienen ms probabilidad de ser acivadas de nuovo, En cualquier caso, el aumento 0 descenso de la fuerza de una producctén es tuno de los mecanismos de aprendizaje que posee el ACT. Pero cémo se forman las producciones? Hasta ahora hemos analizado un sistema estatico, dotaco tan- to de conocimientos declarativos como procedurales. Para que el sistema sea pslcol6gicamente realisia es necesario que disponga de mecanismas para adqul- Tir e808 conocimientos. En a ttima versién del ACT, ANDERSON, (1983) ha elabo- ‘ado una teoria del aprondizaje compatible con aque Mecanismos de aprendizaje on ol ACT ANDERSON (1982, 1983) propone una teorfa del aprendizaje basada en tres es- tadios sucesivos. Toda destreza 0 concepto adquitido pasatfa por tres fases: in- terpretacién declarativa, compilacién y ajuste (ver Tabla 6.2). Oado que la teoria es en esencla una teorfa de aprendizaje procedural o «por la acclénm est enfo: cada preferentemente hacia la adquisicién de destrezas, Pero ésias deben enten- derse en un sentido amplio, abarcando no sélo habilidades motoras sino también destrezas en la solucién de problemas y toma de decisiciones e incluso procesos de categorizacién y formacién de conceptos (ANDERSON, KLINE y BEASLEY, 1979, 1980). ‘Segtin ANDERSON (1983) existe una cierta paradola en el ACT: una produccién sélo s9 creard cuando haya sido ejecutada con éxito, pero al mismo tiempo sélo. '8e pueden ejecutar producciones que ya existan en el sistema, cuyas condiciones uedan ser satisfechas por el conocimionto deciarativo activado en la memoria de trabajo. Esta «paradoja del aprandizajax, que antinja na séla al ACT sino, como. veremos mas adelante, a casi todas las teorfas, (también BEREITER, 1985; PAS- CUAL-LEONE y GOODMAN, 1979), Se resuclve, sogtn ANDERSON (1982, 1983), postu: lando que todo aprendizaje comienza con una fase doclarativa o interpretative. Es decir, la informacién que recibe el sistema es codificada en la memoria dectarativa, dentro de una red de nodos. Los mecanismes mediante los que se forma esa re- presentacién declarativa en ACT no son muy precisos. Supuestamente, cuando el sistema recibe las instrucciones para la solucién de un problema o, en el caso do la formacién de conceptos, informacién sobre la categorizacion de un objeto (por 1a madre que dic a su hilo «mira, un perro»), 80 forma una copia on la me Thola Gaotrava do eeainormacién: «a! 0 cron a momria do abe una Unidad cogniva temporal, hay una protabligad p do quo so creo una copia do {a'misma em la momorla dectarativa a lego plazo™ (ANDERSON, 1883, pag. 20). Esa eprenaciéndectaalva, ue nace con una fuerza ial a uo, aumentara su probabildad de ser acthvada a medida quo vaya slondo Usada, TABLA 6.2, Un esquora de a teria del aprendtzap de Anderson (expicacin en ef txt) companion readenamito —_Congades Spodonet Propel poraececin Mey peceriece ‘etietncin —Meraineen” Sore ate Foauncnits ——nreicy node eeny Pero, aunque es bastante flexible, el conocimiento declarativo es computacio- nalmente costoso, debido a las limitaciores de la memoria de trabajo. Ello puede conduclr a errores como consecuencia de una sobrecarga de ésta. Por ello, la automatizacién de ese conocimiento aurrentard la eficacia del sistema, ya que ha- 14 posible un procesamiento en paralelo sin sobrecargar la memoria de trabajo. Esa automatizacién se logra en el segundo estadio del aprendizaje, mediante la compilacién o transformacién del conocimientc declarativo en procedural. Segdn ANDERSON (1987) la compilacién es el mecanismo basico de aprendizaje en el ACT. Implica dos subprocesos. La proceduralizacién hace que se elaboren ver- slones procedurales del conocimiento deciaraiNvo. La informacion contenida en los nodos activados en la memoria de trabajo se traduce a produccionos, Esta: roceduralizaci6n produce cambios cualitativos en el conocimiento ya que permi- te que éste so aplique de modo automatic, con rapidez y sin demanda de mo. ‘moria (€1 sujato ya no necesita repasar verbalmonto ol conocimiento declarative: su destreza se ha automatizado). Cuando un conocimiento declarative se trans forma en producciones, no necesariamente se pierden los nodos declarativos or ginales. Como ha reconocido el propio ANDERSON (1983), este proceso tiene mu- chos rasgos en comin con la automatizacion de SHIFFRIN y SCHNEIDER (1977, 1984). Este proceso se ve completado por un segundo mecanismo, la composi. cci6n, por la que una secuencia de producciones (o traducciones de declaracio- hes) se funde en una sola produccion, En otras palabras, aquellas producciones que ocurren frencuentemente tienden a «comsilarse» en tina sola produccién, En un principio (Neves y ANDERSON, 1981), la ccmposicién se basaba en la conti. guidad temporal entre las producciones, es decir, aquellas producciones quo se ejocutaban de forma sucesiva acababan componiéndose en una sola produccién Sin embargo, posteriormente ANOERSON (1982), ha observado que la contiguidad temporal puede conducir a composiciones absurdas o poco eficaces entre pro ducciones, por lo que defiende como condicion para la composicién do la exis. tencla do lo que é! denomina una «contiglidad lagica» entre las produccionos, regida por criterios de semejanza en sus metas, Pero el aprendizaje no concluye con la compllacién, Una vez formadas las producciones, éstas serén sometidas, como consecuencia de la practica, a pro. ‘e508 de ajuste, que constituyen el tercor estadio del aprendizaje. El ajuste so lo- ra mediante tres mecanismos automatics: genoralizacién, discriminacién y for- talecimiento (ANDERSON, KLINE y BEASLEY, 1980). La generalizacién de una pro duccién consiste en incrementar su rango de apllcacién. Esto puede conseguirse. sustituyendo valores constantes en las condictones de la produccién por varia. bles. El ACT requiere s6lo dos ejemplos para llegar a una generalizacién. Esta se bbasard en la semejanza entre las condiciones olas acciones de dos produccio- ‘nes. Los mecanismos por los que se computa esa semejanza no estan muy cla- Tos. ANDERSON (1983) sugiere que estan basados en el solapamiento entre las condiciones de dos producciones. Cuando dos produeciones tienen condiciones ‘comunes tenderan a generalizarse. Sin embargo esto canduce, en muchos casos, ‘a goneralizaciones «espireas» o inelicaces. Es necesatio poner limites ala gene. ralizaci6n en ol ACT. Para ello, ANDERSON, KLINE y BEASLEY (1979, 1980) han im- puesto clertas restricclones de cardcter sintact co al modelo iniclal de «fuerza bruta», que generalizaba siempre que era logicamente posible. Asi, proponen ue sélo se intentan generalizaciones cuando se 1a formado una producién nu va y, aun asf, que en ningiin caso se producen generalizaciones que exijan sust tir por variables mas de la mitad de las constantes de la condici6n més pequefia de entre las producciones comparadas. Es decir, que existrfa un limite en la pro- Te w= Tota cogs aera Porcién de constantes que pueden sustiurse por variables. Ademés, el tiempo ‘que el sistema dedica a buscar genoraizaciones es también limitado. Pero estas restricciones siguen siendc insufleientes, pudiénlose producir atin sobregeneralizaciones. Por ello, se propone un segundo mecanismo de ajuste de las producciones, la discriminacién, cuya ‘unet6n es, al contratio dela generaliza- cién, restringir el Ambito de aplicacién de una produccién. Para que se realice una discriminacién es necesario quo el sistorra dlaponga de casos de aplicacisn co: Trecta @ incorrecta de la produccién, siendo medida la correcoién por la adects- cidn de la produccién a las metas propuestas. Un algortmo busca y compara los valores de las variables en las aplicaciones correctas de una produccién. Una vez ‘ocalizadas esas variables, el sistema elige una de elias al azar como base para la Aiscriminacién.\Se trate, por tanto, de un proceso de bisqueda aleatoria nla me. ‘motia procadural (ANDERSON, BeasteY y Kune, 1980). Hay dos tipos de discrimi: nacién: de aecidn cuando produce la aparicién de una nueva accion y de cond c/6n, cuando restringe las condiciones bajp las que se ejecuta una accion ya pre. sonto en el sistema de producciones. En este illimo caso, la diseriminacion pus de producirse tanto sustituyendo una variable por una constante como aadiendo rnuavas cléusulas ala condicién de la produccion, Nila goneratizaci6n ni fa discriminacién eliminan las producciones originales. Unicamente generan nuevas producciones que compiten con aquéllas. Los pro- ‘esos de ajuste se completan con un mecanismo de fortalecimionto de las pro- ducciones, segtin el cual las producciones més fuerte3 emparejen sus condicio. ‘nes mas répidamente con la informacion contenida en la memoria de trabajo y te- nen més probabilidad do ser usadas. Los mecanismos de fortalecimiento de las Producciones son muy similares a los doscritos en el apartado anterior en rela- Cién con la activactin de nodos declaratives. Al igual que sucedia con los nodos, la fuerza de una produccién determina la cantidad de activacién que recibe en re. lacion con ottas producciones. Cuando se crea una producelén, sea por compa ion 0 por aluste de otras producciones, nace con una fuerza igual a uno. Cada vez que la produccién se aplica con éxitc incrementa su fuerza on otra unidad. Cuando 80 aplica incorrectamente pierde al 25% de su fuerza. ANDERSON (1983) Feconoce que estos valores son un tanto erbitratios, pero destaca la Importancia de la relacion, que hace que sea mayor el impacto de los castigos que el de los premios sobre la fuerza de una produccién Sin embargo, hay un rasgo importan- teen fos mocanismos de fortalecimiento del ACT. Cuando el sistema carece de in- formacién sobre la correccién con que ha stio aplicada una produccién se compu- ta, por defecto, como una aplicacién correcta. De esta forma, la simple practica 0 uso de una produccién, aunque se carezea de informacién sobre su correcién, fortaloce la produccién. Aunque ésta no cambia como consecuencia de la mera Préctica, su elecucién se hace més répida, Por ditimo, al igual que sucediera con los nodos declarativos, la activacién se propaga de una produccién a otras simila- res. La fuerza ganada por una producelén se aplica también a todas sus general zaciones. Aplicacién del ACT a la formacién de conceptos ‘Como hemos sefialado, la teoria del aprendizaje basada en el ACT esta orien- tada fundamentalmente a la adquisicién de destrezas (ANDERSON, 1962). De he- ccho, pueden encontrarse con facilidad muchos ejemplos en que el adiostramicnto. {en una tarea responde a los tres estadios mencionados, Pensemos en una perso na que esta aprendiendo a conducir. E! instructor de la autoescuela le describe verbalmente com tiene que realizar el cambio de marchas. Al principio el apren- diz debe vorbalizar o intentar recordar de manera deliberada cada una de la acciénes y el orden en que ha de ejecutarlas: levantar el ple del acelerador, pisar el embrague, mover la palanca de cambios, soltar suavemente el embrague y acelerar de nuevo. Cada una de estas acciones requiere toda la atencién de esa persona. No puede realizar ninguna otra accion a la vez que ejecuta esa secuen: cla. En términos del ACT, el aprondizaje ee halla en el estadio declarative. Los ‘cambios de marchas son en esta fase bruscos, deliberados 0 conscientes y gene- ralmente poco diestros, pudiendo olvidarse algin paso de la secuencia o realizar. os en un orden inadecuado. Pero, como consecuencia de la practica continuada, 21 conocimiento declarativo se va proceduralizando, las acciones se van haciendo automaticas. Ademés se van fundiendo en ura misma secuencia, Las produccio- nes que se van formando a partir de! conoc miento dectarativo se componen y ‘utomatizan. Nos hallamos en el estadio dela compilacion. Las acciones dojan de sor deliberadas y pasan a constituir una sola accién. Las acciones se ajecutan con tal rapidez que «el cambio de marchas»: es para el conductor un poco ave- zado una tinica accion, que ademés no le impide realizar otras acclonos a la voz (mirar un coche detenido en el arcén, tararear una cancién, pensar en el proximo examen, ete.) Al estar compilada la secuencia de producciones, no gasta recuir- 0s de la memoria de trabajo. A partir de aqui, suponemos que con el carné de conduicir en el bolsillo, esa persona sequird alustando la eecucién del cambio de ‘marchas mediante procesos automaticos de forma que la secuencia se realiza ca- da vez con mas precision. Este aprendizaje por ajuste no termina nunca. Basta con cambiar de coche para tener quo iniciar nuevamente el ajuste de las produc- nes que componen la destreza de «cambiar de marcha», Pero el aprendizaje procedural del ACT no sélo es aplicable a este tipo de destrezas motoras relativamente simples. ANDERSON (1983) incluye también, como desirezas que se aprenden por esos mismos mecanismos, otro tipo de habilida- das mas complojas como la toma de decisiones, la solucisn de probiemas mate. méticos o la generacién del lenguaje. Imagiremos, por ejemplo, a una persona aficionada al aedrez. Al principio, cada una de sus jugadas constituye una «Un dad cognitive» aislada, que exige toda su atencién. Sin embargo, los grandes ju gadores se caracterizan por tener automatizadas 0 complladas secuencias ente- ras do jugadas que ejecutan con gran rapidez (CHASE y SIMON, 1979). Las primeras diez Jugadas de una partida entre Karpov y Kasparov puaden durar cinco 0 dioz minutos. Las «aperturas» consisten en producclones compiladas cuyas variantes estan también automatizadas, Los grandes maestros no tienan que pensar duran- oe 1 Tata coi el npn te la apertura sobre cada jugada, dnicamente deben decidir qué secuencia de producciones —la defensa india de rey, la defensa siciliana o el gambito Salvio— van a seguir. Algo similar sucede con los expertos en otros dominios, como la s0- lucién de problemas matematicos, ol diagnéstico médico o el macramé, ‘AJaplicarse a la adquisiciin de este tipo de destrezas complojas, el ACT pue- do también considerarse una teorla del aprendizaje de conceptos. La secuencla dd producciones identificada como « las catactaisteas de exe piimo¢ coche. Tat {1 segundo episodio (Fig. b) algunos rasgos son camunes a ambos habran sudo algunas ‘araciones (Fig. existlendo algunos rasgos eentalos ala eatagora or al, ene cuatro wedasy volant Pale) yottos poifreos (or, trmako, oto). Do esta forma, la adaptacién do la teorfa ACT realizada por RicHaRos y GOLo: Fans (1986) mediante su modelo de memora episédica, consistente en realidad en un modato mixto de elemplar mas prototiz0 como el sugorido por SMITH y ME- on (1981), va mas alla del propio ACT. Sin embargo, talos aventuras parecon ox- cosivas para la endoblez del modelo. Es discutible que supere al propio ACT, una de cuyas mayores virtudes, la precisién de sus predicciones, ests ausente on ol modelo de memoria episédica. Pero, en cualquier caso, tanto el ACT como el mo: delo de memoria episédica derivado pretenden ser teorlas generales y unitarias det aprendizaje. Ello les obliga a ir mas alla de las teorlas revisadas en capitulos anteriores, que eran insuficientes para explicar el aprendizaje de conceptos. Al ha- cer una valoracién del ACT es preciso comparar sus mecanismos de aprendizaje ‘con los propuestos por las teorias anteriores para comprobar si pueden superar {os limites que éstas tenfan, EIACT y «el escéndalo de Ia induccién» EIACT nace con voluntad de constituirse en una teoria general del aprendiza- Je, algo que pocos autores se habian atrevido a ofrecer desde los goriosos tlem- pos del neoconductismo: «EI ACT incorpora la tesis sumamente podorosa do {que un dnico conjunto de procesos de aprendizaja subyace a toda la gama de! aprendizaje humano, desde los nis que eprenden su primer lenguaje oyendo hhablar @ los adultos, hasta los adultos que aprencien a programar un computador leyendo las instruccfones de un manual» (ANOERSON, KUNE y BEASLEY, 1979, pag. 278). Estos propésitos generales comunes al conductismo y al ACT no son fruto de una casualidad. El ACT es, sin duda, un ejemplar prototipico del asociacionis- mo computacional al que hacfamos referercia en el Captulo Ill. Existen claras convergencias teéricas entre el ACT y el conductismo, como consecuencia de ‘sus supvestos asociacionistas comunes. El rropio ANDERSON no tiene ningtin pro- blema en reconocerlo. Asi, destaca la semejanza conceptual entre las asociacio- nes E-R y las producciones condicién-accién: «Los sistemas de produccién pue- den concebirse como teorlas E-R ‘cognitivas’ a pesar de la contradiccién en las connotaciones de esos términos» (ANDERSON, 1983, pag. 6). Como vimos en la Primera Parte de est libro tal contradiccién es mas aparente que real, El cardcter asociacionista_del ACT no se agota en la representacién median- te sistemas de producei6n, sino que alcanza, sobre todo, a st teoria del aprendl ajo. Los tres estadios del aprendizae en el ACT recurren a mevarisinos exclusi- ‘vamente asociativos. Ast, vimos que la designacién o formactén de una represen: tacién declarativa en el estadio de interprotacién consisto, de acuardo con el prin- ciplo de correspondencia, en la elaboracién de una copia o réplica exacta del in- put. En cuanto al segundo estadio, el mecanismo de compilacién es una version actualizada do las tootias do la contighldad (ANDERSON, 1987). La combinacién de producciones se basa en la contiguidad temporal o «légica» entre éstas. Los me- ‘canismos de aluste también son exclusivamente asociativos. Los métodos indue- tivos de generalizacién y discriminacién no difleren mucho de las teorias conduc- \ oa cag apne tistas de la formacién de conceptos por discriminacién. El propio ANDERSON (1982) admite que las predicciones del ACT se aproximan més a las teorfas con- uctistas de la continuided que a las teorlas de la discontinuldad basadas en la ‘comprobacién de hip6tesis (véase Cap. IV). Asimimo, ANDERSON (1982) considera {que los r2ces0s de generalizacién en ACT son similares a los postulados on las teorlas du muestreo de estimulos (ESTES, 1960; también KintscH, 1970). Por dlt- mo, son abvias las semejanzas entre el fortalecimiento de los nodos y tas produc- ‘lonas mediante los procesos de activacién y las prediccionos conductisiae sobre fa influencia de la practica en el aprendizaje. Al Igual quo sucede con otras teorlas computacionales del aprendizajo (ROSENBLOOM y NewELt, 1987), el ACT parece aprender de forma muy parecida a los gatos encerrados on cajas trucadas por ‘THORNDIKE (1911). Aunque las predicclones del ACT dlloren en algunos aspectos de la «ley del ejorcicio», ya que ol ACT es sensible al castigo y puede mejorar su rendimiento incluso on ausencia de refuerzo (ANDERSON, 1983), la Importancia de la fuerza asociativa como consecueneia de la practica en ol ACT es comparable a la. quo este mismo mecanismo tiene tanto en el conexionismo como en el conduc: tismo. Pero estas semejanzas entre el ACT otras teorlas asoclacionistas no deben cccuttar la existencia de algunas diferencias importantes. Ante todo, el ACT, en st calidad de dispositive computacional,tiane una potencla asociativa muy superior a lade cualquier teorla conductista. Ell permite sutiles diferencias en los proce 508 de generalizacion y discriminacién (ANDERSON, 1982). Pero, sobre todo, per- mite levar el principio asoclacionista de correspondencia entre las representacio- nes y los inputs hasta sus ditimas consecuenclas. Como reconocen ANDERSON, KUNE y BEASLEY (1980), el ACT no es sdo una teoria basada on la fuerza ascciatt- va sino sobre todo una teorla «de fuerza bruta. Aunque también es algo mas. Se trata posiblomento junto con los reciortes intentos neoconexionistas de RUMEL- Hart, MCCLELLAND y grupo POP (1986) del intento mas completo y sistemtico de elaborar una teorla asociacionista del conocimiento y el aprendizaje humano. En 01 ACT las formalizaciones sintacticas del asociacionismo alcanzan su maxima precisién, lo que permite la continua reclaboracién de la teorfa en sus sucesivas versiones. El ACT no s6lo es una teorfa potente sino también coherente y precisa El problema es que este acopio de virtudes no puede ocular la propia debilidad basica de la teorla asoclacionista del aprendizaje subyacente. Un repaso de los ‘mecanismos del aprendizaje en el ACT revela una total incapacidad para explicar la apaticién de conacimiontos auténticamente nuevos (PASCUAL-LEONE, 1980). AN- EASON (1987) clasifica los mecanismos de aprendizaje del ACT en dos grupos: los que aumentan la eficacia del sistema pero no cambian sus producciones (compilacion y fortalecimiento) y los que modifican realmente esas producciones (Generalizacién y discriminacion). Por consiguiente, la generacién de nuevos co- nocimientos 0 destrozas en ACT se producitia por medio de ta inducci6n, Pero se recordaré que las teorlas de la induccién o abstraccién vienen desde hace siglos ‘enfronténdose al probloma de las restrcciones en ol proceso inductivo, al que al- ‘aunos han legado a denominar «ol escindalo de a fisolofa. Al llevar la posicién ‘asociacionista a su méxima expresién ANDERSON consigue que ese escdndalo sea atin més notorlo. Aunque es consciente de que son necesarlas esas restrio- Clones, los mecanismos que dispone para Inponerlas son exclusivamente sintéc- ticos y no semanticos. En otras palabras, la induccién se realiza segin criterios formales o si se preflere ldgicos. Como el extraterrestre enfrentado al censo de los Estados Unidos en el ejemplo de PEIRCE, el ACT se enfrenta al mundo dotado de tuna considerable «fuerza bruta» computacional que malgasta a manos llenas en

Potrebbero piacerti anche