IX Congreso Iberoamericano de Indicadores de Ciencia y Tecnologa
9-11 octubre 2013, Bogot, Colombia
esi!n temtica" #erce$ci!n y a$ro$iaci!n social de la ciencia y la tecnologa La cultura cientfica ms all de las encuestas: Wikipedia, la prensa y los libros de texto 1 Carlos G. Fiuerola, !amar Gro"es, #iuel $nel %uintanilla &nstituto 'ni"ersitario de (studios de la Ciencia y !ecnoloa, 'ni"ersidad de )alamanca
*esumen %ebido a la in&luencia 'ue los &actores culturales tienen en la articulaci!n de $olticas de ciencia, tecnologa e inno(aci!n, es im$ortante com$render c!mo la sociedad $ercibe la ciencia) *as encuestas son la +erramienta ms com,n $ara la e(aluaci!n de la $erce$ci!n social de la ciencia, $ero la in&ormaci!n 'ue nos $ro$orcionan $uede ser com$arada y com$lementada con otras &uentes) -n este traba.o describimos un $royecto de in(estigaci!n, actualmente en marc+a, 'ue aborda la $erce$ci!n de la ciencia e base a otros so$ortes de in&ormaci!n" la $rensa, los libros de te/to y la 0i1i$edia) #ara el anlisis de los contenidos en los di&erentes so$ortes utili2amos un marco te!rico ,nico basado en el conce$to de cultura cient&ica) 3no de los ob.eti(os bsicos de nuestro $royecto es $robar la (alide2 del modelo de cultura cient&ica $ara organi2ar una multi$licidad de contenidos y so$ortes de in&ormaci!n) *a cantidad de in&ormaci!n cient&ica 'ue contienen estos tres so$ortes es enorme) #ara $oder anali2arla es necesario em$lear $rocedimientos automticos de locali2aci!n y almacena.e de in&ormaci!n) 4tro ob.eti(o de nuestro $royecto es $or lo tanto crear una base documental de contenidos de cultura cient&ica en es$a5ol) -l tercer ob.eti(o de nuestro $royecto es clasi&icar el contenido cient&ico de la base documental seg,n nuestro modelo de cultura cient&ica con la idea de e/traer unos indicadores de cultura cient&ica 'ue se $odran utili2ar en distintos conte/tos) %ada la im$ortancia 'ue los &actores culturales tienen en la articulaci!n de $olticas de ciencia, tecnologa e inno(aci!n, es im$ortante com$render c!mo la sociedad $ercibe la ciencia) *as encuestas son la +erramienta ms com,n $ara la e(aluaci!n de la $erce$ci!n social de la ciencia) -n nuestro $royecto de in(estigaci!n $retendemos com$arar y com$lementar el uso de las encuestas con otros tres so$ortes de in&ormaci!n" la $rensa, los libros de te/to y la 0i1i$edia) #ara el anlisis de los contenidos en los di&erentes so$ortes utili2amos un marco te!rico ,nico basado en el conce$to de cultura cient&ica) -l $rimer ob.eti(o de nuestro $royecto es $robar la (alide2 del modelo de cultura cient&ica $ara organi2ar una multi$licidad de contenidos y so$ortes de in&ormaci!n) *a cantidad de in&ormaci!n cient&ica 'ue contienen estos tres so$ortes es enorme) #ara $oder anali2arla es necesario em$lear $rocedimientos automticos de locali2aci!n y almacena.e de in&ormaci!n) -l segundo ob.eti(o de nuestro $royecto es $or lo tanto crear una base documental de contenidos de cultura cient&ica en es$a5ol) -l tercer ob.eti(o de nuestro $royecto es clasi&icar el contenido cient&ico de la base documental seg,n nuestro modelo de cultura cient&ica con la idea de e/traer unos indicadores de cultura cient&ica 'ue se $odran utili2ar en distintos conte/tos) #ara cada uno de los so$ortes +emos desarrollado una metodologa 'ue $ermite clasi&icar su contenido seg,n nuestro modelo) -n el caso de la $rensa +emos usado 1 Este trabajo ha sido financiado por el Ministerio espaol, de Ciencia e Innovacin, Subprograma de Proectos de Investigacin !undamental, ref" !!I#$11%#&&'( anlisis de contenido) -n el caso de 0i1i$edia utili2amos $rocesos automticos de recu$eraci!n y clasi&icaci!n y en el caso de los libros de te/to, mane.amos el $rograma atlas-ti 'ue $ermite codi&icar a los $argra&os seg,n la $resencia y ausencia de $alabras cla(es) Toda(a estamos en las $rimeras eta$as de la in(estigaci!n6 sin embargo ya +emos detectado 'ue mientras en los so$ortes tradicionales la cultura cient&ica est caracteri2ada $or una di(isi!n disci$linar tradicional, en 0i1i$edia la distribuci!n de contenidos no $arece de$ender solamente de las disci$linas acad7micas sino tambi7n de $reocu$aciones sociales actuales) 8dems +emos (isto 'ue un &en!meno $arecido $asa con los libros de te/to de la asignatura Ciencias para el Mundo Contempornea 'ue as$ira su$erar el aislamiento de la ense5an2a de la ciencia de sus im$licaciones sociales) (l modelo de Cultura Cientfica 9adie discute la im$ortancia de la di&usi!n $,blica de la ciencia y la tecnologa y de la correlati(a $artici$aci!n del $,blico in&ormado en cuestiones y debates de inter7s en relaci!n con la ciencia y la tecnologa) :uc+os de los grandes debates de nuestra 7$oca ;cambio climtico, seguridad, salud, ca$acidad inno(adora, etc)< son debates en torno a cuestiones de carcter cient&ico) #ara $artici$ar en ellos de &orma racional y e&ecti(a, se re'uiere 'ue la $oblaci!n tenga acceso a in&ormaci!n cient&ica y t7cnica com$le.a, adems de 'ue e/istan cauces e instituciones adecuadas $ara canali2ar la $artici$aci!n) #or esta ra2!n +an ad'uirido cada (e2 ms im$ortancia los estudios de com$rensi!n $,blica de la ciencia y las iniciati(as de $otenciaci!n de la comunicaci!n $,blica de la ciencia) 8 $esar de lo muc+o 'ue se +a a(an2ado en este terreno, no e/isten a,n resultados concluyentes 'ue nos $ermitan entender me.or los $rocesos de comunicaci!n $,blica, su incidencia en las actitudes de la $oblaci!n +acia la ciencia y la tecnologa ;:onta57s, 2010<) -n este conte/to consideramos interesante desarrollar el conce$to de cultura cient&ica 'ue +emos utili2ado de &orma tentati(a en algunos estudios $re(ios ;=uintanilla, et al), 2009<) -ste conce$to es una e/tra$olaci!n del de cultura tecnol!gica utili2ado en traba.os anteriores ;=uintanilla et al), 200><) -l n,cleo &undamental del modelo es la distinci!n entre cultura tecnol!gica incor$orada a sistemas t7cnicos ;las reglas de o$eraci!n de un sistema t7cnico, $or e.em$lo< y cultura tecnol!gica no incor$orada a sistemas t7cnicos ;los &ines sociales $ara los 'ue se usa o se desarrolla una tecnologa, $or e.em$lo<) -l $rimer com$onente de la cultura tecnol!gica es inse$arable de la $ro$ia tecnologa, $ero el segundo es muc+o ms &le/ible y $uede ado$tar di(ersas con&iguraciones, en &unci!n de otros elementos culturales de la sociedad de re&erencia, dando as $ie a di&erentes $rocesos de desarrollo tecnol!gico y de a$ro$iaci!n social de la tecnologa) -sta distinci!n es muy rele(ante $ara entender los $rocesos de trans&erencia tecnol!gica entre sistemas culturales muy di&erentes ;?) C) :artne2, 2010<, as como $ara me.orar nuestra com$rensi!n de c!mo los &actores culturales inciden en la ca$acidad y la $ro$ensi!n a inno(ar de una sociedad ;=uintanilla, 2012<) -l $ro$!sito actual es am$liar el modelo a la cultura cient&ica en general ;no solo tecnol!gica<) *a cultura cient&ica es a'uella $arte de la cultura de un gru$o social 'ue consiste en in&ormaci!n relacionada y com$atible con la acti(idad cient&ica) e $ueden distinguir dos ti$os de com$onentes en la cultura cient&ica" la ciencia $ro$iamente dic+a, $or una $arte, y el resto de la in&ormaci!n, re$resentacional, $rctica o (alorati(a 'ue &orma $arte de la cultura general del gru$o, y tiene 'ue (er con la ciencia aun'ue no &orme $arte de la acti(idad cient&ica como tal) -n la cultura cient&ica as entendida siem$re se $ueden distinguir dos ti$os de com$onentes" las creencias, reglas de actuaci!n y (alores cient&icos $ro$iamente dic+os ;$odramos llamarlos a estos cultura cient&ica en sentido estricto< y las creencias, reglas de actuaci!n y (alores re&eridos a la ciencia y com$atibles con ella, aun'ue 'ue no &orman $arte de la ciencia ;cultura cient&ica en sentido lato<) 3na consecuencia interesante de todo esto es 'ue, en $rinci$io, $ara un mismo ni(el del desarrollo de la ciencia, $uede +aber di&erentes con&iguraciones de la cultura cient&ica en sentido lato) *a otra es 'ue si a$licamos reglas de consistencia $ara la integraci!n de la in&ormaci!n cultural en con.untos co+erentes de in&ormaci!n, tenemos 'ue ace$tar 'ue no cual'uier con&iguraci!n cultural es com$atible con el estado real de la ciencia) -sto signi&ica algo muy sim$le" en &unci!n del estado real de la ciencia $odemos establecer criterios e&ecti(os $ara de&inir 'u7 es una cultura cient&ica adecuada ;es decir com$atible con el conocimiento cient&ico< en cada momento) *a base conce$tual es el modelo te!rico desarrollado en =uintanilla, 2000 y 8ibar y =uintanilla, 2002) -n este modelo, cultura es de&inida como la in&ormaci!n re$resentacional, $rctica y e(aluati(a transmitida a tra(7s del a$rendi2a.e social) 8s, en nuestro modelo distinguimos tres ti$os de cultura" in&ormaci!n re$resentacional, in&ormaci!n o$eracional e in&ormaci!n e(aluati(a) *a cultura cient&ica y tecnol!gica de un $as se caracteri2a en los siguientes t7rminos" Cultura cient&ica" la in&ormaci!n cultural relacionada con acti(idades cient&icas, m7todos, resultados y su relaci!n con cual'uier otra acti(idad social) *a e/$resi!n @cultura cient&ica@ la usamos a'u no $ara re&erirnos a la cultura $ro&esional de los cient&icos, sino a la $arte de la cultura de un indi(iduo o de un colecti(o relati(a al conocimiento y acti(idades cient&icos) -l modelo distingue dos clases o ni(eles de cultura cient&ica 'ue $odemos denominar como intrnseco y e/trnseco) -l $rimero se re&iere a com$onentes culturales inmanentes a las acti(idades cient&icas" el conocimiento cient&ico en cada rea, teoras debatidas $or los cient&icos, +ec+os descubiertos a tra(7s de la in(estigaci!n cient&ica, e/$licaciones e inter$retaciones cient&icas de &en!menos naturales o sociales) etc) Tambi7n se incluyen las normas del m7todo cient&ico, las normas de la in(estigaci!n em$rica, la comunicaci!n cient&ica de los resultados de esa in(estigaci!n, as como los (alores 'ue se su$one 'ue guan la acti(idad cient&ica ;la ob.eti(idad, co+erencia, $recisi!n, etc) -l ni(el e/trnseco se re&iere a todo lo re$resentacional, $rctico y e(aluati(o 'ue est relacionado con las acti(idades cient&icas, asi como con las instituciones y $ersonas 'ue la lle(an a cabo, $ero 'ue no &orman $arte de la cultura cient&ica intrnseca) *a imagen de la ciencia, en el sentido de c!mo la gente la $ercibe, la regulaci!n .urdica de las instituciones cient&icas, la e(aluaci!n de la ciencia desde un $unto de (ista cultural, moral, $oltico, religioso ))) Todo esto es $arte de lo 'ue entendemos como cultura cient&ica e/trnseca) Cultura tecnol!gica" es la in&ormaci!n cultural sobre sistemas t7cnicos, su &uncionamiento, dise5o y $roducci!n y cual'uier otra clase de acti(idad relacionada con la tecnologa) 9ue(amente, @cultura tecnol!gica@ signi&ica a'u no s!lo el conocimiento $ro&esional de tecn!logos e ingenieros, sino tambi7n se re&iere a com$onentes relati(os a la tecnologa, su in(enci!n, $roducci!n, di&usi!n y uso) 4tra (e2 $odemos distinguir dos clases de cultura tecnol!gica, intrnseca y e/trnseca) *a cultura tecnol!gica intrnseca $odra e/$licitarse como toda la in&ormaci!n cultural necesaria $ara dise5ar, $roducir y usar adecuadamente un dis$ositi(o t7cnico) *a e/trnseca, $or su $arte, sera toda la in&ormaci!n cultural ;creencias, normas, actitudes y (alores< 'ue estn relacionados con los sistemas t7cnicos as como con las acti(idades, conocimiento, $ersonas e instituciones 'ue dise5an, $roducen y di&unden tecnologas6 $ero 'ue no &orman $arte de la tecnologa o del sistema t7cnico) #or e.em$lo, las teoras y o$iniones sobre la in&luencia de la tecnologa de la in&ormaci!n en la reducci!n de $uestos de traba.o en la industria) *a distinci!n entre cultura intrnseca y e/trnseca es im$ortante $or'ue, como se +a sugerido en otro lugar ;=uintanilla 200A, =uintanilla, 2012<, el ni(el de inno(aci!n de un $as o de una em$resa de$ende, adems de otros &actores, de dos caractersticas" la ca$acidad de inno(ar y la $ro$ensi!n a inno(ar) *a $rimera, la ca$acidad $ara inno(ar, est directamente relacionada con el acceso lo 'ue +emos llamado cultura cient&ica o tecnol!gica intrnseca, mientras 'ue la segunda, la tendencia a la inno(aci!n de$ende ms de elementos de cultura cient&ica o tecnol!gica e/trnseca) Los libros de texto -ste traba.o se lle(a a cabo en dos &ases y su $ro$!sito es estudiar la $resencia de cultura cient&ica y tecnol!gica, as como &actores de cultura inno(adora y em$rendedora en los libros de te/to de la -nse5an2a ecundaria 4bligatoria en -s$a5a, estudiantes entre 12-1B a5os de edad) -n una $rimera &ase se anali2aron C1 libros de las materias obligatorias y de algunas o$cionales durante los a5os 200A- 200B) Figura 1. Prrafos de cada materia y editorial -l anlisis de contenido de la base documental se reali2! a tra(7s de (arias &ases" 1) -laboraci!n de un t+esaurus de (ocabulario cient&ico de las $alabras cla(e 'ue caracteri2an cada disci$lina) -ste $rocedimiento se reali2! obteniendo de &orma automati2ada la lista de $alabras $resentes en cada te/to y com$arndolas con un cor$us de re&erencia) -sto $ermiti! obtener una serie de listas de $alabras ;a$ro/imadamente setenta $ara cada asignatura< 'ue caracteri2an a los te/tos de cada materia) 2) 8nlisis automtico de la $resencia del (ocabulario cient&ico con cada te/to de la base documental a tra(7s del so&tDare 8tlas ti codi&icando de manera automtica cada $rra&o seg,n se $resente o no alguna de las $alabras cla(e asignadas $ara cada disci$lina) Con lo cual se cubre el $rimero de los ob.eti(os $lanteados) 3) e agru$aron te/tos de di(ersas disci$linas en los 'ue a$arecen contenidos de cultura cient&ica, tecnol!gica e inno(aci!n a $artir de la codi&icaci!n automtica y se lle(o a cabo un anlisis manual de los contenidos de cultura cient&ica, tecnol!gica y de inno(aci!n 'ue a$arecen en este gru$o de te/tos) >) 8nlisis de met&oras de $romesas y amena2as $resentes en los te/tos seleccionados, es decir (aloraciones ante la ciencia ya sean $ositi(as o negati(as) *as conclusiones $rinci$ales &ueron" - Eay un e'uilibrio claro entre los contenidos cient&icos y tecnol!gicos, de un lado y +umansticos y sociales, de otro) -n cuanto a materias indi(iduales, :atemticas es la ms im$ortante) - -l anlisis de las redes semnticas entre los di&erentes contenidos cient&icos muestra una densa red de relaciones entre ellos 'ue sobre$asa los lmites de las disci$linas acad7micas) -s decir, todas las disci$linas estn conectadas con contenidos gen7ricos 'ue $ueden ser rele(antes desde el $unto de (ista de la cultura de la inno(aci!n y el em$rendimiento) Eay, al menos a$arentemente, una e/ce$ci!n" :atemticas carece de relaciones signi&icati(as con el resto de las materias) Figura 2. Red semtica de las diferentes materias - 4tra caracterstica im$ortante es la clara $redominancia de las Tecnologas de la In&ormaci!n, desde el $unto de (ista de usuario, en el rea de -ducaci!n Tecnol!gica) - in embargo, +ay su&icientes elementos en los libros de te/to de la -4 'ue $ermiten conectar los contenidos cient&icos y tecnol!gicos con conce$tos rele(antes de la cultura del em$rendimiento y la inno(aci!n como, $or e.em$lo, los conce$tos gen7ricos de Conocimiento, Com$etiti(idad, Industria, #roducci!n, -conoma, etc) - -l anlisis manual de los contenidos identi&icados como Inno(aci!n y -m$rendimiento, Ciencia y Tecnologa re&uer2a la conclusi!n de 'ue los libros de te/to de la -nse5an2a 4bligatoria ecundaria se caracteri2an $or una (isi!n sesgada de la cultura cient&ica) %e un lado +ay muy $oca relaci!n entre los contenidos cient&icos y los tecnol!gicos6 de otro lado, +ay $oca relaci!n entre elementos intrnsecos y e/trnsecos de la cultura cient&ica) *os contenidos cient&icos no estn relacionados de &orma signi&icati(a con su a$licaci!n $rctica) F la tecnologa es $ercibida ms como un instrumento 'ue uno tiene 'ue a$render a usar 'ue como un con.unto de soluciones $rcticas basadas en el conocimiento cient&ico) 8dems, $arece +aber una di(isi!n en lo re&erente a la transmisi!n de la cultura cient&ica" los libros de ciencia $ro$orcionan conocimiento cient&ico, mientras los libros +umansticos y de ciencias sociales transmiten re$resentaciones de la ciencia y actitudes sobre la ella) Figura 3. Conceptos de Tecnologa - 8 $esar de todo esto, la $erce$ci!n de la ciencia transmitida a los estudiantes no es $esimista ni negati(a6 en realidad es o$timista, o $olari2ada entre ambas $osiciones ;(isi!n $ositi(a de la ciencia y (isi!n $esimista<) -n la &ase actual se est com$letando esta $arte con el anlisis de los libros de te/to de la asignatura Ciencias para el mundo contemporneo, del Bac+illerato, as como con nue(os libros de Ciencias y Tecnologa de $rimer y cuarto curso de la -nse5an2a ecundaria 4bligatoria) +oticias de ,rensa %e otro lado, se +a iniciado un estudio basado en noticias de $rensa relacionadas con la Ciencia y la Tecnologa) #or su mayor &acilidad $ara o$eraciones de tratamiento automtico se decidi! traba.ar con las (ersiones digitales de $eri!dicos de tirada nacional6 as, se seleccionaron los sitios Deb de -l #as, -l :undo y #,blico) -l ele(ado n,mero de documentos de $rensa dis$onibles +aca in(iable una selecci!n manual, $or lo 'ue se decidi! a$licar un clasi&icador 'ue seleccionase de &orma automtica las noticias o documentos 'ue tratasen, de una u otra &orma, sobre temas relacionados con la Ciencia y la Tecnologa) e trata de anali2ar un $erodo am$lio, el com$rendido entre 2002 y 2011) 9o se +an considerado todos los das de estos a5os, sino una muestra am$lia construida ad-+oc) -n el dise5o de esta muestra se +a $rocurado cubrir los di&erentes das de la semana a lo largo de todos los meses del a5o, de manera 'ue $ara cada diario se +an considerado unos C>0 das6 sal(o $ara #,blico, 'ue a$areci! en 200G) *a obtenci!n de las noticias $ara cada uno de esos C>0 das +a sido todo lo e/+austi(a $osible) #ero no +a sido sencilla, dada la estructura de los res$ecti(os $ortales Deb, $oco &a(orable a ello) -n e&ecto, +a sido $reciso em$lear t7cnicas de web scraping ;:oody et al, 2003<, siem$re dentro de la legalidad, limitndose a las $artes de acceso $,blico y abierto de dic+os $ortales) *a cantidad global de noticias de todas las secciones obtenidas $ara cada $eri!dico est re&le.ada en la tabla 1) 9oticias recogidas -l :undo CB)139 -l #as G>)3BC #,blico 2G)3AG !-!.L 1CG)CB> Tabla 1. Cantidad de noticias recogidas #ara la selecci!n de noticias en&ocadas a Ciencia yHo Tecnologa se +a utili2ado un clasi&icador automtico basado en algoritmos Naive Bayes, ;*angley et al), 1992< con algunas es$eci&icidades a5adidas $ro$ias del idioma es$a5ol) e trata de un algoritmo relati(amente sencillo, basado en estimaci!n de $robabilidades a $artir de las $alabras $resentes en una serie de documentos de muestra o entrenamiento, $ero 'ue +a demostrado alcan2ar ni(eles de $recisi!n tan ele(ados como otros algoritmos ms com$le.os ;:cCallum y 9igam, 199C<) -l $rinci$al $roblema de la a$licaci!n de clasi&icadores automticos es 'ue 7stos necesitan de una colecci!n de documentos $re-clasi&icados, de los cuales el $rograma in&ormtico a$rende a di&erencias unas clases de documentos de otras) -l tama5o de esta colecci!n de documentos de a$rendi2a.e o entrenamiento es im$ortante, y el resultado &inal del clasi&icador de$ende en buena medida del n,mero de documentos de entrenamiento dis$onibles) #ara construir dic+a colecci!n y reducir el $roceso de $re-clasi&icaci!n al m/imo se a$lic! un $rocedimiento de bootstrapping consistente en utili2ar los documentos de la secci!n de Ciencia y Tecnologa de -l :undo como entrenamiento inicial, y a$licarla al resto de las secciones de ese mismo diario, as como a los otros dos $eri!dicos) 3na muestra aleatoria de las noticias as obtenidas se re(is! manualmente y con ella se constituy! la colecci!n de entrenamiento a$licada &inalmente) Figura 4. Tamao de coleccin de entrenamiento y resultados del clasificador Como resultado &inal, 1G)AG3 noticias &ueron se5aladas $or el clasi&icador automtico como en&ocadas en Ciencia o Tecnologa) 3n anlisis manual de una muestra aleatoria de ellas mostr! una tasa de aciertos del 9>)1I) -n la actualidad se traba.a con una selecci!n de 1000 noticias clasi&icadas como de Ciencia y Tecnologa, $rocediendo a su anlisis cualitati(o) 8dicionalmente, es $osible someter los te/tos de las 1G)AG3 noticias con&irmadas como de Ciencia yHo Tecnologa a anlisis automticos a(an2ados) 3na de estas $osibilidades es lo 'ue se conoce como detecci!n de entidades nombradas ;named entities<) %e &orma gen7rica consiste en identi&icar elementos at!micos en un te/to y clasi&icarlos en di&erentes categoras ;$ersonas, instituciones, lugares, e(entos, acciones J<) *a Named Entity Recognition ;9-K< es uno de los elementos cla(es en el &uncionamiento del Deb semntico y e/isten en la actualidad di(ersos instrumentos in&ormticos 'ue $ermiten lle(arla a cabo) 3no de tales instrumentos es el ser(icio conocido penCalais, im$ulsado $or T+omson Keuters y 'ue o&rece buenos resultados $ara el idioma es$a5ol ;Castrillo -s$ina, 2013<) *a tabla 2 recoge las 1A entidades ms &recuentes de algunos de los ti$os en los 'ue se clasi&ican) Ti$o" Country -s$a5a -stados 3nidos C+ina Lrancia ?a$!n 8lemania Kusia Italia 8ustralia Canad India Brasil Keino 3nido C+ile #ortugal Ti$o" #erson Cristina 9arbona Ka&ael Bac+iller Meorge 0) Bus+ Barac1 4bama ?ane Moodall Furi Magarin 8l More C+arles %arDin te$+en EaD1ing -lena -s$inosa 8lbert -instein ?os7 *uis Kodrgue2 Na$atero Isabel II Cristina Marmendia Carlos %uarte Ti$o" 4rgani2ation 988 493 3ni!n -uro$ea Mreen$eace :inisterio de :edio 8mbiente 8gencia -s$acial -uro$ea 4rgani2aci!n :undial de la alud 39-C4 Conse.o u$erior de In(estigaciones Cient&icas 4: 3ni(ersidad de Cali&ornia Mobierno es$a5ol Casa Blanca :inisterio de anidad Conse.o de eguridad 9uclear Ti$o" Com$any -ndesa TDitter Moogle :icroso&t -%L Iberdrola Boeing ony ?et #ro$ulsion *aboratory Laceboo1 BBO8 9intendo 9o1ia IB: -//on Tabla !. Entidades nombradas ms "recuentes *a $osibilidad de $oner en relaci!n de coocurrencia unas entidades y otras, as como la de anali2ar la e(oluci!n tem$oral de la a$arici!n en $rensa de determinadas entidades resulta $rometedora) *a detecci!n automtica de temas ;to$ic detection< consiste en la a$licaci!n de t7cnicas automticas $ara identi&icar materiales ;&undamentalmente te/to, $or a+ora< temticamente relacionados ;?o et al), 200G6 ?o et al) 2010<) -l escenario t$ico es el de un &lu.o ms o menos continuo de documentos te/tuales, $or e.em$lo noticias de $rensa, o comentarios en redes sociales como TDitter ;Berrocal et al), 2013<) -s ob(io 'ue tales t7cnicas $ueden ser a$licadas a nuestra base de datos de noticias y $odran arro.ar resultados ,tiles) La Wikipedia *a Deb es un medio com$letamente no(edoso en el $anorama de la cultura cient&ica, al 'ue las encuestas y estudios tradicionales de comunicaci!n $,blica de la ciencia no +an $restado toda(a su&iciente atenci!n) u utili2aci!n $ara la elaboraci!n de indicadores de cultura cient&ica o&rece di&icultades es$ec&icas, $ero tambi7n resulta $rometedor $ara acceder a as$ectos de la cultura cient&ica actual 'ue no es &cil ca$tar $or otros medios) %entro de la Deb, la 0i1i$edia es un &en!meno digno de menci!n, en este conte/to) 8l tratarse de un diccionario enciclo$7dico elaborado y mantenido colecti(amente, a tra(7s de la Deb social, $uede ser muy ,til $ara re(elar detalles y caractersticas sobre la $erce$ci!n PsocialP del conocimiento cient&ico as como de la $artici$aci!n social en la elaboraci!n, uso y di&usi!n de 7ste)
3na de las (enta.as de la 0i1i$edia es su acceso abierto, incluso a sus caractersticas de organi2aci!n interna) -ntre otras cosas, es $osible descargar la base de datos com$leta, sin restricciones, de manera 'ue constituye una &uente de datos de incalculable (alor) 4rgani2ada, como es sabido, en idiomas, nos +emos centrado en la 0i1i$edia en es$a5ol, traba.ando, $or el momento, con los datos de enero de 2012) Eay en esa (ersi!n unos CB0)000 artculos o entradas, cada uno de los cuales est eti'uetado con una o (arias categoras6 7stas son cam$os temticos in&ormales, de manera 'ue cada editor es libre de asignar a cada artculo las categoras 'ue estime o$ortuno, as como de crear categoras nue(as ad-+oc) *a (ersi!n de la 0i1i$edia con 'ue traba.amos tiene unas B0)000 categoras e&ecti(as, una (e2 descartadas las $uramente administrati(as y las 'ue s!lo tienen uno o ning,n artculo) #or el momento, el $rinci$al $roblema con 'ue nos en&rentamos consiste en locali2ar las entradas relacionadas con Ciencia y Tecnologa, $resumiblemente una $e'ue5a $arte de esos CB3)000 artculos mencionados antes) %escartadas selecciones manuales a modo de muestreo, +emos decidido una $rimera a$ro/imaci!n a $artir de las categoras temticas, cuya cantidad es ms reducida) Eemos reco$ilado los artculos eti'uetados con cada una de las B0)000 categoras y +emos e/trado todos los +i$er(nculos e/istentes en esos artculos +acia otras entradas de la misma 0i1i$edia) %e &orma acumulati(a, esto nos +a $ermitido construir un gra&o de las relaciones o +i$erenlaces entre todas las categoras ;C+erno( et al), 200B<) *a a$licaci!n de t7cnicas de 8nlisis de Kedes ociales nos +a $ermitido obser(ar as$ectos interesantes sobre as$ectos del eti'uetado social, o sobre el di&erente &uncionamiento de eti'uetas o categoras trans(ersales &rente a otras de ti$o es$ec&ico) *a &igura A re$resenta la distribuci!n de categoras seg,n el n,mero de artculos, y claramente se (e 'ue sigue las leyes de la e/$onenciaci!n ;Broder et al), 20006 Ooss, 200A< mostrando &uertes seme.an2as con las distribuciones anali2adas $or Cattuto et al) ;200G< $ara otros casos de eti'uetado social) *a tabla 3 de otro lado, muestra las 1A categoras con mayor grado absoluto ;entendido como n,mero de categoras enla2adas, en un sentido o en otro<) -l carcter marcadamente trans(ersal es e(idente6 incluso en a'u7llas ms cercanas la Ciencia es $osible a$reciar ese carcter ;T7rminos Nool!gicos, Botnicos, Categoras Ta/on!micas, J<) -l 8nlisis de Kedes ociales nos +a $ermitido tambi7n a$licar algoritmos de %etecci!n de Comunidades6 las comunidades son gru$os de categoras &uertemente +i$erenla2adas entre s y $resumiblemente, $or tanto, a&ines temticamente) 8s, el algoritmo conocido como #n"omap ;Kos(all y Bergstrom, 200C< nos $ermiti! agru$ar las B0)000 categoras en C39 comunidades 'ue, al ser una cantidad $e'ue5a, +an $odido ser re(isadas de &orma manual $ara identi&icar las categoras relacionadas con la Ciencia y la Tecnologa) Qstas alcan2an la ci&ra de 3)>G1, y la cantidad de artculos o entradas 'ue contienen es de 21B)>A96 7sta es, en $rinci$io, la cantidad de entradas de Ciencia y Tecnologa 'ue contiene la 0i1i$edia en es$a5ol) in embargo, como indican EolloDay et al) ;200G<, una $arte num7ricamente im$ortante de los artculos estn elaborados de &orma automtica $or $rogramas im$ortantes a $artir de rboles ta/on!micos, listas de asteroides, censos $ostales, etc) Figura !. "istri#ucin log$log de categoras y n%mero de artculos Categora Mrado absoluto de enlaces #ersonasR(i(as >39>0 igloRXX 2A1CA 85osR1990 1GB>1 85osR2000 1BC21 igloRXIX 12021 85osR19C0 11GC3 MrandesRciudadesRdeR-s$a5a C310 -scritoresRenRes$a5ol GAAG T7rminosRdeRgeogra&a GAA1 -s$a5a G0>0 Categora Mrado absoluto de enlaces 85osR19G0 BBC3 #aseoRdeRlaRLamaRdeREollyDood BA0B T7rminosRbotnicos B>BA T7rminosR2ool!gicos B>>1 8ctoresRdeRcineRdeR-stadosR3nidos B22B #elculasRdeR-stadosR3nidos A9AB iglos A93> CategorasRta/on!micas AGGC 3nidadesRdeRlongitud A>9C Tabla $. Categor%as &i'ipedia con mayor grado de enlaces *a &igura B muestra el gra&o de todas las categoras de la 0i1i$edia, con a'u7llas 'ue son de Ciencia y Tecnologa marcadas en color ro.o) -l gra&o agru$a los +i$erenlaces entre todos los artculos de cada categora y est elaborado tendiendo a situar $r!/imas las categoras ms interenla2adas entre s) Claramente se a$recian n,cleos com$actos de categoras de Ciencia y Tecnologa ;tambi7n otros, corres$ondientes a otras reas temticas< 'ue $ueden ser anali2ados con mayor detalle, a ni(el de los artculos o entradas indi(iduales y sus enlaces) Figura &. 'as categoras de (i)ipedia seg%n sus enlaces -n esta &ase, $recisamente, se encuentra este as$ecto de nuestro $royecto6 $ero $arece &actible obtener in&ormaci!n de inter7s acerca de as$ectos como la am$litud de la cobertura de las di&erentes disci$linas o reas temticas y de la relaci!n de 7stas entre s) Tambi7n de las cone/iones de temas o reas cient&icas con otras 2onas temticas no cient&icas ni tecnol!gicas) %e otro lado, el mismo ti$o de anlisis a$licado a datos de &ec+as $osteriores ;$or e.em$lo, de 201>< y su com$araci!n con 7stos $odra resultar interesante) Conclusiones y traba/o futuro -n las $ginas $recedentes +emos descrito los datos reco$ilados, las &uentes y las metodologas de reco$ilaci!n y &iltrado, en su caso, utili2adas) 8lgunos de esos datos +an sido ya anali2ados a &ondo y +emos $odido e/traer (aliosas conclusiones" 7ste es el caso de los libros de te/to de la -nse5an2a ecundaria 4bligatoria es$a5ola, sin $er.uicio de nue(os anlisis) Con otros datos, como las noticias de $rensa o la 0i1i$edia, +emos &inali2ado la &ase de reco$ilaci!n y $re$araci!n y est en marc+a el anlisis de esas in&ormaciones) *as metodologas a a$licar en dic+o anlisis $arecen claras" anlisis cualitati(o manual en el caso de las noticias de $rensa, as como, desde el $unto de (ista automati2ado, detecci!n de temas, coocurrencia y tratamiento de entidades nombradas) -n el caso de la 0i1i$edia, a$licaci!n de t7cnicas de 8nlisis de Kedes ociales, adems de la utili2aci!n com$lementaria de t7cnicas cuantitati(as sim$les ;(isitas a los artculos, n,mero de edicionesHeditores, J<) in embargo, adems del estudio $or se$arado de los datos $ro$orcionados $or estas &uentes, tal (e2 e/iste la $osibilidad de (incular entre s algunas de ellas) -n e&ecto, las noticias de $rensa trasmiten e(entos relacionados con Ciencia y Tecnologa 'ue, en la medida en 'ue los medios se +acen eco de ellos, son re(eladores acerca de la manera en 'ue la gente $ercibe la cultura cient&ica y tecnol!gica) 8lgunos autores sugieren 'ue determinados e(entos $ueden tambi7n $roducir eco en la $ro$ia 0i1i$edia ;4sborn et al), 2012<" un aumento en las (isitas o consultas a determinados artculos, $ero tambi7n un aumento en el n,mero de ediciones de determinadas entradas, o incluso la a$arici!n de nue(os artculos de la 0i1i$edia Ses $osible con&irmar y e(aluar el e&ecto de ciertos e(entos y noticias en la 0i1i$ediaT *os datos dis$onibles in(itan a e/$lorar ese camino, y 7sta ser una de las tareas &uturas en nuestro $royecto) 0ibliorafa 8ibar, -) y :) 8) =uintanilla ;2002<) Cultura tecnol(gica ) estudios de ciencia*tecnolog%a y sociedad) Barcelona" IC- 3ni(ersidad de Barcelona 8lonso Berrocal, ?) *)6 Liguerola, C) M) y Na2o Kodrgue2, 8) L) ;2013<) K-I98 at Ke$*ab2013 To$ic %etection Tas1" Community %etection, C+E, !-1$* +ab on nline Reputation Management, +tt$"HHreina)usal)esHbiblioH&ilesHberrocal2013reina)$d& Broder, 8)6 Uumar, K)6 :ag+oul, L)6 Kag+a(an, #)6 Ka.ago$alan, )6 tata, K)6 Tom1ins, 8) y 0iener, ?) ;2000<) Mra$+ structure in t+e Deb, Computer networ's, 33 ;1<, 309-320 Castrillo -s$ina, :) ;2013<) 4$enCalais) %esarrollo de las tecnologas del lengua.e y utilidad del reconocimiento de entidades nombradas $ara la labor del documentalista, 3ni(ersidad de alamanca ;Tesis Lin de :ster<) +tt$"HHreina)usal)esHbiblioH&ilesHcastrillo2013o$encalais)$d& Cattuto, C)6 c+mit2, C)6 Baldassarri, 8)6 er(edio, O)6 *oreto, O)6 Eot+o, 8)6 Mra+l, :) y tumme, M) ;200G<) 9etDor1 $ro$erties o& &ol1sonomies, .# Communications, 20, 2>A- 2B2 C+erno(, )6 Io&ciu, T)6 9e.dl, 0) y N+ou, X) ;200B<) -/tracting emantics Kelations+i$s betDeen 0i1i$edia Categories) em0i1i, 200B, +tt$"HHciteseer/)ist)$su)eduH(ieDdocHdoDnloadTdoiV10)1)1)G3)AA0GWre$Vre$1Wty$eV$d& EolloDay, T)6 Bo2ice(ic, :) y BXrner, U) ;200G<) 8naly2ing and (isuali2ing t+e semantic co(erage o& 0i1i$edia and its aut+ors Com$le/ity, &iley nline +ibrary, 12, 30->0 ?o, F)6 *ago2e, C) y Miles, C) *) ;200G<) %etecting researc+ to$ics (ia t+e correlation betDeen gra$+s and te/ts, /roceedings o" t0e 1$t0 .CM 1#2344 international con"erence on 3nowledge discovery and data mining, 3G0-3G9 ?o, F)6 Eo$cro&t, ?) -) y *ago2e, C) ;2011<) T+e Deb o& to$ics" disco(ering t+e to$ology o& to$ic e(olution in a cor$us, /roceedings o" t0e !-t0 international con"erence on &orld wide web, 2AG-2BB *angley, #)6 Iba, 0) y T+om$son, U) ;1992<) 8n analysis o& bayesian classi&iers) /roceedings National Con"erence on .rti"icial #ntelligence) an 8ntonio, C8" 888I #ress and :IT #ress, 223Y22C :artne2, ?)C) ;2010<) +os "actores culturales y locales en los procesos de trans"erencia de tecnolog%a en un programa de cooperaci(n al desarrollo en la Rep5blica 4ominicana, +tt$"HH+dl)+andle)netH103BBHGBA21 :cCallum, 8) y 9igam, U) ;199C<) 8 com$arison o& e(ent models &or nai(e bayes te/t classi&ication) ...#-67 wor's0op on learning "or te8t categori9ation, >1->C) +tt$"HHDDD)1amalnigam)comH$a$ersHmultinomial-aaaiDs9C)$d& :onta57s, Z) ;2010<) /roblemas epistemol(gicos de la comunicaci(n p5blica de la ciencia) Instituto de -studios de la Ciencia y la Tecnologa) alamanca" 3ni(ersidad de alamanca) :oody, U) W #alomino, :) ;2003<) +ar$$ider" $idering t+e 0eb t+roug+ 0eb er(ices, ,irst +atin .merican &eb Congress, 219-221 4sborne, :)6 #etro(ic, )6 :cCreadie, K)6 :acdonald, C) y 4unis, I) ;2012<) Bieber no more" Lirst story detection using TDitter and 0i1i$edia 1#2#R !-1! &or's0op on Time- aware #n"ormation .ccess =uintanilla, :) 8) ;2000< T7cnica y cultura) Teorema, XOIIH3, >9-B9) =uintanilla Lisac, :) 8)6 *aDler, %)6 Mon2le2 Kodrgue2, :) %)6 :onta57s #erales, 4)6 :ontero Becerra, ?) 8) y #edrera M!me2, %) ?) ;200><) #ublic understanding, scienti&ic culture $erce$tion and ci(ic engagement indicators, cienti&ic UnoDledge and cultural di(ersity) /ublic communication o" science and tec0nology networ') IB9" C>->9G- 0122-C, $g" >33->3A) =uintanilla, :) 8) ;200A<) Tecnolog%a) :n en"o;ue "ilos("ico y otros ensayos de "iloso"%a de la tecnolog%a) :7/ico" Londo de Cultura -con!mica =uintanilla Lisac, :) 8)6 -scobar, :)6 :ontero, ?) 8) et al) ;2009<) +a cultura cient%"ica y tecnol(gica en los libros de te8to de la educaci(n secundaria obligatoria ;%ocumento de Traba.o) Instituto -CFT<) =uintanilla, :)8) ;2012<) Cultura, Tecnologa e inno(aci!n) -n -) 8ibar W :) 8) =uintanilla ;-ds)<, Ciencia* tecnolog%a y sociedad. Enciclopedia #beroamericana de ,iloso"%a) :adrid" Trotta) Kos(all, :) y Bergstrom, C) T) ;200C<) :a$s o& random Dal1s on com$le/ netDor1s re(eal community structure, /roceedings o" t0e National .cademy o" 1ciences, 9ational 8cademy o& ciences, 200C, 10A, 111C-1123)
Sistema de Información Integrado Basado en Tecnología Web para El Colegio de Ingenieros Del Perú - Consejo Departamental de Loreto (CIP - CDL) - 2014 PDF