Sei sulla pagina 1di 15

IX Congreso Iberoamericano de Indicadores de Ciencia y Tecnologa

9-11 octubre 2013, Bogot, Colombia


esi!n temtica" #erce$ci!n y a$ro$iaci!n social de la ciencia y la tecnologa
La cultura cientfica ms all de las encuestas:
Wikipedia, la prensa y los libros de texto
1
Carlos G. Fiuerola, !amar Gro"es, #iuel $nel %uintanilla
&nstituto 'ni"ersitario de (studios de la Ciencia y !ecnoloa, 'ni"ersidad de
)alamanca

*esumen
%ebido a la in&luencia 'ue los &actores culturales tienen en la articulaci!n de $olticas
de ciencia, tecnologa e inno(aci!n, es im$ortante com$render c!mo la sociedad
$ercibe la ciencia) *as encuestas son la +erramienta ms com,n $ara la e(aluaci!n de
la $erce$ci!n social de la ciencia, $ero la in&ormaci!n 'ue nos $ro$orcionan $uede ser
com$arada y com$lementada con otras &uentes) -n este traba.o describimos un
$royecto de in(estigaci!n, actualmente en marc+a, 'ue aborda la $erce$ci!n de la
ciencia e base a otros so$ortes de in&ormaci!n" la $rensa, los libros de te/to y la
0i1i$edia) #ara el anlisis de los contenidos en los di&erentes so$ortes utili2amos un
marco te!rico ,nico basado en el conce$to de cultura cient&ica)
3no de los ob.eti(os bsicos de nuestro $royecto es $robar la (alide2 del modelo de
cultura cient&ica $ara organi2ar una multi$licidad de contenidos y so$ortes de
in&ormaci!n) *a cantidad de in&ormaci!n cient&ica 'ue contienen estos tres so$ortes es
enorme) #ara $oder anali2arla es necesario em$lear $rocedimientos automticos de
locali2aci!n y almacena.e de in&ormaci!n) 4tro ob.eti(o de nuestro $royecto es $or lo
tanto crear una base documental de contenidos de cultura cient&ica en es$a5ol) -l
tercer ob.eti(o de nuestro $royecto es clasi&icar el contenido cient&ico de la base
documental seg,n nuestro modelo de cultura cient&ica con la idea de e/traer unos
indicadores de cultura cient&ica 'ue se $odran utili2ar en distintos conte/tos)
%ada la im$ortancia 'ue los &actores culturales tienen en la articulaci!n de $olticas de
ciencia, tecnologa e inno(aci!n, es im$ortante com$render c!mo la sociedad $ercibe
la ciencia) *as encuestas son la +erramienta ms com,n $ara la e(aluaci!n de la
$erce$ci!n social de la ciencia) -n nuestro $royecto de in(estigaci!n $retendemos
com$arar y com$lementar el uso de las encuestas con otros tres so$ortes de
in&ormaci!n" la $rensa, los libros de te/to y la 0i1i$edia) #ara el anlisis de los
contenidos en los di&erentes so$ortes utili2amos un marco te!rico ,nico basado en el
conce$to de cultura cient&ica)
-l $rimer ob.eti(o de nuestro $royecto es $robar la (alide2 del modelo de cultura
cient&ica $ara organi2ar una multi$licidad de contenidos y so$ortes de in&ormaci!n) *a
cantidad de in&ormaci!n cient&ica 'ue contienen estos tres so$ortes es enorme) #ara
$oder anali2arla es necesario em$lear $rocedimientos automticos de locali2aci!n y
almacena.e de in&ormaci!n) -l segundo ob.eti(o de nuestro $royecto es $or lo tanto
crear una base documental de contenidos de cultura cient&ica en es$a5ol) -l tercer
ob.eti(o de nuestro $royecto es clasi&icar el contenido cient&ico de la base documental
seg,n nuestro modelo de cultura cient&ica con la idea de e/traer unos indicadores de
cultura cient&ica 'ue se $odran utili2ar en distintos conte/tos)
#ara cada uno de los so$ortes +emos desarrollado una metodologa 'ue $ermite
clasi&icar su contenido seg,n nuestro modelo) -n el caso de la $rensa +emos usado
1
Este trabajo ha sido financiado por el Ministerio espaol, de Ciencia e Innovacin,
Subprograma de Proectos de Investigacin !undamental, ref" !!I#$11%#&&'(
anlisis de contenido) -n el caso de 0i1i$edia utili2amos $rocesos automticos de
recu$eraci!n y clasi&icaci!n y en el caso de los libros de te/to, mane.amos el $rograma
atlas-ti 'ue $ermite codi&icar a los $argra&os seg,n la $resencia y ausencia de
$alabras cla(es)
Toda(a estamos en las $rimeras eta$as de la in(estigaci!n6 sin embargo ya +emos
detectado 'ue mientras en los so$ortes tradicionales la cultura cient&ica est
caracteri2ada $or una di(isi!n disci$linar tradicional, en 0i1i$edia la distribuci!n de
contenidos no $arece de$ender solamente de las disci$linas acad7micas sino tambi7n
de $reocu$aciones sociales actuales) 8dems +emos (isto 'ue un &en!meno $arecido
$asa con los libros de te/to de la asignatura Ciencias para el Mundo Contempornea
'ue as$ira su$erar el aislamiento de la ense5an2a de la ciencia de sus im$licaciones
sociales)
(l modelo de Cultura Cientfica
9adie discute la im$ortancia de la di&usi!n $,blica de la ciencia y la tecnologa y de la
correlati(a $artici$aci!n del $,blico in&ormado en cuestiones y debates de inter7s en
relaci!n con la ciencia y la tecnologa) :uc+os de los grandes debates de nuestra
7$oca ;cambio climtico, seguridad, salud, ca$acidad inno(adora, etc)< son debates en
torno a cuestiones de carcter cient&ico) #ara $artici$ar en ellos de &orma racional y
e&ecti(a, se re'uiere 'ue la $oblaci!n tenga acceso a in&ormaci!n cient&ica y t7cnica
com$le.a, adems de 'ue e/istan cauces e instituciones adecuadas $ara canali2ar la
$artici$aci!n)
#or esta ra2!n +an ad'uirido cada (e2 ms im$ortancia los estudios de com$rensi!n
$,blica de la ciencia y las iniciati(as de $otenciaci!n de la comunicaci!n $,blica de la
ciencia) 8 $esar de lo muc+o 'ue se +a a(an2ado en este terreno, no e/isten a,n
resultados concluyentes 'ue nos $ermitan entender me.or los $rocesos de
comunicaci!n $,blica, su incidencia en las actitudes de la $oblaci!n +acia la ciencia y
la tecnologa ;:onta57s, 2010<)
-n este conte/to consideramos interesante desarrollar el conce$to de cultura cient&ica
'ue +emos utili2ado de &orma tentati(a en algunos estudios $re(ios ;=uintanilla, et al),
2009<) -ste conce$to es una e/tra$olaci!n del de cultura tecnol!gica utili2ado en
traba.os anteriores ;=uintanilla et al), 200><) -l n,cleo &undamental del modelo es la
distinci!n entre cultura tecnol!gica incor$orada a sistemas t7cnicos ;las reglas de
o$eraci!n de un sistema t7cnico, $or e.em$lo< y cultura tecnol!gica no incor$orada a
sistemas t7cnicos ;los &ines sociales $ara los 'ue se usa o se desarrolla una
tecnologa, $or e.em$lo<) -l $rimer com$onente de la cultura tecnol!gica es
inse$arable de la $ro$ia tecnologa, $ero el segundo es muc+o ms &le/ible y $uede
ado$tar di(ersas con&iguraciones, en &unci!n de otros elementos culturales de la
sociedad de re&erencia, dando as $ie a di&erentes $rocesos de desarrollo tecnol!gico
y de a$ro$iaci!n social de la tecnologa) -sta distinci!n es muy rele(ante $ara
entender los $rocesos de trans&erencia tecnol!gica entre sistemas culturales muy
di&erentes ;?) C) :artne2, 2010<, as como $ara me.orar nuestra com$rensi!n de c!mo
los &actores culturales inciden en la ca$acidad y la $ro$ensi!n a inno(ar de una
sociedad ;=uintanilla, 2012<) -l $ro$!sito actual es am$liar el modelo a la cultura
cient&ica en general ;no solo tecnol!gica<)
*a cultura cient&ica es a'uella $arte de la cultura de un gru$o social 'ue consiste en
in&ormaci!n relacionada y com$atible con la acti(idad cient&ica) e $ueden distinguir
dos ti$os de com$onentes en la cultura cient&ica" la ciencia $ro$iamente dic+a, $or
una $arte, y el resto de la in&ormaci!n, re$resentacional, $rctica o (alorati(a 'ue
&orma $arte de la cultura general del gru$o, y tiene 'ue (er con la ciencia aun'ue no
&orme $arte de la acti(idad cient&ica como tal) -n la cultura cient&ica as entendida
siem$re se $ueden distinguir dos ti$os de com$onentes" las creencias, reglas de
actuaci!n y (alores cient&icos $ro$iamente dic+os ;$odramos llamarlos a estos
cultura cient&ica en sentido estricto< y las creencias, reglas de actuaci!n y (alores
re&eridos a la ciencia y com$atibles con ella, aun'ue 'ue no &orman $arte de la ciencia
;cultura cient&ica en sentido lato<)
3na consecuencia interesante de todo esto es 'ue, en $rinci$io, $ara un mismo ni(el
del desarrollo de la ciencia, $uede +aber di&erentes con&iguraciones de la cultura
cient&ica en sentido lato) *a otra es 'ue si a$licamos reglas de consistencia $ara la
integraci!n de la in&ormaci!n cultural en con.untos co+erentes de in&ormaci!n,
tenemos 'ue ace$tar 'ue no cual'uier con&iguraci!n cultural es com$atible con el
estado real de la ciencia) -sto signi&ica algo muy sim$le" en &unci!n del estado real de
la ciencia $odemos establecer criterios e&ecti(os $ara de&inir 'u7 es una cultura
cient&ica adecuada ;es decir com$atible con el conocimiento cient&ico< en cada
momento)
*a base conce$tual es el modelo te!rico desarrollado en =uintanilla, 2000 y 8ibar y
=uintanilla, 2002) -n este modelo, cultura es de&inida como la in&ormaci!n
re$resentacional, $rctica y e(aluati(a transmitida a tra(7s del a$rendi2a.e social) 8s,
en nuestro modelo distinguimos tres ti$os de cultura" in&ormaci!n re$resentacional,
in&ormaci!n o$eracional e in&ormaci!n e(aluati(a) *a cultura cient&ica y tecnol!gica de
un $as se caracteri2a en los siguientes t7rminos"
Cultura cient&ica" la in&ormaci!n cultural relacionada con acti(idades cient&icas,
m7todos, resultados y su relaci!n con cual'uier otra acti(idad social) *a e/$resi!n
@cultura cient&ica@ la usamos a'u no $ara re&erirnos a la cultura $ro&esional de los
cient&icos, sino a la $arte de la cultura de un indi(iduo o de un colecti(o relati(a al
conocimiento y acti(idades cient&icos)
-l modelo distingue dos clases o ni(eles de cultura cient&ica 'ue $odemos denominar
como intrnseco y e/trnseco) -l $rimero se re&iere a com$onentes culturales
inmanentes a las acti(idades cient&icas" el conocimiento cient&ico en cada rea,
teoras debatidas $or los cient&icos, +ec+os descubiertos a tra(7s de la in(estigaci!n
cient&ica, e/$licaciones e inter$retaciones cient&icas de &en!menos naturales o
sociales) etc) Tambi7n se incluyen las normas del m7todo cient&ico, las normas de la
in(estigaci!n em$rica, la comunicaci!n cient&ica de los resultados de esa
in(estigaci!n, as como los (alores 'ue se su$one 'ue guan la acti(idad cient&ica ;la
ob.eti(idad, co+erencia, $recisi!n, etc)
-l ni(el e/trnseco se re&iere a todo lo re$resentacional, $rctico y e(aluati(o 'ue est
relacionado con las acti(idades cient&icas, asi como con las instituciones y $ersonas
'ue la lle(an a cabo, $ero 'ue no &orman $arte de la cultura cient&ica intrnseca) *a
imagen de la ciencia, en el sentido de c!mo la gente la $ercibe, la regulaci!n .urdica
de las instituciones cient&icas, la e(aluaci!n de la ciencia desde un $unto de (ista
cultural, moral, $oltico, religioso ))) Todo esto es $arte de lo 'ue entendemos como
cultura cient&ica e/trnseca)
Cultura tecnol!gica" es la in&ormaci!n cultural sobre sistemas t7cnicos, su
&uncionamiento, dise5o y $roducci!n y cual'uier otra clase de acti(idad relacionada
con la tecnologa) 9ue(amente, @cultura tecnol!gica@ signi&ica a'u no s!lo el
conocimiento $ro&esional de tecn!logos e ingenieros, sino tambi7n se re&iere a
com$onentes relati(os a la tecnologa, su in(enci!n, $roducci!n, di&usi!n y uso) 4tra
(e2 $odemos distinguir dos clases de cultura tecnol!gica, intrnseca y e/trnseca) *a
cultura tecnol!gica intrnseca $odra e/$licitarse como toda la in&ormaci!n cultural
necesaria $ara dise5ar, $roducir y usar adecuadamente un dis$ositi(o t7cnico) *a
e/trnseca, $or su $arte, sera toda la in&ormaci!n cultural ;creencias, normas,
actitudes y (alores< 'ue estn relacionados con los sistemas t7cnicos as como con las
acti(idades, conocimiento, $ersonas e instituciones 'ue dise5an, $roducen y di&unden
tecnologas6 $ero 'ue no &orman $arte de la tecnologa o del sistema t7cnico) #or
e.em$lo, las teoras y o$iniones sobre la in&luencia de la tecnologa de la in&ormaci!n
en la reducci!n de $uestos de traba.o en la industria)
*a distinci!n entre cultura intrnseca y e/trnseca es im$ortante $or'ue, como se +a
sugerido en otro lugar ;=uintanilla 200A, =uintanilla, 2012<, el ni(el de inno(aci!n de
un $as o de una em$resa de$ende, adems de otros &actores, de dos caractersticas"
la ca$acidad de inno(ar y la $ro$ensi!n a inno(ar) *a $rimera, la ca$acidad $ara
inno(ar, est directamente relacionada con el acceso lo 'ue +emos llamado cultura
cient&ica o tecnol!gica intrnseca, mientras 'ue la segunda, la tendencia a la
inno(aci!n de$ende ms de elementos de cultura cient&ica o tecnol!gica e/trnseca)
Los libros de texto
-ste traba.o se lle(a a cabo en dos &ases y su $ro$!sito es estudiar la $resencia de
cultura cient&ica y tecnol!gica, as como &actores de cultura inno(adora y
em$rendedora en los libros de te/to de la -nse5an2a ecundaria 4bligatoria en
-s$a5a, estudiantes entre 12-1B a5os de edad) -n una $rimera &ase se anali2aron C1
libros de las materias obligatorias y de algunas o$cionales durante los a5os 200A-
200B)
Figura 1. Prrafos de cada materia y editorial
-l anlisis de contenido de la base documental se reali2! a tra(7s de (arias &ases"
1) -laboraci!n de un t+esaurus de (ocabulario cient&ico de las $alabras cla(e 'ue
caracteri2an cada disci$lina) -ste $rocedimiento se reali2! obteniendo de &orma
automati2ada la lista de $alabras $resentes en cada te/to y com$arndolas con un
cor$us de re&erencia) -sto $ermiti! obtener una serie de listas de $alabras
;a$ro/imadamente setenta $ara cada asignatura< 'ue caracteri2an a los te/tos de
cada materia)
2) 8nlisis automtico de la $resencia del (ocabulario cient&ico con cada te/to de la
base documental a tra(7s del so&tDare 8tlas ti codi&icando de manera automtica cada
$rra&o seg,n se $resente o no alguna de las $alabras cla(e asignadas $ara cada
disci$lina) Con lo cual se cubre el $rimero de los ob.eti(os $lanteados)
3) e agru$aron te/tos de di(ersas disci$linas en los 'ue a$arecen contenidos de
cultura cient&ica, tecnol!gica e inno(aci!n a $artir de la codi&icaci!n automtica y se
lle(o a cabo un anlisis manual de los contenidos de cultura cient&ica, tecnol!gica y de
inno(aci!n 'ue a$arecen en este gru$o de te/tos)
>) 8nlisis de met&oras de $romesas y amena2as $resentes en los te/tos
seleccionados, es decir (aloraciones ante la ciencia ya sean $ositi(as o negati(as)
*as conclusiones $rinci$ales &ueron"
- Eay un e'uilibrio claro entre los contenidos cient&icos y tecnol!gicos, de un lado y
+umansticos y sociales, de otro) -n cuanto a materias indi(iduales, :atemticas es la
ms im$ortante)
- -l anlisis de las redes semnticas entre los di&erentes contenidos cient&icos
muestra una densa red de relaciones entre ellos 'ue sobre$asa los lmites de las
disci$linas acad7micas) -s decir, todas las disci$linas estn conectadas con
contenidos gen7ricos 'ue $ueden ser rele(antes desde el $unto de (ista de la cultura
de la inno(aci!n y el em$rendimiento) Eay, al menos a$arentemente, una e/ce$ci!n"
:atemticas carece de relaciones signi&icati(as con el resto de las materias)
Figura 2. Red semtica de las diferentes materias
- 4tra caracterstica im$ortante es la clara $redominancia de las Tecnologas de la
In&ormaci!n, desde el $unto de (ista de usuario, en el rea de -ducaci!n Tecnol!gica)
- in embargo, +ay su&icientes elementos en los libros de te/to de la -4 'ue
$ermiten conectar los contenidos cient&icos y tecnol!gicos con conce$tos rele(antes
de la cultura del em$rendimiento y la inno(aci!n como, $or e.em$lo, los conce$tos
gen7ricos de Conocimiento, Com$etiti(idad, Industria, #roducci!n, -conoma, etc)
- -l anlisis manual de los contenidos identi&icados como Inno(aci!n y
-m$rendimiento, Ciencia y Tecnologa re&uer2a la conclusi!n de 'ue los libros de te/to
de la -nse5an2a 4bligatoria ecundaria se caracteri2an $or una (isi!n sesgada de la
cultura cient&ica) %e un lado +ay muy $oca relaci!n entre los contenidos cient&icos y
los tecnol!gicos6 de otro lado, +ay $oca relaci!n entre elementos intrnsecos y
e/trnsecos de la cultura cient&ica) *os contenidos cient&icos no estn relacionados de
&orma signi&icati(a con su a$licaci!n $rctica) F la tecnologa es $ercibida ms como
un instrumento 'ue uno tiene 'ue a$render a usar 'ue como un con.unto de
soluciones $rcticas basadas en el conocimiento cient&ico) 8dems, $arece +aber una
di(isi!n en lo re&erente a la transmisi!n de la cultura cient&ica" los libros de ciencia
$ro$orcionan conocimiento cient&ico, mientras los libros +umansticos y de ciencias
sociales transmiten re$resentaciones de la ciencia y actitudes sobre la ella)
Figura 3. Conceptos de Tecnologa
- 8 $esar de todo esto, la $erce$ci!n de la ciencia transmitida a los estudiantes no es
$esimista ni negati(a6 en realidad es o$timista, o $olari2ada entre ambas $osiciones
;(isi!n $ositi(a de la ciencia y (isi!n $esimista<)
-n la &ase actual se est com$letando esta $arte con el anlisis de los libros de te/to
de la asignatura Ciencias para el mundo contemporneo, del Bac+illerato, as como
con nue(os libros de Ciencias y Tecnologa de $rimer y cuarto curso de la -nse5an2a
ecundaria 4bligatoria)
+oticias de ,rensa
%e otro lado, se +a iniciado un estudio basado en noticias de $rensa relacionadas con
la Ciencia y la Tecnologa) #or su mayor &acilidad $ara o$eraciones de tratamiento
automtico se decidi! traba.ar con las (ersiones digitales de $eri!dicos de tirada
nacional6 as, se seleccionaron los sitios Deb de -l #as, -l :undo y #,blico) -l
ele(ado n,mero de documentos de $rensa dis$onibles +aca in(iable una selecci!n
manual, $or lo 'ue se decidi! a$licar un clasi&icador 'ue seleccionase de &orma
automtica las noticias o documentos 'ue tratasen, de una u otra &orma, sobre temas
relacionados con la Ciencia y la Tecnologa)
e trata de anali2ar un $erodo am$lio, el com$rendido entre 2002 y 2011) 9o se +an
considerado todos los das de estos a5os, sino una muestra am$lia construida ad-+oc)
-n el dise5o de esta muestra se +a $rocurado cubrir los di&erentes das de la semana
a lo largo de todos los meses del a5o, de manera 'ue $ara cada diario se +an
considerado unos C>0 das6 sal(o $ara #,blico, 'ue a$areci! en 200G)
*a obtenci!n de las noticias $ara cada uno de esos C>0 das +a sido todo lo
e/+austi(a $osible) #ero no +a sido sencilla, dada la estructura de los res$ecti(os
$ortales Deb, $oco &a(orable a ello) -n e&ecto, +a sido $reciso em$lear t7cnicas de
web scraping ;:oody et al, 2003<, siem$re dentro de la legalidad, limitndose a las
$artes de acceso $,blico y abierto de dic+os $ortales) *a cantidad global de noticias
de todas las secciones obtenidas $ara cada $eri!dico est re&le.ada en la tabla 1)
9oticias recogidas
-l :undo CB)139
-l #as G>)3BC
#,blico 2G)3AG
!-!.L 1CG)CB>
Tabla 1. Cantidad de noticias recogidas
#ara la selecci!n de noticias en&ocadas a Ciencia yHo Tecnologa se +a utili2ado un
clasi&icador automtico basado en algoritmos Naive Bayes, ;*angley et al), 1992< con
algunas es$eci&icidades a5adidas $ro$ias del idioma es$a5ol) e trata de un algoritmo
relati(amente sencillo, basado en estimaci!n de $robabilidades a $artir de las $alabras
$resentes en una serie de documentos de muestra o entrenamiento, $ero 'ue +a
demostrado alcan2ar ni(eles de $recisi!n tan ele(ados como otros algoritmos ms
com$le.os ;:cCallum y 9igam, 199C<)
-l $rinci$al $roblema de la a$licaci!n de clasi&icadores automticos es 'ue 7stos
necesitan de una colecci!n de documentos $re-clasi&icados, de los cuales el $rograma
in&ormtico a$rende a di&erencias unas clases de documentos de otras) -l tama5o de
esta colecci!n de documentos de a$rendi2a.e o entrenamiento es im$ortante, y el
resultado &inal del clasi&icador de$ende en buena medida del n,mero de documentos
de entrenamiento dis$onibles) #ara construir dic+a colecci!n y reducir el $roceso de
$re-clasi&icaci!n al m/imo se a$lic! un $rocedimiento de bootstrapping consistente en
utili2ar los documentos de la secci!n de Ciencia y Tecnologa de -l :undo como
entrenamiento inicial, y a$licarla al resto de las secciones de ese mismo diario, as
como a los otros dos $eri!dicos) 3na muestra aleatoria de las noticias as obtenidas se
re(is! manualmente y con ella se constituy! la colecci!n de entrenamiento a$licada
&inalmente)
Figura 4. Tamao de coleccin de entrenamiento y resultados del
clasificador
Como resultado &inal, 1G)AG3 noticias &ueron se5aladas $or el clasi&icador automtico
como en&ocadas en Ciencia o Tecnologa) 3n anlisis manual de una muestra aleatoria
de ellas mostr! una tasa de aciertos del 9>)1I) -n la actualidad se traba.a con una
selecci!n de 1000 noticias clasi&icadas como de Ciencia y Tecnologa, $rocediendo a
su anlisis cualitati(o)
8dicionalmente, es $osible someter los te/tos de las 1G)AG3 noticias con&irmadas
como de Ciencia yHo Tecnologa a anlisis automticos a(an2ados) 3na de estas
$osibilidades es lo 'ue se conoce como detecci!n de entidades nombradas ;named
entities<) %e &orma gen7rica consiste en identi&icar elementos at!micos en un te/to y
clasi&icarlos en di&erentes categoras ;$ersonas, instituciones, lugares, e(entos,
acciones J<) *a Named Entity Recognition ;9-K< es uno de los elementos cla(es en
el &uncionamiento del Deb semntico y e/isten en la actualidad di(ersos instrumentos
in&ormticos 'ue $ermiten lle(arla a cabo)
3no de tales instrumentos es el ser(icio conocido penCalais, im$ulsado $or
T+omson Keuters y 'ue o&rece buenos resultados $ara el idioma es$a5ol ;Castrillo
-s$ina, 2013<) *a tabla 2 recoge las 1A entidades ms &recuentes de algunos de los
ti$os en los 'ue se clasi&ican)
Ti$o" Country -s$a5a
-stados 3nidos
C+ina
Lrancia
?a$!n
8lemania
Kusia
Italia
8ustralia
Canad
India
Brasil
Keino 3nido
C+ile
#ortugal
Ti$o" #erson Cristina 9arbona
Ka&ael Bac+iller
Meorge 0) Bus+
Barac1 4bama
?ane Moodall
Furi Magarin
8l More
C+arles %arDin
te$+en EaD1ing
-lena -s$inosa
8lbert -instein
?os7 *uis Kodrgue2 Na$atero
Isabel II
Cristina Marmendia
Carlos %uarte
Ti$o"
4rgani2ation
988
493
3ni!n -uro$ea
Mreen$eace
:inisterio de :edio 8mbiente
8gencia -s$acial -uro$ea
4rgani2aci!n :undial de la alud
39-C4
Conse.o u$erior de In(estigaciones Cient&icas
4:
3ni(ersidad de Cali&ornia
Mobierno es$a5ol
Casa Blanca
:inisterio de anidad
Conse.o de eguridad 9uclear
Ti$o" Com$any -ndesa
TDitter
Moogle
:icroso&t
-%L
Iberdrola
Boeing
ony
?et #ro$ulsion *aboratory
Laceboo1
BBO8
9intendo
9o1ia
IB:
-//on
Tabla !. Entidades nombradas ms "recuentes
*a $osibilidad de $oner en relaci!n de coocurrencia unas entidades y otras, as como
la de anali2ar la e(oluci!n tem$oral de la a$arici!n en $rensa de determinadas
entidades resulta $rometedora)
*a detecci!n automtica de temas ;to$ic detection< consiste en la a$licaci!n de
t7cnicas automticas $ara identi&icar materiales ;&undamentalmente te/to, $or a+ora<
temticamente relacionados ;?o et al), 200G6 ?o et al) 2010<) -l escenario t$ico es el
de un &lu.o ms o menos continuo de documentos te/tuales, $or e.em$lo noticias de
$rensa, o comentarios en redes sociales como TDitter ;Berrocal et al), 2013<) -s ob(io
'ue tales t7cnicas $ueden ser a$licadas a nuestra base de datos de noticias y $odran
arro.ar resultados ,tiles)
La Wikipedia
*a Deb es un medio com$letamente no(edoso en el $anorama de la cultura cient&ica,
al 'ue las encuestas y estudios tradicionales de comunicaci!n $,blica de la ciencia no
+an $restado toda(a su&iciente atenci!n) u utili2aci!n $ara la elaboraci!n de
indicadores de cultura cient&ica o&rece di&icultades es$ec&icas, $ero tambi7n resulta
$rometedor $ara acceder a as$ectos de la cultura cient&ica actual 'ue no es &cil
ca$tar $or otros medios) %entro de la Deb, la 0i1i$edia es un &en!meno digno de
menci!n, en este conte/to) 8l tratarse de un diccionario enciclo$7dico elaborado y
mantenido colecti(amente, a tra(7s de la Deb social, $uede ser muy ,til $ara re(elar
detalles y caractersticas sobre la $erce$ci!n PsocialP del conocimiento cient&ico as
como de la $artici$aci!n social en la elaboraci!n, uso y di&usi!n de 7ste)

3na de las (enta.as de la 0i1i$edia es su acceso abierto, incluso a sus caractersticas
de organi2aci!n interna) -ntre otras cosas, es $osible descargar la base de datos
com$leta, sin restricciones, de manera 'ue constituye una &uente de datos de
incalculable (alor) 4rgani2ada, como es sabido, en idiomas, nos +emos centrado en la
0i1i$edia en es$a5ol, traba.ando, $or el momento, con los datos de enero de 2012)
Eay en esa (ersi!n unos CB0)000 artculos o entradas, cada uno de los cuales est
eti'uetado con una o (arias categoras6 7stas son cam$os temticos in&ormales, de
manera 'ue cada editor es libre de asignar a cada artculo las categoras 'ue estime
o$ortuno, as como de crear categoras nue(as ad-+oc) *a (ersi!n de la 0i1i$edia con
'ue traba.amos tiene unas B0)000 categoras e&ecti(as, una (e2 descartadas las
$uramente administrati(as y las 'ue s!lo tienen uno o ning,n artculo)
#or el momento, el $rinci$al $roblema con 'ue nos en&rentamos consiste en locali2ar
las entradas relacionadas con Ciencia y Tecnologa, $resumiblemente una $e'ue5a
$arte de esos CB3)000 artculos mencionados antes) %escartadas selecciones
manuales a modo de muestreo, +emos decidido una $rimera a$ro/imaci!n a $artir de
las categoras temticas, cuya cantidad es ms reducida)
Eemos reco$ilado los artculos eti'uetados con cada una de las B0)000 categoras y
+emos e/trado todos los +i$er(nculos e/istentes en esos artculos +acia otras
entradas de la misma 0i1i$edia) %e &orma acumulati(a, esto nos +a $ermitido
construir un gra&o de las relaciones o +i$erenlaces entre todas las categoras ;C+erno(
et al), 200B<)
*a a$licaci!n de t7cnicas de 8nlisis de Kedes ociales nos +a $ermitido obser(ar
as$ectos interesantes sobre as$ectos del eti'uetado social, o sobre el di&erente
&uncionamiento de eti'uetas o categoras trans(ersales &rente a otras de ti$o
es$ec&ico) *a &igura A re$resenta la distribuci!n de categoras seg,n el n,mero de
artculos, y claramente se (e 'ue sigue las leyes de la e/$onenciaci!n ;Broder et al),
20006 Ooss, 200A< mostrando &uertes seme.an2as con las distribuciones anali2adas $or
Cattuto et al) ;200G< $ara otros casos de eti'uetado social) *a tabla 3 de otro lado,
muestra las 1A categoras con mayor grado absoluto ;entendido como n,mero de
categoras enla2adas, en un sentido o en otro<) -l carcter marcadamente trans(ersal
es e(idente6 incluso en a'u7llas ms cercanas la Ciencia es $osible a$reciar ese
carcter ;T7rminos Nool!gicos, Botnicos, Categoras Ta/on!micas, J<)
-l 8nlisis de Kedes ociales nos +a $ermitido tambi7n a$licar algoritmos de
%etecci!n de Comunidades6 las comunidades son gru$os de categoras &uertemente
+i$erenla2adas entre s y $resumiblemente, $or tanto, a&ines temticamente) 8s, el
algoritmo conocido como #n"omap ;Kos(all y Bergstrom, 200C< nos $ermiti! agru$ar
las B0)000 categoras en C39 comunidades 'ue, al ser una cantidad $e'ue5a, +an
$odido ser re(isadas de &orma manual $ara identi&icar las categoras relacionadas con
la Ciencia y la Tecnologa) Qstas alcan2an la ci&ra de 3)>G1, y la cantidad de artculos o
entradas 'ue contienen es de 21B)>A96 7sta es, en $rinci$io, la cantidad de entradas
de Ciencia y Tecnologa 'ue contiene la 0i1i$edia en es$a5ol) in embargo, como
indican EolloDay et al) ;200G<, una $arte num7ricamente im$ortante de los artculos
estn elaborados de &orma automtica $or $rogramas im$ortantes a $artir de rboles
ta/on!micos, listas de asteroides, censos $ostales, etc)
Figura !. "istri#ucin log$log de categoras y n%mero de artculos
Categora Mrado absoluto de enlaces
#ersonasR(i(as >39>0
igloRXX 2A1CA
85osR1990 1GB>1
85osR2000 1BC21
igloRXIX 12021
85osR19C0 11GC3
MrandesRciudadesRdeR-s$a5a C310
-scritoresRenRes$a5ol GAAG
T7rminosRdeRgeogra&a GAA1
-s$a5a G0>0
Categora Mrado absoluto de enlaces
85osR19G0 BBC3
#aseoRdeRlaRLamaRdeREollyDood BA0B
T7rminosRbotnicos B>BA
T7rminosR2ool!gicos B>>1
8ctoresRdeRcineRdeR-stadosR3nidos B22B
#elculasRdeR-stadosR3nidos A9AB
iglos A93>
CategorasRta/on!micas AGGC
3nidadesRdeRlongitud A>9C
Tabla $. Categor%as &i'ipedia con mayor grado de enlaces
*a &igura B muestra el gra&o de todas las categoras de la 0i1i$edia, con a'u7llas 'ue
son de Ciencia y Tecnologa marcadas en color ro.o) -l gra&o agru$a los +i$erenlaces
entre todos los artculos de cada categora y est elaborado tendiendo a situar
$r!/imas las categoras ms interenla2adas entre s) Claramente se a$recian n,cleos
com$actos de categoras de Ciencia y Tecnologa ;tambi7n otros, corres$ondientes a
otras reas temticas< 'ue $ueden ser anali2ados con mayor detalle, a ni(el de los
artculos o entradas indi(iduales y sus enlaces)
Figura &. 'as categoras de (i)ipedia seg%n sus enlaces
-n esta &ase, $recisamente, se encuentra este as$ecto de nuestro $royecto6 $ero
$arece &actible obtener in&ormaci!n de inter7s acerca de as$ectos como la am$litud de
la cobertura de las di&erentes disci$linas o reas temticas y de la relaci!n de 7stas
entre s) Tambi7n de las cone/iones de temas o reas cient&icas con otras 2onas
temticas no cient&icas ni tecnol!gicas) %e otro lado, el mismo ti$o de anlisis
a$licado a datos de &ec+as $osteriores ;$or e.em$lo, de 201>< y su com$araci!n con
7stos $odra resultar interesante)
Conclusiones y traba/o futuro
-n las $ginas $recedentes +emos descrito los datos reco$ilados, las &uentes y las
metodologas de reco$ilaci!n y &iltrado, en su caso, utili2adas) 8lgunos de esos datos
+an sido ya anali2ados a &ondo y +emos $odido e/traer (aliosas conclusiones" 7ste es
el caso de los libros de te/to de la -nse5an2a ecundaria 4bligatoria es$a5ola, sin
$er.uicio de nue(os anlisis)
Con otros datos, como las noticias de $rensa o la 0i1i$edia, +emos &inali2ado la &ase
de reco$ilaci!n y $re$araci!n y est en marc+a el anlisis de esas in&ormaciones) *as
metodologas a a$licar en dic+o anlisis $arecen claras" anlisis cualitati(o manual en
el caso de las noticias de $rensa, as como, desde el $unto de (ista automati2ado,
detecci!n de temas, coocurrencia y tratamiento de entidades nombradas) -n el caso
de la 0i1i$edia, a$licaci!n de t7cnicas de 8nlisis de Kedes ociales, adems de la
utili2aci!n com$lementaria de t7cnicas cuantitati(as sim$les ;(isitas a los artculos,
n,mero de edicionesHeditores, J<)
in embargo, adems del estudio $or se$arado de los datos $ro$orcionados $or estas
&uentes, tal (e2 e/iste la $osibilidad de (incular entre s algunas de ellas) -n e&ecto, las
noticias de $rensa trasmiten e(entos relacionados con Ciencia y Tecnologa 'ue, en la
medida en 'ue los medios se +acen eco de ellos, son re(eladores acerca de la
manera en 'ue la gente $ercibe la cultura cient&ica y tecnol!gica) 8lgunos autores
sugieren 'ue determinados e(entos $ueden tambi7n $roducir eco en la $ro$ia
0i1i$edia ;4sborn et al), 2012<" un aumento en las (isitas o consultas a determinados
artculos, $ero tambi7n un aumento en el n,mero de ediciones de determinadas
entradas, o incluso la a$arici!n de nue(os artculos de la 0i1i$edia Ses $osible
con&irmar y e(aluar el e&ecto de ciertos e(entos y noticias en la 0i1i$ediaT *os datos
dis$onibles in(itan a e/$lorar ese camino, y 7sta ser una de las tareas &uturas en
nuestro $royecto)
0ibliorafa
8ibar, -) y :) 8) =uintanilla ;2002<) Cultura tecnol(gica ) estudios de
ciencia*tecnolog%a y sociedad) Barcelona" IC- 3ni(ersidad de Barcelona
8lonso Berrocal, ?) *)6 Liguerola, C) M) y Na2o Kodrgue2, 8) L) ;2013<) K-I98 at
Ke$*ab2013 To$ic %etection Tas1" Community %etection, C+E, !-1$* +ab on nline
Reputation Management, +tt$"HHreina)usal)esHbiblioH&ilesHberrocal2013reina)$d&
Broder, 8)6 Uumar, K)6 :ag+oul, L)6 Kag+a(an, #)6 Ka.ago$alan, )6 tata, K)6 Tom1ins,
8) y 0iener, ?) ;2000<) Mra$+ structure in t+e Deb, Computer networ's, 33 ;1<, 309-320
Castrillo -s$ina, :) ;2013<) 4$enCalais) %esarrollo de las tecnologas del lengua.e y
utilidad del reconocimiento de entidades nombradas $ara la labor del documentalista,
3ni(ersidad de alamanca ;Tesis Lin de :ster<)
+tt$"HHreina)usal)esHbiblioH&ilesHcastrillo2013o$encalais)$d&
Cattuto, C)6 c+mit2, C)6 Baldassarri, 8)6 er(edio, O)6 *oreto, O)6 Eot+o, 8)6 Mra+l, :) y
tumme, M) ;200G<) 9etDor1 $ro$erties o& &ol1sonomies, .# Communications, 20, 2>A-
2B2
C+erno(, )6 Io&ciu, T)6 9e.dl, 0) y N+ou, X) ;200B<) -/tracting emantics Kelations+i$s
betDeen 0i1i$edia Categories) em0i1i, 200B,
+tt$"HHciteseer/)ist)$su)eduH(ieDdocHdoDnloadTdoiV10)1)1)G3)AA0GWre$Vre$1Wty$eV$d&
EolloDay, T)6 Bo2ice(ic, :) y BXrner, U) ;200G<) 8naly2ing and (isuali2ing t+e semantic
co(erage o& 0i1i$edia and its aut+ors Com$le/ity, &iley nline +ibrary, 12, 30->0
?o, F)6 *ago2e, C) y Miles, C) *) ;200G<) %etecting researc+ to$ics (ia t+e correlation
betDeen gra$+s and te/ts, /roceedings o" t0e 1$t0 .CM 1#2344 international
con"erence on 3nowledge discovery and data mining, 3G0-3G9
?o, F)6 Eo$cro&t, ?) -) y *ago2e, C) ;2011<) T+e Deb o& to$ics" disco(ering t+e to$ology
o& to$ic e(olution in a cor$us, /roceedings o" t0e !-t0 international con"erence on
&orld wide web, 2AG-2BB
*angley, #)6 Iba, 0) y T+om$son, U) ;1992<) 8n analysis o& bayesian classi&iers)
/roceedings National Con"erence on .rti"icial #ntelligence) an 8ntonio, C8" 888I
#ress and :IT #ress, 223Y22C
:artne2, ?)C) ;2010<) +os "actores culturales y locales en los procesos de
trans"erencia de tecnolog%a en un programa de cooperaci(n al desarrollo en la
Rep5blica 4ominicana, +tt$"HH+dl)+andle)netH103BBHGBA21
:cCallum, 8) y 9igam, U) ;199C<) 8 com$arison o& e(ent models &or nai(e bayes te/t
classi&ication) ...#-67 wor's0op on learning "or te8t categori9ation, >1->C)
+tt$"HHDDD)1amalnigam)comH$a$ersHmultinomial-aaaiDs9C)$d&
:onta57s, Z) ;2010<) /roblemas epistemol(gicos de la comunicaci(n p5blica de la
ciencia) Instituto de -studios de la Ciencia y la Tecnologa) alamanca" 3ni(ersidad de
alamanca)
:oody, U) W #alomino, :) ;2003<) +ar$$ider" $idering t+e 0eb t+roug+ 0eb
er(ices, ,irst +atin .merican &eb Congress, 219-221
4sborne, :)6 #etro(ic, )6 :cCreadie, K)6 :acdonald, C) y 4unis, I) ;2012<) Bieber no
more" Lirst story detection using TDitter and 0i1i$edia 1#2#R !-1! &or's0op on Time-
aware #n"ormation .ccess
=uintanilla, :) 8) ;2000< T7cnica y cultura) Teorema, XOIIH3, >9-B9)
=uintanilla Lisac, :) 8)6 *aDler, %)6 Mon2le2 Kodrgue2, :) %)6 :onta57s #erales, 4)6
:ontero Becerra, ?) 8) y #edrera M!me2, %) ?) ;200><) #ublic understanding, scienti&ic
culture $erce$tion and ci(ic engagement indicators, cienti&ic UnoDledge and cultural
di(ersity) /ublic communication o" science and tec0nology networ') IB9" C>->9G-
0122-C, $g" >33->3A)
=uintanilla, :) 8) ;200A<) Tecnolog%a) :n en"o;ue "ilos("ico y otros ensayos de "iloso"%a
de la tecnolog%a) :7/ico" Londo de Cultura -con!mica
=uintanilla Lisac, :) 8)6 -scobar, :)6 :ontero, ?) 8) et al) ;2009<) +a cultura cient%"ica y
tecnol(gica en los libros de te8to de la educaci(n secundaria obligatoria ;%ocumento
de Traba.o) Instituto -CFT<)
=uintanilla, :)8) ;2012<) Cultura, Tecnologa e inno(aci!n) -n -) 8ibar W :) 8)
=uintanilla ;-ds)<, Ciencia* tecnolog%a y sociedad. Enciclopedia #beroamericana de
,iloso"%a) :adrid" Trotta)
Kos(all, :) y Bergstrom, C) T) ;200C<) :a$s o& random Dal1s on com$le/ netDor1s
re(eal community structure, /roceedings o" t0e National .cademy o" 1ciences,
9ational 8cademy o& ciences, 200C, 10A, 111C-1123)

Potrebbero piacerti anche