Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DE MXICO
Paramispadres
yparatodosaquellosqueconfiaronenm.
Unamencinespecialparatodosytodaslosqueestnylosquehanentradoy
salidodemividadejandoalgo,yenparticular,aLeticia.
Un agradecimiento especial para el Doctor Gerardo Sierra por apoyarme en ste y otros
trabajos; a todos los integrantes del GIL por enriquecer a travs de los seminarios y el
trabajodiarioestatesis;tambinvanmisgraciasparalaDoctoraAnaMaraCardero,la
Maestra Margarita Palacios, la Maestra Adriana vila y la Maestra Alejandra Vigueras
porhaberaceptadoserpartedeesteproyectoyhaberlomejoradoconsusobservaciones.
NDICE
INTRODUCCIN
Antecedentes
de la UNAM
iii
Objetivo
iv
Organizacin
iv
1.
2.
La terminologa
11
13
1.2
Terminologa y lingstica
15
1.3
18
Extraccin de terminologa
21
2.2
25
26
29
31
ndice
2.3
3.
33
3.2
4.
Procesos de anlisis
36
37
40
43
3.1.4 Concordancia
45
47
Programas existentes
49
3.2.1 WordSmith
52
OBTENCIN DE LA TERMINOLOGA
4.1
55
56
4.1.2 El hipertexto
56
Listas de palabras
58
58
59
60
Palabras clave
62
62
63
4.4
64
4.5
Concordancia
69
4.6
4.2
4.3
colocaciones
70
73
ndice
5.
RESULTADOS
5.1
79
5.2
83
6. CONSIDERACIONES FINALES
6.1 Conclusiones
86
90
BIBLIOGRAFA
92
INTRODUCCIN
Antecedentes
El trabajo que enseguida se presenta es el resultado de la investigacin realizada durante la
estancia como becario del Grupo de Ingeniera Lingstica (GIL), dentro del Instituto de
Ingeniera de la UNAM. Entre las distintas actividades y proyectos que se trabajan al
interior del GIL, est un proyecto destinado a elaborar un diccionario onomasiolgico en el
rea de fsica como material de apoyo para los estudiantes que cursan el nivel bachillerato.
De dicho proyecto se desprende este trabajo, cuyo primer objetivo es el de entregar al GIL
la metodologa necesaria para extraer trminos de forma automtica y comprobar su
eficiencia al extraer los trminos concernientes a la subrea de mecnica. El objetivo
particular que se busca conseguir con este trabajo es el de presentar la investigacin
realizada para cumplir con el objetivo del proyecto del GIL, pero dentro de un proyecto de
tesis para obtener el grado de Licenciado en Lengua y literatura hispnicas; carrera que a
travs de su vertiente lingstica dota al alumno de conocimientos que le permiten ampliar
la visin y el estudio de problemticas que lo ataen directa e indirectamente en su relacin
consigo mismo y su entorno.
Introduccin
automtico. El material que compone este trabajo est pensado y divido implcitamente en
tres funciones. En la primera se establecen los fundamentos bsicos del tema que constituye
la materia prima del trabajo, la terminologa, y por consiguiente, los trminos. La segunda
funcin describe, una vez establecido lo que se pretende extraer, cmo la terminologa es
usada en apoyo a la ingeniera lingstica por medio de la aplicacin de herramientas
aprovechadas en programas de cmputo para extraer trminos. La ltima funcin detalla el
procedimiento que se llev a cabo para obtener la terminologa y los resultados obtenidos.
En un apartado del captulo 2 se hace mencin de algunos proyectos relacionados con la extraccin
automtica de trminos.
ii
Introduccin
sistemas para extraer trminos, no porque sta tarea sea la panacea, sino porque resulta,
adems de una disciplina de vasta explotacin, una herramienta bastante til para el
desarrollo y apoyo de otras reas de investigacin que no necesariamente tienen que ver
con la lingstica.
Esta tarea terminolgica cumple un papel muy importante al interior del GIL,
ah se desarrollan sistemas, metodologas, recursos y aplicaciones que explotan los recursos
que representa el aprovechamiento de la lingstica y sus distintas ramas de forma
interdisciplinaria y en beneficio de investigadores, profesionales, estudiantes y pblico en
general.
iii
Introduccin
Objetivo
El objetivo particular que se persigue con este trabajo (presentar esta
investigacin como proyecto de tesis), es el de estudiar la terminologa como teora
especializada en el anlisis de vocabularios tcnicos y cientficos 3 para aplicarla como
herramienta de la ingeniera lingstica, y aprovechar los usos que como herramienta de
apoyo representa en un trabajo de extraccin automtica.
En relacin con los trminos que se pretenden extraer, es necesario dejar muy en
claro que stos se restringen nicamente al nivel bachillerato y al material proporcionado
por el Centro de Instrumentos, llamado hipertexto; de forma que cualquier trmino que no
aparezca en l o que pertenezca a un nivel superior al bachillerato queda completamente
justificado en el entendido de que la extraccin est delimitada slo al hipertexto y al nivel
bachillerato.
Organizacin
El desarrollo que este material sigue, responde a las necesidades del objeto de
Vase Ana Mara Cardero. El procesamiento de una terminologa. Referencia especial a la terminologa de
control de satlites en el rea de las telecomunicaciones en Mxico. Tesis de doctorado. Mxico: 2001.
iv
Introduccin
1. describir los fundamentos bsicos de la materia que se encarga del estudio de las
unidades que se pretenden extraer, es decir, delinear los principios de la terminologa;
2. explicar el uso de la terminologa como recurso de la ingeniera lingstica a travs de
las herramientas diseadas para ejecutar cuestiones de extraccin terminolgica y la
aplicacin de stas a sistemas de cmputo;
3. aplicar las herramientas de extraccin terminolgica presentes en WordSmith para
obtener la terminologa requerida.
Introduccin
De esta forma, una vez finalizado este captulo se tendr en claro lo siguiente:
1. qu es una lista de palabras,
2. qu son y para qu sirven las listas de detencin,
3. qu son y cmo se obtienen las palabras clave,
4. qu es un anlisis de concordancia y para qu sirve,
5. qu es la informacin mutua y qu representa un anlisis por medio de esta
herramienta.
vi
Introduccin
Para conformar este captulo fue necesario realizar, con WordSmith, los anlisis
que deban arrojar la terminologa pretendida. Se detalla desde la obtencin del material,
cedido por el Centro de Instrumentos, el cual mediante los anlisis del programa
proporcionara la terminologa deseada. Se describen los procesos y anlisis llevados a
cabo, tal y como son la elaboracin de listas de palabras y de detencin, los procesos de
bsqueda de palabras clave, los anlisis de concordancia, adems de los hechos por medio
de informacin mutua que dieron como resultado obtener un total de trminos propuestos
para conformar el bloque dedicado a mecnica.
Se finaliza este captulo y el material de que consta este trabajo, con las
observaciones y evaluaciones que los del Centro de Instrumentos sugieren a los resultados
logrados en este trabajo.
De esta forma, las tres funciones implcitas de este trabajo quedan enmarcadas
de la siguiente forma:
a) la funcin primera dedicada a dar los fundamentos bsicos de la terminologa
corresponde al captulo1,
b) los captulos 2 y 3 afectan a la segunda funcin, diseada para establecer cmo la
terminologa es usada en esta investigacin como herramienta de apoyo a la
ingeniera lingstica,
c) la ltima funcin, dedicada a la obtencin de los trminos, equivale a los captulos 4
y 5.
Finalmente, se proporcionan las conclusiones derivadas de este trabajo, as
como los trabajos futuros que se desprenden de este material
4
Por razones de necesidad (haba que obtener una respuesta pronta de parte de gente especializada no tanto en
terminologa, sino en el rea de fsica, de los resultados conseguidos para no detener el proyecto principal), y
luego de tiempo (en el tiempo y espacio disponibles para realizar una tesis de licenciatura no es posible
abarcar todo lo que uno quisiera), no existi la posibilidad de evaluar la terminologa obtenida por medio de
reglas lingsticas.
vii
1.1 La terminologa
La investigacin que a continuacin se desarrolla tiene por objeto presentar una
terminologa concerniente al lxico empleado en la enseanza de la fsica a nivel
bachillerato. Para lograr este fin, a lo largo de los siguientes cinco captulos se trazan los
principios bsicos de lo que es la materia de estudio de este trabajo: terminologa, y por
tanto, trminos; as tambin, se describen las herramientas y algunos programas existentes
sobre la extraccin de trminos, adems de los procesos llevados a cabo para obtener la
terminologa de la que ms arriba se habla.
Por ejemplo, hay quienes definen las terminologas como vocabularios especiales,
los cuales son la llave para los especialistas en sus procesos comunicativos, donde el uso de
estas terminologas hace que su comunicacin sea ms eficaz. En cambio, hay quienes
juzgan las terminologas como una jerga por dems incomprensible para el pblico. Baste
como ejemplo mencionar las plticas entre mdicos.
A fin de cuentas, estas ideas podran resumirse como competencia lingstica, que
no es otra cosa que los conocimientos que un individuo tiene sobre una lengua; y en un
punto en que esta competencia lingstica es llevada a tal grado de especializacin como lo
son las terminologas, resulta de gran utilidad y provecho para aqullas que tienen su
campo de estudio y trabajo en el uso diario de trminos que deben representar slo un
concepto, objetos de sus desempeos laborales e intelectuales diarios, tal y como lo seala
Cardero cuando apunta que una terminologa en su concepcin ideal debe tratar de incluir
todos los trminos que empleen los profesionales de la ciencia o de la tcnica de que se
trate en una lengua 4 para facilitar la labor de stos y propiciar un nivel vasto de
entendimiento.
Christian Galinsky. Terminologa y sociedad moderna: el papel de INFOTERM. Las industrias de la lengua.
Madrid: Fundacin Germn Snchez Ruiprez, 1991. p. 243.
3
Juan Carlos Sager. La terminologa, puente entre varios mundos. Op. Cit. pp. 12 13.
4
Ana Mara Cardero. La integracin del corpus de la terminologa de control de satlites en Mxico. Actas
del lV simposio iberoamericano de terminologa RITerm. Terminologa y desarrollo. Tomo ll. Mxico, (1996)
p. 106.
5
Mara Teresa Cabr. Op. Cit. p. 37
Ahora bien, una vez sentadas las bases de la terminologa, es preciso dedicar un
apartado a la explicacin del objeto de estudio de la misma, los trminos; y ahondar en lo
posible sobre ella para, en la medida de nuestras posibilidades y de las necesidades de este
trabajo, dejar en claro la disciplina que se ocupa de la materia prima de la actual
investigacin.
Por otro lado, Cabr apunta que la diferencia entre palabra y trmino estriba en
que una palabra es una unidad descrita por un conjunto de caractersticas lingsticas
sistemticas y dotada de la propiedad de referirse a un elemento de la realidad 8 ; mientras
que un trmino es, una unidad de caractersticas lingsticas parecidas, utilizada en un
dominio de especialidad. [Por tanto] una palabra que forme parte de un mbito
especializado sera un trmino 9 .
Alicia Fedor de Diego. Terminologa teora y prctica. Venezuela: Universidad Simn Bolvar / Unin
Latina, 1995. p. 54 55.
7
Jos Vega. Herramientas lingsticas para la terminologa. Actas del lV simposio iberoamericano de
terminologa RITerm. Terminologa y desarrollo. Tomo ll, Argentina: (1994). p. 26.
8
Mara Teresa Cabr. Op. Cit. p. 87.
9
dem. p. 87.
10
Ver V. S Kulebakin y A. Klimovitskii. Los trabajos para la elaboracin de la terminologa cientfico
tcnica en la URSS y la Escuela de Terminologa Sovitica. Textos de terminlogos de la escuela rusa.
Barcelona: Institut Universitari de Lingstica Aplicada Pompeu Fabra, 2001, 61 - 87.
11
Ver V. S. Kulebakin y A. Klimovitskii. Op. Cit. pp. 61 - 87.
Mas ahora surge una interrogante muy fuerte, qu hay con aquellas palabras que
pueden entrar dentro de la categora tanto de palabras como de trminos, o cmo
diferenciar a los trminos [que] participan en varios campos 12 de conocimiento? Este
problema es al que Cardero se refera cuando hablaba del comportamiento semntico de
los trminos, las creaciones neolgicas, los problemas de normalizacin, los problemas
sociolingsticos y pragmticos 13 , que nos enfrentan al problema de la polisemia.
Este argumento muestra que una palabra polismica puede ser, dependiendo del
sentido en que es utilizada, un elemento especfico y diferenciador. En este caso, sntesis
entra dentro de campos de especializacin que le adjudican su carcter de trmino; pero si
12
13
esta misma unidad es usada en un contexto diferente, en donde por el carcter semntico de
su utilizacin no sea aplicado como elemento de especializacin, pierde la categora de
trmino, quedando slo como palabra.
Pero no es tan fcil aceptar estos postulados; por ejemplo, Alpizar seala en El
lxico de la terminologa. Algunas precisiones, que:
No obstante que esa es slo una posicin entre muchas, no deja de causar
inquietud o asombro. Por ejemplo, las ideas de Garca Palacios, quien plantea que dentro
de lo posible est tambin que en el fondo no nos encontremos ni ante palabras ni ante
14
Vase V. P. Danilenko. Sobre la posicin de la terminologa cientfica en el sistema lxico de una lengua.
Textos de terminlogos de la escuela rusa. Barcelona: Institut Universitari de Lingstica Aplicada Pompeu
Fabra, 2001, 19 28.
15
Rodolfo Alpizar Castillo. El lxico de la terminologa. Algunas precisiones. Actas del lV simposio
iberoamericano de terminologa RITerm. Terminologa y desarrollo. Tomo ll, Argentina: (1994). p. 79.
trminos, sino ante una especie de metalenguaje utilizado para referirnos a los nudos
clasificatorios. 16
Sin embargo, para diferenciar entre estas unidades, Cabr seala que existe otro
aspecto que permite diferenciar entre trminos y palabras: el sentido pragmtico, el cual
determina la diferencia entre trmino y palabra a partir de cuatro puntos 17 :
1. Usuarios
2. Situaciones de uso
3. Temtica
4. Contextos (discursos)
En cada uno de estos puntos tanto trmino como palabra son usados para referirse
a asuntos diferentes; por ejemplo, as como los trminos son usados por gente especializada
o dentro de un contexto de especialidad, las palabras son usadas a un nivel ms general en
donde los usuarios no necesitan comunicarse con unidades inequvocas. Respecto a las
situaciones de uso, un trmino se cie ms a situaciones cientficas que a coloquiales, que
son ms propias de las palabras. En cuanto a la temtica, los trminos cumplen una funcin
muy especfica que no cumplen las palabras; por ltimo, en cuanto a los contextos, tanto
trminos como palabras, son utilizados(as) con una categora particular que responde a las
necesidades del discurso. Todo esto no excluye el que trminos y palabras interacten en
cada uno en un sentido especfico, en los puntos que seala Cabr.
16 Joaqun Garca Palacios. La terminologa en los manuales de enseanza media: hacia la determinacin de
la terminologa bsica del espaol. Actas del V simposio iberoamericano de terminologa. Terminologa,
ciencia y tecnologa. Mxico, (1996). p. 153.
17
Mara Teresa Cabr. Op. Cit. pp. 88 89.
10
glido
radio
radioscopia
b) Por el tipo de morfemas de que estn constituidos los trminos complejos. stos
pueden ser derivados (formados por la agregacin de afijos a bases lxicas) y
compuestos (formados por combinaciones de bases lxicas. Actuales o histricas,
con la posibilidad de agregar posteriormente afijos a las mismas) 19 .
pisapapeles
limpiabotas
microfilmar
microfilmacin
dermatologa
dermatolgico
c) En relacin con los trminos complejos, stos pueden seguir estructuras sintcticas
definidas (tambin conocidos como locuciones en los trabajos de terminologa):
hora punta
18
Todos los trminos para ejemplificar las diferencias entre los tipos de trmino fueron tomados de la obra de
Cabr: La terminologa. Teora, metodologa y aplicaciones. 1993.
19
Mara Teresa Cabr. Op. Cit. p. 176.
11
informtica = informacin
automtica) 20 ,
20
Es de notar lo que Guadalupe Aguado de Cea seala respecto a estas categorizaciones; ella dice que no
existe un acuerdo unnime en torno al concepto de sigla, y los lmites con los conceptos de abreviatura y
acrnimo. Cit. en Franceschi, Mara Eugenia. La terminologa INTERNET. Actas del V simposio
iberoamericano de terminologa. Terminologa, ciencia y tecnologa. Mxico, (1996): 144 149. p. 147.
21
Rosa Estop. Elementos lingsticos de las unidades terminolgicas para su extraccin automtica. La
terminologa cientfico tcnica: reconocimiento, anlisis y extraccin de informacin formal y semntica.
Barcelona: Institut Universitari de Lingstica Aplicada Pompeu Fabra, 2001. p. 68.
22
Ana Mara Cardero. El procesamiento de una terminologa. Referencia especial a la terminologa de control
de satlites en el rea de las telecomunicaciones en Mxico. Tesis de doctorado. Mxico, 2001. p. 45.
12
hay una fijacin sintctica. Aparecen, acompaadas, en ocasiones, por marcas que
complementan su significado o que lo equivalen. Estas unidades lxicas adquieren valor de
trmino en un contexto o situacin especializada y representan un nudo de conocimiento
compacto en la estructuracin conceptual de un mbito especializado. 23
23
dem. p. 163.
Tambin es necesario manifestar que cuando se hable sobre trminos compuestos de dos o ms palabras, o
sintagmas, se adopt el trmino que utilizan Mara Teresa Cabr y Rosa Estop: terminologa polilxica.
25
Mara Teresa Cabr. Op. Cit. p. 169.
24
13
Debido a lo cual, los estudios y los rganos que voltean hacia ella son cada da
ms numerosos y exhaustivos.
El siguiente postulado, tomado de la norma DIN 26 , muestra el grado de
profundidad que deben presentar las terminologas, y dice que el lenguaje especializado es
el rea de la lengua que aspira a una comunicacin unvoca y libre de contradicciones en un
rea especializada determinada y cuyo funcionamiento encuentra un soporte decisivo en la
terminologa establecida 27 .
26
14
participan de esta rea para encaminarse a la consecucin de las metas propuestas; adems
de la formacin de profesionales comprometidos con el rea. Tambin en la UNAM, en el
campus de Acatln se desarrollan desde el inicio de la dcada de los 80 vocabularios
especializados.
29
15
Pero sta es slo una aproximacin y una teora que pueden compartir un cierto
grupo de personas; y que, aunque pudiese parecer general a simple vista, para el estudioso
no lo es; por ejemplo, Sager 31 habla de que respecto a su aplicacin, la terminologa est
relacionada con la lexicografa y aade que la terminologa comparte con la lexicografa
mtodos sobre la estructuracin y la descripcin de palabras.
30
Ver nota 1.
Juan Carlos Sager. Curso prctico sobre el procesamiento de la terminologa. Madrid: Fundacin Germn
Snchez Ruiprez y Ediciones Pirmide, 1993. p. 23.
31
16
En otro sentido, Rodolfo Alpizar maneja una concepcin muy particular, y vlida
sobre la terminologa y el plurisemntismo que encuentra en esta voz, en la que seala que
dado el carcter polismico de la palabra, sta ofrece una vaguedad y confusin que hacen
necesario un riguroso reajuste de preceptos. Por ejemplo habla de 32 :
Para sostener el argumento de que en tanto el concepto como el trmino sean ocupaciones
de la terminologa, sta debe ser estudiada en distintas vertientes. Habla tambin acerca del:
Tecnolecto: Conjunto de todos los recursos que la lengua pone a disposicin del
discurso cientfico o tcnico.
Y justifica el uso de ste, arguyendo que la terminologa es el estudio de una parte de los
recursos de un tecnolecto, que no es otra cosa que un conjunto de recursos lingsticos.
Mas, como el deseo en esta investigacin no es aclarar ste y otros problemas que
surgen respecto de la terminologa, sino dar los elementos bsicos sobre un tema que forma
parte del cuerpo central de la investigacin, se hace necesario slo el justificar la nocin a
priori de este apartado: el que la terminologa en tanto subcomponente de la lexicologa, e
32
17
Hasta hace poco era extravagante el pensar en relacionar por ejemplo la ingeniera
y la lingstica, dos reas desvinculadas desde siempre y que en esencia no tienen nada en
comn; no obstante sus directrices opuestas, la combinacin de sus recursos puede ayudar o
coadyuvar, con un nuevo enfoque, a la solucin de problemas. Ya antes se hizo mencin de
la diversidad de recursos con que cuenta la lingstica; si estos recursos se aplican a otras
reas como un apoyo, los horizontes de investigacin se ensanchan con perspectivas
diferentes, por ejemplo, una investigacin computacional encaminada a resolver problemas
de identificacin de recursos semnticos, en donde las reglas y algoritmos matemticos
seran coadyuvados con criterios y recursos lingsticos, en este caso semnticos y
gramaticales, para resolver problemas o identificar situaciones que desde un punto de vista
nicamente computacional, difcilmente seran contempladas. O la interaccin de patrones
lingsticos con reglas informticas para crear de forma rpida y eficiente un corpus
digitalizado para el anlisis gramatical del Quijote en forma electrnica. Esta interaccin
18
permitira obtener provecho tanto para las distintas reas de conocimiento con sus
especialistas, como para el comn de la gente, con un resultado de beneficio muy grande. Si
no fuese por esta interaccin, no tendra este procesador de textos que facilita y ahorra
cantidad de tiempo en la elaboracin de este escrito, sin mencionar las repercusiones
econmicas que este simple procesador de textos representa a quienes vieron la capacidad y
riqueza de investigacin que trajo la unin de reas de trabajo tan impensables: la
ingeniera y la lingstica.
Ahora bien, arriba se habl de que la ingeniera lingstica se vale de los distintos
recursos que le representa la ingeniera y la lingstica, con todas las reas y subreas que
33
19
las conforman; pues bien, una vertiente de esta investigacin se encamina hacia la
explotacin de una de estas reas, la termintica; la cual representa el soporte terminolgico
y el campo de investigacin para hacer que este soporte se vea alimentado en forma
eficiente y en lo posible, automtico, por procesos de extraccin de terminologa.
20
2.1
Extraccin de terminologa
Si tanto la disciplina como el objeto de estudio (terminologa y trmino respectivamente) no son tratados
profusamente, se debe a que este trabajo, que si bien es cierto est vinculado con la terminologa, no est
diseado ni trabajado para seguir lineamientos nicamente lingsticos, sino que la terminologa como
disciplina sirve como herramientas para resolver cuestiones desde un enfoque de la ingeniera lingstica. Por
tanto, baste con dejar en claro los elementos bsicos, que son la materia prima de este trabajo (trminos), y la
disciplina que los estudia (terminologa), para entender que lo que aqu se pretende es la extraccin de
trminos, no de lxico, de palabras, de informacin, etc.
2
En esta investigacin, se hablar de programa y/o software, para referirse a todo el sistema computacional
que trabaja con un conjunto de instrucciones que permiten a una computadora realizar determinadas
operaciones. Cfr. D.R.A.E 1995.
21
los tiempos que llevan al especialista, sea terminlogo, lexiclogo, lexicgrafo, etc., a
efectuar su labor y volverla ms sencilla.
Los resultados que tantos aos de investigacin han producido son hasta cierto
punto satisfactorios; sin embargo, existen tareas que tales programas no resuelven de modo
eficaz; y aunque, como apunta Cardero, la deteccin [y en este caso, la extraccin]
automatizada de trminos resulta del mayor inters para la terminologa, sobre todo en
etapas de inicio de acopio 4 , existe un consenso de parte de los usuarios de este tipo de
programas, quienes manifiestan que todava hay mucho sobre qu investigar con el fin de
mejorar estos programas, puesto que presentan deficiencias que hacen que el trabajo no sea
del todo automtico.
22
A problemas de este tipo han tenido que enfrentarse todos los que de alguna u otra
forma hayan trabajado en la extraccin automtica, y no exclusivamente de trminos, como
por ejemplo, Luis Fernando Lara y el equipo que junto con l se ha visto involucrado en el
desarrollo y elaboracin del Diccionario del Espaol de Mxico 8 (DEM), quienes en un
23
De aqu que no slo sea til, sino necesario profundizar y tratar de resolver estas
carencias o fallas que representan los extractores automticos, ya que los campos de accin
de las disciplinas cada da interactan de una manera ms activa y en beneficio de todos,
aunque, como indica Carlos Sager, los resultados de estos trabajos no tengan como fin
inmediato el hombre, sino las diferentes disciplinas que puedan satisfacer sus necesidades a
travs de los resultados terminolgicos, como es el caso de los estudios sobre ingeniera
lingstica, que se socorren de la terminologa para resolver las exigencias que se le
presentan en:
correctores de ortografa,
24
2.2
estadsticos,
10
25
Una vez que el programa aplica reglas estadsticas para realizar los procesos de
bsqueda, los resultados se presentan en diferentes tipos de listas: listas alfabticas, de
frecuencia o estadsticas; cada una con una funcin a desempear, segn las necesidades
del terminlogo o la investigacin, dentro del anlisis. Lara les atribuye los siguientes
beneficios 12 :
11
12
Vase Luis Fernando Lara, Roberto Ham Chande y Mara Isabel Garca Hidalgo. Op. Cit.
dem. p. 34.
26
Un problema muy comn con el empleo de este tipo de mtodos es con respecto a
los trminos que aparecen con muy baja frecuencia 13 :
The problem with this kind of approach is that there are lowfrequency terms difficult to be managed by extraction systems.
Here it is important to note that these systems use basically
numerical information and thus are prone to be language
independent.
estos
sistemas
usan
informacin
bsicamente
Trminos estos que no por tener una baja frecuencia dejan de ser trminos,
independiente de si representan mayor aporte para el correcto entendimiento de los textos o
no; recurdese que esto no es extraccin de informacin documental, en donde se pretende
la extraccin de informacin representativa del texto; sino extraccin de terminologa, y el
fin de sta es presentar los trminos que aparezcan en un corpus, aunque slo sea nombrado
una vez.
Otro punto en contra que tiene el mtodo estadstico, reside en el hecho de que es
muy probable que las unidades que conforman los trminos compuestos aparezcan muy por
debajo en los ndices de frecuencia, y por tanto, sean discriminadas con base en un criterio
13
27
multiword
terms
with
more
than
two
words.
Sin embargo, este mtodo no es del todo desdeable, por ejemplo, el equipo del
DEM opt por este mtodo, ya que ellos sealan como atributo el que ste es el nico
capaz de dar los registros necesarios y la cantidad de datos suficientes (...) de un modo
objetivo e imparcial 15 .
14
Gal Dias, Sylvie Guillor, Jean-Claude Bassano, Jos Gabriel Pereira Lopes. Combining Linguistics with
Statistics
for
Multiword
Term
Extraction:
A
Fruitful
Association?
[En
lnea.]
<http://citeseer.nj.nec.com/context/1674205/410737>
15
Luis Fernando Lara, Roberto Ham Chande y Mara Isabel Garca Hidalgo. Op. Cit. p. 12.
28
[Los
sistemas
completamente
lingsticos
proponen
16
17
29
como
preposicin-nombre.
nombre-adjetivo
nombre-
Esto
el
uso
requiere
de
18
dem. p. 55.
30
Los mtodos hbridos de algn modo solventan las carencias que por separado
presenta tanto el mtodo estadstico como el lingstico. Trabaja a partir de la interaccin
de criterios estadsticos y lingsticos para los anlisis de corpora.
31
trminos
de
modelos
sintcticos
controles
sintcticos
priori
definidos
(Sust+Adj,
acercamientos,
primero
identifican
controles
19
32
2.3
En la actualidad muchos son los proyectos e investigaciones que se han visto tanto
vinculados como beneficiados con la aplicacin de sistemas de extraccin de trminos.
Mucho de este beneficio se debe en gran medida a la creacin de bancos de datos
terminolgicos, que desde que se hace un uso mayor de stos, las labores de numerosos
profesionales, sin excluir al terminlogo, se han visto facilitadas y optimizadas hasta el
grado de que en la actualidad su uso, ya sea en investigacin como en industria, se hace
cada vez ms imprescindible.
33
Proyecto
ACORDEON 27 :
Aplicaciones
cooperativas
de
recuperacin
de
informacin.
20
Por razones de tiempo y espacio slo se har mencin de algunos proyectos. Para ms informacin acerca
de stos, se ponen a disposicin ligas de Internet a pie de pgina, en donde pueden ser consultados tales
proyectos.
21
Proyecto CRATER. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/proyectos/crater.html>
22
Proyecto GLOSMETAL. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/~flora/projects/glosmetal.html>
23
Proyecto RITerm BD. [En lnea]. <http://www.riterm.net/es/index.htm>
24
Proyecto HAL. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica, Lenguas
Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/docs_es/proyectos/APC.html>
25
Proyecto BN ARGENTINA. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de
Lingstica, Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/~fmarcos/informes/BNArgentina/BN.htm>
26
Proyecto PROTEUS. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/proyectos/proteus.html>
34
27
Proyecto ACORDEON. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/~ares/acordeon.html>
28
Proyecto C-ORAL-ROM. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/~sandoval/coralrom.html>
29
Proyecto ADMYTE. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/~fmarcos/informes/admyte/admyteix.html>
30
Proyecto ATILA. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica, Lenguas
Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/proyectos/atila.html>
31
Proyecto CREA. [En lnea]. <http://www.rae.es/NIVEL1/CREA.HTM>
32
Proyecto CON-TEXT. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/proyectos/context.html>
33
Proyecto EUROTRA. [En lnea]. En: Universidad Autnoma de Madrid. Departamento de Lingstica,
Lenguas Modernas, Lgica y Filosofa de la Ciencia y Teora de la literatura y Literatura
<http://www.lllf.uam.es/docs_es/proyectos/APC.html>
34
Proyecto SIIT VIRTUAL. [En lnea]. <http://www.riterm.net/es/index.htm>
35
3.1
Procesos de anlisis
En un apartado del captulo anterior se habl acerca de las distintas metodologas que
existen para realizar la extraccin de trminos (mtodos estadsticos, lingsticos e
hbridos); ahora, en este captulo, toca el turno de hablar sobre la aplicacin de estas
metodologas en programas computacionales, y en especfico, en el programa con el cual se
efectuaron los procesos de extraccin: WordSmith 1 .
Se hablar, para la aplicacin de los mtodos expuestos en el captulo 2, bsicamente sobre WordSmith,
porque es el programa que sirvi a esta investigacin; sin embargo, no se dejarn de lado la extensin de
beneficios a otros programas existentes, sin que esto signifique un dominio absoluto sobre el funcionamiento
de estos otros programas, ya que como en la introduccin se seala, el inters de este trabajo no reside en la
evaluacin ni de los mtodos ni de los programas que trabajan en la extraccin de trminos, ni tampoco hacer
una ponderacin de WordSmith, sino simplemente, sealar los diferentes usos, aplicaciones y beneficios que
presenta la extraccin automtica de trminos, independiente del programa o el mtodo utilizado.
36
Cabe sealar que en la actualidad la mayora de los programas que hacen uso de estas herramientas, emplean
una metodologa hbrida, apoyando las reglas lingsticas con elementos estadsticos o viceversa, con la
intencin de arrojar un mejor y ms sustentado resultado; aunque hay investigadores y, por tanto, programas
que prefieren hacer uso de un slo mtodo, sin que por ello dejen de ofrecer resultados.
3
Todas las ilustraciones que aparecen en este captulo corresponden a las ventanas con que se trabaja en
WordSmith.
4
Vase nota 12 en captulo 2.
37
H. P. Luhn. Potentialities of auto encoding of Scientific Literature. Yorktown Height: CBM, 1959. p. 5.
38
Estas listas de palabras son la base por medio de la cual WordSmith y algunos
programas realizan los procesos de extraccin e identificacin de trminos; dado que estos
programas trabajan a partir de listas de palabras; esto es, una vez que todas las palabras del
corpus estn organizadas, ya sea en orden alfabtico o de frecuencia, el programa puede
lematizar 6 , identificar las palabras clave, analizar una palabra en su contexto, calcular la
probabilidad de que dos palabras puedan aparecer juntas, etctera, y coadyuvar a la
extraccin de trminos.
La lematizacin es una herramienta que ofrece la posibilidad de simplificar las palabras resultantes mediante
el conteo por derivacin lxica, esto es, permite mediante procesos lingsticos unir dos o ms unidades a una
forma cannica o a alguna otra forma segn las necesidades; se pone por caso las palabras medimos, meda,
mide, y medir, que pueden ser consideradas variaciones de la forma medir, y analizadas todas esas formas
como una nica forma, en este caso, como medir.
7
La adaptacin del trmino ingls stop list es propio.
39
F. W. Lancaster. Vocabulary Control for Information Retrieval. Washington D.C.: Information Resources
Press, 1972. p. 154.
40
41
La aplicacin de estas listas logra reducir hasta un 50 por ciento del corpus, segn
palabras del mismo Lancaster; y el beneficio es obvio e inmediato. Al ser eliminado un
porcentaje alto de palabras como artculos, pronombres, etctera, que no presentan mayor
relevancia al anlisis, se puede al mismo tiempo y en un porcentaje alto estar seguro de que
se trabaja con palabras que representan mayor riqueza de anlisis (ver ilustracin 4 en
donde se aprecia como la lista se enriquece al desaparecer del conteo palabras que no
significativas, conservando ahora, en los primeros sitios, palabras que aportan mayor
significacin al anlisis); adems, en caso de que una palabra se haya dado por sentado de
que no es significativa y en verdad lo sea, el programa puede tomarla en cuenta para otros
procesos, como en palabras clave o concordancia, si la lista de detencin no es activada en
tales mdulos.
42
Ralf Steinberger. Cross - lingual Keyword Assignment. Procesamiento del lenguaje natural. Espaa: SEPLN
/ Universidad de Jan, 2001. p. 274.
43
Para obtener una lista de palabras clave es necesario contar con dos listas de
palabras de diferentes reas de conocimiento, esto, con el fin de eliminar en un porcentaje
alto las posibles coincidencias que una o varias palabras pudiesen tener en ambas listas,
como el ejemplo de movimiento, el cual pudiese aparecer tanto en fsica como en poesa; y
ya que estos inconvenientes no pueden eliminarse radicalmente, es recomendable elaborar
44
ms listas de palabras de diferentes reas con que comparar la lista principal, para as
reducir al mnimo el margen de coincidencias que pudiesen presentarse.
Una vez tenidas las listas de palabras, con las herramientas que en este caso
WordSmith ofrece, se realiza una comparacin de listas de palabras que mostrar en los
resultados un grupo de palabras significativas de cada lista; estas palabras representan la
columna vertebral del texto analizado, puesto que muestran en esta serie de palabras clave,
a grandes rasgos, el contenido del texto; tal y como sucede en Recuperacin de
Informacin, donde esta herramienta es utilizada en gran medida.
3.1.4 Concordancia
A concordance, in its simplest form, is an alphabetical listing of
the words in a text, given together with the contexts in which
they appear. The most common form of concordance today is the
Keyword-in-Context (KWIC) index, in which each word is
centered in a fixed-length field. 10
Lara seala en la investigacin para la creacin del DEM que no slo [les]
interesa obtener del anlisis de[l] corpus la lista alfabtica de los vocablos incluidos en l,
sino que tambin [interesa] conocer los contextos en que aparece utilizada cada palabra 11 .
Esto es, ver en los resultados cmo se comporta una palabra dada, a travs del anlisis del
10 Para mayores referencias sobre el tema y sobre KWIC, Vase:
http://www.georgetown.edu/cball/corpora/tutorial3.html
11
Vase Luis Fernando Lara, Roberto Ham Chande y Mara Isabel Garca Hidalgo. Op.cit. p. 30.
45
46
12
Sobre este tema y sobre ingeniera lingstica cfr. el manuscrito La informtica en el trabajo terminolgico.
Sierra, 2002.
47
[Los
sistemas
basados
en
estadstica
funcionan
constantemente
ms
arriba
de
un
nivel
los ya ofrecidos por las anteriores herramientas, puede mostrar algunos resultados bastante
interesantes adems de que abre otras lneas de investigacin para quien est interesado en
el tema.
13
Mara Teresa Cabr, Rosa Estop, Jordi Vivaldi. Recent advances in computational terminology.
Amsterdam / Philadelphia: John Benjamins B. V., 2001. p. 55.
14
Para profundizar en este tema y ver algunos resultados interesantes relacionados con informacin mutua y
otras medidas de extraccin, consultar el siguiente enlace:
http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/corpus3/3fra1.htm
48
3.2
Programas existentes
Esta necesidad por extraer trminos de manera automtica surge a finales de los
aos ochenta; la aparicin del programa TERMINO en 1990, marca un avance significativo
en el rea de extraccin terminolgica va procesos automticos y muestra resultados
alentadores 15 . Muchos son ahora los grupos 16 que tienen inters sobre el tema y que se
encuentran en el desarrollo de recursos para aprovechar los estudios, programas y la
infraestructura existentes, para dar a conocer nuevas tcnicas que redunden en el beneficio
de los terminlogos, de los profesionales que necesitan una terminologa inequvoca en sus
labores, de los estudiantes e incluso de la misma gente que carece de elementos con que
poder entender estas jergas.
free
unit;
3. identification of the terminological nature of a lexical unit, that
is, knowing whether in a specialised text a lexical unit has a
terminological nature or belongs to general language and
4. appropriateness of a terminological unit to a given vocabulary
(this has scarcely been addressed from the point of view of
automatization) 17 .
1.
dnde
empieza
acaba
terminolgica;
15
Vase Mara Teresa Cabr, Rosa Estop, Jordi Vivaldi. Op. Cit. p. 54.
Vase captulo 1.El rea terminolgica en nuestros das.
17
Mara Teresa Cabr, Rosa Estop, Jordi Vivaldi. Op. Cit. p. 54.
16
49
una
frase
2.
3.
4.
Otro gran problema de los extractores automticos de trminos es, como seala
Estop, que la mayora de extractores de terminologa se han centrado en la recuperacin
de las unidades terminolgicas polilxicas a travs de estrategias formales basadas en sus
patrones morfosintcticos 18 . Y como apunta Vivaldi, ningn sistema comprueba si el
trmino propuesto pertenece o no al mbito de especialidad que se est analizando 19 ; de
ah que salga a colacin la necesidad del uso correcto de las herramientas que dichos
programas ofrecen, puesto que la labor del terminlogo se incrementa en la medida en que
el programa presente estas carencias o en que estas carencias se hagan ms grandes si no se
hace una explotacin apropiada de los recursos existentes.
Mas con todo, el trabajo ah est y son constantes las investigaciones y el inters
por aprovechar las ventajas que la extraccin automtica de trminos presenta.
Ahora bien, el inters en este apartado es mencionar algunos de los programas que
tienen que ver directa o indirectamente con la extraccin de trminos. Y he dicho
18
Rosa Estop. Elementos lingsticos de las unidades terminolgicas para su extraccin automtica. La
terminologa cientfico tcnica: reconocimiento, anlisis y extraccin de informacin formal y semntica.
Barcelona: Institut Universitari de Lingstica Aplicada Pompeu Fabra, 2001. p. 68.
19
Jorge Vivaldi. Elaboracin de una aplicacin automtica de reconocimiento y extraccin de informacin
terminolgica en textos de dominios restringidos. La terminologa cientfico tcnica: reconocimiento,
anlisis y extraccin de informacin formal y semntica. Barcelona: Institut Universitari de Lingstica
Aplicada Pompeu Fabra, 2001. p. 230.
50
mencionar, porque por cuestiones de tiempo, espacio y por no salir del tema que ahora nos
ocupa y entrar en otro, se hace imposible una evaluacin de tales programas; mas para
quien est interesado se indican enlaces en donde se puede encontrar informacin detallada
y evaluaciones de los programas aludidos.
Cabe sealar que los programas referidos no siguen orden alguno para su
inclusin en este trabajo, ni son todos los que existen en el mercado; es slo una muestra
representativa de los recursos disponibles, algunos de ellos incluso son gratuitos en
Internet.
MonoConc Pro:
http://www.ruf.rice.edu/~barlow/mono.html#monopro
CONC:
http://www.sil.org/computing/conc/
ParaConc:
http://www.ruf.rice.edu/~barlow/parac.html
Hyperbase:
http://info.ox.ac.uk/ctitext/resguide/resources/h123.html
http://lolita.unice.fr/~brunet/hyperbase.html.
Lexa 6.0:
http://info.ox.ac.uk/ctitext/resguide/resources/l120.html
ANA 20
CLARIT
20
A partir de este programa y hasta el ltimo sealado, se puede encontrar una evaluacin detallada por
terminlogos y referencias hacia los documentos originales en: Cabr, Mara Teresa, Rosa Estop, Jordi
Vivaldi. Recent advances in computational terminology. Op. Cit. pp. 57-84.
51
Daille-94
FASTR
LEXTER
NAULLEAU
NEURAL
NODALIDA-95
TERMIGHT
TERMINO
TERMS
3.2.1 WordSmith
Como arriba queda sentado, el programa con el cual fueron efectuados todos los
anlisis de esta investigacin es WordSmith. Dicho programa es un software desarrollado
por Mike Scott en la Oxford University Press en la dcada de los 90,
52
1.
lista de palabras
2.
palabras clave
3.
concordancia
En estos mdulos el usuario puede hacer uso de las herramientas con que el
programa cuenta para reducir, dirigir y, en cierto sentido, comprobar los resultados que el
programa arroja mediante los propios recursos del programa. Entre los procesos con que
cuenta WordSmith para extraer trminos y que fueron utilizados dentro de esta
investigacin se encuentran:
etiquetado de palabras,
etctera.
53
54
4. OBTENCIN DE LA TERMINOLOGA
4.1
Como en la introduccin queda asentado, el fin ltimo del presente trabajo consiste en
presentar una terminologa bsica, obtenida con herramientas informticas y avalada por
expertos, relativa a la fsica a nivel bachillerato; esta investigacin se desprende de un
proyecto que el GIL realiza para implementar un diccionario de bsquedas onomasiolgicas
en el rea de fsica. Una de las metas del proyecto consiste en obtener la terminologa
relativa al rea de mecnica. Para lo cual, se realiz esta investigacin y se desprendi el
presente trabajo, el cual se enfoca hacia la extraccin de los trminos de mecnica en fsica.
Las siguientes metas en este rubro terminolgico, y que no son tratadas en esta tesis,
pretenden probar la metodologa empleada en este trabajo, y segn los resultados obtenidos,
implementar los trabajos de extraccin de trminos a completar todas las disciplinas que
conforman la fsica y extenderlos hacia otras reas de conocimiento como la lingstica, la
qumica, etc.
55
El material proporcionado fue elaborado con los fines de representar los recursos
terminolgicos y en algunos casos conceptuales del proyecto del GIL.
4.1.2 El hipertexto
El hipertexto 1 es la conformacin de los quince archivos proporcionados por el
Centro de Instrumentos, compuesto de 76,991 palabras (ilustracin 1). Fue conformado por
especialistas de fsica con la consigna de que el material que facilitasen debera ser
exclusivo para la enseanza y el estudio de la fsica en el nivel bachillerato, sin que esto
excluya que deban ser textos especializados en el rea, en este caso, de mecnica.
Es preciso sealar que toda la informacin que contena el hipertexto fue proporcionada bajo la premisa de
que el diccionario estara dirigido a los alumnos del nivel bachillerato. Por lo tanto, no se espere encontrar en
la terminologa resultante trminos que pertenezcan a un dominio ms profundo de la fsica y de sus subreas.
56
Una vez obtenido el material del que partiran los anlisis se iniciaron los procesos
que conforman la fase de extraccin.
Cabe hacer mencin de que el anlisis del hipertexto nunca fue manual, en ningn
momento se dio una lectura de la informacin que contena, como tampoco se hizo en los
materiales conseguidos para hacer comparaciones con ste. En este sentido, se realiz un
proceso automtico.
57
4.2
Listas de palabras
4.2.1 Procesos para la obtencin de listas de palabras
Hubo toda una serie de procesos y anlisis de prueba realizados con WordSmith para ver el funcionamiento
de ste y los posibles resultados que arrojaba, tanto en mecnica como en otras reas, sin embargo, tales
anlisis no sern detallados en este lugar.
58
A,ADEMS,ANTE,AUN,AN,AS,AQU,ALL,AH,ACERCA,AL,
AUNQUE,
AQUEL,AQUELLO,AQUELLA,AQUELLOS,AQUELLAS,AQUL,ALGO,
ALGN,
ALGUNA,ALGUNOS,ALGUNAS,ANTES,
BAJO,BIEN,BUENO,BUENA,BUENOS,BUENOS,
CABE,CASI,CON,CONTRA,COMO,CMO,CUAN,CUN,CUANTO,
CUNTO,
CUANDO,CUNDO,CUAL,CUL,CUALES,CULES,CADA,COMN,
CERCA,CERCANO
CIERTO,CIERTA,CIERTOS,CIERTAS,CUALQUIER,CUALQUIERA,
DE,DESDE,DONDE,DNDE,DEMS,DEL,DADO,DADA,DADAS,DADOS
DENTRO,DESPUS,
E,EL,L,ELLA,ELLO,ELLOS,ELLAS,EN,ENTRE,ESTO,ESTA,
ESTOS,ESTAS,ESTE,
STE,STA,STOS,STAS,ESO,ESA,ESE,ESOS,ESAS,SE,SA,
SOS,SAS,EMBARGO,
FUERA,FAVOR,GRAN,
HA,HACIA,HACA,HASTA,
IGUAL,IGUALMENTE,
LA,LO,LAS,LOS,LE,LES,LUEGO,
MI,M,MO,MIS,MAS,MS,MENOS,MAYOR,MENOR,MIENTRAS,
MUY,MUCHO,MUCHOS,MUCHA,MUCHAS,MAL,MISMO,MISMA,MISMOS
MISMAS,
NO,NI,NADA,NINGN,NINGUNA,NINGUNOS,NINGUNAS,NUNCA,
NOSOTROS,NOS
NUESTRO,NUESTRA,NUESTROS,NUESTRAS,
O,OTRO,OTRA,OTROS,OTRAS,
POR,PARA,PORQUE,PORQUS,POR QU,PARA QU,PERO,
QUE,QU,QUIZ,QUIZS,QUIEN,QUIENES,QUIN,
SEGN,SIN,SO,SOBRE,SI,S,SU,SUS,SUYA,SUYAS,SUYO,
SUYOS,SINO,SIEMPRE,
SOLO,SOLA,SOLOS,SOLAS,SLO,SE,
TODO,TODA,TODOS,TODAS,TAMBIN,TRAS,TRS,TAL,TANTO,T
TU,TI,TE,
TUYO,TUYA,TUYOS,TUYAS,TODAVA,TUS,TAN,TALES,
U,USTED,USTEDES,UN,UNA,UNOS,UNAS,UNO,
VEZ,
Y,YA,YO,
Ilustracin 2: Palabras funcionales de la lista de detencin aplicada al hipertexto
Ver nota 2.
59
Para corroborar esta idea, mejorar los supuestos que se tenan y aprovechar los
recursos disponibles, se hizo uso del mdulo dedicado a extraer palabras clave.
60
Nmero
Palabra
Frecuencia
1
MOVIMIENTO
107
2
FUERZA
93
3
VELOCIDAD
81
4
ENERGA
78
5
FIGURA
75
6
MASA
57
7
TIEMPO
54
8
ECUACIN
53
9
CUERPO
48
10
NEWTON
45
11
DOS
43
12
SISTEMA
42
13
DISTANCIA
41
14
X
41
15
T
40
16
TIENE
38
17
FUERZAS
37
18
FRICCIN
36
19
MOMENTO
36
20
PODEMOS
36
21
V
36
22
FORMA
35
23
ANGULAR
34
24
CENTRO
34
25
LEY
33
26
CONSERVACIN
32
27
PUEDE
32
28
TRABAJO
32
29
OBJETO
30
30
TENEMOS
30
31
ANTERIOR
29
32
CASO
29
33
PLANO
29
34
PRINCIPIO
28
35
DIRECCIN
26
36
SOL
26
37
ACELERACIN
25
Nmero
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
Palabra
CONSTANTE
M
R
F
PUNTO
CINTICA
CUERPOS
ECUACIONES
INCLINADO
ALTURA
CANTIDAD
MUESTRA
PARTCULAS
DECIR
VALOR
D
MPETU
LEYES
LINEAL
MUEVE
POTENCIAL
CERO
H
MECNICA
PROBLEMA
TOTAL
UNIFORME
VE
RO
ACCIN
NGULO
DEBE
DICE
ESCRIBIR
GALILEO
HEMOS
LADO
Frecuencia
24
24
23
21
21
20
20
20
20
19
19
19
19
18
18
17
17
17
17
17
17
16
16
16
16
16
16
16
15
14
14
14
14
14
14
14
14
61
4.3
Palabras clave
4.3.1 Elaboracin de listas de palabras alternas
Mara del Carmen Ruiz de la Cierva. Imagen intelectual de Octavio Paz. [En lnea]. En: Proyecto Ensayo
Hispanoamericano (2002). <http://ensayo.rom.uga.edu/filosofos/mexico/paz/ruiz/>
5
Gua de alimentacin y salud [En lnea]. En: Sociedad espaola de nutricin bsica y aplicada (2002).
<http://www.uned.es/pea-nutricion-y-dietetica-I/guia/index.htm>
62
Este proceso de bsqueda de palabras clave permite que dos listas sean
equiparadas a travs de procesos estadsticos y matemticos que actan estableciendo que si
una palabra aparece en un texto X pero no aparece en un texto Y o aparece muy poco en
relacin con el texto X, entonces esta palabra ser clave en el texto X, dado que el contraste
de aparicin en los textos X y Y supone que tal palabra debe ser significativa; pero si esta
misma palabra aparece en ambos textos, el proceso las anular de forma automtica, si es
significativa en ambos, bajo la regla de que como su aparicin es regular en uno y otro
texto, la posibilidad de que sea significativa se reduce sobremanera.
Conviene hacer mencin que los dos archivos obtenidos de la red con que se compar mecnica son ms
grandes en la extensin de su corpus; esto permite que el nmero de comparaciones de las palabras que
conforman mecnica sea mayor y las palabras clave resultantes ms especficas y confiables.
63
4.4
Lista 1
mecnica
mecnica
mecnica
mecnica
mecnica
mecnica
mecnica
mecnica
Lista 2
alimentacin
alimentacin
alimentacin
alimentacin
Paz
Paz
Paz
Paz
Palabras clave
529
113
85
25
499
128
60
5
Los resultados de esta lista de 1444 palabras mostraban que el nmero total de
palabras diferentes era de slo 606; esto quiere decir que algunas palabras estaban presentes
en todas las comparaciones y tenan una frecuencia de ocho debido a las ocho
64
comparaciones y haba otras que slo aparecan con frecuencia de uno. Este contraste en
el nmero de frecuencias se deba a los valores de bsqueda de las palabras clave, en
donde, en algunas comparaciones se tenan ms de 500 palabras y en otras apenas 5.
Valor de bsqueda
0.1
0.001
0.00001
0.0000000001
Palabra clave
MOVIMIENTO
MOVIMIENTO
MOVIMIENTO
MOVIMIENTO
FUERZA
FUERZA
FUERZA
FUERZA
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
FIGURA
FIGURA
FIGURA
FIGURA
ECUACIN
ECUACIN
ECUACIN
ECUACIN
MASA
MASA
MASA
MASA
NEWTON
NEWTON
NEWTON
NEWTON
DISTANCIA
DISTANCIA
DISTANCIA
DISTANCIA
FUERZAS
FUERZAS
FUERZAS
FUERZAS
FRICCIN
FRICCIN
FRICCIN
FRICCIN
CENTRO
CENTRO
CENTRO
CENTRO
LEY
LEY
LEY
LEY
CONSERVACIN
CONSERVACIN
CONSERVACIN
CONSERVACIN
TIEMPO
TIEMPO
TIEMPO
TIEMPO
PLANO
PLANO
PLANO
PLANO
ANGULAR
ANGULAR
ANGULAR
ANGULAR
DIRECCIN
DIRECCIN
DIRECCIN
DIRECCIN
Ilustracin 6: Primeras 20 palabras clave obtenidas de las cuatro comparaciones entre mecnica y
alimentacin
La tarea que a continuacin se presentaba, era que de esas 606 palabras se deban
descartar todas aqullas que no se relacionasen con mecnica o con fsica. Para realizar la
tarea se procedi a hacer una depuracin de las 606 palabras. La depuracin consisti, en
primer lugar, en eliminar todos los verbos, flexionados o en su forma cannica, que
aparecan como palabras clave, adems de todas las palabras que slo cumplan una funcin
discursiva 7 .
Para constatar que tales palabras cumplan slo una funcin discursiva, fueron sometidas a un proceso de
anlisis de concordancia para observar el comportamiento que presentaban en relacin con los contextos en
que aparecan dentro de mecnica.
65
Valor de bsqueda
Palabra clave
0.005
0.0001
0.000001
0.000000000000001
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
MOVIMIENTO
MOVIMIENTO
MOVIMIENTO
MOVIMIENTO
ENERGA
ENERGA
ENERGA
ENERGA
FUERZA
FUERZA
FUERZA
FUERZA
MASA
MASA
MASA
MASA
FIGURA
FIGURA
FIGURA
ECUACIN
ECUACIN
ECUACIN
NEWTON
NEWTON
NEWTON
DISTANCIA
DISTANCIA
DISTANCIA
FRICCIN
FRICCIN
FRICCIN
ANGULAR
ANGULAR
ANGULAR
CONSERVACIN
CONSERVACIN
CONSERVACIN
PLANO
PLANO
PLANO
SISTEMA
SISTEMA
SISTEMA
PODEMOS
PODEMOS
PODEMOS
ACELERACIN
ACELERACIN
ACELERACIN
LEY
LEY
LEY
TENEMOS
TENEMOS
TENEMOS
TRABAJO
TRABAJO
TRABAJO
CENTRO
CENTRO
CENTRO
PRINCIPIO
PRINCIPIO
PRINCIPIO
CUERPO
CUERPO
CUERPO
ECUACIONES
ECUACIONES
CINTICA
CUERPOS
CUERPOS
ECUACIONES
CINTICA
CINTICA
CUERPOS
FUERZAS
FUERZAS
FUERZAS
Ilustracin 7: Primeras 30 palabras clave obtenidas de las cuatro comparaciones entre mecnica y paz
El resultado de esta depuracin dio como resultado una lista compuesta por 218
palabras clave, todas ellas simples (ilustracin 8); sin contar con las siglas las cuales fueron
eliminadas despus de aplicarles un anlisis de concordancia que revelaba que stas no eran
usadas de manera general; cada una apareca en archivos diferentes del hipertexto y no se
repeta en algn otro; por tanto, no eran parte de una norma que fijase que tales siglas
deberan ser tenidas como trminos.
66
67
ACCIN
COTES
GRAVITACIONAL
OBJETO
RELACIN
ACELERACIN
CUALIDAD
HIELO
OBSERVACIN
RELATIVIDAD
ACELERADO
CUERPO
HIPOTENUSA
ONDA
REPOSO
ACERO
CURVA
HIPTESIS
OPUESTO
RESONANCIA
AFELIO
CHOQUE
HOOKE
RBITA
ROTACIN
AGUA
DESPLAZAMIENTO
HORIZONTAL
OSCILACIN
ROTACIONAL
AIRE
DESTELLO
MPETU
OSCILADOR
SATLITE
ALTURA
DA
INCIDENTE
PAR
SEGUNDA
AMORTIGUADO
DIMETRO
INCLINACIONES
PARABLICO
SENOIDAL
SENTIDO
SIMPLE
SIMULTANEIDAD
AMPLITUD
DIFRACCIN
INCLINADO
PARALELA
ANGULAR
DILATACIN
INERCIA
PARTCULA
NGULO
DIMENSIN
INFLUENCIA
PENDIENTE
APLICADA
DIRECCIN
INICIAL
PNDULO
ARCO
DISIPATIVAS
INTERACCIN
PERIHELIO
REA
DISTANCIA
INTERFERENCIA
PERODO
ARISTTELES
ECUACIN
INTERVALO
PERPENDICULAR
ARMNICO
EJE
KEPLER
PESAS
SPERA
ELCTRICA
LADO
PESO
ATRACCIN
ELIPSE
LMPARA
PLANETA
BALANZA
ELPTICAS
LEY
PLANETARIO
BALN
ELONGACIN
LIBRE
PLANO
CADA
ENERGA
LMITE
POSICIN
CALOR
EQUILIBRIO
LNEA
POSTULADO
CAMBIO
ESCALA
LINEAL
POTENCIA
CANTIDAD
ESFERA
LONGITUD
POTENCIAL
CARTESIANOS
ESPACIO
LORENTZ
PRECISIN
CAUSALIDAD
ESPECIAL
LUMINOSO
PREFACIO
CAUSA
ESTADO
LUNA
PRINCIPIO
TRABAJO
TRANSFORMACIN
CAVENDISH
ESTTICA
LUZ
PROPIEDAD
TRASLACIN
CELESTE
TER
MAGNITUD
PROPORCIONAL
TRAYECTORIA
CENTRPETA
EVENTOS
MARCO
PROYECCIN
TRINGULO
CENTRO
EXPERIMENTO
MAREA
PROYECTIL
TRILOGA
CINEMTICA
FASE
MASA
PTOLOMEO
UNIDAD
SISTEMA
SOL
SOLAR
SUPERFICIE
TANGENCIAL
TEORA
TRMICA
TRMINO
TIEMPO
TIERRA
TIPO
TIRO
TORSIN
CINTICA
FENMENOS
MATERIA
PULSOS
CIRCULAR
FSICA
MXIMA
PUNTO
UNIFORME
UNIFORMEMENTE
CRCULO
FOCO
MAXWELL
RADIO
UNIVERSAL
CIRCUNFERENCIA
FORMA
MECNICA
RAPIDEZ
VACO
COEFICIENTE
FRECUENCIA
MECANISMOS
RAYO
VALIDEZ
CONSERVACIN
FRICCIN
MEDIO
RAZN
VALOR
CONSERVATIVA
FUERZA
METAL
REACCIN
VARILLA
CONSTANTE
FUNCIN
MOMENTO
REALIZADO
VECTOR
CONTRACCIN
GALILEO
MVIL
RECTA
VELOCIDAD
COORDENADAS
GRAVEDAD
MOVIMIENTO
RECTNGULO
VIBRACIN
COPRNICO
GRAVITACIN
NEWTON
RECTILNEO
68
4.5
Concordancia
Cada una de las 218 palabras clave finales fue sometida a un anlisis de
concordancia con el fin de verificar que tuviesen una relacin con el rea pretendida. Los
anlisis fueron hechos desde mecnica para advertir cmo era el comportamiento de las
218 palabras en cada uno de los archivos del hipertexto.
69
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
4.6
Con la idea de despejar esta duda que las concordancias haban arrojado, se
procedi a ejecutar en cada una de las 218 palabras clave un anlisis por medio de
agrupamientos para examinar la conducta de cada una de ellas en relacin con el contexto
en que se encontraban dentro de los archivos del hipertexto 8 .
Estos anlisis fueron hechos sobre la lista mecnica, la cual contena los quince archivos del hipertexto.
70
CENTRO de masa
21
centro de MASA
19
el CENTRO de
10
el centro de
del CENTRO de
a la MASA
en el CENTRO
la MASA del
el CENTRO del
de MASA m
equilibrio CENTRO de
de MASA m#
su CENTRO de
de una MASA
causalidad CENTRO de
la velocidad del
CENTRO de equilibrio
proporcional a la
Ahora bien, de los posibles 218 trminos simples con que se contaba despus de
las comparaciones, resultaba interesante que los resultados de agrupamientos mostraran que
un porcentaje alto de la supuesta terminologa simple podra ser slo componente de la
terminologa polilxica.
71
L4
0
5
0
3
0
1
2
1
1
1
1
0
2
1
2
1
1
L3
1
1
0
9
1
5
0
0
0
1
0
0
0
0
0
1
0
L2
0
0
19
0
0
0
0
1
1
0
1
5
1
2
0
0
0
L1
0
17
0
0
0
0
4
0
0
0
0
0
0
0
0
0
0
*
57
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
R1
1
1
0
0
9
7
0
1
0
0
3
0
1
1
0
0
0
R2
0
1
1
1
2
2
0
4
5
0
3
2
0
1
0
1
3
R3
1
4
0
1
2
0
1
1
0
3
0
0
2
1
0
1
0
R4
0
5
0
0
2
0
1
2
3
1
1
1
2
1
1
0
1
R5
0
3
0
3
3
2
2
3
1
3
1
1
0
1
2
1
0
72
L4
2
0
0
1
1
4
1
2
2
1
0
1
0
L3
1
2
0
1
0
4
0
0
1
0
1
1
1
L2
5
0
0
0
1
1
5
2
0
0
1
0
2
L1
0
0
1
14
7
0
0
0
0
0
0
0
0
*
0
34
0
0
0
0
0
0
0
0
0
0
0
R1
25
0
0
0
3
0
1
0
0
0
0
1
0
R2
0
0
19
0
1
2
0
0
0
0
2
0
0
R3
2
2
0
1
2
1
1
1
2
4
0
1
0
R4
4
0
0
0
0
0
1
0
1
0
0
0
0
R5
2
0
1
2
0
2
0
0
0
1
1
0
1
73
Frecuencia
3
FUERZAS CONSERVATIVAS
FUERZAS DISIPATIVAS
MPETU LINEAL
MOMENTO ANGULAR
MOVIMIENTO ARMNICO
MOVIMIENTO RECTILNEO
RBITA CIRCULAR
RBITAS ELPTICAS
RBITAS PLANETARIAS
PLANO INCLINADO
PULSOS LUMINOSOS
RELATIVIDAD ESPECIAL
VELOCIDAD ANGULAR
VELOCIDAD CONSTANTE
6
11
15
3
13
3
4
6
2
2
3
3
3
3
17
16
2
7
2
2
2
20
6
2
11
7
Los resultados que estas ocho listas arrojaron muestran toda una serie de
candidatos a trminos polilxicos muy interesantes; en las Ilustraciones 14 a 18 se observa
cmo la mayora de las palabras clave se mezclan entre ellas para conformar posibles
trminos polilxicos que ya en los anlisis de concordancia se insinuaban.
Palabra
ACCIN A DISTANCIA
ARCO DE CIRCUNFERENCIA
BALANZA DE CAVENDISH
CAMBIO DE ENERGA
CENTRO DE MASA
COEFICIENTE DE FRICCIN
CONSERVACIN DEL MPETU
CONSERVACIN DEL MOMENTO
DIRECCIN DE MOVIMIENTO
ECUACIN DE CONSERVACIN
74
Frecuencia
2
3
3
3
19
5
3
3
4
7
ECUACIN DE MOVIMIENTO
ESTADO DE MOVIMIENTO
FUERZA DE ATRACCIN
FUERZA DE FRICCIN
LEY DE CONSERVACIN
LEY DE KEPLER
LEYES DE NEWTON
LEYES DEL MOVIMIENTO
MARCO DE REFERENCIA
MECNICA DE NEWTON
MOMENTO DE INERCIA
MOMENTO DE TORSIN
MOVIMIENTO CIRCULAR UNIFORME
MOVIMIENTO DE TRASLACIN
MOVIMIENTO RECTILINEO UNIFORME
MOVIMIENTO UNIFORMEMENTE
ACELERADO
PRINCIPIO DE CONSERVACIN
PRINCIPIO DE GALILEO
TIPO DE MOVIMIENTO
4
5
2
9
3
3
16
3
7
3
5
4
5
4
3
8
8
7
3
Las listas de dos hasta ocho palabras ayudaron a esclarecer la duda que el
comportamiento de las palabras clave en los anlisis de concordancia supona; y no
obstante que luego de los anlisis que se haban efectuado para obtener la terminologa
simple y polilxica, los resultados en cierta medida resultaban satisfactorios, se opt por
realizar una ltima prueba que constatara los trminos simples y sustentara de forma ms
slida los trminos polilxicos. Esta ltima prueba fue efectuada con la herramienta de
informacin mutua, explicada en captulos anteriores, con la cual se esperaba, si as lo
demostraban los resultados, cerrar los anlisis de esta investigacin.
Palabra
CONSERVACIN DE LA ENERGA
CONSERVACIN DEL MPETU LINEAL
CONSERVACIN DEL MOMENTO
ANGULAR
ECUACIONES DE LA ENERGA
FUERZA DE FRICCIN ESTTICA
MOVIMIENTO RECTILNEO Y UNIFORME
TEORA DE LAS CUALIDADES
Frecuencia
16
3
3
2
2
2
2
75
Palabra
CASO DE LA CADA LIBRE
CASO DEL MOVIMIENTO UNIFORMEMENTE ACELERADO
CUALIDADES OCULTAS EN LA MATERIA
ECUACIN DEL MOVIMIENTO UNIFORMEMENTE
ACELERADO
LEY DE LA GRAVITACIN UNIVERSAL
TEORA DE LAS CUALIDADES OCULTAS
TEORA ESPECIAL DE LA RELATIVIDAD
Frecuencia
2
2
2
2
2
2
2
Para realizar este anlisis final se volvi a hacer uso de mecnica, ya que en todos
los procesos practicados, como palabras clave, concordancia y dems, fue necesario contar
con los textos de los cuales se desprendan todas las palabras con las que se vena
trabajando; por consiguiente, en informacin mutua era necesario contar con toda la
informacin que se encontraba en el hipertexto, para que los clculos de probabilidad con
que trabaja esta herramienta estuviesen respaldados por los contextos en los que aparece
cada palabra clave.
Palabra
ECUACIN DE CONSERVACIN DE LA
ENERGA
PRINCIPIO DE CONSERVACIN DE LA
ENERGA
Frecuencia
3
3
76
que dos o ms palabras puedan aparecer juntas en un contexto determinado (ilustracin 19,
en donde los valores entre parntesis son los porcentajes de informacin mutua).
PALABRA
ACELERACIN
ACELERADO
RELACIN
RELACIN
RELACIN
RELACIN
RELACIN
RELACIN
RELACIN
centrpeta
diferente
q (4,26)
ahora (4,26)
acuerdo
cero (3,65))
cambio
(5.07)
(4,48)
uniformemente
rectilneo
(7,25)
(5,66)
pesas (4,88)
momento
(4,07)
curva (5,66)
eje (4,93)
uniforme
(3,61)
tipo (4,79)
(4,83)
movimiento
(3,83)
AFELIO
AIRE
ANGULAR
i (4,04)
satlite (3,81)
(4,77)
ARMNICO
ATRACCIN
simple (7,32)
gravitacional
tipo (5,66)
luna (4,66)
CENTRO
CIRCULAR
CRCULO
ecuaciones
movimiento
(5,39)
(3,38)
tierra (4,48)
cuerpos
partculas
(4,39)
(3,88)
sustituimos
aceleracin
fuerza
(6,12)
(5,8)
(3,17)
crculo (4,3)
Masa (4,11)
planetas
circunferencia
posicin
(4,04)
(3,88)
(3,75)
llama (4,93)
mvil (4,8)
uniforme
supongamos
rbita
(6,19)
(6,07)
(5,39)
perpendicular
Llama (5,93)
mvil (5,8)
(6,8)
CIRCUNFERENCIA
arco (6,58)
Iguales
radio (5,22)
direccin
velocidad
(4,69)
(3,05)
mueve (4,3)
centro
(5,58)
COEFICIENTE
friccin (5,22)
CONSERVACIN
fsica (4,71)
CUALIDADES
materia (7,65)
gira (3,75)
(3,81)
(6,47)
CENTRPETA
ahora
lnea (3,62)
mueve
movimiento
(4,32)
(3,97)
dice (3,49)
ley (3,25)
aplicar
mueve
(3,54)
(3,36)
(3,88)
Principio
problema
siguiente
energa
(4,6)
(4,03)
(3,59)
(3,59)
peso (3,8)
estado (3,8)
define (3,8)
Teora
(5,58)
CUERPO
pesas (4,39)
Realizado
(3,9)
Ilustracin 19: Fragmento de los resultados del anlisis de las palabras clave efectuado a travs de
informacin mutua
77
78
5. RESULTADOS
5.1
Por otro lado, es conveniente precisar que la terminologa que se obtuvo pretende
ser lo ms completa en el nivel especificado; sin embargo, no es exhaustiva debido a que el
campo de extraccin de los trminos se limit al material proporcionado por la gente
especializada del Centro de Instrumentos y que consta, como ya se ha anotado antes, de
slo quince archivos. Tambin es necesario aclarar que no se efectu un proceso de
extraccin en materiales ms especficos como diccionarios o enciclopedias sobre el tema,
puesto que ah la extraccin, y desde luego, la identificacin, hubiesen sido procesos de
antemano asegurados a un cien por ciento, aunque fuesen como en el caso presente,
semiautomticos; mas la cuestin es que se pretenda adems de extraer los trminos de
mecnica, probar una herramienta como WordSmith que fuese aplicable no slo a material
absoluto e integro sobre un tema o rea especfica, sino aprovecharlo en otras vertientes que
no necesariamente sean especializadas.
79
Captulo 5 Resultados
Ahora bien, los anlisis que se llevaron a cabo para obtener la terminologa
pretendida son, como en captulos anteriores se menciona, efectuados con el programa
WordSmith. Con este programa se pretenda, a partir del uso y explotacin de las distintas
herramientas con que cuenta, extraer la terminologa de mecnica presente en el hipertexto,
por medio de los mdulos de listas de palabras, palabras clave y concordancia.
ACCIN
DIFRACCIN
LNEA
ACELERACIN
DILATACIN
LONGITUD
AFELIO
DIMENSIN
LORENTZ
ALTURA
DINMICA
LUMINOSO
AMORTIGUADO
DIRECCIN
LUNA
AMPLITUD
DISTANCIA
LUZ
ANALOGA
ECUACIN
MAGNITUD
ANGULAR
EINSTEIN
MAREA
REA
EJE
MASA
ARISTTELES
ELONGACIN
MATERIA
BALN
ENERGA
MECNICA
CALOR
EQUILIBRIO
MECANISMO
CANTIDAD
ESFERA
MOMENTO
CARTESIANO
ESPACIO
MVIL
CAUSALIDAD
ESTTICA
MOVIMIENTO
CAUSALIDAD
TER
NEWTON
CAVENDISH
EXPERIMENTO
NEWTON (UNIDAD)
CENTRPETA
FSICA
OBJETO
CHOQUE
FRECUENCIA
OBSERVACIN
CINEMTICA
FRICCIN
OBSERVADOR
CINTICA
FUERZA
ONDA
CIRCULAR
FUNCIN
PTICA
CIRCUNFERENCIA
GALILEO
ORBITA
CONSERVACIN
GIRO
OSCILACIN
CONSTANTE
GRAVEDAD
OSCILADOR
CONTRACCIN
GRAVITACIN
PAR
COPRNICO
HIPOTENUSA
PARABLICO
COTES
HOOKE
PARTCULA
CRONMETRO
MPETU
PNDULO
CUADRADO
INCLINACIN
PERIHELIO
CUALIDAD
INERCIA
PERODO
CUERPO
INTERFERENCIA
PERPENDICULAR
CURVA
KEPLER
PESA
DESPLAZAMIENTO
LEY
PESO
80
Captulo 5 Resultados
PLANETA
RECTA
TIEMPO
PLANO
RECTNGULO
TIERRA
POSTULADO
RECTILNEO
TORCA
POTENCIA
RELATIVIDAD
TORSIN
PRINCIPIO
REPOSO
TRABAJO
PROPIEDAD
RESONANCIA
TRANSFORMACIN
PROPORCIONAL
RESORTE
TRASLACIN
PROYECTIL
REVOLUCIN
TRAYECTORIA
PTOLOMEO
ROTACIN
TRINGULO
PULSOS
SATLITE
UNIDAD
PUNTO
SEGUNDO
UNIFORME
RADIO
SIMULTANEIDAD
VECTOR
RAPIDEZ
SISTEMA
VELOCIDAD
RAYO
SOL
VIBRACIN
RAZN
SUPERFICIE
REACCIN
TEORA
ACELERACIN ANGULAR
ACELERACIN CENTRPETA
ARCO DE CIRCUNFERENCIA
CUERPO CELESTE
ATRACCIN GRAVITACIONAL
DA SOLAR
BALANZA DE CAVENDISH
DA SOLAR MEDIO
CADA LIBRE
CAMBIO DE ENERGA
CENTRO DE EQUILIBRIO
DIRECCIN DE UN VECTOR
CENTRO DE MASA
CHOQUE ELSTICO
ECUACIN DE CONSERVACIN
CHOQUE INELSTICO
COEFICIENTE DE FRICCIN
ECUACIONES DE LA ENERGA
COMPONENTE DE UN VECTOR
ECUACIONES DE MOVIMIENTO
CONSERVACIN DE LA ENERGA
EJE DE GIRO
EJE DE ROTACIN
81
Captulo 5 Resultados
ELPTICA
LEYES DE NEWTON
ENERGA CINTICA
LEYES DE NEWTON
ENERGA ELCTRICA
ENERGA INICIAL
MAGNITUD DE UN VECTOR
ENERGA MECNICA
MARCO DE REFERENCIA
ENERGA POTENCIAL
ENERGA QUMICA
MASA PUNTUAL
ENERGA TRMICA
MECNICA DE NEWTON
ESTADO DE MOVIMIENTO
MEDIO ELSTICO
ESTADO DE REPOSO
MOMENTO ANGULAR
EVENTOS SIMULTNEOS
MOMENTO DE INERCIA
FRECUENCIA DE RESONANCIA
MOMENTO DE TORSIN
FRECUENCIA NATURAL
MOVIMIENTO ARMNICO
FRICCIN CINTICA
FRICCIN ESTTICA
MOVIMIENTO CIRCULAR
FUERZA CENTRPETA
FUERZA CONSERVATIVA
FUERZA DE ATRACCIN
MOVIMIENTO DE TRASLACIN
MOVIMIENTO LINEAL
FUERZA DE FRICCIN
MOVIMIENTO RECTILNEO
MOVIMIENTO ROTACIONAL
FUERZA DE INERCIA
FUERZA DE MAREA
FUERZA DISIPATIVA
ONDA LUMINOSA
FUERZA FICTICIA
ONDA SENOIDAL
FUERZA GRAVITACIONAL
ORBITA CIRCULAR
FUERZA NORMAL
ORBITA ELPTICA
FUERZA PROPORCIONAL
RBITAS PLANETARIAS
FUERZA RESULTANTE
OSCILACIN FORZADA
FUERZAS CONSERVATIVAS
OSCILACIN LIBRE
FUERZAS DE FRICCIN
OSCILADOR ARMNICO
FUERZAS DISIPATIVAS
MPETU LINEAL
PLANO INCLINADO
LEY DE CONSERVACIN
PRINCIPIO DE CONSERVACIN
PRINCIPIO DE GALILEO
PRINCIPIO DE LA CAUSALIDAD
PULSOS LUMINOSOS
PUNTO DE EQUILIBRIO
LEYES DE KEPLER
RELATIVIDAD ESPECIAL
82
Captulo 5 Resultados
SENTIDO DE UN VECTOR
TERCERA LEY DE NEWTON
SISTEMA AMORTIGUADO
SISTEMA CONSERVATIVO
TIPO DE MOVIMIENTO
SISTEMA DE PARTCULAS
TIRO PARABLICO
TRANSFORMACIN DE LA MASA
SISTEMA DISIPATIVO
TRANSFORMACIN DE LORENTZ
SISTEMA FSICO
VELOCIDAD ANGULAR
SISTEMA MECNICO
VELOCIDAD CONSTANTE
SISTEMA VIBRATORIO
VELOCIDAD DE LA LUZ
TEORA DE LA RELATIVIDAD
VELOCIDAD INSTANTNEA
5.2
Idem.
83
Captulo 5 Resultados
trminos 3 que componen, segn los procesos realizados en este trabajo, la terminologa de
mecnica para el nivel bachillerato, fueron presentados a los expertos del Centro de
Instrumentos para que, como gente especializada sobre el tema, diesen su evaluacin. Para
la evaluacin de los expertos se sigui el mtodo Delphi 4 , consistente en este caso de un
solo ciclo, en donde cada uno de los expertos evalu la terminologa en privacidad, con el
fin de no haber influencias entre los expertos.
Cabe sealar que estas personas no se basaron en criterios lingsticos para emitir
su evaluacin, sino que sta fue dada con base en sus propias apreciaciones, sustentadas por
el conocimiento y experiencia en el rea, y bajo la premisa que se ha manifestado a lo largo
de este estudio: la terminologa est pensada slo para satisfacer las necesidades de
aprendizaje y fungir como material de apoyo para los estudiantes del nivel bachillerato.
Dicho lo anterior, estas son algunas de las observaciones 5 que los expertos 6
sealan a la terminologa obtenida en este trabajo:
deben ser consecuentes con el idioma en los nombres propios, esto es, si
usan Albert Einstein por qu no siguen el mismo criterio en Juan Kepler
Es preciso sealar que lo nico que se entreg a los expertos del Centro de Instrumentos fue la lista que
contena los 307 trminos resultantes. A excepcin de esta informacin que era necesaria para obtener una
evaluacin conforme a los requerimientos del proyecto del GIL, nada del material que compone esta tesis fue
puesto en manos de las personas del dicho centro.
4
Referencia al mtodo Delphi. Cfr. Makridakis, Spyros y Wheelwright. Forecasting Methods for
management. Wiley. 1989.
5
Las observaciones que los expertos hicieron luego de las evaluaciones no siguen un patrn de importancia
para insertarlas en este trabajo.
6
En total fueron cuatro expertos quienes evaluaron los trminos presentados.
84
Captulo 5 Resultados
Estas son las observaciones que los del Centro de Instrumentos devolvieron en las
copias que se les entregaron sobre la terminologa presentada. Hubo, de entre los cuatro
expertos, uno que no hizo ninguna observacin; slo al final de la terminologa, que fue
dada en forma alfabtica, pona un signo de paloma para los trminos que consideraba
adecuados, y un tache para los trminos que consideraba descartar.
Con esta evaluacin de los resultados se dio por concluido este trabajo.
Para este trabajo no se excluyeron los trminos que proponan los expertos y que para el diccionario se
descartaron. Aqu se presentan los 307 trminos finales que arroj la investigacin.
85
6. CONSIDERACIONES FINALES
6.1 Conclusiones
A pesar de los contratiempos y vicisitudes que supone la elaboracin y conclusin de un
proyecto de tesis, la etapa correspondiente a este trabajo se da por concluida, no sin
antes puntualizar lo que se llev a cabo a lo largo del desarrollo de cada captulo, y de
dar, a modo de conclusin, una serie de puntos que en la investigacin resultaron de
gran inters.
Qued claro qu es un trmino, tanto para los estudiosos como para esta
investigacin (trmino es una palabra que dentro de un dominio especfico, sea de
cualquier ndole [tcnico, cientfico, etc.], tiene la caracterstica de que slo puede
referirse a un concepto, no acepta sinonimia; y esta referencia debe ser inequvoca 2 ), y
las diferencias y caractersticas que lo distinguen de una palabra.
86
Por ltimo, en este captulo qued establecida la forma en que sera tratada la
terminologa, esto es, estudiar esta disciplina para aplicarla como herramienta de apoyo
a la ingeniera lingstica.
87
Barcelona:
Con este argumento que era apoyado por los resultados y la delimitacin
muy especfica del objeto de estudio, se realizaron todos los procesos y anlisis que
dieron como resultado la terminologa que se present en el captulo 5.
Citado en Luis Fernando Lara, Roberto Ham Chande y Mara Isabel Garca Hidalgo. Investigaciones
lingsticas en lexicografa. Mxico: COLMEX, 1979. p. 15.
88
Otro aspecto importante es que algunos terminlogos plantean una duda muy
fuerte en relacin con los lmites precisos de lo qu es un trmino; hay quienes
incluso aducen que no se trata siquiera de trminos o palabras, sino, de unidades
an no catalogadas.
Con respecto a las metodologas que existen para extraer trminos de forma auto
o semiautomtica, es preciso recalcar que an con la interaccin de ellas, es muy
difcil que presenten resultados cien por ciento satisfactorios.
Los mtodos lingsticos deben estar apoyados sobre gramticas que en sus
reglas quede muy claro, a la hora de ser aplicadas por un programa
computacional, los lmites precisos y las caractersticas que debe presentar cada
elemento de la oracin.
De lo anterior se deduce que hay una necesidad por adaptar, sino crear, una
gramtica que se ajuste a las necesidades de los extractores de trminos para que
la tarea, a fin de cuentas, sea lo ms automtica posible, adems de confiable.
89
tiene como fin identificar contextos definitorios, los cuales pueden coadyuvar a
la identificacin y extraccin de terminologa.
Por ltimo, es necesario hacer notar que debe haber una mayor adecuacin,
investigacin y compromiso sobre este tema, lo cual contribuira en beneficio de
terminlogos, profesionales, expertos, investigadores y pblico en general.
2.
3.
4.
obtener una evaluacin positiva y satisfactoria de los trminos obtenidos dada por
gente especializada en el rea a la que pertenece tal terminologa.
aprovechar las herramientas que se tienen a disposicin para crear o mejorar los
recursos para extraer trminos;
90
91
BIBLIGRAFA
Ball, Catherine. Concordances and Corpora. [En lnea] En: Department of linguistics
Georgetown
University
(1997).
<http://www.georgetown.edu/cball/corpora/tutorial3.html>
92
Barcelona:
Bibliografa
Cabr, Mara Teresa, Rosa Estop, Jordi Vivaldi. Recent Advances in Computational
Terminology. Didier Bourigault, Christian Jacquemin, MarieClaude LHomme
eds. Amsterdam / Philadelphia: John Benjamins B. V., 2001.
Cammelli, Antonio. Hacia una normalizacin terminolgica para una mejor redaccin
normativa. Actas del lV simposio iberoamericano de terminologa RITerm.
Terminologa y desarrollo. Tomo ll, Argentina: (1994): 37 42.
De los Ros Porras, E., et al. Aplicacin de las bases de datos orientadas a objetos a los
trabajos terminolgicos. Actas del lV simposio iberoamericano de terminologa
RITerm. Terminologa y desarrollo. Tomo l, Argentina: (1994): 33 36.
93
Bibliografa
Dias Gal, Sylvie Guillor, Jean-Claude Bassano, Jos Gabriel Pereira Lopes. Combining
Linguistics with Statistics for Multiword Term Extraction: A Fruitful Association?
en lnea. http://citeseer.nj.nec.com/context/1674205/410737
Diguez, Mara Isabel, e Ileana Cabrera Ponce. Estado de avance proyecto FONDECYT n
1960441: Traduccin automtica versus traduccin humana: variables que
inciden en la eleccin de uno u otro mtodo de traduccin con miras a optimizar el
tiempo, costo y calidad de la traduccin. Actas del V simposio iberoamericano de
terminologa. Terminologa, ciencia y tecnologa. Mxico, (1996):134 143.
Doyle, Lauren. Automatic Indexing. Information Retrieval and Processing. Los Angeles,
California: Melville Publishing Company, 1975. 291 300.
Fedor de Diego, Alicia. Algunas reflexiones sobre las polticas terminolgicas. Actas del
V simposio iberoamericano de terminologa. Terminologa, ciencia y tecnologa.
Mxico, (1996): 11a - 11d.
94
Bibliografa
Gua de alimentacin y salud [En lnea]. En: Sociedad espaola de nutricin bsica y
aplicada (2002). <http://www.uned.es/pea-nutricion-y-dietetica-I/guia/index.htm>
95
Bibliografa
Systems for Global Information Networks. India: FID/CR and Sarada Ranganathan
Endowment for Library Science, 1979. 363 368.
Lara, Luis Fernando, Roberto Ham Chande y Mara Isabel Garca Hidalgo. Investigaciones
lingsticas en lexicografa. Mxico: COLMEX, 1979.
Las industrias de la lengua. Dir. Jos Vidal Beneyto. trad. Manuel Alvar Ezquerra, et al.
Madrid: Fundacin Germn Snchez Ruiprez, 1991.
Lancaster
<http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/corpus3/3fra1.htm>
96
University
Bibliografa
Las
Prez, J. L., Miranda A., Garcs A., y Lara N. Hipertexto de fsica. En Ruiz G. (Ed.). SOMI
XIII, Mxico: Sociedad Mexicana de Instrumentacin, 1998, 325-329.
Prado, Daniel. RITerm, proyecto de nodos nacionales y regionales. Actas del lV simposio
iberoamericano de terminologa RITerm. Terminologa y desarrollo. Tomo ll,
Argentina: (1994): 43 45.
Literatura
<http://www.lllf.uam.es/~fmarcos/informes/admyte/admyteix.html>
<http://www.lllf.uam.es/proyectos/atila.html>
97
Bibliografa
Teora
de
la
literatura
Literatura
<http://www.lllf.uam.es/~fmarcos/informes/BNArgentina/BN.htm>
98
Bibliografa
Ruiz de la Cierva, Mara del Carmen. Imagen intelectual de Octavio Paz. [En lnea]. En:
Proyecto
Ensayo
Hispanoamericano
(2002).
<http://ensayo.rom.uga.edu/filosofos/mexico/paz/ruiz/>
Sager, Juan Carlos. Curso prctico sobre el procesamiento de la terminologa. trad. Laura
Chumillas Muya. Madrid: Fundacin Germn Snchez Ruiprez y Ediciones
Pirmide, 1993.
Sager, Juan Carlos. La terminologa, puente entre varios mundos, prlogo de la versin
espaola del libro de Mara Teresa Cabr. La terminologa. Teora, metodologa y
aplicaciones. Barcelona: Antrtida/Empries, 1993; pp. 11 1 7.
99
Bibliografa
Textos de terminlogos de la escuela rusa. Cabr, Mara Teresa, et al. Eds. Barcelona:
Institut Universitari de Lingstica Aplicada Pompeu Fabra, 2001.
100
Bibliografa
WordSmith. Lexical Analisys Software for Data-Driven Learning and Research [En lnea].
<http://www.liv.ac.uk/~ms2928/wordsmith>
WordSmith
[En
lnea].
En:
Oxford
University
Press
<http://www.oup.co.uk/elt/catalogu/multimed/4589846/4589846.html>
101
(2002).