Sei sulla pagina 1di 3

19/5/2014 Chantal Pérez, Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento

Estudios de Lingüística del Español (ELiEs)


Comité de Redacción

Volumen 18 (2002)
ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: ©Chantal Pérez

Explotación de los córpora textuales informatizados para la creación de bases de datos


terminológicas basadas en el conocimiento

M. Chantal Pérez Hernández

Universidad de Málaga

Índice general

1 INTRODUCCIÓN

1.1 Marco teórico y metodología de investigación


1.2 Delimitiación e integración de nuestra investigación en el marco del proyecto
OncoTerm

2 ESTUDIOS BASADOS EN CORPUS: LA NECESIDAD DE ESTUDIAR LA LENGUA EN USO

2.1 Planteamientos teóricos para la investigación basada en corpus


2.1.1 La dicotomía chomskiana frente a la teoría contextual del significado
2.1.2 La necesidad de estudiar el uso lingüístico
2.2 El corpus en los estudios lingüísticos
2.3 El concepto de corpus y su definición
2.3.1 Recopilación y diseño: representatividad del corpus
2.3.2 Tipología de córpora
2.3.3 Codificación (anotación y etiquetado) de los córpora
2.4 Recursos lingüísticos en Europa: iniciativas para la creación y distribución de
córpora y archivos textuales
2.4.1 Centros de investigación y asociaciones dedicadas a la creación de recursos
lingüísticos
2.4.2 Córpora y bancos de texto
2.4.2.1 Proyectos de creación de corpus en lengua inglesa
2.4.2.2 Proyectos de creación de corpus en lengua española
2.5 Análisis cualitativo y cuantitativo: herramientas para el tratamiento de los córpora
2.6 Herramientas básicas de manejo y análisis de córpora
2.7 Lexicografía basada en corpus
2.7.1 Los córpora textuales informatizados como fuente de información lexicográfica
2.7.2 Consideraciones sobre la lexicografía bilingüe y el uso de los córpora textuales
informatizados
2.8 Conclusiones y discusión

3 "-LOGÍAS" Y "-GRAFÍAS": DE LO GENERAL Y LO ESPECIALIZADO

3.1 La terminología: ciencia interdisciplinar


3.1.1 La importancia de la terminología en la sociedad de la información
3.1.2 Problemas y limitaciones de la terminología actual
3.2 Terminología descriptiva y prescriptiva (normalizadora)

http://elies.rediris.es/elies18/ 1/3
19/5/2014 Chantal Pérez, Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento

3.2.1 Normalización terminológica: esfuerzos de estandarización e instituciones


normalizadoras
3.2.2 Terminología descriptiva: el vínculo necesario entre realidad y normalización
3.3 Terminografía y lexicografía
3.3.1 El enfoque terminológico y el enfoque lexicográfico
3.3.2 Terminografía y lexicografía especializada: acercamiento de las dos disciplinas
3.4 La barrera entre lo general y lo especializado
3.4.1 Lengua general y lenguajes de especialidad
3.4.2 Palabras y términos
3.4.3 Diccionarios generales, diccionarios especializados y bancos terminológicos
3.5 Conclusiones y discusión

4 TERMINOGRAFÍA BASADA EN CORPUS: ASPECTOS FUNDAMENTALES DE LA GESTIÓN


TERMINOLÓGICA

4.1 DIMENSIONES QUE CONFORMAN LAS UNIDADES TERMINOLÓGICAS


4.1.1 Conceptos y términos
4.1.2 Unidades terminológicas y su dimensión conceptual
4.1.3 Unidades terminológicas y léxico: la dimensión lingüística
4.1.4 Unidades terminológicas y su dimensión comunicativa: la documentación
especializada
4.2 El uso de córpora textuales informatizados en terminología
4.3 Recopilación, diseño y análisis de corpus especializado
4.3.1 Criterios generales para la selección de los textos de un corpus especializado
4.3.2 Herramientas de análisis de corpus: necesidades específicas de los
terminólogos
4.3.3 Información oncológica disponible en formato electrónico
4.3.3.1 Fuentes documentales en CD-ROM
4.3.3.2 Fuentes documentales en la red
4.3.3.3 Glosarios, clasificaciones y léxicos especializados disponibles en la red
4.3.3.4 Información disponible de libre acceso y derechos de autor
4.4 Conclusiones y discusión

5 REPRESENTACIÓN DE LA INFORMACIÓN TERMINOLÓGICA EN ONTOTERM™: UN GESTOR


DE BASE DE DATOS TERMINOLÓGICA BASADO EN EL CONOCIMIENTO

5.1 Formas tradicionales de representación del conocimiento especializado


5.1.1 Descripción de los conceptos y sistemas conceptuales
5.1.2 Representación del concepto: las definiciones terminológicas
5.2 Representaciones formales del conocimiento
5.2.1 Resituando el concepto de concepto
5.2.2 Bases de datos y bases de conocimiento
5.2.3 Esquemas de representación de conocimiento formalizados
5.3 Terminología basada en ontologías
5.3.1 Definición de ontología como especificación del conocimiento
5.3.2 Ontologías para el Procesamiento del Lenguaje Natural y la Terminología
5.3.3 La ontología de Mikrokosmos y su reutilización para el subdominio del cáncer
5.4 El sistema gestor de representación de conocimiento: ONTOTERM™
5.5 Categorías de datos en las bases de datos terminológicas y su estructuración
5.5.1 El CLS Framework y las categorías de datos de la norma ISO 12620
5.5.2 Estructura de una base de datos en el CLS Framework
5.5.3 Categorías de datos de la norma ISO 12620 y su aplicación
5.5.4 El intercambio de información terminológica
5.6 El editor de base de datos terminológicas de ONTOTERM™
5.7 Conclusiones y discusión

6 EL USO DEL CORPUS PARA EXTRACCIÓN DE INFORMACIÓN Y SU REPRESENTACIÓN

6.1 El corpus como herramienta de análisis terminográfico


6.1.1 Estadísticas de composición del corpus y ratio palabras/formas
6.1.2 Frecuencia de las formas en el corpus
6.1.3 Palabras-clave en los textos: comparación de frecuencia de formas
http://elies.rediris.es/elies18/ 2/3
19/5/2014 Chantal Pérez, Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento

6.1.4 Enlaces de palabras clave


6.1.5 Key-KeyWords: comparación de palabras clave en los textos
6.2 Análisis conceptual y su representación en el gestor de ontologías de ONTOTERM™
6.2.1 Relaciones semánticas y estructuras lingüísticas
6.2.2 Sondas de búsqueda de información conceptual
6.2.3 Propiedades del concepto: relaciones complejas
6.2.4 Representación de las relaciones en la ontología
6.3 Información metalingüística en el corpus
6.3.1 Sondas de conocimiento metalingüístico
6.3.2 Análisis de clusters: delimitación de las unidades terminológicas
6.4 Conclusiones y discusión

7 CONCLUSIONES FINALES

8 REFERENCIAS

APÉNDICE I

APÉNDICE II

APÉNDICE III

APÉNDICE IV

Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

http://elies.rediris.es/elies18/ 3/3

Potrebbero piacerti anche