Sei sulla pagina 1di 23

CORPUS DEL ESPAOL DEL SIGLO XXI

CORPES XXI
Versin 0.8, beta
Manual de consulta en lnea

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 1 de 23

NDICE
Requisitos de uso.................................................................................................................................................... 3
Consulta del corpus ................................................................................................................................................ 3
La ventana de consulta....................................................................................................................................... 3
Concordancias ................................................................................................................................................... 5
Consulta de lemas y formas .......................................................................................................................... 5
Localizacin de formas verbales con enclticos .............................................................................................. 6
Consulta de signos de puntuacin .................................................................................................................. 6
Uso de los comodines ................................................................................................................................... 7
Criterios lingsticos ..................................................................................................................................... 7
Anlisis de la proximidad entre varias piezas lxicas ..................................................................................... 7
Criterios para la seleccin de textos (Subcorpus) ........................................................................................... 8
Criterios de ordenacin ................................................................................................................................. 9
Combinacin de criterios de consulta: criterios lgicos ................................................................................ 10
Combinacin de criterios de consulta: consultas de ndole gramatical ........................................................... 12
Consulta de la transcripcin de textos orales con sonido alineado ...................................................................... 14
Informacin estadstica .................................................................................................................................... 14
Coapariciones....................................................................................................................................................... 16
Definicin y uso .............................................................................................................................................. 16
Parmetros para la obtencin de las coapariciones ............................................................................................ 17
Clase de palabra ......................................................................................................................................... 17
Tema.......................................................................................................................................................... 17
Origen ........................................................................................................................................................ 17
Descripcin de las medidas estadsticas de asociacin ....................................................................................... 17
MI (Mutual information)............................................................................................................................. 17
T-score ....................................................................................................................................................... 17
LL simple (Log likelihood) ......................................................................................................................... 17
Obtencin de ejemplos a partir de las coapariciones .......................................................................................... 18
Nmina de autores y obras .................................................................................................................................... 19
Configuracin ...................................................................................................................................................... 19
Informacin de contacto .......................................................................................................................................20
Cmo citar este corpus..........................................................................................................................................20
Apndice I. Referencia rpida ............................................................................................................................... 21
Apndice II. Preguntas ms frecuentes .................................................................................................................. 22
1) Cmo obtener los ejemplos de uso de un lema o una forma (concordancia) ................................................... 22
2) Cmo ver las combinaciones ms frecuentes de una palabra (coapariciones) ................................................. 22
3) Cmo consultar los datos estadsticos de una consulta (estadstica) ............................................................... 22
4) Cmo ordenar los ejemplos (ordenar por) ..................................................................................................... 22
5) Cmo ver el detalle de un ejemplo y su referencia bibliogrfica (concordancia ampliada) .............................. 22
6) Cmo utilizar el asistente para crear consultas complejas ............................................................................. 22
7) Cmo imprimir o guardar en un archivo los resultados de las consultas (imprimir/exportar) ........................... 23
8) Cmo obtener ejemplos en los que figuren dos o ms palabras determinadas (proximidad) ......................... 23
9) Cmo localizar ejemplos de una forma grfica determinada en el corpus (maysculas/tildes) ......................... 23
10) Cmo emplear los comodines en la consulta ............................................................................................... 23
Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 2 de 23

REQUISITOS DE USO
La consulta del corpus precisa de una conexin a la red Internet y de un navegador web estndar que
acepte el lenguaje Javascript, por ejemplo, Microsoft Internet Explorer, Mozilla Firefox, Google Chrome,
Apple Safari etc.
CONSULTA DEL CORPUS
La aplicacin de consulta del CORPES en lnea permite obtener ejemplos de uso de los lemas y formas
contenidos en l, ver los datos estadsticos ms relevantes, comprobar las agrupaciones ms frecuentes de
una palabra (coapariciones), obtener la concordancia de palabras cuando aparecen en proximidad, as
como clasificar y filtrar los resultados de la consulta mediante diversos criterios.
La ventana de consulta
La ventana inicial de consulta denominada Concordancias proporciona ejemplos de uso de las
palabras contenidas en el corpus.

Fig. I. Ventana inicial del sistema de consulta: concordancia bsica


Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 3 de 23

Presenta una interfaz inicial simplificada organizada en tres zonas: en la superior se especifican los
criterios de consulta, en la intermedia se muestran los ejemplos y la inferior sirve para ampliar el contexto
de un ejemplo determinado junto con su referencia bibliogrfica completa y los datos de clasificacin del
texto en el CORPES:
Referencia bibliogrfica:
Los conserjes de San Felipe Neri. Alonso de Santos, Jos Luis: Los conserjes de San Felipe Neri. Madrid:
Ctedra, 2012.
Clasificacin CORPES:
Ao: 2011. Criterio: Fecha de escritura. Medio: Escrito. Bloque: Ficcin. Soporte: Libro. Tema:
Teatro. Pas: Espaa. Tipologa: Ficcin.
Los ejemplos de uso de la palabra consultada se muestran, por defecto, en orden cronolgico en el formato
Kwic1, habitualmente utilizado para la presentacin de este tipo de datos. En este formato cada lnea
corresponde a un ejemplo, que dispone adems de un nmero correlativo de identificacin, as como de la
fecha de clasificacin y el pas (abreviado) de la obra de la que ha sido extrado. Si el ejemplo corresponde a
la transcripcin de la lengua hablada de la parte oral alineada del corpus aparece tambin el smbolo de un
altavoz para indicar la disponibilidad de sonido.
En el texto, aparece resaltada la palabra buscada y, si se sita el puntero del ratn sobre la fecha, se
muestra la referencia bibliogrfica detallada de la obra. Si se seala cualquier palabra, se obtiene su
anlisis lingstico; en el caso de la palabra pivote (la destacada en azul), se muestra adems una pequea
ampliacin del contexto.
En la parte superior de la tabla de resultados, en el ngulo superior derecho, se encuentra la opcin para
clasificar los ejemplos y ordenarlos segn el criterio que se elija; por defecto, como ya se ha indicado
previamente, est marcado el cronolgico.
En el ngulo superior izquierdo de la tabla de resultados se proporciona el nmero total de casos obtenidos
en la consulta, y el nmero de documentos seleccionados para la obtencin de los ejemplos. Debajo de los
ejemplos est la opcin para pasar de pgina y continuar viendo los ejemplos, as como los botones para
imprimirlos o exportarlos2.
Cuando se necesita ampliar el contexto de un ejemplo, se debe pulsar con el puntero del ratn sobre la
palabra pivote (resaltada en color azul); se despliega entonces, en la zona inferior de la pgina, un espacio
donde figura el ejemplo, encabezado por la referencia bibliogrfica completa del texto que lo contiene, su
clasificacin en el corpus, as como la opcin de ampliar el contexto precedente y posterior con los botones
(+). Se dispone adems de un botn para Imprimir el ejemplo y de una botonera para la reproduccin del
sonido, que solo aparece en el caso de que el ejemplo corresponda a la transcripcin de la lengua hablada
de la parte oral alineada del corpus.
Los cambios de color de fondo que se observan en las concordancias sirven para identificar ejemplos
pertenecientes a obras distintas.
1 Keyword
2

in context (La palabra en su contexto).

La exportacin de ejemplos se ha limitado por razones operativas a un mximo de mil casos.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 4 de 23

Concordancias
Consulta de lemas y formas
Los ejemplos de uso de lemas y formas se obtienen escribiendo la palabra en la casilla correspondiente y
haciendo clic con el ratn en el botn Concordancia. El botn Nueva consulta restaura las condiciones
originales.
Lema
La consulta de Lema recupera todos los ejemplos de la palabra, de modo que, si se escribe en esta casilla la
forma cannica de una palabra, se obtendrn los ejemplos de todas sus variantes (morfolgicas, flexivas y
grficas).
Si se busca el infinitivo andar el sistema proporciona los ejemplos de miles de formas diferentes de este
verbo, como: andaba, andan, anduvo, andis, anduviese, andemos, etc. Los sustantivos se deben buscar
en singular; por ejemplo, mujer, y se obtendrn las concordancias de mujer, mujeres, mujercita, etc. En
cuanto a los adjetivos, se escribe el masculino singular, como vergonzoso, y se ofrecern ejemplos de
vergonzoso, vergonzosa, vergonzosos, vergonzosas, etc.
Forma
La bsqueda de una determinada variante debe hacerse en la casilla Forma; seleccione la opcin de
Grafa original (descrita ms abajo en esta seccin) si desea localizar la forma exacta, tal y como figura en
el texto y sin aplicar ningn tipo de regularizacin.
Puede tambin emplear los comodines para localizar formas (vase el apartado Uso de los comodines). Por
ejemplo, para buscar los ejemplos de aerostato se puede usar el comodn de la interrogacin lanzando la
bsqueda de aer?stato, con lo que se obtendrn las dos grafas admitidas: aerostato y aerstato (vase el
apartado Uso de los comodines). Incluso puede usarse el asterisco en esta casilla, por ejemplo el prefijo
pre*, para conocer todas las formas que comienzan as.
Lema + forma
La combinacin de ambas casillas permite obtener ejemplos de una forma concreta perteneciente a un
lema determinado. Esta opcin puede ser til para buscar solo ciertas formas de un paradigma ms amplio
que tengan un uso diferente del resto del paradigma, como por ejemplo ver+viste, que devuelve casos de la
forma como 'apndice confirmativo'.
Grafa original
Esta casilla reduce la consulta de lemas y formas a su grafa original, sin emplear ningn tipo de
regularizacin. Es til para hacer pertinente la diferenciacin acentual (esto es, la existencia o no de tilde) y
la ortogrfica (mayscula o minscula); as, se puede buscar en forma s para recuperar solo los ejemplos
del verbo saber que estn tildados; o buscar el nombre propio Aurora, en mayscula, y no el sustantivo
comn.
Texto libre
Es posible realizar la consulta de expresiones que contengan hasta cinco palabras. Esta posibilidad es til
para buscar frases hechas, locuciones, etc. Por ejemplo, si se quiere consultar expresiones como amor
libre, de tal palo tal astilla, de tomo y lomo, etc. basta con escribirlas en la casilla Forma.
Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 5 de 23

Localizacin de formas verbales con enclticos


La consulta de formas verbales pronominales puede realizarse de tres maneras:
1.

Escribiendo directamente en la casilla Forma la forma verbal pronominal, por ejemplo dgamelo.

2.

Tecleando en la casilla Forma la forma verbal separada de los clticos mediante espacios, por ejemplo
ponr se lo, ponr me la, etc. Este sistema permite combinar clticos de acuerdo con las necesidades.

3.

Mediante la consulta de Proximidad, escribiendo el lema o la forma verbal sin clticos en la casilla
correspondiente (Lema o Forma), y aadiendo un criterio de proximidad para cada cltico. Esta
modalidad es la ms flexible, ya que permite obtener con una sola consulta los ejemplos de todas las
formas de un verbo con determinados clticos. As, si escribimos en la casilla Lema el infinitivo del
verbo sentir, y aadimos el cltico me como criterio de proximidad por la derecha, obtendremos
sentirme, sintindome, sentame etc.

Consulta de signos de puntuacin


La bsqueda de signos de puntuacin se efecta de dos maneras:
1.

Aadindolos a la palabra o frase en la casilla Forma, pero separados por espacios. Por ejemplo, si
queremos encontrar formas interrogativas de verdad, escribiremos verdad ?
Nota: Se admite la consulta de signos de puntuacin sin necesidad de que vayan acompaados de
texto.

2.

Mediante la consulta de Proximidad, escribiendo en la casilla Forma el texto de la consulta y


aadiendo un criterio de proximidad por cada signo de puntuacin. La fig. II muestra un ejemplo de
consulta de proximidad para localizar expresiones interrogativas que contengan la palabra verdad.

Fig. II. Ventana de la concordancia: bsqueda de signos de puntuacin mediante el


criterio de proximidad
Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 6 de 23

Uso de los comodines

Se admite el uso de comodines en la consulta de lemas y formas. El comodn ? representa una ocurrencia
simple de cualquier carcter en la posicin en que se inserta, mientras que el comodn* sustituye a
cualquier nmero de caracteres (incluyendo ninguno) a partir de la posicin en que aparece.
De este modo, se puede buscar el prefijo sub*, y se obtiene, si se lanza la bsqueda en Lema,
subsiguientes, subjetivos, subtropical, subvirante, etc. Si se consulta un sufijo, por ejemplo *mente,
recoger, entre otras, las siguientes: prcticamente, silenciosamente, actualmente, tpicamente, etc.
Si se busca, por ejemplo, la expresin amarill? en Forma, se recuperarn los ejemplos de amarillo y de
amarilla, mientras que amarill* (en Lema o Forma) ofrecer adems de las anteriores, las de
amarillear, amarillento, etc.
Criterios lingsticos
Se puede reducir la ambigedad en la consulta de Lema y Forma seleccionando la clase de palabra y su
correspondiente descripcin morfosintctica. Para ello basta con seleccionar una clase de palabra y su
flexin en el desplegable denominado Clase de palabra.
Ejemplo: Si desea obtener los ejemplos de aviso como primera persona del singular del presente de
indicativo del verbo avisar, ponga en forma aviso y despus seleccione, en Clase de palabra, verbo y la
persona, el tiempo y el modo verbal.
Anlisis de la proximidad entre varias piezas lxicas
El submen denominado Proximidad permite consultar en el corpus ejemplos de hasta cuatro lemas o
formas que ocupan posiciones cercanas (separadas como mximo por diez palabras).
Ejemplo: En la figura que se muestra a continuacin se pueden ver ejemplos de la expresin dar cuartel
independientemente de la flexin verbal, de los pronombres enclticos, etc. Para realizar esta consulta se
escribir dar en la casilla de Lema y, tras pulsar el botn de Proximidad, se pondr, en la nueva casilla
de Lema, cuartel, se seleccionar Intervalo 1 por la Derecha, y finalmente se pulsar en
Concordancia.

Fig. III. Ventana de la concordancia: consulta de proximidad


Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 7 de 23

Puede indicarse adems la posicin en la que deben figurar los lemas o formas (expresada en nmero de
palabras) respecto del principal, o bien el intervalo mximo que ha de existir entre las palabras (de una a
cinco palabras de distancia). Tambin se puede fijar la situacin en la que deben aparecer los lemas o
formas secundarios (es decir, buscar que estn situados a la izquierda o a la derecha del lema principal, o
bien en ambas posiciones).
En el caso de ambigedad categorial basta con seleccionar la clase de palabra del lema o la forma.
Existe la posibilidad de realizar la consulta de proximidad sustituyendo lemas o formas secundarios por
categoras gramaticales. De ese modo se obtienen ejemplos de uso del lema requerido en combinacin con
sustantivos, adjetivos, verbos, etc.
Criterios para la seleccin de textos (Subcorpus)

El botn Subcorpus del men principal de consulta despliega las opciones de seleccin de textos del
corpus. Es posible establecer filtros3 dinmicos basados en los siguientes elementos:

Nombre del autor

Ttulo de la obra

Ao o intervalo temporal en el que se clasifican los textos

Origen geogrfico de las obras (Amrica, Espaa, Filipinas y Guinea Ecuatorial)

Zonas lingsticas americanas (Andina, Antillas, Caribe continental, Chilena, Estados Unidos,
Mxico y Centroamrica y Ro de la Plata)

Pases

Clasificacin temtica del texto

Medio (escrito, oral)

Bloque (ficcin, no ficcin)

Soporte (internet, libro, miscelnea, prensa)

Tipologa del texto (acadmico, biografa memoria, divulgacin, jurdico administrativo, libro de
texto, etc.)

Ejemplo: Para obtener ejemplos de voseo en Argentina, escriba la forma verbal correspondiente en la
casilla Forma, por ejemplo sabs, seleccione la opcin de Grafa original, despliegue el men de
Subcorpus y seleccione Origen (Amrica), Zona lingstica (Rio de la plata) y Pas (Argentina); pulse
a continuacin el botn Concordancia para obtener los ejemplos.

Se admite la seleccin mltiple para el origen, zonas lingsticas, pases, medio, soporte, tipologa y clasificacin

temtica de las obras. Nota: emplee simultneamente la tecla Control y el botn izquierdo del ratn para seleccionar
ms de un criterio.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 8 de 23

Fig. IV. Ventana de la concordancia (criterios de seleccin de textos: subcorpus)

Criterios de ordenacin
Los ejemplos se presentan, por defecto, en el orden cronolgico de clasificacin del texto en CORPES. Se
pueden clasificar, adems, combinando libremente dos de los siguientes criterios:
Ao de clasificacin (ascendente o descendente)
Autor4
Ttulo
Origen geogrfico (Amrica, Espaa, Filipinas y Guinea Ecuatorial)
Zonas lingsticas americanas (Andina, Antillas, Caribe continental, Chilena, Estados Unidos, Mxico y
Centroamrica y Ro de la Plata)
Pases
Lema, forma
Clase de palabra del lema o la forma
Lema o forma situado a una distancia de hasta tres palabras a la izquierda o a la derecha del consultado
Clase de palabra del lema o la forma situado a una distancia de hasta tres palabras a la izquierda o a la
derecha del consultado

Para facilitar la localizacin de autores y obras sin necesidad de escribir el nombre completo se admite en estos

apartados la consulta por cualquier palabra del texto. Escriba, por ejemplo, Molina en la casilla de Autor para localizar
los textos de Vicente Molina Foix, Antonio Muoz Molina, etc.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 9 de 23

Combinacin de criterios de consulta: criterios lgicos

Los sistemas de consulta de corpus obligan, por lo general, a conocer con precisin la sintaxis del lenguaje
de interrogacin para efectuar consultas complejas. Con el fin de evitar este inconveniente, se ha diseado
un asistente que facilita la creacin de criterios de consulta complejos mediante la combinacin de
operadores lgicos. De esta manera, se pueden acotar determinadas formas dentro de un lema amplio
(marcador Y), combinar la bsqueda de dos o ms formas o lemas al mismo tiempo (marcador O) o evitar
la aparicin de formas o lemas determinados (marcador NO)
Para aadir o eliminar criterios se emplean los botones + y -, situados en la lnea inferior del criterio de
consulta. Los criterios exigen incluir al menos un lema o una forma, que han de estar conectados entre s
mediante operadores lgicos.
Mediante el operador lgico Y, es posible delimitar varias caractersticas del trmino buscado. Por ejemplo,
puede realizar la bsqueda combinada de Lema vivir Y Forma vivo, lo que eliminar todas las formas de
vivo que no sean verbales. Tambin se pueden usar comodines, por ejemplo, Lema doler y Forma due*,
que recuperara todas las formas de este verbo que empiecen por due-.

Fig. V. Ventana de la concordancia (Y lgico)

Mediante O, es posible buscar al tiempo dos o ms formas o lemas. La bsqueda Forma tuit O Forma
tweet recuperar todos los ejemplos de estos dos trminos en el corpus, tanto si aparecen en el mismo
texto como si no.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 10 de 23

Fig. VI. Ventana de la concordancia (O lgico)


Empleando NO, puede limitarse la aparicin de cualquier forma dentro de una bsqueda ms amplia, lo
que hace posible limitar los datos intiles o consabidos en una bsqueda. Por ejemplo, en la bsqueda
Lema perro NO Forma perro*, se recuperan ejemplos de perra, perrito, perrucho, perras etc., pero no
perro ni perros.

Fig. VII. Ventana de la concordancia (NO lgico)


Es posible combinar varios operadores, o emplear varias veces el mismo. Por ejemplo, en la bsqueda de
perfectos acabados en *jeron, se pueden eliminar los casos ms repetidos, formulando la bsqueda:
Forma *jeron NO Forma dijeron, y aadir otra fila ms, con NO Forma trajeron (o NO Lema
traer).
Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 11 de 23

Fig. VIII. Ventana de la concordancia (combinacin de criterios lgicos)


Combinacin de criterios de consulta: consultas de ndole gramatical
La consulta del CORPES es, desde la v. 0.8, mucho ms rpida y permite el acceso instantneo sin
limitaciones a cualquier combinacin de criterios lingsticos, formas y lemas con comodines y filtros de
seleccin de textos. El nuevo motor de bsqueda, desarrollado mediante las ltimas tecnologas de big
data y procesamiento paralelo, admite la consulta en tiempo real sin necesidad de establecer restricciones
de formas o lemas. Esta caracterstica elimina buena parte de las barreras que impedan o dificultaban las
investigaciones lingsticas y supone un salto cualitativo en la evolucin de las herramientas de explotacin
de corpus.
Si quisiramos estudiar, por ejemplo, casos del verbo haber con participio pasado, podramos emplear el
criterio de proximidad del siguiente modo:

Fig. IX. Ventana de la concordancia (ejemplos del verbo haber con participio pasado)
Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 12 de 23

Tambin podramos realizar consultas de rasgos gramaticales sin necesidad de emplear una determinada
forma o lema. Veamos en el ejemplo siguiente casos de sustantivos doblemente adjetivados:

Fig. X. Ventana de la concordancia (sustantivos con doble adjetivacin)


Si deseramos obtener casos de la perfrasis ir a con infinitivos, frecuentemente utilizada para expresar la
futuridad, podramos utilizar los siguientes criterios de proximidad:

Fig. XI. Ventana de la concordancia (perfrasis verbal ir a seguida de infinitivo)

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 13 de 23

Consulta de la transcripcin de textos orales con sonido alineado

Se introducen por primera vez en el CORPES ms de 900 000 palabras procedentes de trascripciones de
lengua hablada. Estos textos disponen de sonido alineado, lo que posibilita escuchar el audio de los
ejemplos seleccionados.
El ejemplo siguiente muestra la concordancia de la palabra video obtenida de las trascripciones de la parte
oral del CORPES que corresponde a grabaciones del espaol de Amrica.

Fig. XII. Ventana de la concordancia (sonido alineado con los ejemplos)

Informacin estadstica
El CORPES dispone de un sistema de clculo dinmico de la informacin estadstica. Los valores que se
ofrecen siempre se refieren a la consulta realizada, de modo que si se establecen filtros o se emplean
criterios de proximidad, los datos estadsticos se recalculan dinmicamente sobre el subcorpus
seleccionado.
Para acceder a la informacin estadstica de cualquier consulta basta con pulsar el botn de Estadstica
que figura inmediatamente a la derecha del de Concordancia.
Se muestran en primer lugar tres valores globales relativos a la consulta realizada: la frecuencia absoluta,
que representa el nmero total de ocurrencias de la consulta, el nmero de documentos que disponen de
ocurrencias, y la frecuencia normalizada, expresada como nmero de ocurrencias por cada milln de
palabras.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 14 de 23

A continuacin se ofrecen tablas y grficos de frecuencia 5 por zona geogrfica, pas, perodo, tema y tipo de
texto. De ese modo se muestra la representacin de la consulta en el corpus y se obtiene una primera
indicacin acerca del uso en las diferentes zonas geogrficas, as como su vigencia a lo largo del tiempo, su
distribucin en las diversas reas temticas, por tipo de texto, etc.
En la figura siguiente se muestran los datos estadsticos del trmino informtico disquete, cuyo uso
decreciente se puede apreciar claramente en el grfico de distribucin por perodos.

Fig. XIII. Ventana de datos estadsticos (distribucin por perodos)


Desde las tablas de informacin estadstica se puede acceder a los ejemplos pulsando con el puntero del
ratn sobre un elemento cualquiera de la tabla o sobre su correspondiente representacin grfica.

Fig. XIV. Ventana de datos estadsticos (ejemplos de uso, en Espaa, de la forma disquete
en el perodo 2001-2005, obtenidos a partir de la tabla estadstica de Distribucin por
perodos)
5

Los datos de frecuencia se expresan en dos columnas: frecuencia conjunta (nmero total de ocurrencias obtenidas para

la consulta realizada), y frecuencia normalizada (nmero de ocurrencias de la consulta por cada milln de palabras de la
categora que le corresponde en la distribucin).

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 15 de 23

COAPARICIONES
Definicin y uso
Las coapariciones (tambin conocidas en los corpus como colocaciones) son palabras que se combinan con
el lema buscado con una frecuencia mayor de la que sera explicable por el azar. Este sistema de bsqueda
proporciona un primer ndice de la concordancia, es decir, da cuenta de qu es lo ms llamativo del
comportamiento combinatorio de una voz en este corpus.
En la ventana de Coapariciones se proporcionan tres filtros: el filtro de Clase de palabra, que delimita
el lema en caso de homografa, el de Origen geogrfico de los textos, y el de clasificacin temtica
(Tema). Es posible adems ordenar los resultados por clase de palabra, frecuencia, o la medida de
asociacin estadstica preferida, as como acceder a los ejemplos de cada una de las combinaciones
obtenidas.
El ejemplo siguiente muestra las coapariciones del adjetivo circular ordenadas por la medida de asociacin
MI (Mutual Information)6, que es el orden que se aplica por defecto.

Fig. XV. Ventana de coapariciones

La ordenacin (ascendente o descendente) de las coapariciones se consigue, alternativamente, pulsando sobre el

nombre de la variable estadstica que encabeza la columna de la tabla de resultados.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 16 de 23

Parmetros para la obtencin de las coapariciones


Clase de palabra
Limita la bsqueda de coapariciones a las clases de palabras seleccionadas.
Tema
Filtra las coapariciones segn los criterios de clasificacin temtica de los textos.
Origen
Selecciona las coapariciones de los textos pertenecientes a determinados orgenes geogrficos.

Descripcin de las medidas estadsticas de asociacin


La fortaleza de la asociacin en las coapariciones se puede calcular mediante mltiples procedimientos
estadsticos; cada uno de ellos puede servir para identificar un determinado tipo de asociacin.
Para calcular las coapariciones de una palabra en el CORPES se han empleado tres medidas estadsticas de
asociacin frecuentemente utilizadas en Lingstica de corpus: LL simple, Mutual information y T-score.
Veamos las caractersticas de cada una de ellas:

MI (Mutual information)
Se obtiene comparando la frecuencia de coaparicin de dos hechos lingsticos 7, observados en una
muestra, con la frecuencia esperada en virtud de las frecuencias individuales de los elementos en esa
muestra. Su valor expresa el grado de divergencia entre la frecuencia real y la esperada, e indica el grado de
condicionamiento que un elemento ejerce sobre su contexto lingstico. Se interpreta como un ndice de la
potencia de asociacin entre los elementos.
T-score
Esta medida, adems de cuantificar la divergencia entre las frecuencias reales y esperadas de una
combinacin de elementos, toma en consideracin la cantidad de evidencia que aporta la muestra para
respaldar esa divergencia. Su valor se interpreta, por tanto, como un ndice de la confianza que se puede
atribuir a la potencia de asociacin calculada para los elementos.
Tericamente, se ha sealado que presupone una distribucin de los datos ausentes en los textos. En la
prctica, se ha comprobado que favorece las combinaciones de alta frecuencia, por lo que se ha
especializado su aplicacin en la deteccin de patrones muy consistentes.

LL simple (Log likelihood)


Del mismo modo que la MI, contrasta frecuencias reales y esperadas, pero tiene en cuenta tambin la
cantidad de evidencia disponible y su valor es interpretable de acuerdo con una escala normalizada. A

En la aplicacin ms habitual, se contrastan dos elementos, aunque es posible aumentar ese nmero. Igualmente, lo

ms habitual es contrastar la frecuencia de coaparicin de unidades textuales (formas o lemas), pero cualquier hecho
lingstico (categoras, subcategoras, construcciones, esquemas, coligaciones) contable en un corpus puede ser
contrastado. Esto vale para cualquiera de las medidas.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 17 de 23

pesar de que esa escala normalizada permite establecer umbrales de tolerancia al error, muchos pares de
alta frecuencia pero dbilmente asociados superan incluso el umbral menos restrictivo.
Ejemplo
Las coapariciones del lema germen en el CORPES, obtenidas en una ventana simtrica de cinco posiciones
(excluyendo signos de puntuacin), permiten observar algunos de los efectos mencionados en las medidas
estadsticas de asociacin: entre los veinte primeros seleccionados por MI se encuentran trigo, patgeno,
cereal, levadura, bacteria o infeccin, todos ellos perfectamente previsibles. Sin embargo LL, y sobre todo
tScore, priman las combinaciones de alta frecuencia, intercalando en las primeras posiciones
combinaciones de menor inters o sin una asociacin lxica tan clara.
Obtencin de ejemplos a partir de las coapariciones
Puede resultar til el acceso a los ejemplos a partir de las coapariciones. Para ello basta con calcularlas 8 y
pulsar con el puntero del ratn sobre cualquier elemento de la tabla de resultados.

Fig. XVI. Ventana de coapariciones

9Cuando

se accede a las concordancias desde la tabla de coapariciones el nmero de concordancias mostradas puede no

coincidir con la frecuencia indicada en la tabla. Estas discrepancias son correctas y pueden ser de dos tipos:
1) El nmero de concordancias es menor que el nmero de coapariciones cuando existe ms de una coaparicin en
alguna concordancia.
2) El nmero de concordancias es mayor que el nmero de coapariciones cuando la coaparicin se corresponde con un
lema que presenta alguna forma ambigua, puesto que al realizar la consulta de las concordancias no se exige que los
ejemplos sean no ambiguos.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 18 de 23

En la siguiente figura se muestran ejemplos de uso de abrigar esperanza, obtenidos a partir de las
coapariciones de abrigar.

Fig. XVII. Ventana de la concordancia (ejemplos obtenidos de las coapariciones)

NMINA DE AUTORES Y OBRAS

En prximas versiones del CORPES se ofrecer la posibilidad de consultar selectivamente la nmina de


autores y obras. La consulta ofrecer la referencia bibliogrfica completa de las obras, as como los datos
estadsticos ms relevantes de cada texto.

CONFIGURACIN
Esta ventana incluir opciones de configuracin que facilitarn el uso del corpus de acuerdo con las
preferencias del consultante. En esta versin (0.7 beta) solo se admite la configuracin del nmero de
ejemplos que se recuperan en la ventana de Concordancias.

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 19 de 23

INFORMACIN DE CONTACTO

Para enviar una sugerencia o consultar cualquier duda o problema respecto al uso de esta aplicacin, por
favor, utilice el formulario Sugerencias que figura en el men principal.

CMO CITAR ESTE CORPUS

Si desea citar este corpus, por favor, emplee el siguiente formato:


REAL ACADEMIA ESPAOLA: Banco de datos (CORPES) [en lnea]. Corpus del Espaol del Siglo
XXI. <http://www.rae.es> [Fecha de la consulta]

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 20 de 23

APNDICE I.
REFERENCIA
RPIDA

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 21 de 23

APNDICE II. PREGUNTAS MS FRECUENTES

1) Cmo obtener los ejemplos de uso de un lema o una forma (concordancia)


En la ventana principal del sistema de consulta del CORPES seleccione la pestaa de la Concordancias,
escriba el lema (p. e. hombre), la forma (p. e. hombretn) o la combinacin de ambas (cada una en su
casilla correspondiente, p. e. lema amor y forma amo) de la palabra que desea consultar en las casillas
correspondientes y pulse la tecla Intro o haga clic con el puntero del ratn sobre el botn Concordancia.
2) Cmo ver las combinaciones ms frecuentes de una palabra (coapariciones)
Seleccione la pestaa denominada Coapariciones de la ventana principal, teclee el lema en la casilla
correspondiente (p. e. hombre) y pulse con el ratn sobre el botn Coapariciones. Para ver los ejemplos de
una determinada combinacin de palabras, pulse con el ratn sobre el elemento que le corresponda en la
tabla (p. e. enjuto).
3) Cmo consultar los datos estadsticos de una consulta (estadstica)
En la ventana principal del sistema de consulta del CORPES seleccione la pestaa de la Concordancias,
teclee la consulta y pulse con el ratn sobre el botn denominado Estadstica. Para ver los ejemplos
concretos de una determinada zona, pas, perodo, tema o tipo de texto, pulse con el ratn sobre el
elemento deseado de la tabla o bien sobre su correspondiente grfico.
4) Cmo ordenar los ejemplos (ordenar por)
Obtenga los ejemplos empleando uno de los procedimientos descritos en los tres primeros apartados de
esta gua rpida (Concordancias, Coapariciones o Estadstica) y despus despliegue las opciones de
clasificacin denominadas Ordenar por que encontrar en la parte derecha de la cabecera de la tabla de
ejemplos (a continuacin de los epgrafes Referencia y Concordancia) y seleccione una de ellas (Ao
ascendente, Ao descendente, Autor, Ttulo, etc.). Los ejemplos se ordenarn automticamente por el
criterio elegido.
5) Cmo ver el detalle de un ejemplo y su referencia bibliogrfica (concordancia ampliada)
Obtenga los ejemplos empleando uno de los procedimientos (Concordancias, coapariciones o estadstica)
descritos en los tres primeros apartados de esta gua rpida y pulse con el puntero del ratn sobre el pivote
(resaltado en azul) del ejemplo concreto que le interese. Comprobar que en la zona inferior de la ventana
de consulta se muestra el ejemplo y la referencia bibliogrfica completa. Puede ampliar el contexto del
ejemplo pulsando sobre los botones (+) de ampliacin de contexto.
6) Cmo utilizar el asistente para crear consultas complejas
Seleccione la pestaa denominada Concordancias de la ventana principal y escriba el lema o la forma de la
palabra que desea consultar en la casilla correspondiente; opcionalmente, aada filtros empleando las
opciones desplegables (Clase de palabra, Proximidad y Subcorpus).
Pulse con el ratn sobre el botn (+) situado debajo de la casilla Lema, en la zona superior izquierda de la
ventana para aadir otro criterio y repita el procedimiento descrito en el prrafo anterior.
Cuando haya finalizado la introduccin de criterios pulse el botn Concordancia para ejecutar la consulta.
Tenga en cuenta que debe enlazar los criterios empleando los operadores lgicos (Y, O, NO).
Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 22 de 23

7) Cmo imprimir o guardar en un archivo los resultados de las consultas


(imprimir/exportar)
Obtenga los ejemplos empleando uno de los procedimientos descritos en los tres primeros apartados de
esta gua rpida (Concordancias, Coapariciones o Estadstica) y pulse con el puntero del ratn sobre el
botn Imprimir que encontrar en la base de la tabla de ejemplos (a su izquierda). Obtendr los ejemplos
en una nueva pgina en el formato Html que podr imprimir o guardar. Si prefiere guardar los ejemplos en
un archivo de texto sin formato, utilice el botn de Exportar situado a la derecha del de Imprimir.
8) Cmo obtener ejemplos en los que figuren dos o ms palabras determinadas
(proximidad)
En la ventana principal del sistema de consulta del CORPES escriba la consulta (p. e. mano) y despliegue el
men de proximidad pulsando con el puntero del ratn sobre la casilla de opcin denominada Proximidad.
Escriba a continuacin el lema o la forma de la palabra que debe figurar prxima a la primera (p. e. echar),
pulse la tecla Intro o bien presione con el puntero del ratn sobre el botn Concordancia. Puede aadir
hasta cuatro criterios empleando el botn (+) de la ventana de Proximidad
9) Cmo localizar ejemplos de una forma grfica determinada en el corpus
(maysculas/tildes)
En la ventana principal del sistema de consulta del CORPES escriba la forma exacta de la palabra que
desea consultar en la casilla correspondiente (p.e. para recoger nicamente ejemplos con tilde lite o
perodo, o concordancias en mayscula Aurora o Po), seleccione con el puntero del ratn la opcin
denominada grafa original y haga clic sobre el botn Concordancia. Obtendr nicamente los ejemplos
en los que aparezca la forma grfica exacta.
10) Cmo emplear los comodines en la consulta
En la ventana principal del sistema de consulta del CORPES escriba la expresin con comodines (? *) que
desea consultar en la casilla correspondiente al lema o a la forma y haga clic sobre el botn Concordancia.
Son vlidas, por ejemplo, las expresiones: vas*, *miz, des*tar y des??tado.

____________________

Corpus del Espaol del Siglo XXI. Manual de consulta en lnea (v 0.8 beta).

Pgina 23 de 23

Potrebbero piacerti anche