Sei sulla pagina 1di 20

Procesamiento de Lenguaje

Natural
Rivas Del Angel Ernesto

{ Ramirez Oscar
Segura Gomez Francisco Javier
Ruvalcaba Martinez Ricardo Manuel
Casanova Del Angel Miguel Angel
El recurso ms importante que posee la raza humana
es conocimiento, o sea informacin. En la poca actual
de informacin, del manejo eficiente de este
conocimiento depende el uso de todos los dems
recursos naturales, industriales y humanos
Durante toda la historia de humanidad el
conocimiento, en su mayor parte se comunica, se
guarda y se maneja en la forma de lenguaje natural
griego, latn, ingls, espaol, etc. La poca actual
no es ninguna excepcin: el conocimiento sigue
existiendo y crendose en la forma de documentos,
libros, artculos, aunque stos se guardan en forma
electrnica, o sea digital. El gran avance es que, en
esta forma, las computadoras ya pueden ser una
ayuda enorme en el procesamiento de este
conocimiento.
Sin embargo, lo que es conocimiento para nosotros los
seres humanos no lo es para las computadoras. Son
los archivos, unas secuencias de caracteres, y nada ms.
Una computadora puede copiar tal archivo,
respaldarlo, transmitirlo, borrarlo como un burcrata
que pasa los papeles a otro burcrata sin leerlos. Pero
no puede buscar las respuestas a las preguntas en este
texto, hacer las inferencias lgicas sobre su contenido,
generalizar y resumirlo es decir, hacer todo lo que las
personas normalmente hacemos con el texto. Porque
no lo puede entender.
Para combatir esta situacin, se dedica
mucho esfuerzo, sobre todo en los
pases ms desarrollados del mundo,
al desarrollo de la ciencia que se
encarga de habilitar a las
computadoras a entender el texto.
Esta ciencia, en funcin del enfoque
prctico versus terico, del grado en el
cual se espera lograr la comprensin y
de otros aspectos tiene varios
nombres: procesamiento de lenguaje
natural, procesamiento de texto,
tecnologas de lenguaje, lingstica
computacional. En todo caso, se trata
de procesar el texto por su sentido y
no como un archivo binario.
El esquema general de la mayora de los sistemas y
mtodos que involucran el procesamiento de lenguaje
es el siguiente:

Primero, el texto no se procesa directamente si no se


transforma en una representacin formal que preserva
sus caractersticas relevantes para la tarea o el mtodo
especfico (por ejemplo, un conjunto de cadenas de
letras, una tabla de base de datos, un conjunto de
predicados lgicos, etc.). Luego, el programa principal
manipula esta representacin, transformndola segn
la tarea, buscando en ella las subestructuras necesarias,
etc. Finalmente, si es necesario, los cambios hechos a la
representacin formal (o la respuesta generada en esta
forma) se transforman en el lenguaje natural.
{ Conceptos Bsicos
Definicin de Lenguaje
Un lenguaje se puede definir de diferentes formas: desde el
punto de vista funcional lingstico se define como una
funcin que expresa pensamientos y comunicaciones entre la
gente. Esta funcin puede realizarse mediante signos escritos
(escritura) o mediante seales y vocales (voz). Desde un punto
de vista formal se define como un conjunto de frases, que
generalmente es infinito y se forma con combinaciones de
elementos tomados de un conjunto (usualmente infinito)
llamado alfabeto, respetando un conjunto de reglas de
formacin (sintcticas o gramaticales) y de sentido
(semnticas).
Podemos distinguir entre dos clases de lenguajes: los lenguajes
naturales (ingls, alemn, espaol, etc.) y lenguajes formales
(matemtico, lgico, programable etc.).
Lenguaje Natural
El lenguaje natural(LN) es el medio que utilizamos de manera
cotidiana para establecer nuestra comunicacin con las dems
personas. El LN ha venido perfeccionndose a partir de la
experiencia a tal punto que puede ser utilizado para analizar
situaciones altamente
complejas y razonar muy sutilmente. Los lenguajes naturales
tienen un gran poder expresivo y su funcin y valor como una
herramienta para razonamiento. Por
otro lado, la sintaxis de un LN puede ser modelada fcilmente
por un lenguaje formal, similar a los utilizados en las
matemticas y la lgica.
En resumen, los lenguajes naturales se caracterizan por las
siguientes propiedades:
Un lenguaje natural se define a partir de una gramtica G,

sin embargo, este se enriquece progresivamente modificando


as tambin la gramtica que la define. Esto dificulta la
formalizacin de la definicin de G.

Un LN tiene un gran poder expresivo debido a la riqueza del


componente semntico (poli semntica). Esto dificulta an
ms la formalizacin completa de su gramtica.
Lenguaje Formal

El lenguaje formal es aquel que el


hombre ha desarrollado para expresar las
situaciones que se dan en especfico en
cada rea del conocimiento cientfico. Los
lenguajes formales pueden ser utilizados
para modelar una teora de la mecnica,
fsica, matemtica, ingeniera elctrica, o
de otra naturaleza, con la ventaja de que,
en estos, toda ambigedad es eliminada.
Revisten especial importancia los
lenguajes de programacin
de computadoras, y estas se definen
considerando un conjunto de
componentes lxicos, reglas gramaticales
y una delimitacin semntica.
En resumen, las caractersticas de los lenguajes
formales son las siguientes:

Se desarrollan a partir de una gramtica G preestablecida.


Componente semntico mnimo.
Posibilidad de incrementar el componente semntico de
acuerdo con la teora a formalizar.
La sintaxis produce oraciones no ambiguas.
Completa formalizacin y por esto, el potencial de la
construccin computacional.
Lenguaje de programacin
Un lenguaje de programacin es un lenguaje formal definido
como un conjunto de elementos (componentes lxicos)
organizados a travs de constructores (re-glas gramaticales) que
permiten escribir un programa y que ste sea entendido por el
computador y pueda ser trasladado a computadores similares
para su funcionamiento en otros sistemas. Un programa es una
secuencia de instrucciones ordenadas correctamente que
permiten realizar una tarea o trabajo especfico. Un lenguaje de
programacin se basa en dos elementos muy importantes:

Sintaxis: que se encarga del orden correcto de los


componentes lxicos
Semntica: se encarga de que cada oracin del lenguaje de
programacin utilizado tenga un significado correcto.
Procesamiento de lenguaje natural

Una de las tareas fundamentales de la Inteligencia Artificial (IA)


es la manipulacin de lenguajes naturales usando herramientas
de computacin, en esta, los lenguajes de programacin juegan
un papel importante, ya que forman el enlace necesario entre los
lenguajes naturales y su manipulacin por una mquina. El PLN
consiste en la utilizacin de un lenguaje natural para
comunicarnos con la computadora, debiendo sta entender las
oraciones que le sean proporcionadas, el uso de estos lenguajes
naturales, facilita el desarrollo de programas que realicen tareas
relacionadas con el lenguaje o bien, desarrollar modelos que
ayuden a comprender los mecanismos humanos relacionados
con el lenguaje.
Aplicaciones del PLN

Las aplicaciones del PLN son muy


variadas, ya que su
alcance es muy grande, algunas de las
aplicaciones son:

Traduccin automtica
Recuperacin de la informacin
Extraccin de Informacin y
Resmenes
Resolucin cooperativa de problemas
Tutores inteligentes
Reconocimiento de Voz
{ Desarrollos Actuales y sus Aplicaciones
Tecnologas del habla.
Las tres reas bsicas que configuran las tecnologas del habla
son:
La sntesis del habla (el ordenador proporciona informacin
oral). Este tipo de aplicaciones informticas Permite la
generacin de mensajes hablados a partir de un texto escrito
almacenado en formato electrnico. Suelen emplear los sistemas
de conversin de texto en habla, que constan por lo general de un
mdulo de procesamiento lingstico, en el que se llevan a cabo
una trascripcin fontica y un anlisis lingstico ms o menos
detallado del texto de entrada y de otro que se ocupa de los
aspectos ms ligados al tratamiento informtico de la seal
sonora. Las personas con discapacidad visual pueden por
ejemplo acceder a la informacin a travs de los sistemas que
convierten el texto escrito en texto hablado.
El reconocimiento del habla (el ordenador procesa los
enunciados emitidos por un interlocutor). Este tipo de
aplicaciones procede realizando a una operacin inversa a la
llevada a cabo en la sntesis: la onda sonora portadora de un
mensaje se convierte en una representacin simblica, que suele
ser un texto escrito. El ordenador recibe los sonidos del habla en
forma de ondas analgicas que se analizan para identificar las
unidades que constituyen las palabras (fonemas).
Los sistemas de dilogo (comunicacin bidireccional). Constan
de un mdulo de reconocimiento automtico del habla, un
sistema de comprensin que se ocupa de la interpretacin del
enunciado, un mdulo de generacin que crea un texto con los
resultados de una consulta a una base de datos o con la respuesta
adecuada a la conversacin entre usuario y sistema, y de un
conversor de texto en habla que transforma esta respuesta en su
equivalente sonoro. Estas operaciones estn coordinadas por un
mdulo de gestin del dilogo, responsable de los turnos de
palabra, de la coherencia entre preguntas y respuestas y de todos
aquellos aspectos que hacen que la interaccin entre la persona y
el ordenador sea lo ms natural posible. El mdulo de
reconocimiento debe procesar la informacin acstica que
contiene el mensaje que recibe del usuario para poder
interpretarlo semnticamente.
Tecnologas del texto.

Aplicaciones informticas basadas en el anlisis morfolgico,


sintctico y semntico del texto:
Analizadores morfolgicos / Generadores

Analizadores sintcticos

Correctores

Desambiguadores

Traductores

Textos predictivos

Potrebbero piacerti anche