Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Susana Carbajales
"Entre lo que pienso, lo que quiero decir, lo que creo decir, lo que digo, lo que quieres
oír, lo que oyes, lo que crees entender y lo que entiendes, existen nueve posibilidades
de no entenderse", dice una famosa frase. Si además uno de los interlocutores es una
máquina, la complejidad y los problemas aumentan considerablemente.
1 de 4 03/06/2019 12:37
Es complicado que las máquinas nos entiendan con lenguaje natural, pero... https://www.xataka.com/robotica-e-ia/complicado-que-maquinas-nos-ent...
La minería de opiniones y análisis de sentimientos, por otro lado, sirve para saber si
un texto genera opiniones positivas o negativas en sus receptores. "El análisis de
sentimientos no funciona con precisión absoluta, pero en algunos dominios funciona
bien. Las empresas están interesadas en saber cómo la gente recibe sus
productos o sus servicios".
La cantidad de datos de los que se disponga hará que los sistemas de procesamiento
de lenguaje natural, independientemente del idioma, sean capaces de extraer
información y aprender de una forma más rápida y eficaz. Aunque sólo sea por una
cuestión de volúmenes, cuantas más personas hablen un idioma, de más
datos se dispondrá. En la actualidad, el español es la segunda lengua más hablada
del mundo.
Hombre Muffin
Un famoso chiste sobre programadores ilustra muy bien esta situación. Una mujer le
dice a su marido que vaya al supermercado y le traiga un cartón de leche y, si hay
huevos, una docena. El marido regresa y aparece con una docena de cartones de
leche.
"Un ser humano sabe que los huevos se compran por docenas y la leche
no. Y que nadie compra doce cartones de leche. Podemos hacer que las
máquinas aprendan esto, pero es todo un desafío."
Huevos
Felisa Verdejo
2 de 4 03/06/2019 12:37
Es complicado que las máquinas nos entiendan con lenguaje natural, pero... https://www.xataka.com/robotica-e-ia/complicado-que-maquinas-nos-ent...
"En inglés funcionan bien los algoritmos de stemming, mientras que para el español,
que tiene múltiples procesos de flexión, derivación y composición, así como
excepciones, no funcionan igual de bien. Si quieres calidad de procesamiento de
datos, tienes que hacer un análisis sintáctico."
La flexión es un proceso que permite componer palabras con una misma raíz pero
distintos atributos. Por ejemplo, en la palabra rojo, tenemos la raíz roj y un morfema
flexivo de género másculino (la o).
"En español no hay una estructura fija de las palabras dentro de una
oración como ocurre en otras lenguas, lo que genera que haya diferentes
posibilidades de análisis y se requiera un mayor tratamiento semántico."
Esto hace que no baste con conocer cómo se componen las palabras o las frases, sino
que haya que ir un paso más allá y adentrarse en el significado. Y, en español, es
bastante complicado, ya no sólo por los dobleces y dobles significados de nuestra
lengua, sino por los distintos localismos y regionalismos que hace que una misma
palabra pueda tener cientos de connotaciones diferentes dependiendo del país, región
o contexto.
3 de 4 03/06/2019 12:37
Es complicado que las máquinas nos entiendan con lenguaje natural, pero... https://www.xataka.com/robotica-e-ia/complicado-que-maquinas-nos-ent...
Sin embargo, aún quedan muchos problemas por resolver. Y no todos son lingüisticos
o computacionales. La inversión en investigación es claramente insuficiente en el
caso de lenguas minoritarias, como el finés o el alemán. El entrenamiento de los
sistemas para que se perfeccionen y lleguen a responder como un humano sigue
siendo un trabajo duro y, conseguir que la gente a la que no le agrada hablar con una
máquina utilice estas tecnologías todo un reto.
4 de 4 03/06/2019 12:37