C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

29
CONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño

Transcript of C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

Page 1: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

CONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL

Ana María Tangarife Patiño

Page 2: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

OBJETIVO

Exponer los conceptos generales de la disciplina, identificando las relaciones y diferencias con otras áreas disciplinares que comparten su objeto de estudio.

Page 3: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

INTERDISCIPLINARIEDAD

Lingüística Informática

Objetivo:Generar modelos computacionales que reproduzcan uno o más

aspectos del lenguaje humano.

Page 4: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

ÁREAS DISCIPLINARES INVOLUCRADAS (1)

LCIA

Industrias de la Lengua

Lingüística

aplicada

Lingüística

teórica

La LC es un campo interdisciplinario cuyo objetivo es incorporar en los computadores la habilidad en el manejo del lenguaje humano o natural.

Page 5: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

ÁREAS DISCIPLINARES INVOLUCRADAS (2)

Informática IA

•Es la ciencia de hacer máquinas inteligentes.

LC •Diseña máquinas capaces de comprender el lenguaje, aprender, razonar y tomar decisiones.

Page 6: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

ÁREAS DISCIPLINARES INVOLUCRADAS (3)

Lingüística teórica

•La lingüística es el estudio científico de la lengua. Como tal, se ocupa de descubrir y entender la naturaleza y las leyes que gobiernan el lenguaje.

LC •Elabora modelos formales (implementables informáticamente) del lenguaje humano.

Page 7: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

FUNDAMENTOS DE LA LC

Lingüística aplicada •Rama de la lingüística que se ocupa de los problemas que el lenguaje plantea como medio de relación social y de la cual derivan tres ramas o campos de acción: enseñanza de lengua materna, enseñanza de segunda lengua y enseñanza de lenguas asistida por computador.

LC •Aplica los modelos y métodos de investigación lingüísticos en campos como la enseñanza de idiomas, la traducción, etc.

Page 8: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

FUNDAMENTOS DE LA LC

LC •Elabora programas informáticos (software) para el mercado como los traductores, procesadores de texto, etc.

Industrias de la lengua

•Entendida como una actividad de índole fundamentalmente comercial, requiere el desarrollo de la ingeniería lingüística para disponer de las herramientas y técnicas a partir de las que se crean productos que realizan diversas funciones relacionadas con la utilización del lenguaje.

Page 9: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

OBJETIVOS DE LA LC

Comprobar los modelos lingüísticos y las teorías, diseñando algoritmos y sistemas que puedan ser evaluados y comprendidos en trabajos de procesamiento de lenguaje natural (PLN).

Diferencia entre LC y PLN

LC: usa las máquinas computacionales para investigar o tratar los fenómenos lingüísticos.

PLN: aplicaciones concretas para el procesamiento de textos.

Page 10: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

VERTIENTES DE LA LC

Dado que la LC abarca muchos objetivos es necesario diferenciar tres vertientes que delimitan su campo de acción:

1. Informática aplicada a la investigación

2. Implementación de teorías lingüísticas

3. Aplicaciones lingüísticas de la informática

Page 11: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

INFORMÁTICA APLICADA A LA INVESTIGACIÓN

• Su objetivo es emprender el estudio científico del lenguaje por medio ordenadores.

• Suele recibir el nombre de Lingüística informática o de Informática aplicada a la lingüística.

Ejemplo: conocer el uso del sufijo –able en inglés moderno temprano por medio de un corpus escrito.

Page 12: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

IMPLEMENTACIÓN DE TEORÍAS LINGÜÍSTICAS

• Su objetivo es elaborar formalismos lingüísticos que son lenguajes artificiales diseñados específicamente para representar conocimientos lingüísticos y que pueden ser entendidos por los ordenadores.

• Suele recibir el nombre de Lingüística computacional en sentido estricto.

Ejemplo: Wordnet, corpus lingüístico para el inglés

Page 13: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

APLICACIONES LINGÜÍSTICAS DE LA INFORMÁTICA

• Diseña sistemas informáticos encaminados a la comprensión y generación del lenguaje natural.

• Esta vertiente recibe el nombre de Procesamiento del lenguaje natural, Tecnologías de la lengua o Ingeniería lingüística.

Ejemplo: tecnologías del habla, traducción automática, sistemas de extracción de información, etc.

Page 14: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

PROGRAMAS PRINCIPALES DESARROLLADOS POR LA

LINGÜÍSTICA COMPUTACIONAL Modelos de teorías lingüísticas

Enseñanza de lenguas extranjeras

Corrección de ortografía y sintaxis de textos

Reconocimiento de voz humana

Procesamiento de información

Sistemas expertos

Traducción automática

Page 15: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

ÁREAS DE LA LC

Análisis automático de la fonética, la fonología, la morfología, la sintaxis y la pragmática.

A partir de las siguientes tareas Etiquetamiento morfológico o tagging Análisis sintáctico o parsing Técnicas de reconocimiento automático de voz Recuperación inteligente de información Sistemas de diálogo y sistemas expertos Traducción automática

Page 16: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

ANÁLISIS MORFOLÓFICO

Tagging (Etiquetador)

Análisis automático de las palabras que componen una frase.

Page 17: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

ANÁLISIS SINTÁCTICO

Parsing (Parse: analizar sintácticamente)

Análisis automático de una oración.

Fase inicial para la interpretación semántica

Page 18: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

ANALIZADORES MORFOSINTÁCTICOS

Ejemplos para el español http://www.gedlc.ulpgc.es/investigacion/desambi

gua/morfosintactico.htm http://www.mystilus.com/MorphosyntacticAnalyz

er

Analizador para el inglés: http://www2.lingsoft.fi/cgi-bin/engcg/

Page 19: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

RECUPERACIÓN INTELIGENTE DE INFORMACIÓN

Information Retrieval

Almacenamiento y envío digital de datos

Técnicas de extracción de datos contenidos en textos y su transmisión a los usuarios

Ejemplos: Bases de datos Buscadores de internet

Page 20: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

SISTEMAS DE DIÁLOGO Y SISTEMAS EXPERTOS

Comunicación entre uno o más usuarios y la computadores

Sistemas pregunta-respuesta

Ejemplo: Asistente en la instalación de un programa, compras por internet

Sistemas expertos Representación de conocimiento Generación automática de textos

Software de manipulación de datos: Esto requiere un CORPUS amplio sobre los dominios

Ejemplos: Diagnósticos automatizados de enfermedades

Page 21: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

TRADUCCIÓN AUTOMÁTICA

Representación intermedia de dos o más códigos linguísticos

INTERLINGUA

Ejemplos: http://www.reverso.net/text_translation.aspx?lan

g=ES http://translate.google.es/

Page 22: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

LC COMO ÁREA DE CONOCIMIENTO

Un programa de formación en lingüística computacional debe contener las siguientes áreas de conocimiento: Lingüística Matemática Informática

En cuanto a los conocimientos teóricos Teorías estructuralistas Teorías generativistas clásicas Gramática de casos de Fillmore Gramática funcional Lingüística algorítmica

Page 23: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

PROBLEMAS ACTUALES EN LA LC

La LC trabaja en distintos niveles del lenguaje:

Fonética/Fonología

Morfología

Sintaxis

Semántica

Pragmática

Page 24: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

PROBLEMAS ACTUALES EN LA LCFONÉTICA Y FONOLOGÍA

Sistemas de análisis y síntesis del habla

Reconocimiento de voz

Generación de voz

Estos desarrollos se dirigen hacia el interés de diseñar programas para el dictado y reconocimiento automático.

No presentan aún desarrollos significativos puesto que no se logra modelar flexiones y variaciones en entonaciones particulares en las lenguas

Page 25: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

PROBLEMAS ACTUALES EN LA LCMORFOLOGÍA

Análisis y síntesis automático morfológico (sufijos, prefijos, raíces y flexiones)

Hace falta la construcción de diccionarios robustos

Aunque ha habido grandes desarrollos, se requiere una estandarización efectiva del lenguaje para la marcación

Page 26: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

PROBLEMAS ACTUALES EN LA LCSINTAXIS

Análisis y sintáctico (parser)

Es especialmente difícil automatizar en español donde no hay un orden fijo de las palabras que componen una oración

Ejemplo:

¿Estuviste en el parque el sábado?

¿El sábado estuviste en la parque?

¿Tu estabas en el parque el sábado?

Page 27: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

PROBLEMAS ACTUALES EN LA LCSEMÁNTICA

Construcción de redes semánticas donde se presenten conceptos y relaciones entre ellos Problemas: Polisemia Ejemplo:

Gato (animal felino) Gato (instrumento)

Encontrar sentidos y hacer separaciones entre ellos Lexicografía: construcción de diccionarios generales y

especializados

Representación de conocimientos en general Elaboración de terminologías especializadas Ontologías

Page 28: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

PROBLEMAS ACTUALES EN LA LCPRAGMÁTICA

Relaciones entre oración y el mundo externo.

Como ya se tienen muchos problemas en la semántica, es difícil continuar el análisis en el nivel siguiente.

Page 29: C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.

REFERENCIAS

Domínguez Burgos, Andrés. Lingüística computacional: un esbozo. Boletín de lingüística, No. 18. pp. 104-119

Mercado, Heiner (2008). Fundamentos de la LC [presentación de clase]

Sidorov, Grigory (2001). Problemas actuales de lingüística computacional. Revista digital universitaria, Vol. 2, No. 1