C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
-
Upload
guillermo-lopez-olivares -
Category
Documents
-
view
223 -
download
0
Transcript of C ONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL Ana María Tangarife Patiño.
CONCEPTOS GENERALES DE LA LINGÜÍSTICA COMPUTACIONAL
Ana María Tangarife Patiño
OBJETIVO
Exponer los conceptos generales de la disciplina, identificando las relaciones y diferencias con otras áreas disciplinares que comparten su objeto de estudio.
INTERDISCIPLINARIEDAD
Lingüística Informática
Objetivo:Generar modelos computacionales que reproduzcan uno o más
aspectos del lenguaje humano.
ÁREAS DISCIPLINARES INVOLUCRADAS (1)
LCIA
Industrias de la Lengua
Lingüística
aplicada
Lingüística
teórica
La LC es un campo interdisciplinario cuyo objetivo es incorporar en los computadores la habilidad en el manejo del lenguaje humano o natural.
ÁREAS DISCIPLINARES INVOLUCRADAS (2)
Informática IA
•Es la ciencia de hacer máquinas inteligentes.
LC •Diseña máquinas capaces de comprender el lenguaje, aprender, razonar y tomar decisiones.
ÁREAS DISCIPLINARES INVOLUCRADAS (3)
Lingüística teórica
•La lingüística es el estudio científico de la lengua. Como tal, se ocupa de descubrir y entender la naturaleza y las leyes que gobiernan el lenguaje.
LC •Elabora modelos formales (implementables informáticamente) del lenguaje humano.
FUNDAMENTOS DE LA LC
Lingüística aplicada •Rama de la lingüística que se ocupa de los problemas que el lenguaje plantea como medio de relación social y de la cual derivan tres ramas o campos de acción: enseñanza de lengua materna, enseñanza de segunda lengua y enseñanza de lenguas asistida por computador.
LC •Aplica los modelos y métodos de investigación lingüísticos en campos como la enseñanza de idiomas, la traducción, etc.
FUNDAMENTOS DE LA LC
LC •Elabora programas informáticos (software) para el mercado como los traductores, procesadores de texto, etc.
Industrias de la lengua
•Entendida como una actividad de índole fundamentalmente comercial, requiere el desarrollo de la ingeniería lingüística para disponer de las herramientas y técnicas a partir de las que se crean productos que realizan diversas funciones relacionadas con la utilización del lenguaje.
OBJETIVOS DE LA LC
Comprobar los modelos lingüísticos y las teorías, diseñando algoritmos y sistemas que puedan ser evaluados y comprendidos en trabajos de procesamiento de lenguaje natural (PLN).
Diferencia entre LC y PLN
LC: usa las máquinas computacionales para investigar o tratar los fenómenos lingüísticos.
PLN: aplicaciones concretas para el procesamiento de textos.
VERTIENTES DE LA LC
Dado que la LC abarca muchos objetivos es necesario diferenciar tres vertientes que delimitan su campo de acción:
1. Informática aplicada a la investigación
2. Implementación de teorías lingüísticas
3. Aplicaciones lingüísticas de la informática
INFORMÁTICA APLICADA A LA INVESTIGACIÓN
• Su objetivo es emprender el estudio científico del lenguaje por medio ordenadores.
• Suele recibir el nombre de Lingüística informática o de Informática aplicada a la lingüística.
Ejemplo: conocer el uso del sufijo –able en inglés moderno temprano por medio de un corpus escrito.
IMPLEMENTACIÓN DE TEORÍAS LINGÜÍSTICAS
• Su objetivo es elaborar formalismos lingüísticos que son lenguajes artificiales diseñados específicamente para representar conocimientos lingüísticos y que pueden ser entendidos por los ordenadores.
• Suele recibir el nombre de Lingüística computacional en sentido estricto.
Ejemplo: Wordnet, corpus lingüístico para el inglés
APLICACIONES LINGÜÍSTICAS DE LA INFORMÁTICA
• Diseña sistemas informáticos encaminados a la comprensión y generación del lenguaje natural.
• Esta vertiente recibe el nombre de Procesamiento del lenguaje natural, Tecnologías de la lengua o Ingeniería lingüística.
Ejemplo: tecnologías del habla, traducción automática, sistemas de extracción de información, etc.
PROGRAMAS PRINCIPALES DESARROLLADOS POR LA
LINGÜÍSTICA COMPUTACIONAL Modelos de teorías lingüísticas
Enseñanza de lenguas extranjeras
Corrección de ortografía y sintaxis de textos
Reconocimiento de voz humana
Procesamiento de información
Sistemas expertos
Traducción automática
ÁREAS DE LA LC
Análisis automático de la fonética, la fonología, la morfología, la sintaxis y la pragmática.
A partir de las siguientes tareas Etiquetamiento morfológico o tagging Análisis sintáctico o parsing Técnicas de reconocimiento automático de voz Recuperación inteligente de información Sistemas de diálogo y sistemas expertos Traducción automática
ANÁLISIS MORFOLÓFICO
Tagging (Etiquetador)
Análisis automático de las palabras que componen una frase.
ANÁLISIS SINTÁCTICO
Parsing (Parse: analizar sintácticamente)
Análisis automático de una oración.
Fase inicial para la interpretación semántica
ANALIZADORES MORFOSINTÁCTICOS
Ejemplos para el español http://www.gedlc.ulpgc.es/investigacion/desambi
gua/morfosintactico.htm http://www.mystilus.com/MorphosyntacticAnalyz
er
Analizador para el inglés: http://www2.lingsoft.fi/cgi-bin/engcg/
RECUPERACIÓN INTELIGENTE DE INFORMACIÓN
Information Retrieval
Almacenamiento y envío digital de datos
Técnicas de extracción de datos contenidos en textos y su transmisión a los usuarios
Ejemplos: Bases de datos Buscadores de internet
SISTEMAS DE DIÁLOGO Y SISTEMAS EXPERTOS
Comunicación entre uno o más usuarios y la computadores
Sistemas pregunta-respuesta
Ejemplo: Asistente en la instalación de un programa, compras por internet
Sistemas expertos Representación de conocimiento Generación automática de textos
Software de manipulación de datos: Esto requiere un CORPUS amplio sobre los dominios
Ejemplos: Diagnósticos automatizados de enfermedades
TRADUCCIÓN AUTOMÁTICA
Representación intermedia de dos o más códigos linguísticos
INTERLINGUA
Ejemplos: http://www.reverso.net/text_translation.aspx?lan
g=ES http://translate.google.es/
LC COMO ÁREA DE CONOCIMIENTO
Un programa de formación en lingüística computacional debe contener las siguientes áreas de conocimiento: Lingüística Matemática Informática
En cuanto a los conocimientos teóricos Teorías estructuralistas Teorías generativistas clásicas Gramática de casos de Fillmore Gramática funcional Lingüística algorítmica
PROBLEMAS ACTUALES EN LA LC
La LC trabaja en distintos niveles del lenguaje:
Fonética/Fonología
Morfología
Sintaxis
Semántica
Pragmática
PROBLEMAS ACTUALES EN LA LCFONÉTICA Y FONOLOGÍA
Sistemas de análisis y síntesis del habla
Reconocimiento de voz
Generación de voz
Estos desarrollos se dirigen hacia el interés de diseñar programas para el dictado y reconocimiento automático.
No presentan aún desarrollos significativos puesto que no se logra modelar flexiones y variaciones en entonaciones particulares en las lenguas
PROBLEMAS ACTUALES EN LA LCMORFOLOGÍA
Análisis y síntesis automático morfológico (sufijos, prefijos, raíces y flexiones)
Hace falta la construcción de diccionarios robustos
Aunque ha habido grandes desarrollos, se requiere una estandarización efectiva del lenguaje para la marcación
PROBLEMAS ACTUALES EN LA LCSINTAXIS
Análisis y sintáctico (parser)
Es especialmente difícil automatizar en español donde no hay un orden fijo de las palabras que componen una oración
Ejemplo:
¿Estuviste en el parque el sábado?
¿El sábado estuviste en la parque?
¿Tu estabas en el parque el sábado?
PROBLEMAS ACTUALES EN LA LCSEMÁNTICA
Construcción de redes semánticas donde se presenten conceptos y relaciones entre ellos Problemas: Polisemia Ejemplo:
Gato (animal felino) Gato (instrumento)
Encontrar sentidos y hacer separaciones entre ellos Lexicografía: construcción de diccionarios generales y
especializados
Representación de conocimientos en general Elaboración de terminologías especializadas Ontologías
PROBLEMAS ACTUALES EN LA LCPRAGMÁTICA
Relaciones entre oración y el mundo externo.
Como ya se tienen muchos problemas en la semántica, es difícil continuar el análisis en el nivel siguiente.
REFERENCIAS
Domínguez Burgos, Andrés. Lingüística computacional: un esbozo. Boletín de lingüística, No. 18. pp. 104-119
Mercado, Heiner (2008). Fundamentos de la LC [presentación de clase]
Sidorov, Grigory (2001). Problemas actuales de lingüística computacional. Revista digital universitaria, Vol. 2, No. 1