PLN interpretación semántica1 Interpretación semántica Semántica léxica Desambiguación de...
-
Upload
valerio-claudio -
Category
Documents
-
view
104 -
download
0
Transcript of PLN interpretación semántica1 Interpretación semántica Semántica léxica Desambiguación de...
PLN interpretación semántica 1
Interpretación semántica
• Interpretación semántica• Semántica léxica• Desambiguación de sentidos
• Word Sense Disambiguation (WSD)
PLN interpretación semántica 2
La Interpretación Semántica
• semántica léxica• "Pedro" pedro.
• "rie" (lambda(x), reir(x)))
• composición• (lambda(x), reir(x)) pedro reir(pedro).
• ¿Cómo llevar a cabo la IS? • función (o funciones) de composición
• momento de llevar a cabo la interpretación
PLN interpretación semántica 3
función de composición = lambda evaluación.
ORACION GN FV, (2 1)
GN np, (1)
FV vi, (1)
FV vt GN (1 2)
Pedro np, pedro
María np, maria
ríe vi, (lambda (x), reir(x))
ama a vt, ((lambda (x), (lambda (y), ama(y,x))))
PLN interpretación semántica 4
"Pedro rie"FRASE | SEM = (2 1) = (FV:SEM GN:SEM) = | ((lambda(x) reir(x)) pedro) = reir(pedro) | |_______GN | | SEM = (1) = (np:SEM) = pedro | | | |_______np | | SEM = pedro | | | Pedro |_______FV
| SEM = (1) = (vi:SEM) = (lambda(x) reir(x)) |_______vi
| SEM = (lambda(x) reir(x)) | ríe
ejemplo 1
PLN interpretación semántica 5
"Pedro ama a María"FRASE | SEM = (2 1) = (FV:SEM GN:SEM) = | ((lambda(x) amar(x,maria)) pedro) = amar(pedro,maria) |_______GN | | SEM = (1) = (np:SEM) = pedro | |________np | | SEM = pedro | Pedro |_______FV SEM=(1 2) = (vt:SEM GN:SEM) = (((lambda(y)
| (lambda(x) amar(x,y))) maria)=((lambda(x)amar(x,maria)) |_______vt | | SEM = ((lambda(y) (lambda(x) amar(x,y))) | ama a | |_______GN
| SEM = (1) = (np:SEM) = maria |_______np
| SEM = maria María
ejemplo 2
PLN interpretación semántica 6
Estrategias de la interpretacion semántica
• proceso posterior al análisis sintáctico• se parte del arbol de análisis
• unificacion del proceso sintáctico y semántico• existe un solo proceso de análisis.
• las categorias gramaticales se unifican: gramáticas semánticas
• proceso en paralelo sintaxis/semántica.• la semántica sirve para validar hipotesis de análisis sintáctico
• las interpretaciones (parciales) semánticas se construyen a medida que se construye el arbol de análisis.
• analizadores guiados por la semántica. • el papel de la sintaxis se reduce (si es que existe análisis sintáctico) a validar
determinadas hipotesis semánticas (ej. patrones de subcategorización o restricciones de selección) o a categorizar partes del texto.
PLN interpretación semántica 7
Análisis semántico independiente y posterior al sintáctico (Allen)
• aplicación de reglas de interpretación.
• <esquema> <descripcion parcial de la f.l.>
• el esquema consiste en un conjunto de restricciones selectivas, producto del análisis sintáctico.
• la representación semántica será una forma lógica. Las componentes de una construcción sintáctica darán lugar a formas lógicas parciales (con alguno de sus elementos aun no determinado).
• notacion:• * objeto (identificación única) descrito por la forma lógica
• t (<descritor>) tipo del constituyente
• v (<descritor>) interpretación semántica del constituyente
• ? elemento aún no determinado.
PLN interpretación semántica 8
Sintaxis de la forma lógica
• (<OPERADOR> <NOMBRE> <TIPO> <MODIFICADORES>)• Los operadores dependen del tipo de estructura a representar:
• Sintagmas nominales no cuantificados:• DEF/SING, DEF/PL, INDEF/SING, INDEF/PL
• Sintagmas nominales cuantificados• EACH, SOME
• Pronombres interrogativos• WH, WH/PL, WH/SING
• Pronombres personales• PRO
• Nombres propios• NAME
• Oraciones• ASSERT, Y/N_QUERY, WH_QUERY, COMMAND
• Sintagmas verbales• PAST, PRES, FUT, INF
• Relaciones• OR, AND, BUT
PLN interpretación semántica 9
Ejemplos de reglas de interpretacion 1
a green apple(NP DET a
ADJ (green)HEAD apple)
{(? A1 APPLE (COLOR C1 GR137)), (? A1 APPLE (UNRIPE C1))}
PLN interpretación semántica 10
Ejemplos de reglas de interpretacion 2
The man laughed(S SUBJ (NP DET the
HEAD manNUM {3s}SEM (DEF/SING M1 MAN))
MAIN-V laughTENSE past)
(? L1 LAUGH
[AGENT (DEF/SING M1 MAN)])
PLN interpretación semántica 11
Algoritmo de interpretacion semántica 1
• Se asume que cada subconstituyente se interpreta automáticamente cuando se efectúa la primera verificación semántica sobre él
• Se crea un nombre (reemplazando *)• Análisis del núcleo
• aplicar todas las reglas de interpretación indexadas por el núcleo
• mezclar las FLs parciales
• Para cada interpretación del núcleo aplicar lo siguiente hasta que todos los modificadores hayan actuado• seleccionar un modificador (componente sintáctico aún no interpretado)
• aplicar todas las reglas de interpretación indexadas por el head del modificador
• mezclar las FLs
• Producir las FLs mediante unificación
PLN interpretación semántica 12
Interpretacion de los constituyentes simples
• en general, la interpretacion de un constituyente comienza interpretando el nucleo de dicho constituyente (lo cual da lugar a llamadas recursivas al mecanismo de interpretacion).
• la interpretacion del nucleo suele obligar a la interpretacion de alguno de los modificadores. el resultado de esta fase (head analysis) es un conjunto de descripciones parciales correspondientes a la interpretacion del nucleo y una lista de modificadores ya utilizados).
• la siguiente fase (modifiers analysis) consiste en la interpretacion de los modificadores aun no interpretados y la incorporacion del resultado a la forma logica (parcial) que interpreta al componente.
PLN interpretación semántica 13
Algoritmo de unificación 1
• Unificador• ? unifica con cualquier cosa. • dos objetos identicos unifican• dos objetos con modificadores unifican si son
consistentes los modificadores correspondientes a los casos más internos.
• la unificación con valores ambiguos se realiza mediante la intersección de los valores de cada una de las interpretaciones parciales.
PLN interpretación semántica 14
Algoritmo de unificación 2
• ejemplos• (? R1 RUN [THEME (NAME J1 PERSON "John"]))
• (? R1 RUN [THEME (DEF/SING P1 PRINT-PRESS)])
• no son unificables• (? R1 RUN [AGENT (NAME J1 PERSON "John"]))
• (? R1 RUN [THEME (DEF/SING P1 PRINT-PRESS)])
• si lo son, dando lugar a:• (? R1 RUN [AGENT (NAME J1 PERSON "John"]))
[THEME (DEF/SING P1 PRINT-PRESS)])
PLN interpretación semántica 15
Algoritmo de interpretacion semántica 2
The dishwasher laughed(S SUBJ (NP DET the
NUM {3s}HEAD diswasher)
MAIN-V laugh TENSE past)
(the.1) (NP DET the NUM {3s}) (DEF/SING * ? ?)
(dishwasher.1) (NP HEAD dishwasher) (? * {PERSON_TYPE_43, APPLIANCE_TYPE_3} ?)
(laugh.1) (S SUBJ +animate MAIN_V laugh) (? * LAUGH [AGENT V(SUBJ)])
(past.1) (S TENSE PAST) (PAST ? ? ?)
PLN interpretación semántica 16
aplicacion de la regla laugh.1 ==> subj ha de tener la caracteristica +animate==> hay que analizar subj ==> hay que analizar np ==> aplicacion de the.1 y diswasher.1
(DEF/SING D1 ? ?)(? D1 {PERSON-TYPE-3,
APPLIANCE-TYPE-43} ?)
Algoritmo de interpretacion semántica 3
PLN interpretación semántica 17
se unifican las descripciones parcialesel resultado rellena el descriptor sem del np y del subj.
(S SUBJ (NP DET theNUM {3s}HEAD diswasherSEM (DEF/SING D1
{PERSON-TYPE-3, APPLIANCE-TYPE-43})
MAIN-V laughTENSE past)
Algoritmo de interpretacion semántica 4
PLN interpretación semántica 18
ahora ya es posible la aplicacion de la regla laugh.1, dando lugar a
(? L1 LAUGH [AGENT (DEF/SING D1 PERSON-TYPE-3)])
la interpretacion de TENSE, mediante la aplicacion de la regla past.1 da lugar a
(PAST ? ? ?)
y la posterior unificacion a
(PAST L1 LAUGH [AGENT (DEF/SING D1 PERSON-TYPE-3)])
Algoritmo de interpretacion semántica 5
PLN interpretación semántica 19
Jerarquía de reglas
(give.1) (S SUBJ +animate MAIN_V give) (? * GIVE1 [AGENT V(SUBJ)])(give.2) (S OBJ +physobj MAIN_V give) (? * GIVE1 [THEME V(OBJ)])(give.3) (S IOBJ +org MAIN_V give) (? * GIVE1 [TO_POSS V(IOBJ)])(give.4) (S MAIN_V give MODS (PP PREP to POBJ +org)) (? * TO_POSS [AGENT V(POBJ)])
action
obj/action
to/action inst/action
laugh
give break
PLN interpretación semántica 20
Interpretacion de los componentes complejos 1
The man gave the company a car at the fairgrounds
(S SUBJ (NP "the man")MAIN-V giveTENSE pastOBJ (NP "a car")IOBJ (NP "the company")MODS ([PP PREP at
POBJ (NP "the fairgrounds")]))
(? G1 GIVE1 [AGENT (DEF/SING M1 MAN)][THEME (INDEF/SING C1 AUTO)][TO-POS (DEF/SING C2 COMPANY_ORG)])
la aplicación del algoritmo sobre el núcleo da lugar a:
de forma que sólo TENSE y MODS quedan sin interpretar
PLN interpretación semántica 21
la interpretacion de tense, mediante la aplicacion de la regla past.1 da lugar a
(PAST ? ? ?)
la interpretacion de mods se realiza mediante la regla at.1. dando lugar a:
(? G1 ? (AT-LOC G1 (DEF/SING F1 FAIRGROUND)))
Interpretacion de los componentes complejos 2
PLN interpretación semántica 22
La posterior unificacion de estas dos formas con la resultante del nucleo produce:
(PAST G1 GIVE1 [AGENT (DEF/SING M1 MAN)][THEME (INDEF/SING C1 AUTO)][TO-POS (DEF/SING C2 COMPANY_ORG)](AT-LOC G1 (DEF/SING F1 FAIRGROUND)))
Interpretacion de los componentes complejos 3
PLN interpretación semántica 23
Gramáticas semánticas 1
• combinación de sintaxis y semántica en un único formalismo (normalmente gramáticas incontextuales)
• en las gramáticas semánticas los símbolos terminales son categorías semánticas.• tamaño mayor (número de reglas).
• número de palabras por categoría mucho menor.
• mayor ambigüedad.
• problema: generalidad
• aplicación: sistemas robustos y eficientes en dominios restringidos.• la construcción de la forma lógica a partir de la gramática se hace
directamente mediante simples extensiones.
PLN interpretación semántica 24
Gramáticas semánticas 2
RES_VP RESERVING, RES_MODSDEP_VP DEPARTING, DEP_MODS
RESERVING RESERVE_VERB, FLIGHTRES_MODS for, PERSONRES_MODS []
DEPARTING DEPART_VERBDEPARTING DEPART_VERB, SOURCE_LOCDEP_MODS DEP_MOD, DEP_MODSDEP_MODS []DEP_MOD to, DEST_LOCDEP_MOD from, SOURCE_LOC
PLN interpretación semántica 25
Semántica léxica
• Diccionarios semánticos• Ontologías
• Tipología
• Granularidad
• Ámbito
• Generalidad
• Ejemplos• UMLS
• WordNet
• EuroWordnet
• Otros recursos
PLN interpretación semántica 26
Ejemplo: UMLS
• UMLS (Unified Medical Language System) • National Library of Medecine, USA Department of Health and Human
Services
• Conjunto de recursos
• Metatesauro
• 330.000 conceptos, 735.000 términos
• Red Semántica
• Conjunto de categorías semánticas básicas (135 tipos semánticos, 51 relaciones)
• Enlaces con los Vocabularios fuente
• 30 fuentes (multilingües)
• Lexicón especializado
• con información morfo-sintáctica
PLN interpretación semántica 27
Ejemplo: WordNet
• WordNet • Universidad de Princeton (Fellbaum,1998)
• Conceptos lexicalizados (palabras, lexías)• synsets: conjunto de sinónimos (sinonimia en contexto)
• Cobertura en nombres, verbos, adjetivos y adverbios
• Relacionados entre sí por relaciones semánticas• sinonimia
• antonimia
• hiperonimia-hiponimia
• meronimia
• implicación
• causa
• ...
• Wn1.5, Wn1.6,Wn 1.7: 120.000 palabras, 100.000 synsets
• Wn2.0, Extended WordNet
http://www.cogsci.princeton.edu/~wn/
PLN interpretación semántica 28
{vehicle}
{conveyance; transport}
{car; auto; automobile; machine; motorcar}
{cruiser; squad car; patrol car; police car; prowl car} {cab; taxi; hack; taxicab; }
{motor vehicle; automotive vehicle}
{bumper}
{car door}
{car window}
{car mirror}
{hinge; flexible joint}
{doorlock}
{armrest}
hyperonym
hyperonym
hyperonym
hyperonymhyperonym
meronym
meronym
meronym
meronym
Fragmento de WN1.5
PLN interpretación semántica 29
EuroWordNet
• Proyecto LE-2 4003 Telematics Application Programme de la Unión Europea• Redes semánticas de diversas lenguas, integradas e interconectadas
• Inglés Universidad de Sheffield
• Holandés Univ. de Amsterdam
• Italiano I.L.C. de Pisa
• Español UB, UPC, U.N.E.D
• Cobertura básicamente nominal y verbal (50.000 acepciones por lengua)• Gran riqueza en las relaciones semánticas
• inter/intra linguales, inter/intra categoriales
• EWN2• Alemán, Checo, Estonio, Francés
• Extensiones al catalán, gallego y vasco• Extensiones y mejoras
http://www.hum.uva.nl/~ewn/http://www.lsi.upc.es/~nlp/
PLN interpretación semántica 30
PLN interpretación semántica 31
Levin classes (3100 verbs)
• 47 top level classes, 193 second and third level
• Basadas en pares de plantillas sintácticas.John broke the jar. / Jars break easily. / The jar broke.
John cut the bread. / Bread cuts easily. / *The bread cut. John hit the wall. / *Walls hit easily. / *The wall hit.
• Reflejan implícitamente los componentes semánticoscontact, directed motion, exertion of force, change of state
• Sinonimia, plantillas sintácticas (patrones de subcategorización)
PLN interpretación semántica 32
Intersective Levin classes
PLN interpretación semántica 33
Regular Sense Extensions
John pushed the chair. +force, +contact
John pushed the chairs apart. +ch-state
John pushed the chairs across the room. +ch-loc
John pushed at the chair. -ch-loc
The train whistled into the station. +ch-loc
The truck roared past the weigh station. +ch-loc
PLN interpretación semántica 34
VerbNet 1
• Lexicón verbal computacional• Asociaciones entre sintaxis y semántica
• Syntactic frames (patrones de subcategorización) y restricciones de selección.
• Información semántica léxica – estructura predicado/argumentos
• Componentes semánticos representados como predicados• Links a synsets de WordNet
• Entradas basadas en refinamiento de las clases de Levin
• Propiedades temporales inherentes representadas explícitamente• during(E), end(E), result(E)
PLN interpretación semántica 35
Hit Class
Basic Transitive A V P Manner (during(E), directedmotion,A)^
Manner (end(E), forceful,A)^
Contact(end(E),A,P)
Transitive with
Instrument
AVP with I Manner (during (E)directedmotion,I)^
Manner (end (E),forceful,I)^
Contact (end(E),I,P)
Conative AV at P Manner (during (E), directedmotion, A)
With/against alternation A V I against/on P
Manner(during (E), directedmotion, I)^
Manner(end(E), forceful, I)^
Contact (end(E), I, P)
<<MEMBERS>> [<hit1>, <kick1>,<slap1>…]<<THEMATIC ROLES>> Agent(A), Patient(P), Instrument(I)<<SELECT RESTRICTIONS>> Agent [+animate],
Patient [+concrete],Instrument [+concrete,-animate]
<<FRAMES and PREDICATES>>
VerbNet 2
PLN interpretación semántica 36
Penn Treebank
• 1,3 millones de palabras, 40.000 oraciones• Wall Street Journal y otras fuentes• POS tagged• Syntactically Parsed
PLN interpretación semántica 37
A TreeBanked Sentence
Analysts
S
NP-SBJ
VP
have VP
been VP
expecting NP
a GM-Jaguar pact
NP
that
SBAR
WHNP-1
*T*-1
S
NP-SBJVP
wouldVP
give
the US car maker
NP
NP
an eventual 30% stake
NP
the British company
NP
PP-LOC
in
(S (NP-SBJ Analysts) (VP have (VP been (VP expecting
(NP (NP a GM-Jaguar pact) (SBAR (WHNP-1 that)
(S (NP-SBJ *T*-1) (VP would
(VP give (NP the U.S. car maker)
(NP (NP an eventual (ADJP 30 %) stake) (PP-LOC in (NP the British
company))))))))))))
Analysts have been expecting a GM-Jaguar pact that would give the U.S. car maker an eventual 30% stake in the British company.
PLN interpretación semántica 38
Proposition Bank (Propbank)
Powell met Zhu Rongji
Proposition: meet(Powell, Zhu Rongji)Powell met with Zhu Rongji
Powell and Zhu Rongji met
Powell and Zhu Rongji had a meeting
. . .
When Powell met Zhu Rongji on Thursday they discussed the return of the spy plane.
meet(Powell, Zhu) discuss([Powell, Zhu], return(X, plane))
debate
consult
joinwrestle
battle
meet(Somebody1, Somebody2)
Generalización de oraciones a proposiciones
PLN interpretación semántica 39
The same sentence, PropBanked
Analysts
have been expecting
a GM-Jaguar pact
Arg0 Arg1
(S Arg0 (NP-SBJ Analysts) (VP have (VP been (VP expecting
Arg1 (NP (NP a GM-Jaguar pact) (SBAR (WHNP-1 that)
(S Arg0 (NP-SBJ *T*-1) (VP would
(VP give Arg2 (NP the U.S. car maker)
Arg1 (NP (NP an eventual (ADJP 30 %) stake)
(PP-LOC in (NP the British company))))))))))))that would give
*T*-1
the US car maker
an eventual 30% stake in the British company
Arg0
Arg2
Arg1
expect(Analysts, GM-J pact)give(GM-J pact, US car maker, 30% stake)
PLN interpretación semántica 40
Desambiguación de sentidos 1
• Sense (sentido, acepción)• distinción del significado de una palabra (word type)
observable en diferentes usos (word tokens)
• Word Sense Disambiguation (WSD)• dada una palabra (word token) en un contexto determinar cuál
es su sentido correcto
PLN interpretación semántica 41
Desambiguación de sentidos 2
• Problemas• Homonimia: significados no relacionados
• banco financiero, banco de pesca
• Polisemia: significados relacionados
• Polisemia regular (sistemática)• entré en (el edificio de) la universidad
• Metáfora• Me bebí un vaso de vino
• ¿Cuántos sentidos? ¿Cuáles?
• ¿Realmente es posible?
PLN interpretación semántica 42
Desambiguación de sentidos 3
• Problema similar al POS tagging• Se pueden intentar aproximaciones similares
• Pero es mucho más difícil
• Restricciones habituales• Yarowsky (1995)
• One sense per discourse
• One sense per collocation
PLN interpretación semántica 43
Desambiguación de sentidos 4
• Una posible solución (Naive Bayes)• Sea w la palabra a desambiguar
• Sean ck los posibles sentidos
• Sea el vector de contexto (p.ej. ventana fija de 100 palabras).
• Aplicando Bayes tenemos:
x
)|(maxarg' xcPc kck
PLN interpretación semántica 44
Desambiguación de sentidos 5
xinv
kkjc
kkc
kkc
kk
c
kc
jk
k
k
k
k
cPcvP
cPcxP
cPcxP
cPxP
cxP
xcPc
)(log)|(logmaxarg
)(log)|(logmaxarg
)()|(maxarg
)()(
)|(maxarg
)|(maxarg'