3.7 Introducción al problema de la decisión. - lllf.uam.es7Elogicaww/textos/L%F3gica%20... ·...

26
Introducción al problema de la decisión En este capítulo me voy a ocupar de estudiar si es posible contar o no con un procedimiento que en tiempo finito determine si un cierto argumento es admisible desde el punto de vista de un cierto formalismo. En realidad, tendremos siempre en mente el caso de LPO de modo que el problema será determinar la existencia de un procedimiento tal para la relación de derivabilidad o consecuencia semántica, tanto da, de la Lógica de Primer Orden. Aunque la decidibilidad de una Lógica suele adjudicarse con frecuencia al cálculo, y no a los modelos –a la consecuencia semántica- en realidad no hay razones que justifiquen esta postura. La definición que aquí se ha dado de lo que debe entenderse por una Lógica permite considerar la decidibilidad como un rasgo genérico del sistema que se analice en cada caso. La consabida coincidencia extensional entre las relaciones de derivabilidad formal y consecuencia semántica para LPO permite que estudiemos la decidibilidad como una propiedad de la Lógica de Primer Orden y no como algo más específico. De hecho, veremos que algunos de los razonamientos son absolutamente abstractos y no hace mención a contexto alguno, aunque también es oportuno reconocer que en este caso la noción constructiva de prueba ejerce una considerable influencia en todo el tratamiento. La propiedad de ser decidible se puede predicar de una propiedad, relación, de una definición, y, desde luego, de un procedimiento. Posee una vida propia que la hace independiente de los aspectos específicos que encontramos asociados al estudio de la derivabilidad y al estudio de la consecuencia. ¿Cuándo decimos que una propiedad o relación es decidible? En primer lugar, es preciso fijar una colección de objetos sobre la cual tiene sentido hacerse esa pregunta. Decimos entonces que

Transcript of 3.7 Introducción al problema de la decisión. - lllf.uam.es7Elogicaww/textos/L%F3gica%20... ·...

Introducción al problema de la decisión

En este capítulo me voy a ocupar de estudiar si es posible contar o no con un

procedimiento que en tiempo finito determine si un cierto argumento es admisible

desde el punto de vista de un cierto formalismo. En realidad, tendremos siempre en

mente el caso de LPO de modo que el problema será determinar la existencia de un

procedimiento tal para la relación de derivabilidad o consecuencia semántica, tanto da,

de la Lógica de Primer Orden.

Aunque la decidibilidad de una Lógica suele adjudicarse con frecuencia al

cálculo, y no a los modelos –a la consecuencia semántica- en realidad no hay razones

que justifiquen esta postura. La definición que aquí se ha dado de lo que debe

entenderse por una Lógica permite considerar la decidibilidad como un rasgo genérico

del sistema que se analice en cada caso. La consabida coincidencia extensional entre

las relaciones de derivabilidad formal y consecuencia semántica para LPO permite que

estudiemos la decidibilidad como una propiedad de la Lógica de Primer Orden y no

como algo más específico. De hecho, veremos que algunos de los razonamientos son

absolutamente abstractos y no hace mención a contexto alguno, aunque también es

oportuno reconocer que en este caso la noción constructiva de prueba ejerce una

considerable influencia en todo el tratamiento.

La propiedad de ser decidible se puede predicar de una propiedad, relación, de

una definición, y, desde luego, de un procedimiento. Posee una vida propia que la

hace independiente de los aspectos específicos que encontramos asociados al estudio

de la derivabilidad y al estudio de la consecuencia. ¿Cuándo decimos que una

propiedad o relación es decidible? En primer lugar, es preciso fijar una colección de

objetos sobre la cual tiene sentido hacerse esa pregunta. Decimos entonces que

Lógica de Primer Orden

384

[1] Una propiedad o relación es decidible sobre un dominio particular de

objetos syss existe un procedimiento efectivo que permite responder en

tiempo finito y de forma tanto afirmativa como negativa la pregunta de si

un objeto de ese dominio posee la propiedad o relación en cuestión.

Faltaría ver qué es eso de un procedimiento efectivo, pero siempre podemos

considerar que un procedimiento efectivo es uno en el que nos limitamos a aplicar una

serie de instrucciones inequívocas, siempre ejecutables en tiempo finito, y que

proceden de modo que nunca caben dudas acerca de qué instrucción corresponde

ejecutar a continuación.

Así las cosas, no parece que la decidibilidad, en lo que aquí nos afecta,

corresponda en abstracto a la derivabilidad o a la consecuencia semántica, sino más

bien a cada posible descripción concreta de esas nociones. ¿Supone esto que

debemos estar dispuestos a aceptar que un cierto sistema deductivo sea decidible

mientras que otro, equivalente al primero, no lo es? En tal caso, ¿qué debemos decir

de la derivabilidad para ese lenguaje, que es decidible o que no lo es? Hay sistemas

deductivos cuya estructura les hace de forma explícita malos candidatos a erigirse en

procedimientos de decisión. ¿Cómo responderíamos a la pregunta “¿X|A?” en Axc o

en DNc? Consideremos sólo el segundo caso. La única forma de comprobar si X|DNcA

es dando inicio a una derivación en la que tras colocar cada una de las fórmulas de X

como premisas intentaríamos hallar la conclusión A. ¿Qué pasa si tras una larga serie

de pasos aún no hemos llegado a A? ¿Debemos confiar en nuestras capacidades y

afirmar que si en k pasos A no ha sido hallada es porque no puede serlo, o debemos

insistir un poco más y prolongar la derivación otros n pasos más? Es obvio que el

Cálculo de Deducción natural no fue concebido como un procedimiento para

responder preguntas acerca de la derivabilidad de un argumento, sino, más bien,

como un procedimiento para construir derivaciones. Algo distinto es lo que sucede con

el Cálculo de Tablas Analíticas. La posibilidad de alcanzar un punto donde,

eventualmente, ya no se pueden seguir aplicando reglas permite pensar en una

detención del procedimiento en un punto que permita juzgar si el argumento en

Introducción al problema de la decisión

385

cuestión es o no derivable. Como se puede ver, que un sistema deductivo constituya o

no un procedimiento de decisión depende, en primer lugar, de su estructura o

arquitectura general: el cálculo de secuentes no está originalmente orientado a

la decisión, pero una serie de manipulaciones de su arquitectura permiten dar con un

procedimiento tal. Pero también depende del tipo de reglas que nos veamos obligados

a admitir. Estas reglas son resultado, a su vez, de la presencia de ciertas constantes

lógicas en el lenguaje formal que en cada caso se estudia. Con esto llegamos a un

hecho fundamental: la decidibilidad de un sistema deductivo puede depender, en

última instancia, del tipo de constantes lógicas presentes en un lenguaje formal. Si

admitimos que la presencia de constantes lógicas en un lenguaje formal es una forma

de medir su potencia expresiva, ese aserto se transforma en otro algo más vago, pero

mucho más significativo: la decidibilidad de un sistema deductivo puede depender de

la potencia expresiva del lenguaje formal cuya relación de consecuencia se estudia. Si

la decidibilidad afectada es la del único sistema deductivo orientado a la decisión,

entonces aún podemos obtener algo más definitivo hablando no ya de este o aquel

sistema formal, sino de la misma relación de derivabilidad. Es este hecho el que hace

tan importante el estudio de la decidibilidad, ya que parece aludir a una especie de

conexión general entre la textura con que un lenguaje formal representa la estructura

de la inferencia y la capacidad de juicio o control que nos concede. El descubrimiento

de sutiles puntos de equilibrio en un asunto tan fundamental como es ese, nos lleva

una vez más ante la existencia de una especie de materia formal que se manifiesta en

nuestras capacidad cognitivas y que en ocasiones parecemos descubrir más que

legislar.

Hemos hablado sólo de derivabilidad, ¿es que acaso la decidibilidad no se

puede predicar de la relación de consecuencia semántica? Es evidente que la relación

de consecuencia semántica posee una definición en modo alguno orientada a la

decisión. Eso no significa que en determinados casos no se pueda establecerse un

mecanismo de decisión propiamente semántico, pero ello exige un cierto alejamiento

de la definición original de la consecuencia.

Lógica de Primer Orden

386

Puede sorprender que en esta ocasión no termine ofreciendo uno de esos

teoremas que tanto proliferan en Lógica, uno que diga, por ejemplo, que la relación de

entrañamiento o la de derivabilidad son decidibles para LE (LC). Para poder afirmar que

la derivabilidad es decidible para un lenguaje formal L bastará con que alguno de los

sistemas deductivos definidos constituya un procedimiento de decisión para preguntas

del tipo ¿X|SA?. Ya sabemos, por ejemplo, que la derivabilidad definida para LE es

decidible: TA se transforma fácilmente en uno de esos procedimientos, pero también lo

es la relación de consecuencia semántica mediante el método de tablas de verdad. No

lo es, sin embargo, la derivabilidad definida sobre LC. El estudio de esta situación nos

pondrá en contacto con uno de los problemas más profundos que pueden estudiarse

en Lógica. Me refiero a las limitaciones que nuestro ingenio formal encuentra para

tratar de forma mecánica la solución a problemas absolutamente legítimos. También

veremos que no todo LC es indecidible, existiendo fragmentos decidibles cuya

existencia nos pone ante una frontera epistemológica no siempre bien entendida ni

explicada. Pero todo esto será más adelante.

El término problema de la decisión que se menciona el título de este capítulo

data, como tal, de los primeros años del siglo xx. No se trata pues de una

denominación elegida simplemente como epígrafe de una nueva sesión de este curso,

sino de un asunto erigido en hito y tópico de cualquier exposición de los modernos

contenidos de la Lógica. El problema de la decisión –Entscheidungsproblem, en la

denominación original debida a Hilbert- consiste en determinar si un argumento dado

es correcto o no para la Lógica de Primer Orden. ¿Por qué debería representar este

asunto un problema? La comprobación de la existencia de un procedimiento de

decisión para la Lógica de Primer Orden no debería suponer nada distinto de la

demostración de un resultado, un teorema, en el que se establezca si éste es o no el

caso, sin que se vea en ello problema alguno. La razón de que la búsqueda de este

teorema fuera bautizada en su día como un problema se debe, en gran medida, al

número de consecuencias e implicaciones epistemológicas de todo tipo que poco a

poco se fueron concentrando en torno a esta cuestión.

Introducción al problema de la decisión

387

El periodo que se extiende desde los últimos años del siglo xix hasta el primer

tercio del siglo xx constituye una etapa de grandes esperanzas para el futuro de la

Lógica. El lenguaje de la Lógica de Primer Orden con identidad es considerado como

un medio óptimo para representar una gran cantidad de conocimiento matemático

hasta entonces expresado de manera más o menos informal. Esta impresión general

acerca del valor de la Lógica es desarrollada de manera sistemática por Hilbert y la

escuela formalista para proponer su programa de axiomatización de la Matemática. El

objetivo de este proyecto consistía, entonces, en reducir las distintas teorías

matemáticas particulares a sistemas axiomáticos formulados en LC=. El contenido

específico de cada una de estas teorías, expresadas antes en el lenguaje ordinario

con la imprecisión que eso conlleva, quedaría alojado en sus axiomas particulares y en

la interpretación de los símbolos lógicos que en LC= carecen de designación fija –las

letras predicativas, las letras de constante individual-. Una vez sometida a este nuevo

formato, la teoría matemática original habría pasado a comportarse en todo lo demás

como una teoría lógica. En particular, todo su aparato de prueba habrá quedado

convertido en el que LC= posee por tratarse de un sistema formal. Vemos cómo, poco a

poco, y ante la evidencia de la utilidad de un cierto lenguaje para expresar

conocimiento con sus recursos expresivos, el problema de determinar la derivabilidad

de un argumento lógico va acumulando consecuencias epistemológicas imprevistas.

Pero, ¿qué consecuencias de orden intuitivo tiene el que una teoría

axiomatizada posea, por tratarse de una teoría formalizada en LC=, un método para

determinar si una fórmula es o no consecuencia de esos axiomas? ¿Acaso no va esto

implícito en el logro de esa formalización la existencia de un mecanismo tal? Una

teoría axiomática posee, por el hecho de serlo, un procedimiento que permite

enumerar una tras otra las sucesivas conclusiones que se siguen de ella. Basta utilizar

los axiomas y los teoremas de dicha teoría para generar, mediante sus reglas de

inferencia, nuevos teoremas. La enumeración aludida se refiere a la posibilidad de

registrar en un listado –con posibles repeticiones- todas las fórmulas que van siendo

obtenidas. La descripción de este proceso parece dar a entender la reducción del

manejo de dicha teoría a un procedimiento mecánico capaz de determinar todas las

cuestiones relacionadas con ella. Sin embargo, esta interpretación podría ser

Lógica de Primer Orden

388

parcialmente incorrecta. Imaginemos que alguien pregunta a un grupo de expertos

dedicados al desarrollo de una teoría axiomatizada T si una determinada fórmula es o

no consecuencia de esa teoría. ¿Qué se supone que han de hacer estos

investigadores para comprobarlo? Posiblemente encargarían a uno de sus miembros

el repaso de la lista intentando localizar la presencia de la fórmula solicitada. Si ésta se

halla en la lista la respuesta es clara, pero ¿qué sucede si no se encuentra? La

respuesta habría de ser, tal vez, un “...bueno, por el momento no tenemos constancia,

pero quizá en el futuro...”. Dudo que nuestro hipotético solicitante se conformase con

esa respuesta ya que el no ha preguntado si su fórmula, sea ésta A, era tenida entre

los teoremas de T, sino si es un teorema de T. Caso de insistir, parece que la única

solución será hacer que uno de estos investigadores se disponga a buscar una

derivación de A a partir de T. Aunque desde un punto de vista informal la diferencia

entre lo que nuestro investigador hacía antes de esta molesta interrupción de su rutina,

derivar conclusiones sin más, y lo que hace ahora, buscar una en concreto, no es

apreciable en toda su extensión, se trata, tal vez, de uno de los distingo de orden

epistemológico más importante que cabe atribuir a la investigación Lógica. Mientras

que la primera actividad resulta mecánica en un sentido trivial, la segunda no lo es:

hay un objetivo cuya satisfacción obliga a una tarea de planificación y diseño de

estrategias para la cual no poseemos instrucciones precisas, en cualquier caso no se

trata de instrucciones dependientes de T. Imaginemos que disponemos una de estas

estrategias de búsqueda y procedemos a ensayar si A es o consecuencia de T. Al

cabo de un tiempo prudencial no hemos localizado A, ¿se debe a que A no es

realmente una consecuencia de T, o que nuestra estrategia no es adecuada? De

nuevo no hay nada en T que permita distinguir estas dos circunstancias, a saber, la

ausencia de una demostración por falta de pericia, o una ausencia debida a la

inexistencia de una demostración de A.

Es posible que nuestro cliente se atreva entonces a sugerir lo que parece

obvio: ¿acaso no es posible ir elaborando un listado alternativo en el que consten

exactamente aquellas fórmulas que no son consecuencia de T? Si las cosas están

bien hechas, no habrá nunca ninguna fórmula que pueda aparecer en ambas listas y

además, cada fórmula acabará por aparecer en una de ellas. Esta inteligente

Introducción al problema de la decisión

389

observación resuelve el problema que hemos experimentado al no saber cómo

interpretar el fracaso de nuestros intentos por determinar si A es o no un teorema de T.

Si A aún no ha sido localizada en T ello se puede deber a que realmente no está en T,

pero entonces habrá de estar en alguna posición de la lista de no-T –las fórmulas que

no son teoremas de T- y será cuestión de tiempo localizarla. Cuando una teoría posee

suficiente capacidad para comportarse de este modo, decimos que es decidible, en

caso contrario será sólo semidecidible. Pero, ¿de qué depende que una teoría sea o

no decidible?, ¿hay teorías de Primer Orden semidecidibles? Puesto que hemos

aceptado que nuestras teorías son teorías de Primer Orden con identidad, el asunto

sólo dependerá de la existencia de un procedimiento de decisión para ese lenguaje.

Elegir los sistemas axiomáticos no ha sido, desde este punto de vista, una buena

decisión. Ellos no están orientados a la decisión sino a la demostrabilidad, de modo

que debemos plantearnos otros mecanismos mejor encaminados. Los cálculos de

Secuentes –Sqc- , o de Tablas Analíticas –TAc- parecen mejores candidatos por las

razones que ya explicamos en su momento, ¿por qué no ensayar con ellos?

La razón para evitar un trabajo como el que aparentemente nos deberíamos

plantear ahora es la misma que permitió demostrar a Church y Turing en 1936, de

forma independiente, la inexistencia de un procedimiento de decisión para la Lógica de

Primer Orden con identidad. Ambos supieron ver que la capacidad expresiva de este

lenguaje formal y la posibilidad de emplearlo para formalizar importantes dominios de

la realidad matemática debía tener consecuencias en investigaciones aparentemente

de menor rango. Esa generalidad debía tener también una contrapartida para la Lógica

haciéndola vulnerable al impacto de los resultados que se pudieran dar

independientemente en teorías particulares –o fragmentos relevantes- que resultasen

a la larga formalizables en Primer Orden. De este modo, el problema de la decisión

para la Lógica de Primer Orden con identidad se resuelve, en realidad, desde fuera de

la misma Lógica. ¿Cómo?

Tanto Church como Turing, sobre todo el primero, venían trabajando en un

intento de descripción matemática completa de la clase de tareas que pueden ser

ejecutadas de manera efectiva, o por decirlo de otro modo, que son mecanizables.

Lógica de Primer Orden

390

Estas tareas se concentraban en aquellas relacionadas con el cálculo de funciones

numéricas entre números naturales, pero esto es lo de menos. Por entonces era un

problema de la mayor importancia saber si dada una de estas tareas –un descripción

exacta de sus instrucciones, en realidad- y un input para la misma, sea éste in, era

posible determinar de manera efectiva si dicha tarea finalizaría arrojando un output, no

importa cuál –este problema será después conocido por problema de parada-. La

conexión entre este problema y el que nos ocupa se produce en dos etapas. La

primera, menos comentada en la bibliografía, se refiere a la identificación del tipo de

operación mecánica que tiene lugar al ejecutar cada una de las instrucciones que

forman una de estas rutinas. Tales operaciones resultan en esencia idénticas a

aquellas que tienen lugar al aplicar cada una de las reglas de inferencia con las que

hemos generado los sistemas deductivos para LC=, es decir, resultan ser operaciones

efectivas en el mismo sentido de éste término –sea el que sea-. La segunda etapa es,

en parte consecuencia de ésta. Dada la generalidad de LC=, no es imposible imaginar

una forma de representar dentro de LC= el problema de parada para una tarea

previamente dada que opera sobre un input in igualmente dado. Tampoco es

imposible, ni siquiera difícil, representar mediante una fórmula de Primer Orden el acto

de aplicar una instrucción de las que posee la tarea para dar lugar a un paso ulterior

de esa tarea. Así las cosas, determinar el problema de parada de una tarea efectiva

dado un input se reduce a demostrar en Primer Orden la fórmula que expresa la

existencia de un output a partir de la aplicación de una serie de instrucciones

previamente fijadas. Por tanto, si la Lógica de Primer Orden con identidad resulta ser

decidible, el problema de parada para una tarea dada resultará igualmente decidible.

Esta consecuencia constituye el nudo del teorema que a continuación se

enuncia:

Introducción al problema de la decisión

391

[2] Teorema (Church, Turing 1936): La Lógica de Primer Orden con

identidad no es decidible.

Esquema de demostración: Como se acaba de indicar, si el problema

de la decisión para la Lógica de Primer Orden con identidad tiene una

solución positiva, entonces el problema de parada para cualesquiera

tareas efectivas tiene, a su vez, una solución positiva. Sin embargo esto

último debe ser rechazada en función de un argumento independiente, y

por tanto, también la existencia de la solución indicada al problema de la

decisión.

Como puede verse, este resultado es, en realidad un corolario de un enunciado

tan perturbador o más que el propio teorema que acabamos de formular. La

demostración de la inexistencia de una solución general al problema de parada va más

allá de los contenidos de este curso formando parte íntegra de los cursos de Teoría de

la Computación.

La conclusión general que se desprende de todo ello es la definitiva ineficacia

de cualquier sistema deductivo o procedimiento que quepa formular para la Lógica de

Primer Orden. Esta observación resulta llamativa en la medida en que nos obliga a

reconocer que sistemas en principio bien orientados hacia el asunto de la decisión,

pienso en TAc, dejan de actuar adecuadamente a partir de un cierto punto. El cálculo

de Tablas Analíticas parecía ser un buen candidato para construir ese par de listas

donde irían acumulándose por orden fórmulas –argumentos- derivables y no

derivables. Bastaría enumerar todas las fórmulas de LC= para acometer, por orden, la

tabla de cada una de estas fórmulas –argumentos-. Si la tabla cierra todas sus ramas

la fórmula en cuestión es apuntada en la lista de teoremas de la Lógica de Primer

Orden con identidad, en caso contrario deberá ser apuntada en la lista alternativa.

¿Qué está mal en esta hipótesis? Sólo resulta incorrecta la suposición de que en este

caso cada tabla llegue realmente a terminar como vimos que sucedía en el caso de la

Lógica Proposicional Clásica. La inclusión de reglas para los cuantores permite, tal y

como vimos en su momento, reutilizar fórmulas cuantificadas reemplazando las

Lógica de Primer Orden

392

variables ligadas por parámetros no empleados antes. Este hecho no establece que

tales reemplazos introduzcan realmente información relevante para la construcción de

la tabla, o mejor dicho, para su desenlace. Podríamos imaginar la posibilidad de acotar

el desarrollo de una de estas tablas mediante el establecimiento de un número de

individuos máximo a tener en cuenta. Esa cantidad indicaría en definitiva el número

máximo de individuos que pueden ser diferenciados, reconocidos, mediante una

colección finita de enunciados de LC=. Puesto que la información codificada por cada

fórmula es finita, no es tan implausible la existencia de este número máximo. El

teorema anterior indica que realmente no hay tal límite.

¿Qué moraleja podemos obtener de todo esto? Es difícil hablar de una sola

consecuencia para un resultado de este calibre, pero la que más claramente de

impone, por su evidencia, es el definitivo divorcio entre el rigor que supone el carácter

formal de una teoría, y la mecanización de sus consecuencias. Estamos hablando, lo

sabemos ahora, de facultades cognitivas distintas. El tipo de construcción que lleva a

generar una enumeración de los teoremas de una teoría formal no constituye una

primera aproximación a la presentación definitiva de esa teoría en términos de algún

procedimiento de decisión para la clase de sus teoremas. Muy bien puede suceder

que esa etapa ulterior sea inalcanzable.

Vemos, en definitiva, cómo aparece ante nuestra vista una frontera

epistemológica del tipo más general que cabe imaginar. Esta frontera se encuentra

asociada a la capacidad expresiva de un lenguaje formal y surge debido, precisamente

a la capacidad de tal lenguaje formal para representar problemas concretos de

disciplinas particulares. Sabemos que el lenguaje de la lógica de enunciados está

asociado a un procedimiento de decisión, el que permite determinar los teoremas de la

Lógica Proposicional Clásica. Sabemos igualmente que esto no es cierto para el

lenguaje LC= y la consecuencia que sobre él se define. En algún punto entre LE y LC

=

hay un frontera cuyas consecuencias epistemológicas no podemos ignorar, pero

¿dónde se encuentra exactamente este punto?

Introducción al problema de la decisión

393

La identidad bajo sospecha. La Lógica Clásica de Enunciados –Lógica Proposicional

clásica- es decidible. Sin embargo, la Lógica Clásica de Primer Orden con identidad,

una extensión directa de los métodos de la primera al dominio de las propiedades y

relaciones de individuos no lo es. Entremedias debe haber algún punto en el cual se

produce lo que parece una irreparable pérdida de control. Por otra parte, todo indica

que esa especie de frontera debe venir dada por algún tipo de ganancia en eso que

vagamente hemos venido llamando potencia expresiva de un lenguaje. No hay nada

en nuestra argumentación anterior que permita asociar este efecto al contenido

material, a una interpretación, de los símbolos de LC=; éstos continúan careciendo de

significado distinto del que atribuimos a las constantes. Es esta observación la que, en

cierto modo, presta plausibilidad a esas referencias a la potencia expresiva de un

lenguaje formal. La existencia de propiedades que se pierden o adquieren bajo

determinadas condiciones ajenas por completo al contenido material de teoría alguna,

suministra, en definitiva, una forma de medir esa potencia expresiva. Pero, ¿dónde se

encuentra la frontera exacta cuya existencia hemos comprobado en la sesión anterior?

Una conjetura obvia, según el desarrollo que aquí han tenido los

acontecimientos, es imputar el problema a la presencia de la identidad. Como ya dije,

su inclusión en LC para dar lugar a LC= obedece, en última instancia, a razones

históricas. Resulta muy difícil ver de qué modo se puede formalizar una teoría

matemática de manera realista sin contar, ya desde un principio, con el signo de

identidad. La demostración ideada por Church y Turing hace además uso del signo de

identidad de una forma explícita y relevante. Un lenguaje de Primer Orden con

identidad permite, por otra parte, expresar ciertas condiciones acerca del cardinal del

universo en las que la identidad es la responsable inmediata. Así, por ejemplo,

∃x∃y¬(x=y) no puede ser satisfecha por modelos con menos de dos individuos, etc.

Analizar si en cada uno de estos casos la identidad puede ser reemplazada por algún

recurso disponible en LC no resulta una estrategia suficientemente general. Así, en

lugar de proceder caso por caso, lo que se intenta es establecer un mecanismo

general de reemplazo de la identidad que permita ver si las propiedades de una

Lógica de Primer Orden

394

fórmula con identidad se conservan en la traducción en la que ese símbolo aparece

reemplazado de forma adecuada. Esta substitución no puede ser, obviamente, sólo

simbólica.

La identidad es, en definitiva, una relación binaria entre individuos del dominio.

Podemos elegir una letra, sea ésta E, para substituir la identidad, escribiendo Exy

donde antes escribiríamos x=y. No bastará con reemplazar la identidad por el símbolo

relacional E aplicando a continuación las cláusulas semánticas que antes convenían a

“=”. “E” no es una constante, es una letra relacional. Traducir una fórmula con

identidad a otra que no posee la identidad supone redistribuir el contenido de la

constante lógica eliminada sobre el símbolo “E” y sobre las restantes constantes

lógicas. ¿Es posible hacer esto de manera uniforme? Efectivamente. Existe una

traducción τ capaz de obtener para cada fórmula A en la que se presentan ocurrencias

del símbolo de identidad otra fórmula Aτ que preserva su conducta modelista. Esto se

resume en el siguiente resultado:

[3] Teorema: Sea A una fórmula perteneciente a LC=, y sea µ un modelo

que satisface a A. Entonces existe una fórmula Aτ obtenida a partir de A

en la que no figura el símbolo de identidad y para la cual existe un

modelo µ’ que verifica a Aτ.

No hay una forma suficientemente informal de describir la traducción τ ni la

demostración de este resultado, aunque en este caso ninguno de estos dos elementos

añaden nada a lo ya dicho.

La consecuencia inmediata para nuestro estudio del problema de la decisión es

que la Lógica de Primer Orden definida sobre LC, esto es, sin identidad, es igualmente

indecidible. No cabe más remedio que admitirlo así. Todo parece indicar que el

legítimo deseo de penetrar en la estructura de los enunciados con que trabaja la

Lógica Proposicional tiene como contrapartida la pérdida de propiedades esenciales

como la de la decidibilidad. La frontera parece situarse, por tanto, entre la Lógica

Introducción al problema de la decisión

395

Proposicional Clásica, y la Lógica de Primer Orden. Esta conclusión, que a primera

vista resulta plausible, es, sin embargo, falsa. Dentro de la Lógica de Primer Orden

existen fragmentos decidibles que van silueteando la frontera de la decisión sin llegar

a definirla de un modo del todo exacto.

Fragmentos decidibles: el fragmento monádico. El primer fragmento decidible del que

cabe hablar está formado por lo que en ocasiones se denomina Lógica de Predicados

de Primer Orden, o siendo más correctos, por el fragmento monádico de la Lógica de

Primer Orden. Como cabe imaginar, el fragmento aludido consiste en aquel que

resulta de considerar sólo letras relacionales unarias –de predicado o propiedad- en el

vocabulario básico de LC. Esta operación da lugar a un lenguaje, LC1, en el que las

únicas letras relacionales son unarias, siendo, por lo demás en todo idéntico a LC. No

importa, además, incluir la identidad como constante lógica destacada, obteniendo así,

un lenguaje monádico con identidad que simbolizamos como LC1=. El resultado es el

mismo: la Lógica de Primer Orden restringida al lenguaje LC1= resulta decidible. De

hecho, la demostración que se aporta a continuación se ajusta a este caso que es, en

definitiva, más general. Resulta llamativo, no obstante, que después de llegar

prácticamente a convertir la eliminación de la diferencia ingenua entre propiedades y

relaciones en la condición de posibilidad de la lógica moderna nos encontremos que

vuelve ahora a emerger en unos términos tan precisos. Parece que la silogística

ideada por Aristóteles y desarrollada con ahínco durante la Edad Media no constituía,

después de todo, un corte arbitrario en la estructura oracional que es capaz de

reconocer la Lógica de Primer Orden.

Para demostrar que un fragmento de la Lógica de Primer Orden es decidible

hay que recuperar una idea cuyo desarrollo suspendimos al hablar de la indecidibilidad

de este sistema considerado al completo. Ya hemos visto que la decidibilidad es una

propiedad que no se predica de un sistema deductivo o de un sistema formal, es decir,

no le conviene más un tratamiento modelista que uno caracterizado por las técnicas de

la teoría de la demostración, sino que se predica directamente de una lógica –lo que

Lógica de Primer Orden

396

aquí he caracterizado como un triplo de tipo <L, [|S], √>-. Esto, unido al hecho de que

la Lógica de Primer Orden es completa –y a fortiori su fragmento monádico- permite

que tratemos el problema de la decisión desde donde más convenga. En esta ocasión,

el contexto es modelista. La idea a la que me refiero es aquella que lleva a reducir el

problema de la existencia de un modelo para una fórmula cuantificacional a la

construcción de un modelo con cardinal finito. En el caso de la Lógica de Primer Orden

al completo no hizo falta considerar esta posibilidad: el teorema de Church-Turing

constituye una garantía de que tal reducción no es, en general, posible. Pero esto no

se aplica al fragmento monádico. El resultado es que podemos afirmar que:

[4] Teorema: Sea B una fórmula del fragmento monádico de LC1=. Sucede,

entonces que B tiene un modelo syss tiene un modelo con cardinal finito

con a lo sumo 2m.v elementos, donde m es el número de letras

predicativas en B y v el número de variables.

Esquema de la demostración: El nudo de esta demostración se

encuentra en reconocer que una fórmula de LC1= sólo es capaz de

distinguir entre un número finito de elementos del dominio original del

modelo. Por Pk, 1# k#m, se entenderá cada una de las letras relacionales

unarias que aparecen en B. Dados cualesquiera dos elementos ui, uj en

el universo del modelo original µ, definimos una relación de equivalencia

≈B del modo que sigue:

- ui≈Buj syss para toda letra relacional Pk en B sucede que <ui>∈I(Pk)

syss <uj>∈I(Pk).

En otras palabras, dos individuos del dominio de µ son idénticos desde

el punto de vista de B syss satisfacen sus mismas subfórmulas

atómicas, que en este caso vienen dadas por las letras relacionales

unarias indicadas. ¿Cuántas clases de equivalencia distintas hay de

este tipo? Es obvio que hay exactamente 2m donde m es, recuérdese, el

número de letras relacionales distintas. Tomando ahora el dominio U del

modelo µ y la relación ≈B construimos lo que se denomina su espacio

Introducción al problema de la decisión

397

cociente constituido por las clases de equivalencia de individuos de U

módulo ≈B, que representamos como [ui]≈B. Para construir el nuevo

dominio, que representamos como U/≈B, bastaría con tomar un individuo

de cada una de esas clases, si prescindimos de la identidad. En caso

contrario será preciso contar a lo sumo con tantos individuos como

variables distintas de individuo haya en B, si la clase original contiene al

menos v elementos, y los que posea si está formada por menos de v

elementos. Esto hace que el número de individuos que debemos incluir

en el universo U≈B sea lo sumo 2m.v. Es evidente que si µ es modelo de

B también lo será el modelo µ≈B así obtenido. La demostración completa

se obtiene por inducción sobre el grado lógico de las fórmulas de LC1=.

Imagino que la inclusión de v elementos del dominio original puede sorprender.

La razón es sin embargo fácil de entender. Aunque dos individuos pueden ser

indistinguibles desde el punto de vista del contenido predicativo de B sí pueden ser

reconocidos como distintos por medio del uso del símbolo de identidad. Ahora bien,

nunca habrá más distingos expresables en B por medio de la identidad que aquellos

que correspondan al número de variables individuales distintas en B, que son, a lo v.

Un dato que merece también comentario a propósito de este teorema es la

referencia explícita a una cota superior, un número máximo, para el tamaño del

universo en el cual hay que buscar un modelo para una fórmula de LC1=, si es que ha

de tener uno. ¿No nos hubiera bastado con establecer que toda fórmula de estas

características que tiene un modelo formado por un universo con infinitos elementos

tiene también uno con finitos elementos? Este es un resultado sin duda interesante,

pero no basta para hacer que el fragmento lingüístico donde se satisface resulte

decidible. La razón es bien simple. La existencia de un modelo finito para una fórmula

no aclara mucho sobre la dimensión real que puede tener la búsqueda de dicho

modelo. Eventualmente, podemos encontrarnos ante una búsqueda en la que seamos

incapaces de establecer si aún no hemos dado con el modelo que satisface la fórmula

Lógica de Primer Orden

398

porque su universo no dispone todavía de suficientes elementos, o porque tal modelo

no existe.

La principal consecuencia que se desprende del teorema [4] afecta a un

problema con una larga tradición dentro del pensamiento occidental: la forma en que

entendemos y manipulamos el concepto de infinito. Dejando a un lado viejas

cuestiones filosóficas lo que sí resulta evidente es que este teorema anuncia la

existencia de fórmulas dotadas de modelos cuyo universo nunca es finito, o en

cualquier caso, de modelos finitos cuyo cardinal no puede ser determinado a partir de

la información contenida en la propia fórmula. Pero, ¿significa esto que en el caso del

fragmento monádico las fórmulas en LC1,= sí contienen información suficiente acerca

del cardinal de los universos en los cuales cabe encontrar modelos para tales

fórmulas? Dudo que esta lectura sea correcta. Más bien parece que es el contexto en

el cual se interpretan el que facilita que exista esa información. Sea como fuere, creo

que a estas alturas podemos reconocer que el modo en que una fórmula contiene

información acerca del tamaño de los modelos que la satisfacen es, posiblemente, uno

de los asuntos más apasionantes que cabe encontrar en teoría de modelos.

Una forma de ver la manera en que el contexto en que se interpretan las

fórmulas de LC influye en el problema de la decisión es considerar sólo modelos finitos.

¿Puede una fórmula de LC resultar indecidible sobre un modelo finito? Evidentemente

no. Para ello basta ver cómo una fórmula de LC cuando se interpreta sobre un universo

finito no porta más información que la que expresaría una fórmula puramente

proposicional convenientemente diseñada. El mejor modo presentar esta afirmación es

recordar la existencia del mecanismo de traducción que conecta una fórmula de

Primer Orden con otra de la Lógica proposicional.

[3] Traducción.

C0) [¬A]t/U= ¬[A]t/U

C1) [AoB]t/U=[A]t/Uo[B]t/U, donde o∈{&,v,→}

Introducción al problema de la decisión

399

C2) [∀xA]t/U=[Ax/u1]t/U& [Ax/u2]t/U&...&[Ax/un]t/U, donde {u1,u2,...un}

son todos y cada uno de los elementos de U.

C3 [∃xA]t/U= [Ax/u1]t/Uv [Ax/u2]t/Uv...v[Ax/un]t/U, donde {u1,u2,...un}

son todos y cada uno de los elementos de U.

C4) [A]t/U= A, si A es atómica.

La razón de incluir siempre mención al universo U en el proceso de traducción

se debe a que siempre hay que tener presentes sus elementos. Nunca construimos

algo así como una traducción de la fórmula en cuestión sobre un universo de cardinal

finito pero indeterminado, sino sobre modelos de cardinal finito conocido.

La frontera de la decisión –quizá habría que decir mejor de la decidibilidad-

parece situarse, entonces, entre el fragmento monádico LC1,= y la Lógica de Primer

Orden al completo siempre que se consideren modelos de cualquier cardinal. ¿Es

posible ganarle otra rebanada más a LC para mayor gloria de nuestras habilidades

formales? El siguiente resultado muestra la imposibilidad de extender este proceso

incorporando, por ejemplo, un lenguaje que admitiese relaciones de ariedad 2.

[4] Teorema: El conjunto de fórmulas de LC cuyos únicos símbolos no

lógicos son letras predicativas diádicas no es decidible.

Asumiremos este resultado sin demostración, aceptando a partir de ahora que

lo que parece evidente: que las relaciones binarias, y de ahí todas aquellas de mayor

ariedad, son las que nos llevan a cruzar la frontera de la decisión. ¿A qué se debe esta

especie de pertinaz resistencia de nuestro mapa cognitivo a olvidar toda distinción

relevante entre propiedades y relaciones? Si queremos evitar tentaciones metafísicas

poco justificadas, el mejor modo de analizar esta cuestión será repasar el teorema que

establece originalmente la indecidibilidad de LC. Parece obvio que la explicación de por

qué las relaciones, entendiendo por tal, relaciones de ariedad n∃2, han de

desempeñar algún papel especial o destacado que quepa apreciar. Y así es: la noción

de prueba en un sistema deductivo que es, en definitiva la que genera el conflicto que

Lógica de Primer Orden

400

aquel teorema muestra, es una noción sólo entendible como una relación binaria entre

premisas y conclusión. No es, por tanto, algo en el fondo tan misterioso o intrigante

que la Lógica de relaciones de ariedad n∃2 sea indecidible: simplemente refleja la

categoría formal enteramente abstracta a que responde una noción conflictiva como es

la de prueba.

Como ya dijimos en su momento, lo malo de la Lógica, entendida como un puro

formalismo, es que ese mismo carácter la hace vulnerable a fenómenos que pueden

tener lugar relativamente lejos de lo que son su dominios. Puede parece que la

frontera de la decisión está ya bien fijada. Y es verdad si por tal se entiende la

identificación de un fragmento del lenguaje, significativo en algún sentido, que permita

establecer un aquí y un allí de forma justificada. Pero también es cierto que hay formas

de entender esa frontera que hacen de ella una franja no muy precisa dentro de la cual

aún es posible encontrar fragmentos decidibles. Para poder hablar de ello tenemos

que introducir un recurso útil en general: las formas normales.

Formas normales: fragmentos decidibles. El concepto de forma normal encuentra

utilidad en muy distintos dominios de la Lógica moderna. En nuestro caso, su uso se

predica sólo de fórmulas, y por ello hablaremos siempre de fórmulas en forma normal

o de formas normales, pero también existen aplicaciones distintas frecuentes en

distintos dominios de la Lógica no elemental. En general, una fórmula en forma

normal es una fórmula que cumple ciertos requisitos, por lo general muy estrictos, en

cuanto a su aspecto. Dado un lenguaje formal L, sus formas normales bajo algún

determinado criterio previamente establecido no son sino un subconjunto propio de

ese mismo lenguaje. ¿Para qué sirven estas formas normales? Como ya hemos visto,

las propiedades lógicas de una fórmula, respecto a las relaciones de derivabilidad y

consecuencia semántica, por ejemplo, dependen por entero de su estructura. Muchas

veces hay alteraciones de esa estructura que preservan, no obstante, las propiedades

lógicas de la fórmula inicialmente considerada. Si fuera posible elegir una única

formula de entre todas aquellas que se comportan del mismo modo respecto a ciertos

Introducción al problema de la decisión

401

conceptos fundamentales, y fuera además posible reflejar del modo más directo esa

conducta en su forma, entonces el estudio de las propiedades generales,

metateóricas, de un lenguaje se simplificaría sobremanera. Las formas normales

responden a este objetivo. Para que la introducción de formas normales en un sistema

lógico tenga sentido tiene que poderse establecer previamente lo que se denomina un

teorema de normalización. Estos resultados establecen la bondad de las formas

normales consideradas al mostrar cómo consiguen capturar ellas solas y sin pérdida

alguna todas las propiedades relevantes de un lenguaje formal. En términos muy

generales, un teorema de forma normal para fórmulas tendría el siguiente aspecto:

[5] Teorema de normalización para fórmulas. Sea L un lenguaje formal y Σ

una propiedad predicable de fórmulas de L. Entonces,

i. Para cada fórmula B de L existe una fórmula BN, la forma normal

de B, y sucede, además, que

ii. B satisface Σ syss BN satisface Σ.

Es fácil entender la utilidad de las formas normales: todo lo que se pueda decir

de las fórmulas de L se puede decir igualmente estudiando sólo sus formas normales.

Cuanto más compacta y uniforme sea la estructura de estas formas normales tanto

mejor se apreciarán las propiedades notables de una fórmula mediante una simple

inspección visual.

El primer tipo de fórmulas en forma normal que hemos estudiado son las que

tienen vigencia en la Lógica Proposicional Clásica. Aunque la noción de forma normal

puede establecerse en un lenguaje formal sin atender otras consideraciones, me

refiero al tratamiento de sus constantes lógicas, su utilidad depende de que pueda

establecerse el teorema anterior. Así, puede haber lógicas basadas en LE, por

ejemplo, que debido a una distinta interpretación de sus conectivas, no tienen formas

normales, o mejor dicho, sus formas normales no normalizan esa lógica, con lo cual

carecen de valor. Las formas normales pertinentes en la Lógica Proposicional Clásica

Lógica de Primer Orden

402

eran de dos tipos, formas normales disyuntivas, FND en símbolos, y formas normales

conjuntivas, FNC. Recordemos que

[6] i. Una fórmula en forma normal disyuntiva es toda fórmula de la forma

C1vC2v...vCn, donde cada Ci es una conjunción formada por átomos o

negaciones de átomos.

ii. Una fórmula en forma normal conjuntiva es toda fórmula de la

forma D1vD2v...vDn, donde cada Di es una disyunción formada por

átomos o negaciones de átomos.

Para mostrar que siempre existe una fórmula en forma normal para otra dada

se puede proceder de dos maneras distintas en esta caso. La primera consiste en

definir un procedimiento de traducción en el que se emplean reglas de transformación

que preservan la equivalencia lógica entre la fórmula original y la traducción. Mostrar

desde aquí la satisfacción de [6] se reduce a comprobar que el procedimiento

establecido es efectivo y exhaustivo, es decir, se reduce, en realidad, a mostrar la

parte i del teorema de normalización, ya que la segunda está explícitamente

garantizada por el tipo de reglas empleadas. La segunda estrategia es más larga pero

permite mostrar muchas otras cosas a la vez y consiste, básicamente, en la que ya se

describió de manera exhaustiva en el cap. 2.5, [6].

El uso de formas normales –FND- en Lógica Proposicional Clásica tiene dos

aplicaciones de interés. La primera afectaba al problema de la completitud funcional.

La segunda consiste en la posibilidad de establecer un procedimiento muy directo y

general para resolver la validez (teorematicidad) de clases enteras de fórmulas.

El teorema de normalización para fórmulas garantiza que una fórmula en forma

normal preserva módulo equivalencia una cierta propiedad predicable sobre

expresiones de LE. En el caso que nos afecta, la propiedad que se preserva se refiere

a su conducta con respecto a la colección de interpretaciones admisibles de ese

lenguaje: si una fórmula es una tautología (contradicción), entonces también lo es

aquella forma normal que se obtiene de ésta mediante las oportunas manipulaciones,

Introducción al problema de la decisión

403

y viceversa. ¿Qué utilidad puede tener este hecho? Como es fácil imaginar, los

severos requisitos impuestos sobre una fórmula para que esté en forma normal

arbitrarios. Con ellos se intenta que las propiedades relevantes de las fórmulas del

lenguaje en cuestión estén a la vista, que destaquen con la mera lectura de esa

expresión, o al menos, que la comparación entre diversas fórmulas resulte mucho

más directa. Considérese la siguiente fórmula en forma normal:

[7] pv(q&r)v(q&¬p&¬q).

Sabemos que no es una tautología con poco más que un somero análisis de

su estructura. El razonamiento es fácil. La fórmula posee tres variables distintas y está

en FND. Una fórmula en FND cuyos coyuntos elementales Ci consten de esos tres

átomos precisa 23 de esos coyuntos distintos para ser una tautología –la razón de ello

queda como ejercicio-. La fórmula en [7] está formada por conjunciones elementales

que carecen de algunas de las variables presentes en la fórmula. Pero además,

contiene una conjunción en la que se hallan presentes un átomo y su negación, razón

por la cual puede eliminarse directamente –propongo también que quede como

ejercicio la justificación de ese paso-. El siguiente listado muestra cómo alcanzar la

fórmula que finalmente interesa considerar:

[8] i. pv(q&r)v(q&¬p&¬q)

ii. pv (q&r)

iii. (p&q)v(p&¬q)v(q&r)

iv. (p&q&r)v(p&q&¬r)v(p&¬q)v(q&r)

v. (p&q&r)v(p&q&¬r)v(p&¬q&r)(p&¬q&¬r)v(q&r)

vi. (p&q&r)v(p&q&¬r)v(p&¬q&r)(p&¬q&¬r)v(p&q&r)v(¬p&q&r)

vii (p&q&¬r)v(p&¬q&r)(p&¬q&¬r)v(p&q&r)v(¬p&q&r).

Este procedimiento se puede agilizar de múltiples maneras dando lugar a un

sofisticado método de análisis que en un mayor grado de desarrollo conduce a lo que

se conoce como Método de Resolución de Robinson.

Lógica de Primer Orden

404

Este procedimiento tiene más sentido cuando damos el paso que nos lleva a la

Lógica de Primer Orden aproximándonos a esa tenue línea divisoria que hemos venido

denominando aquí frontera de la decisión. Es ahí donde más partido se puede sacar a

las reducciones de fórmulas a una forma normal cuyas propiedades puedan ser

fácilmente asociadas a elementos característicos de su estructura, a ciertos patrones,

en definitiva, apreciables en la disposición de sus elementos constitutivos. ¿Es posible

refinar aún más aquella frontera arrebatando a la Lógica de Primer Orden fragmentos

significativos incorporables al dominio de las expresiones cuya satisfacibilidad o

teorematicidad son decidibles? La respuesta, por extraño que parezca, es afirmativa:

la frontera de la decisión no es siquiera una línea recta. Para mostrar la existencia de

estas clases se acudió en su día a ciertas formas normales características de la Lógica

de Primer Orden.

[9] Una fórmula en forma normal prenexa es toda expresión del lenguaje LC

en la que los cuantores aparecen todos ellos a la izquierda de una

expresión que constituye su alcance.

Una fórmula en forma normal prenexa tiene será de la forma Q1...Qn(Ψ), donde

cada Qi es un cuantor universal o un cuantor existencial. La serie de cuantores Q1...Qn

recibe el nombre de prefijo, y la fórmula Ψ el de matriz. Este tipo de formas normales

satisfacen los requisitos del teorema de normalización para fórmulas incluso cuando la

propiedad Σ es la de ser satisfecho por un modelo. Es decir,

[10] Para toda fórmula B existe una fórmula BFNP tal que para cualquier

modelo µ, [B]µ=V syss [BFNP]µ=V.

Haciendo uso de este resultado se ha conseguido establecer la decidibilidad,

entre otras, de las siguientes clases de fórmulas:

[11] i. ∀x1∀x2...∀xn ∃y1∃y2...∃yn Ψ.

ii. ∀x1∀x2...∀xn Ψ.

Introducción al problema de la decisión

405

iii. ∃y1∃y2...∃yn Ψ.

iv. Aquellas que no contienen más de un cuantor existencial.

Como se puede ver, la localización de cada una de estas clases se basa en el

estudio minucioso de ciertos componentes identificables en el prefijo cuantificacional

de estas fórmulas en FNP. Como ya he dicho hay más clases que las listadas en [11]

que son también decidibles. No obstante, el estudio de la geografía exacta de la

frontera de la decisión no puede ir aquí mucho más allá de este punto. Un último

intento de sistematizar aún más el estudio de la decidibilidad en Primer Orden es el

que se lleva a cabo con las llamadas formas normales de Skolem. El valor de este

recurso queda probado al mostrar su utilidad no sólo en el problema que ahora nos

ocupa, sino también al permitir simplificar ciertos aspectos de la prueba de completitud

de original de Gödel para LPO, o reforzar el alcance del teorema original de

Löwenheim. Este tipo de formas normales requieren la introducción de un recurso

extra que recibe el nombre de funciones de Skolem. Para representar una función de

Skolem haremos uso de la notación habitual: f(x1,...xn), etc. El lenguaje resultante de

admitir este tipo de recurso se simbolizará como LCSK admitiendo la existencia de los

recursos semánticos oportunos para tratar con funciones, aunque aquí no se vayan a

explicar por el momento.

[12] Una fórmula de normal de Skolem es toda aquella expresión de LCSK en

forma normal prenexa en la que los cuantores existenciales preceden a

cualquier cuantor universal.

Una fórmula en forma normal de Skolem presenta el siguiente aspecto:

∃y1∃y2...∃yn ∀x1∀x2...∀xm Ψ, donde la matriz admite la presencia de símbolos

funcionales. El teorema de normalización asociado a este tipo de fórmulas es algo más

débil esta vez:

Lógica de Primer Orden

406

[13] Para toda fórmula B de LC existe un fórmula BFNS en LCSK tal que si B es

satisfecha por algún modelo µ, entonces BFNS es satisfecha por otro

modelo µ’, el cual no tiene que coincidir con el original.

La propiedad que el teorema de normalización preserva no es en esta ocasión

de la “ser satisfecho por un modelo µ”, sino la de “existir un modelo que satisfaga la

fórmula”. Dicho de otra forma, una fórmula B y su forma normal de Skolem BFNS

podrían no ser equivalentes.

Dada una fórmula en forma normal prenexa, su transformación a una forma

normal de Skolem, si no lo es ya, sólo exige alterar de algún modo la presencia de

cuantores existenciales ubicados tras algún cuantor universal. Para ello basta con

aplicar una transformación en la que, como no podía ser de otro modo, se hace un

uso relevante de las funciones de Skolem:

[14] ∀x1...∀xi∃yj Qk....QnΨ reemplácese por ∀x1...∀xi Qk....QnΨ(yj/f(x1...xi))

No es muy difícil entender qué hace una de estas funciones de Skolem. La

ocurrencia de un cuantor existencial tras una secuencia de cuantores universales se

lee en castellano del siguiente modo: “para todo x1, x2,...xi hay un yj ...tal que...” Es

obvio que el individuo del domino que vaya a reemplazar a la variable yi estará en

función de aquello que se diga en la matriz de la fórmula de los x1,...xn. Eso es

exactamente lo que expresa una función de Skolem -existe una forma normal de

Skolem dual de ésta en la que son los cuantores universales los que preceden a

cualquier cuantor existencial. Entonces se hace referencia a formas ∀∃ y formas ∃∀.

Si se toma en serio la observación anterior puede no resultar tan extraño que

este tipo de expresiones basten por sí solas para representar toda la variedad de

formas admisibles que puede tener que ver con la adquisición o pérdida de la

satisfacibilidad en primer orden. La uniformidad tiene en este caso un precio que es

necesario satisfacer: la clase de fórmulas normales de Skolem no es decidible. De otro

Introducción al problema de la decisión

407

modo las fórmulas de la Lógica Clásica de Primer Orden también lo serían y ello en

función tan sólo del teorema de normalización que las fórmulas de Skolem satisfacen.

A partir de este punto el estudio de la decidibilidad de la Lógica de Primer

Orden se pierde en un mar de precisiones y detalles que apenas añaden nada nuevo a

lo ya visto. Sorprende y creo que siempre lo hará, ver cómo algo que debería

responder relativamente bien a nuestra voluntad se muestre finalmente tan esquivo y

autónomo. Estamos acostumbrados a considerar que la ambigüedad o el contenido de

los términos de una teoría son invariablemente los responsables de todas las

deficiencias o limitaciones de esa teoría. Nunca se nos habría ocurrido pensar en que

un lenguaje desprovisto por completo de contenido material pudiera mostrar

dificultades que le hacen adquirir algo en cierto modo parecido a una conducta. Esto

sólo quiere decir que los lenguajes formales tal vez, no son pura forma, sino que

contienen ya la expresión de alguna realidad independiente de difícil identificación.

Lógica de Primer Orden

408

Orientación bibliográfica.

Para entender el contexto histórico en que se plantea el Problema de la

Decisión se puede tener en cuenta [Gareth Ashurst, 1982], y [Kleene, 1952]. Un

texto mucho más preciso y profundo es [Sieg, 1999].

Para la decidibilidad de fragmentos de LC está indicado [Hunter, 1974], secc.

50, y [Garrido, 1974], cap. XV, secc.

Para consultar con más detenimiento el papel que desempeña la identidad se

dispone de [Bell y Machover, 1977], cap. 2, secc.11. Hay también consideraciones

generales sobre capacidad expresiva en [Manzano, 1989] cap. II, secc. 3.1.

Para analizar las fórmulas en forma normal para LE es más que suficiente lo

que se contiene en [Garrido, 1974], cap.XII, secc. 6 y 7 y [Hunter, 1969] Segunda

Parte. Un interesante comentario sobre la importancia de estos resultados en contexto

no clásicos se encuentra en [Blamey, 1986]. Este ítem sólo lo recomiendo como

segunda lectura.

La referencia obligada para el método de Resolución es obviamente

[Robinson, 1965]. Otra referencia para ampliar información acerca de técnicas

próximas a las implementaciones computacionales es [Cuena, 1985].

Para el estudio de formas normales y de Skolem para Lógica de Primer Orden

son referencias útiles, [Bell y Machover, 1977], cap. 2, secc. 9 y sobre todo [Hunter,

1974], Cuarta Parte, secc.58. Un interesante comentario al respecto es el que figura

en [Kleene, 1952], secc. 76.