La frase simple
1. Introducción
Uno de los objetivos que nos planteamos en la investigación lingüística, tal y como la describimos en este libro, es el análisis automático de textos. Ello implica un grado de cobertura de los hechos lingüísticos que solo puede conseguirse con un diccionario electrónico construido a tal efecto. Por supuesto, todas las palabras del texto deben ser reconocidas morfológicamente y, además, deben describirse sus propiedades combinatorias, es decir sintácticas, y su significado en contexto. Este objetivo exige también que se tengan en cuenta las secuencias fijas, cuyos elementos constitutivos no tienen autonomía, y que se resuelva la polisemia inherente a casi todas las palabras de la lengua.
La definición de la noción de texto dista mucho de ser simple. No existe razón alguna para imponer una talla determinada al texto, siendo su límite inferior la frase simple. Independientemente de este problema de talla, debe subrayarse un carácter fundamental del texto: no se puede tratar en ningún caso de una lista de palabras independientes unas de las otras, sacadas al azar de un léxico. Un texto es una construcción compleja que codifica un mensaje pensando en un destinatario Esta constatación ha sido objeto de multitud de desarrollos variados, que se han centrado ya sea en el destinatario o en el propio mensaje (Jakobson, 1973). En cualquier caso, sea cual sea la complejidad interna de un texto, es preciso admitir que se trata de un conjunto organizado y no de una secuencia aleatoria de palabras.
2. Los esquemas predicativos
Este conjunto organizado plantea, sin embargo, otros problemas. Entre ellos, el de saber qué herramientas se requieren para dar cuenta de esta estructura. Una manera ingenua de responder consistiría en decir que la solución es léxica; es decir, que basta con conocer el significado de las palabras del texto. Desde el punto de vista de un lector humano, el conocimiento que tiene de la lengua le permite entender el mensaje de manera casi inmediata, sin pasar por ejercicios escolares como el análisis lógico o el gramatical. La cuestión resulta más complicada si se aborda el tema desde el punto de vista del procesamiento automático. La solución ingenua que se adopta por el momento consiste en tomar las palabras una a una y construir así el sentido. Sin embargo, este procedimiento comporta una dificultad enorme. Como la mayoría de las palabras, consideradas aisladamente, son polisémicas, incluso decenas de veces, el número de caminos que debe recorrerse para hallar el sentido del texto crece exponencialmente incluso en frases cortas.
Esta posible solución, que pone todas las palabras en un mismo plano, es costosa y crea, por así decirlo, muchas pistas inútiles. Además, supone definir las palabras únicamente por su significado. Es el error que se comete cuando se pregunta a un alumno, por ejemplo, el significado del verbo abatir. La pregunta está mal planteada, porque este predicado tiene diversos significados; por tanto, responder a esta pregunta supone seleccionar arbitrariamente el significado que a uno se le ocurra de manera espontánea. En cambio, si damos un argumento, por ejemplo, abatir las velas, abatir a un enemigo, la noticia lo abatió mucho, abatir las cartas, abatir una tienda de campaña, entonces se puede responder de manera adecuada, e ilustrar la respuesta mediante un sinónimo: arriar las velas, matar a un enemigo, la noticia lo afligió mucho, mostrar las cartas, desmontar una tienda de campaña. La descripción de un elemento léxico no puede hacerse de ningún modo limitándose al plano semántico, ya que sus propiedades de construcción, es decir su sintaxis, forman parte integrante de su definición.
De hecho, los textos no están formados por palabras intercambiables como lo serían los ladrillos de una pared, sino que forman entre sí estructuras elementales que subyacen a todo discurso. Estas estructuras elementales se denominan esquemas predicativos o esquemas de argumentos. Un esquema predicativo está formado por un predicado acompañado de sus argumentos, nociones que definiremos en la sección siguiente. Cuando se reconoce un esquema predicativo en una zona del texto, se tiene una selección de palabras que constituyen una unidad y se excluyen las restantes interpretaciones posibles de estas palabras (que tendrían si se insertasen en otros esquemas). Por consiguiente, la primera etapa de todo análisis de un texto es el reconocimiento de los esquemas predicativos.
Si, para mayor claridad, en un primer momento consideramos solo las palabras simples, constataremos que un esquema predicativo no puede estar formado por cualquier secuencia de palabras. Una secuencia como un artículo un bolígrafo no constituye una frase, y no es, por tanto, una aserción. Tampoco lo es una secuencia de dos adjetivos como oscuro largo, por no hablar de una secuencia de conjunciones. Obviamente, un sustantivo como artículo puede figurar en un esquema de argumentos, pero su combinatoria es tan abierta que resulta difícil atribuirle un entorno propio. En cambio, si consideramos una unidad léxica como redactar, su entorno puede describirse con precisión. A la izquierda tenemos un sustantivo que designa a un humano y, a la derecha, un sustantivo como artículo, redacción, novela, cuento o, de manera más general, cualquier sustantivo que pertenezca a una clase semántica que podríamos denominar <textos>. Se observa, pues, que las palabras artículo y redactar forman parte de dos conjuntos funcionalmente distintos pero complementarios. El segundo delimita dos sub-conjuntos semánticos dentro conjunto de los sustantivos: la clase de los humanos y la de los <textos> (o <escritos>), mientras que el primero no determina ningún entorno semánticamente homogéneo, sino que abre perspectivas combinatorias muy laxas y no sistematizables. No solo se puede escribir un artículo, sino también puede leerse, apreciarse, conocerse, desaprobarse, citarse, un artículo puede enviarse a un amigo, publicarse, criticarse, reseñarse, etc. Una palabra como escribir tendría el mismo tipo de entornos que redactar con, tal vez, un sustantivo suplementario en su esfera de influencia: con un bolígrafo.
Llamaremos predicados a palabras como redactar o escribir y argumentos a palabras como artículo y bolígrafo. Siguiendo a Harris (1976), definimos un predicado como una palabra que opera una selección determinada entre las restantes palabras del léxico para formar un esquema que sea la base de una aserción. Los argumentos son los elementos léxicos seleccionados por los predicados en el marco de una frase simple. No ejercen por sí mismos ninguna selección sobre otras palabras (Harris, 1976, los llama argumentos elementales). No hay que confundirlos con otros sustantivos como valor, por ejemplo, que tiene una doble función: la de argumento respecto al predicado de la frase que lo inserta en una frase compleja y, al mismo tiempo, la de predicado respecto a sus propios argumentos, formando así, con los mismos, una frase cuya función sintáctica es argumental, como en: conozco su valor derivado de conozco el valor que tiene. Este fenómeno ha recibido distintas denominaciones: inserción, recursividad, construcción completiva. Existe, pues, una diferencia de fondo entre predicados y argumentos: los primeros pueden tener una doble función de predicados y de argumentos, mientras que los segundos nunca pueden ser predicativos. Definimos, pues, un esquema predicativo como la unión de un predicado y de los argumentos que éste selecciona. Podemos añadir a la definición de Z. S. Harris otro criterio que no figura explícitamente en su obra: un predicado puede inscribirse en el tiempo, es decir, podemos conjugarlo (cf. cap. 8), lo que no sucede nunca con los argumentos elementales, como los sustantivos concretos. No es pertinente, por ejemplo, preguntarse cuál es el pasado indefinido de los sustantivos artículo o bolígrafo. Lo que llamamos actualización no es más que la inscripción en el tiempo de un esquema predicativo.
4. Representación de la frase
En la bibliografía lingüística, hay muchas descripciones de la frase simple, que corresponden a diversos grados de abstracción. Es conveniente prestarles atención, habida cuenta de la importancia de la cuestión para el análisis lingüístico. Básicamente, tenemos dos tipos de representación de la frase. La primera, basada en la filosofía antigua, divide la frase en dos partes que corresponden, respectivamente, a «aquello sobre lo cual se habla» (y que se denomina tema o sujeto) y a «aquello que se dice» (que se denomina rema o predicado). La gramática generativa retomó esta división bajo los términos de grupo nominal (GN) y grupo verbal (GV). La intuición que se entrevé tras esta oposición es la de la aserción, el verbo dotado de sus complementos afirma algo sobre un sujeto.
La otra representación de la frase es de tipo lógico. Z. S. Harris defendió, en la línea de la filosofía analítica (Frege) y de la fenomenología (Husserl), una concepción de la frase como un predicado acompañado de sus argumentos (sujeto y objetos). El predicado selecciona los argumentos; es decir, elige, entre los sustantivos, los que le son compatibles. Podemos representar este conjunto mediante el esquema siguiente: Predicado (arg1, arg2, arg3...). Según la posición teórica adoptada, el término predicado corresponde, pues, a realidades estructurales distintas y se presta a confusión. En el primer modelo, este término designa al verbo y a sus complementos mientras que, en el segundo, los complementos figuran, junto con el sujeto, entre los argumentos. A continuación, mostraremos que la segunda representación presenta claras ventajas sobre la primera.
De entrada, existen procedimientos formales que permiten delimitar los argumentos de un predicado y que justifican su autonomía distribucional en el marco de la frase. Es el caso de tematizaciones, como, por ejemplo, la extracción en Es... el que, Es... la que...
Esos salvajes rompieron el escaparate.
Esos salvajes son los que rompieron el escaparate.
Son esos salvajes los que rompieron el escaparate.
El escaparate, lo rompieron esos salvajes.
Lo que rompieron esos salvajes es el escaparate.
La pronominalización, que solo es posible si se puede delimitar un objeto para calcular el antecedente de la anáfora, nos prueba también la autonomía de los argumentos: le he prestado el mechero a mi vecino. Se lo he prestado. La posibilidad de elisión de los complementos es otra muestra de la libertad sintáctica del complemento respecto al predicado: está barriendo (él; la terraza). Entre sujeto y predicado son posibles muchas inserciones, propiedad que presentan también los complementos, lo cual los hace tan autónomos respecto al predicado como lo es el sujeto:
(Este año, como usted ya sabe), Francia ha vendido muchos automóviles.
Francia, este año, como usted ya sabe, ha vendido muchos automóviles.
Francia ha vendido, este año, como usted ya sabe, muchos automóviles.
Además, la partición binaria (SN + SV) destaca al sujeto entre todos los argumentos, dándole un rango superior al de los objetos, como puede verse por su situación en el árbol sintáctico. Ahora bien, como han demostrado muchos estudios y como veremos más tarde cuando analicemos los empleos del verbo abatir, las informaciones que aportan los complementos son más importantes que las que aporta el sujeto: reconocimiento del empleo en caso de polisemia, posibilidad de pasivización, indicación de fijación, posibilidad de elisión de un objeto con o sin modificación de la interpretación del predicado, posición de la negación, etc. (cf. cap. 4).
El propio término de grupo verbal parece indicar que solo los verbos son predicados. Y, sin embargo, es obvio que existen predicados adjetivos y predicados nominales, sin olvidar los empleos predicativos de algunas preposiciones. Incluso considerando solo los predicados nominales (cf. cap. 5), podemos ver que la noción de grupo verbal es inadecuada, ya que el verbo que figura en estas cons-trucciones no presenta función predicativa alguna. En una frase como Juan le ha dado un beso a Ana, es el sustantivo beso el que selecciona los dos argumentos humanos; el verbo dar no hace sino inscribir este predicado en el tiempo (cap. 8). Esta indicación temporal puede suprimirse, como en el beso de Juan a Ana, que conserva el esquema predicativo de la frase precedente, pero no su actualización. Este análisis no se aplica solo al sustantivo beso por el hecho de que exista una forma verbal asociada, Juan ha besado a Ana, sino que también se aplica a los sustantivos predicativos que no presentan vínculo morfológico alguno con un verbo, como en Juan le ha dado un coscorrón a Ana.
En cambio, no existe ningún medio sintáctico similar que permita justificar una entidad como la noción de grupo verbal. El único test se halla en las frases coordinadas en las que interviene el adverbio también: Juan ha perdido el tren y yo también. En esta frase, yo es la forma tónica del pronombre y representa al sujeto, el adverbio también es coordinativo; se suprime, para evitar la redundancia, he perdido el tren, que representa al predicado según la concepción binaria de la frase. No obstante, este criterio por sí solo tiene un peso menor que el de los que muestran la autonomía de los argumentos.
La noción de grupo verbal se aplicaría más bien a las construcciones fijas que a las libres. En estas estructuras «congeladas», los sustantivos que están a la derecha del verbo no son verdaderos objetos sino que forman una secuencia única con el mismo, presentando el conjunto un significado no analizable en secuencias sintácticas. No se puede afirmar que en matar el gusanillo (calmar el hambre momentáneamente), el sustantivo gusanillo sea un verdadero complemento de matar. En el caso de las secuencias fijas, la noción de grupo verbal se justificaría mejor, aunque algunas propiedades (como la inserción) puedan ser comunes tanto a construcciones libres como a construcciones fijas: Juan matará también una gallina; Juan matará también el gusanillo.
La oposición tema/rema se ilustra a menudo con la observación de que una predicación «dice algo» de un «sujeto». Ahora bien, una predicación no hace intervenir solo un sujeto, también está caracterizada por la presencia de objetos. Por ejemplo, si bien el verbo leer queda definido por el hecho de tener un sustantivo humano como sujeto, aún queda definido con mayor precisión por la naturaleza de su complemento, que designa a un elemento de la clase de los <textos> (novela, poema, artículo) o de los <soportes de escritura> (libro, periódico, revista).
Es posible que el análisis binario de la frase provenga de una concepción particular del predicado surgida de la lógica clásica, que privilegia las frases definitorias: el hombre es mortal, en que tradicionalmente el predicado queda asimilado a la secuencia es mortal. En estas frases, el hecho de recurrir exclusivamente al presente de valor acrónico puede llevar a creer que el verbo ser forma parte del predicado y que se está ante la secuencia ser mortal. Pero las lenguas naturales no se reducen a estas relaciones lógicas. Los predicados sufren modificaciones temporales, por tanto el tiempo (y aquí su expresión léxica mediante el soporte ser) no forma parte del predicado propiamente dicho. Las siguientes frases, en que interviene la temporalidad, son perfectamente aceptables:
Los antiguos no creían que los dioses fuesen inmortales.
Dos y dos nunca darán solo cuatro.
5. Definición de la frase simple
Partimos de la idea de que las frases simples son los constituyentes fundamentales de los textos, lo cual obviamente no quiere decir que se presenten siempre con la forma canónica que tienen en los diccionarios electrónicos, ni que no haya otros elementos de estructuración del texto, como los conectores, por ejemplo. El hecho de que no todas las combinaciones de palabras sean posibles pone en evidencia la existencia de una estructuración del texto en frases. La descripción de las frases simples se basa, en un primer momento, en tres propiedades de los predicados: corresponden a varias categorías gramaticales, presentan argumentos y están inscritos en el tiempo.
5.1. Forma morfológica de los predicados
Precisemos que una frase simple, en el sentido técnico en que le damos aquí a este término, contiene un solo predicado. Toda frase de un texto real que contenga más de un predicado es una frase compleja. Los predicados de una frase simple pueden corresponder a cuatro tipos morfológicos distintos, si tenemos en cuenta algunos adverbios, que funcionan como predicados de primer orden; es decir, predicados cuyos argumentos son sustantivos elementales: Juan está bien. La salida está muy cerca.
Tenemos, en primer lugar, los verbos predicativos, sobre los que no nos extenderemos porque la tradición gramatical los identifica con la noción misma de predicado. Nos limitaremos a dar un ejemplo: este hombre respeta a los demás en que hombre y otros son, respectivamente, el sujeto y el objeto del predicado verbal respetar. En la frase, que puede considerarse sinónima, este hombre les tiene respeto a los demás, el término que selecciona el sujeto y el complemento es el sustantivo respeto y no el verbo tener, como sucedía con beso y dar en el ejemplo que hemos visto antes. El verbo tener en realidad «conjuga» el predicado nominal respeto. Más adelante (cap. 5) expondremos en detalle las propiedades de las construcciones nominales. Señalemos simplemente aquí que el sustantivo respeto no es un complemento del verbo tener, como lo podría ser coche en: este hombre tiene coche.
También están las frases cuyo predicado es un adjetivo: este hombre es respetuoso con los demás. Aquí, el verbo ser desempeña el mismo papel que tener en el ejemplo anterior, ya que inscribe al adjetivo respetuoso en el tiempo. Finalmente, algunas preposiciones tienen la posibilidad de generar argumentos y no solo de introducirlos, como se suele decir. Así, en la frase, este hombre está contra los demás, es la preposición contra la que constituye el núcleo de la frase y el verbo ser inscribe este predicado en el tiempo: este hombre (está, estaba, estará) contra los demás.
Obsérvese que se puede borrar la actualización de los predicados, como hemos visto antes con el beso de Juan a Ana. Un predicado verbal en infinitivo no presenta actualización: Respetar a los demás es algo que se aprende, ni un predicado nominal, adjetivo o preposicional sin su correspondiente verbo soporte: El respeto a los demás es algo que se aprende. Ser respetuoso con los demás es algo que se aprende. Juan, siempre contra todo el mundo. El inventario sistemático de todas las frases simples, necesario para el procesamiento automático, implica la descripción sistemática de todos los predicados. Más adelante veremos que cada tipo morfológico de predicados de primer orden genera propiedades sintácticas específicas, que requieren diccionarios distintos.
5.2. Forma morfológica de los argumentos
Los argumentos de un predicado pueden ser sustantivos o frases:
Juan ha escrito un texto.
Juan ha escrito que yo no tenía razón en ese punto.
Cabría preguntarse si los argumentos no pueden tener, en algunos casos, forma adverbial: van a aplazar la ceremonia hasta mañana. El grupo hasta mañana depende directamente del verbo aplazar; por tanto, sería razonable considerarlo un argumento. Ahora bien, como este grupo puede permutar con complementos del tipo: hasta el viernes, hasta que P, se podría considerar hasta mañana como una forma pronominal, del mismo modo que en aquella época puede reemplazarse por entonces.
En el capítulo 4 veremos que los argumentos son susceptibles de diversas modificaciones. Pueden pronominalizarse, tematizarse, etc. Cuando tenemos un predicado nominal (cap. 5), los argumentos toman, a veces, una forma adjetiva: la respuesta de Francia; la respuesta francesa. Como un predicado se define por el número y la naturaleza semántica de sus argumentos, la identificación de estos últimos resulta indispensable para el reconocimiento y el análisis del predicado. Cabría concluir que el primer objetivo del procesamiento automático de textos es el reconocimiento de las frases, que consideramos las unidades mínimas de análisis, y no de las palabras o los morfemas, como en la tradición basada en Saussure.
El reconocimiento de los argumentos en un texto se hace por comparación con su descripción exhaustiva tal y como esta figura en un diccionario electrónico (cf. cap. 17). Un diccionario de este tipo tiene que registrar sistemáticamente todas las formas predicativas (verbo, nombre, adjetivo, preposición) y argumentales (sustantivo o frase), anotando para cada una de ellas el conjunto de las propiedades que las caracterizan: secuencia de argumentos más larga, naturaleza semántica de los argumentos y actualización. El conjunto así descrito en el diccionario puede experimentar modificaciones (reducciones, transformaciones, reestructuraciones) en el momento de la inserción en un texto (cf. cap. 4). Estas modificaciones deben ser descritas también de manera reproductible. En el capítulo siguiente, trataremos de todas estas informaciones.
6. Ambigüedades categoriales
Todo análisis automático plantea el problema de la naturaleza de las categorías gramaticales, llamadas también partes del discurso. En efecto, que un sistema pueda reconocer todas las palabras que constituyen una frase o un texto no significa que pueda analizarlas. La experiencia muestra que el etiquetado no permite, por sí solo, dar cuenta de las estructuras sintácticas que subyacen en todo texto. El tagging (etiquetado), que se basa en la atribución de los elementos léxicos a una de las nueve categorías tradicionales, debe tener en cuenta el hecho de que estas no determinan automáticamente las relaciones sintácticas que vinculan entre sí los elementos de una estructura. Antes de contemplar un análisis automático eficaz, es necesario proceder a una reflexión en profundidad sobre la noción de parte del discurso, que ha estado siempre en el centro del análisis lingüístico.
En este punto, la tradición gramatical resulta nociva para la investigación lingüística. La tradición identifica una categoría gramatical con su empleo prototípico e ignora los demás, que a veces son muy numerosos. De poco sirve seguir afirmando que los nombres se refieren a sustancias, los verbos a acciones o acontecimientos y los adjetivos a cualidades, si se prescinde de que un gran número de empleos no corresponden a estas definiciones. Centrarse en la «naturaleza» de las palabras no sirve de nada en el análisis automático de grandes corpus. Las categorías gramaticales son conjuntos heterogéneos que exigen un análisis sintáctico preciso para resultar utilizables en un sistema formal. Las descripciones destinadas al procesamiento automático y por consiguiente, al reconocimiento de los empleos, tienen que integrar tres niveles de análisis generalmente separados: la morfología (y, con ella, el léxico), la sintaxis y la semántica. En las páginas siguientes insistiremos sobre los límites del tagging que reposa únicamente sobre criterios morfológicos.
6.1. Los diferentes tipos de verbos
Resulta relativamente sencillo identificar, en un texto dado, una forma verbal con independencia de su empleo, gracias a su morfología específica. No obstante, esta indicación no es suficiente para el reconocimiento automático de la estructura de la frase porque una «parte del discurso» no determina automáticamente una función. Es importante, pues, establecer una clasificación de los verbos que tenga en cuenta sus propiedades sintácticas y semánticas, es decir, su función en la frase. Desde este punto de vista, hay, al menos, seis tipos de verbos distintos.
En primer lugar, tenemos los verbos predicativos tradicionales, denominados distribucionales, que, por definición, seleccionan clases de argumentos. Un verbo como anotar requiere un sujeto humano y un complemento perteneciente a la clase de los <textos>. Del mismo modo, el verbo talar exige en su contexto derecho un complemento de la clase <árboles>. No es necesario extenderse aquí sobre estos verbos, ya que han sido objeto de gran número de estudios en la tradición gramatical, que ha identificado de facto verbo con función predicativa.
Un segundo tipo de verbos corresponde a las «locuciones verbales» o a los «verbos fijos». Estas formas no seleccionan por sí mismas verdaderas clases de argumentos. En estirar la pata o coger el toro por los cuernos, los sustantivos pata y toro no pueden considerarse como verdaderos complementos de los verbos estirar y coger. La relación entre verbos y sustantivos, en estos casos, no es de naturaleza combinatoria, como sucede con los verbos distribucionales. El conjunto formado por el verbo y sus «complementos» funciona como una unidad, tiene naturaleza predicativa y puede, eventualmente, tener argumentos como en el aspirante le está pisando los talones al campeón, donde el esquema de argumentos es el siguiente: pisar los talones (aspirante, campeón). La fijación en sí, puede explicarse mediante categorías generales como la metáfora, la metonimia, etc. (cf. cap. 10).
En tercer lugar, tenemos verbos predicativos ordinarios, verbos causativos, que operan sobre otro predicado. Este predicado puede ser verbal (los niños leen / has hecho leer a los niños. Los palitroques han caído / la bola ha hecho caer los palitroques), adjetivo (Juan está triste / esa noticia puso a Juan triste) o nominal (Juan tiene muchas dificultades / esto ha causado muchas dificultades a Juan). No hay que confundir esta clase de causativos con los verbos de causación interna, cuyos argumentos son de naturaleza nominal, como derramar o derribar: Juan ha derramado la leche. El viento ha derribado varios árboles. Este tipo de verbos son predicados simples, como todas las otras clases semánticas de predicados de primer orden.
En cuarto lugar, unos pocos verbos, que podríamos llamar pro-verbos, pueden sustituir, dadas ciertas condiciones sintácticas, a clases de verbos, como sucede con los pronombres respecto a los grupos nominales. Es el caso de hacer en empleos como: Juan ya no baila como lo hacía antes. Juan se ha marchado, como hace siempre que encuentra dificultades.
Los dos últimos grupos de verbos son de naturaleza muy distinta. La tradición gramatical ha reconocido siempre una clase de verbos auxiliares cuya función consiste en actualizar los predicados verbales: ir, estar a punto de, acabar de, etc. Estos verbos no forman parte del esquema fundamental de la frase (predicado/ argumentos), sino que inscriben a los predicados verbales en el tiempo o son de naturaleza aspectual. Su reconocimiento como actualizadores es crucial en el análisis ya que, en algunos casos, podría haber confusión entre esta función de auxiliares y un empleo predicativo, en particular con ir: voy a dejar el trabajo. Voy al trabajo y acabar de: acabo de comer; acabo la faena y me voy.
Y, finalmente, existen varios centenares de verbos que actualizan los predicados nominales y desempeñan respecto a ellos el mismo papel que los verbos auxiliares o las desinencias con los predicados verbales. Se trata de los verbos soporte (llamados también verbos de apoyo). Por ejemplo, el verbo sentir con el sustantivo respeto en: Juan siente respeto por esta actitud o proceder en: Juan ha procedido al análisis de la situación. Tienen propiedades que examinaremos en detalle en el capítulo 8. Baste precisar aquí que estos verbos no seleccionan argumentos, sino que tienen una auténtica función de conjugación de sustantivos predicativos, función que corresponde a la localización temporal (conjugación) y a las indicaciones aspectuales.
Como hemos visto, para el análisis automático no es suficiente localizar y reconocer una determinada forma verbal, ya que esta puede desempeñar funciones sintácticas muy diversas. En particular, las construcciones con verbo soporte se asimilan a locuciones verbales, cuando en realidad tienen un comportamiento sintáctico totalmente distinto.
6.2. Los diferentes tipos de nombres
Como sucede con los verbos, la atribución de un elemento léxico a la clase de los nombres no es suficiente para atribuirle una función en la frase. La función que se le reconoce tradicionalmente, la de hacer referencia a objetos del mundo real, constituye una información importante pero muy incompleta, como sucede cuando se identifica una frase entera con sus propiedades prototípicas. La indización morfológica automática solo es útil si viene acompañada de la determinación de la función sintáctica del elemento en la frase o el texto. Y la categoría de sustantivo corresponde a realidades lingüísticas muy distintas.
Como tendremos ocasión de desarrollar ampliamente en lo que sigue, los sustantivos se dividen esencialmente en predicados y argumentos. Como sucede con verbos y adjetivos, existen sustantivos que introducen argumentos en el discurso. El sustantivo sueño tiene un sujeto humano, exactamente igual que el verbo soñar. Esta realidad lingüística ha escapado a la tradición escolar y a algunos sistemas de traducción automática de primera generación. En cambio, siempre se ha atribuido la función de argumento a los sustantivos. Llamaremos argumentos fundamentales o elementales a los sustantivos que se refieren a «objetos» del mundo real que nunca tienen, por sí mismos, función predicativa. Esta precisión es necesaria porque los predicados también pueden desempeñar el papel de argumentos cuando están en posición de sujeto o de complemento de otro predicado. Además, una misma forma puede ser tanto un predicado como un argumento. Tomemos la palabra construcción. Será un predicado en una frase como: se llevó a cabo la construcción de un nuevo puente, que es paralela a la frase, con predicado verbal: se construyó un nuevo puente. En este caso, es legítimo hablar de sujeto y de complemento de un sustantivo. Pero construcción, como muchos predicados de creación, también puede designar el resultado de esta actividad, por ejemplo un edificio: esta construcción tiene una altura de seis metros.
Un sustantivo puede desempeñar funciones en la frase que no pueden preverse solo a partir de su condición morfológica. Un analizador tiene que reconocer funciones nominales como:
• La determinación: un montón de (tonterías).
• La indicación del género: una jirafa macho, un sacerdote mujer.
• Un valor adjetivo: una oferta monstruo.
• Un elemento de un nombre compuesto: un círculo vicioso.
• Un elemento de una locución verbal: levantar la liebre.
Todo lo que hemos expuesto aquí milita por un tratamiento integrado del léxico, la sintaxis y la semántica.
6.3. Los diferentes tipos de adjetivos
Las observaciones que hemos hecho antes sobre la identificación de toda una clase con uno de sus empleos prototípicos se ven ilustradas, de manera casi caricaturesca, por la descripción que normalmente se hace de los adjetivos. Daremos solo algunos ejemplos para poner de manifiesto la heterogeneidad de esta categoría. El hecho de que la mayoría de adjetivos se refieran a cualidades no debe excluir sus otros empleos, que son numerosos. Si dejamos de lado los adjetivos «determinativos», como los demostrativos, los posesivos, los indefinidos, etc., que forman parte de la clase de los determinantes, distinguimos distintos problemas de análisis:
a) Problemas de delimitación de categorías, ya que las mismas palabras tienen que figurar en diccionarios distintos:
• Adjetivos y participios pasados: cansado.
• Adjetivos y nombres: los adjetivos de color, por ejemplo: rosa, naranja.
• Adjetivos y preposiciones: salvo.
• Adjetivos y adverbios: (llueve) fuerte.
• Adjetivos con un estatus particular: presunto.
b) Problemas de falta de motivación semántica.
Los adjetivos pueden figurar, como las restantes categorías gramaticales, en secuencias fijas. En ese caso, su aporte de significado no es composicional y las reglas sintácticas habituales no se aplican. Estas secuencias tienen que registrarse en un diccionario:
• De nombres compuestos: agujero negro, pintura rupestre.
• De adverbiales: en plena noche (*en noche).
• De secuencias intensivas: un miedo cerval.
• De verbos compuestos: prometérselas felices.
c) Adjetivos clasificadores.
Muchos adjetivos se encuentran en secuencias que no son fijas y en las que, sin embargo, los adjetivos no tienen su función habitual, la de atribuir una propiedad o una cualidad a un sustantivo. En estos casos, los adjetivos designan los elementos de un paradigma que contiene las variedades posibles de una entidad. Así, por ejemplo, la noción de bosque se presta a diversas clasificaciones, de las que dan cuenta los siguientes grupos de adjetivos que indican la situación geográfica: bosque amazónico, bosque tropical, bosque boreal; la formación: bosque primario, bosque secundario; el tipo de bosque: bosque caducifolio, bosque virgen, etc. Llamaremos a estos adjetivos adjetivos clasificadores (cf. cap. 5, § 2.1.)
d) Adjetivos-argumento: sujeto o complementos.
Existen adjetivos comúnmente llamados adjetivos de relación, definidos como derivados de nombres: postal, ministerial, petrolero. Preferimos llamarlos adjetivos-argumento por razones de funcionamiento sintáctico. Tomemos un ejemplo que da cuenta de su sintaxis. Sea la frase de predicado verbal: Francia produce petróleo. Tiene una variante nominal con el verbo soporte tener: Francia tiene una producción de petróleo. Podemos introducir una relativa: la producción de petróleo que Francia tiene. Esta frase sigue estando actualizada, ya que tenemos aún el verbo soporte. Si lo suprimimos, obtendremos: la producción de petróleo de Francia, con un genitivo objetivo y un genitivo subjetivo respectivamente. Estos dos argumentos pueden reemplazarse por adjetivos que conservan las funciones de sujeto y de objeto: la producción petrolera de Francia; la producción francesa de petróleo; la producción petrolera francesa. Estos adjetivos no puede ser atributos: *la producción es petrolera (cf. cap. 5, § 2.2.).
e) Adjetivos anafóricos.
Hemos señalado antes que no tenemos en cuenta los adjetivos determinativos: este, mi, algún. Algunos adjetivos anafóricos no forman parte de esta clase, pero tampoco son predicativos. Es el caso de tal: tal actitud es intolerable. Vemos, de nuevo, que una gramática destinada al procesamiento automático tiene que tomar distancias respecto a la tradición, que simplifica la realidad lingüística al reducir una categoría a solo algunos de sus empleos.
6.4. Los diferentes tipos de preposiciones
Las preposiciones tampoco presentan un comportamiento sintáctico unitario. Tienen tres empleos distintos, dos de los cuales son bien conocidos. En primer lugar, una preposición puede ser un indicador de argumentos; es decir, puede introducir un complemento de verbos transitivos indirectos: pensar en N, contar con N, ir a N, rivalizar con N. Como esta es la función atribuida tradicionalmente a la preposición, no nos extenderemos aquí sobre este empleo.
El segundo empleo, no tan reconocido, es de naturaleza predicativa. Si el adjetivo contrario a (Juan es contrario a ese proyecto) es obviamente un predicado, lo mismo sucede con la preposición contra (Juan está contra ese proyecto) en que contra presenta exactamente los mismos argumentos que el adjetivo contrario a. Un gran número de preposiciones locativas y temporales pueden analizarse del mismo modo. En tu libro está sobre la mesa, el predicado es la preposición sobre, cuyos argumentos son, respectivamente, libro y mesa. Resulta coherente analizar: Juan me llamó antes de mi viaje como el hecho de que Juan me llamase tuvo lugar antes de mi viaje, en que el esquema de argumentos sería el siguiente: antes (llamar, viaje). El predicado antes está actualizado por el verbo soporte de ocurrencia tener lugar.
Finalmente, existe un tercer empleo que no ha sido objeto de estudios detallados. Hay secuencias formadas por una preposición y un sustantivo que tienen una sintaxis de adjetivos: de moda, de buen ver, a rayas (cf. cap. 6). En estos casos, la preposición funciona como elemento de «traslación» (Tesnière, 1959), que permite formar adjetivos compuestos.
7. Elaboración de clases o construcciones idiosincráticas
Cuando hablamos de esquemas predicativos, ponemos de manifiesto dos tipos de secuencias fundamentales en la lengua: por un lado, el de las distintas clases de predicados y por otro, el de las clases de argumentos. Estas clases representan cientos, tal vez miles de categorías semánticas, todas necesarias para la descripción del comportamiento de los nombres simples. A su vez, estas clases pueden reagruparse en una docena de clases más generales o hiperclases, como los <humanos>, los <concretos artificiales>, etc. Sucede lo mismo con los predicados. En este nivel, podremos hablar de las acciones que vinculan humanos con humanos, relaciones entre concretos, etc. Esta división da lugar, de manera natural, a una estructuración semántica del léxico de una lengua dada.
Esta distinción entre predicados y argumentos abre la vía a una nueva manera de concebir el reparto entre lo que llamamos las construcciones regulares y las que son objeto de restricciones. Cuando decimos que un esquema predicativo implica un predicado con una secuencia particular de clases de argumentos, afirmamos al mismo tiempo que toda construcción que haga intervenir argumentos de la misma clase semántica dará lugar a una frase simple sintáctica y semánticamente correcta. Los esquemas predicativos representan un gran número de instanciaciones regulares. En cambio, toda estructura sintáctica que implique grupos nominales en el interior de un predicado fijo será irregular, aunque en superficie la estructura parezca regular. Por ejemplo, la secuencia Juan ha cogido el toro por los cuernos no es semánticamente regular porque no es posible sustituir toro por otros sustantivos del mismo tipo, como vaca, cabra. Salvo, claro está, en juegos lingüísticos que consisten en desautomatizar y crear condiciones específicas de lisibilidad, más o menos artificiales, de los elementos de la secuencia.
8. Fijación
Las estructuras que hemos considerado hasta el momento ponen en juego palabras simples en las posiciones (argumentales o predicativas) de las frases que hemos descrito. Podemos, pues, asociar formas sintácticas a elementos simples del léxico. Por ejemplo, podemos establecer conjuntos de frases con predicado verbal que tengan en común propiedades definitorias. Llegamos así a varias decenas de miles de entradas, si tenemos en cuenta la naturaleza de los argumentos.
No obstante, las frases simples no se limitan a estructuras cuyo núcleo predicativo es una palabra simple. Todo lo contrario, las formas predicativas complejas (poliléxicas) son las más numerosas, ya se trate de verbos, de nombres o de adjetivos predicativos. Pensamos en la inmensa masa de las construcciones fijas que en gran parte aún tienen que inventariarse y cuyas variaciones internas son muy importantes (cap. 11). Tomemos algunos ejemplos que hacen intervenir núcleos verbales. En la frase Juan ha estirado la pata, tenemos dos lecturas, una de ellas es composicional, en que el verbo tiene la misma lectura que: Juan ha estirado el brazo. En la otra interpretación, sería un sinónimo aproximado de morir, sin que pudiese afirmarse que pata es el complemento de objeto de estirar. El significado global de la frase sería, en este caso, independiente de los elementos léxicos que la constituyen. Diremos, pues, que la secuencia estirar la pata es un verbo fijo y que, a pesar del sustantivo pata, estamos ante un verbo intransitivo.
La frase Ana le ha dado calabazas a Juan, es otro ejemplo de verbo fijo en que una doble lectura es posible. Una de ellas corresponde a la interpretación literal: calabaza podría permutar con palabras como melones, sandías y dar con traer o regalar. En la otra interpretación dar calabazas significa rechazar (los avances amorosos de alguien) sin que los elementos constitutivos del verbo fijo tengan una relación directa con el significado del conjunto. Ahora bien, a diferencia de lo que sucedía en el ejemplo precedente, dar calabazas es una construcción transitiva que tiene como objeto directo un sustantivo humano.
Los ejemplos que hemos considerado se refieren a verbos, pero el fenómeno afecta también a las otras formas predicativas. Así, al lado de predicados nominales simples: Juan me ha hecho un (signo, gesto), podemos tener: Juan me ha hecho un corte de mangas, cuyo significado global no puede inferirse del de los elementos constitutivos. Del mismo modo, al lado de adjetivos simples como esto es posible para Juan, tendremos esto está al alcance de Juan, en donde al alcance de es un adjetivo compuesto fijo que tiene un argumento-objeto humano. Se puede observar que esta secuencia tiene todas las propiedades de los adjetivos: puede ser atributo, epíteto, pronominalizarse por lo... La fijación puede aplicarse también a las preposiciones predicativas, como en los ejemplos siguientes: la estatuilla está (sobre la, encima de la) cómoda; Juan está (con el, a favor del) candidato de los Verdes.
Las cifras de unidades léxicas existentes en cada caso dan cuenta de la amplitud del fenómeno. Se han inventariado cerca de 35.000 verbos fijos (Gross, 1986), frente a unos 12.000 verbos simples. Si evaluamos en cerca de 70.000 los nombres simples del francés, inventarios sistemáticos han recogido más de 200.000 nombres compuestos, correspondientes a más de 700 moldes morfológicos de formación (Mathieu-Colas, 1996). Estamos, pues, en presencia de un hecho masivo que debe ser considerado una propiedad definitoria de las lenguas naturales y que ha escapado por completo a la tradición gramatical. Remitimos al capítulo 11, donde analizamos más ampliamente el fenómeno de la fijación y donde mostramos que afecta a todas las categorías gramaticales clásicas, sea cual sea su estatus sintáctico.
9. Elementos léxicos fuera de la predicación
Si se asocia a cada frase su esquema predicativo, resulta más fácil poner de manifiesto los otros elementos de la frase que contribuyen a su interpretación, como la determinación, los operadores temporales y modales, etc. Estos elementos pertenecen a la frase y dependen del esquema de argumentos. También pueden detectarse con facilidad otros elementos que no pertenecen al ámbito de la frase, como algunas expresiones que estructuran el discurso o están al servicio de estrategias retóricas: por una parte, por otra parte; desde este punto de vista; por lo demás, etc., indicaciones sobre el tema de un discurso: en el plano político, políticamente, en el ámbito de la medicina, desde el punto de vista del léxico, etc. Como puede observarse, la identificación de los esquemas predicativos de un texto constituye la primera etapa, indispensable, de su análisis.
10. Frases simples y frases complejas
Lo que habitualmente se llama frase compleja corresponde, de hecho, a dos tipos de estructuras distintas. Por una parte, tenemos verdaderas frases complejas de las que hablaremos más adelante y que consisten en dos frases simples reunidas mediante un conector, como en: nos hemos quedado porque llovía; dijo eso para enmendar mi error. Por otra parte, tenemos frases en que el predicado presenta argumentos de naturaleza frástica: creo que ya ha llegado. Los textos reales contienen ocurrencias de ambos tipos de frases. En el análisis, siempre podemos proceder a la reducción de una frase compleja a sus partes constitutivas, es decir, a sus frases simples.
Es importante también tener en cuenta un tipo de frases muy frecuentes que, a primera vista, no parecen ser complejas. Se trata de ocurrencias de lo que llamaremos frases reducidas. Como veremos más tarde, el fenómeno de la reducción está muy extendido y se observa muy a menudo. Por ejemplo, encontramos frases simples reducidas en: tumbado sobre la cama, pensaba en las vacaciones, en que la construcción tumbado sobre la cama puede considerarse una forma reducida de una predicación integral, expresada normalmente por X está tumbado sobre su cama. Para comprender esta frase, hay que reconstruir los vínculos entre el argumento sujeto no expresado de tumbado y el argumento sujeto presente en la segunda frase, estableciendo entre los mismos una correferencia, subrayada por la concordancia en masculino. Del mismo modo, existen múltiples ejemplos de la operación de reducción en las construcciones coordinadas, que van desde estructuras en que falta uno o varios argumentos a estructuras que carecen de predicado, por ejemplo:
Luis ha comido ensalada y bistec.
Luis ha comido ensalada y Juan también.
A Juan le gusta la cerveza, a María no.
Metodológicamente, proponemos enumerar las estructuras sintácticas de las frases simples asociadas a sus esquemas predicativos, especificando todas las variantes estructurales que pueden observarse en textos concretos. Este enfoque no está alejado de la manera en que se elaboran ciertos diccionarios morfológicos de palabras, en que se describen las relaciones entre las variantes morfológicas de una misma palabra, consideradas instanciaciones de la forma canónica. Se considera, por ejemplo, que la forma pasiva de una estructura transitiva es una realización entre otras de dicha frase, del mismo modo que la segunda persona del singular del presente de indicativo es una realización de un verbo dado, cuya forma de referencia es habitualmente el infinitivo. Técnicamente, esto da lugar a una representación de todas las variantes sintácticas de una frase simple mediante un transductor, que codifica estas formas de una manera muy eficiente.
11. Esquemas predicativos de segundo orden
A la distinción que hemos hecho antes entre frases simples y frases complejas corresponde, además, la existente entre predicados de primer y de segundo orden. Estas frases complejas contienen, en general, un elemento predicativo que vincula dos argumentos de naturaleza frástica; es decir, que introduce, a su vez, otro elemento predicativo. Durante mucho tiempo se ha ignorado la enorme variedad en la formación de las frases complejas a partir de conectores que expresan relaciones entre acontecimientos, acciones, estados, etc. Una muestra del tipo de frases en las que pensamos podría ser(cf. cap. 15 y 16):
Han podado los árboles con el fin de fortalecerlos.
Ha habido un corrimiento de tierras a causa de una lluvia torrencial.
El policía llegó en el momento en que el juez se iba.
Estas dificultades han hecho el trabajo mucho más difícil.
A causa de su enfermedad, Juan no ha podido venir.
Cada vez que llueve, Juan se queda en casa.
Es de capital importancia establecer una clasificación de este tipo de predicados. Como veremos más adelante, no se trata solo de conectores morfológicos de palabras simples como o y pero, sino de secuencias de una gran variedad sintáctica y semántica.
Conclusión
El estado actual del procesamiento automático de las lenguas naturales no permite aún hablar de sistemas de comprensión de textos que puedan realizar tareas complejas. Parece claro que el procesamiento automático depende estrechamente del grado de cobertura del que el sistema dispone. Esta exigencia supone llevar a cabo un buen número de tareas complejas y laboriosas. Reconocer las unidades léxicas implica que se hayan inventariado todas las secuencias fijas, al menos las de las categorías compuestas. De ahí que haya que establecer la lista de todos los predicados de primer orden para poder reconocer las frases simples, que constituyen las unidades mínimas de análisis de los textos. La desambiguación de los elementos léxicos, que son casi siempre polisémicos si se consideran aisladamente, se hace en el marco de los esquemas de argumentos. El reconocimiento de los esquemas de argumentos permite, además, aislar los predicados de segundo orden, así como todos los elementos léxicos que no pertenecen a la frase simple y que deben recibir una descripción específica.
Abeillé, A., 2002, Une grammaire électronique du français. Paris: CNRS Editions.
Bloomfield, L., 1933. Language. New York: Holt & Co.
Bresnan, J., 2000. Lexical Functional Syntax. Oxford: Blackwell.
Chomsky, N., 1965. Aspects of the Theoty of Syntax. Cambridge: MIT Press.
Chomsky, N., 1981. Lectures on Governement and Binding. Dordrecht: Foris.
Chomsky, N., 1995. TheMinimalistProgram. Cambridge: MIT Press.
Danlos, L., 1985. La génération automatique de textes en langues naturelles. Paris: Masson, Paris.
Goldberg, A.-E., 1995. A construction Grammar Approach to Argument Structure. Chicago University Press.
Gross, M., 1975. Méthodes en syntaxe. Paris: Hermann.
Gross, M., 1986. Grammaire transformationnelle du français. Tome 2, Syntaxe du nom, Cantilene: Malakoff.
Habert, B., Nazarenko, A. y Salem, A., 1997. Les linguistiques de corpus. Paris: A. Colin.
Harris, Z. S., 1961, Methods in Structural Linguistics, University of Chicago Press, Chicago, Illinois.
Harris, Z. S., 1968. Mathematical Structures of Language. New York: Wiley.
Harris, Z. S., 1976. Notes du cours de syntaxe. Paris: Le Seuil.
Harris, Z. S., 1978. «Operator-Grammar of English.» Linguisticae Investigationes tom. II: 1. Amsterdam: John Benjamins.
Jakobson, R., 1963. Essais de linguistique générale. Paris: Editions de Minuit.
Jespersen, O., 1924. La philosophie de la grammaire. Paris: Editions de Minuit.
Lazard, G., 1994. L’actance. Paris: PUF, Paris.
Lyons, J., 1980. Sémantique linguistique. Paris: Larousse.
Mathieu-Colas, M., 1996. «Essai de typologie des noms composés français.» Cahiers de lexicologie n° 69-II: 71-125. Paris: Didier.
MelČuk, I., Clas, A. y Polguère, A., 1995. Introduction à la lexicologie explicative et combinatoire. Louvain-la-Neuve: Duculot.
Milner, J.-C., 1989. Introduction à une science du langage. Paris: Le Seuil.
Ruwet, N., 1972. Théorie syntaxique et syntaxe du français. Paris: Le Seuil.
Salkoff, M., 1979. Analyse syntaxique du français: grammaire en chaîne. Amsterdam: John Benjamins.
Saussure, F. de, 1916. Cours de linguistique générale. Paris: Payot (1979).
Tesnière, L., 1959. Eléments de linguistique structurale. Paris: Klincksieck.
Chevalier, J.-Cl. et al. 1964. Grammaire Larousse du français contemporain. Paris: Larousse. Grevisse, M. y Goosse, A., 1993. Le bon usage. Louvain-la-Neuve: Duculot, édition refon-
due par A. Goose. Le Goffic, P., 1993. Grammaire de la phrase française. Paris: Hachette. Riegel, M., Pellat, J.-Ch. y Rioul, R., 2009. Grammaire méthodique du français. Paris: PUF. Wagner, R.-L. y Pinchon, J., 1962. Grammaire du français classique et contemporain. Paris: Hachette.
Wilmet, M., 1997. Grammaire critique du français. Paris: Hachette y Duculot.
Diccionarios de lingüística
Dubois, J. et al. 1973. Dictionnaire de linguistique. Paris: Larousse. Gary-Prieur, M.-N., 1999. Les termes clés de la linguistique. Paris: Seuil. Neveu, Fr., 2009. Lexique des notions linguistiques. Paris: A. Colin.
Schaeffer, J.-M y Ducrot, O., 2000. Nouveau dictionnaire encyclopédique des sciences du langage. Paris: Seuil.