LEXIQUE
ÉLECTRONIQUE
DES VALENCES VERBALES DU FRANÇAIS
Données linguistiques
: André Valli et Morris Salkoff
Lexique électronique : Laure Brieussel
Coordination du projet : Paul Sabatier
Objectifs
Sources des données
Patrons de compléments
Propriétés grammaticales et sélections lexicales
Exemples et consultation du lexique électronique
Références
bibliographiques
Le lexique, en particulier le lexique de verbes ou de la complémentation verbale apparaît, à côté des grammaires comme une pièce maîtresse dans la description formalisée des langues, comme l'indique l'abondance de références à des projets de Valency Lexicon en particulier dans l'univers du traitement automatique des langues (TAL). C'est une des raisons pour laquelle André Valli et Morris Salkoff ont entrepris la construction d'une base de données décrivant la complémentation verbale du français qui pourra constituer un outil commode pour les linguistes et servir en particulier en TAL (Salkoff et Valli, 2005, 2006). Cette base de données réunira bientôt une liste des 975 entrées des verbes d'emploi le plus fréquent (Juilland, Brodin, Davidovitch 1970). A terme, elle réunira les entrées de plus de 6 000 verbes, ce qui en fera une base de données plus importante que le lexique Dicovalence (Van den Eynde et Mertens 2003) qui constitue une description de la syntaxe verbale du français dans le cadre théorique de l'Approche pronominale.
Le développement d'un tel lexique de la complémentation verbale - par la suite Lexique des valences verbales du français (LEXVALF) -, constitue une tâche considérable pour une petite équipe sans doute, mais d'une dimension raisonnable, toutefois, puisque ont été écartés de notre inventaire les constructions à verbe support, les constructions verbales figées (les recueils sont disponibles pour le français sous divers formats) - ainsi que les collocations.
Cela a conduit les auteurs de LEXVALF à produire pour chaque entrée verbale une masse de données importante et fortement structurée. A partir d'une liste préalablement établie de tous les patrons de compléments acceptés par l'ensemble des verbes, sont établies, pour chaque verbe, toutes les formules de compléments acceptées. Leur description est enrichie par l'intégration de tous les phénomènes de sous-catégorisations grammaticales et de restrictions grammaticales pertinents, le tout assorti d'au moins un exemple extrait d'un des corpus des différentes ressources.
LEXVALF se présente partiellement comme un équivalent formalisé d'un dictionnaire usuel, à cela près que l'essentiel de l'effort est consacré à la description de particularités syntaxiques de constructions des unités lexicales verbales : caractérisation syntaxique des arguments et des propriétés de construction particulière (pronominale, impersonnelle, etc.). A la différence d'un lexique comme FrameNet (Fillmore 1976) pour l'anglais, LEXVALF ne développe pas une caractérisation sémantique de chaque emploi verbal identifié par une formule de complément ; il se borne à associer à chaque réalisation de patron de complément décrite l'emploi sémantique correspondant dans Les Verbes français (LVF) de J. Dubois et F. Dubois-Charlier (2004) ; mais, comme dans FrameNet, sont également mentionnées dans LEXVALF les relations de sélection lexicales entre le verbe et chacun des arguments - voire entre les arguments (bien reformulé) - au moyen de notations de sémantique référentielle très générales (humain, non humain, abstrait, concret) ou plus rarement de "classes d'objets", comme les "noms partie du corps".
Le Lexique-grammaire développé au LADL par M. Gross (1975) et son équipe, J-P. Boons, A. Guillet et Ch. Leclère (1976, 1992), et mis à la disposition des chercheurs par L'IGM (Institut Gaspard Monge), constitue, incontestablement, la ressource d'informations syntaxiques la plus riche qui existe sur le verbe français. Dans le projet LEXVALF, cette ressource est exploitée manuellement en établissant les formules de compléments identifiés pour chacune des entrées verbales par l'examen des matrices de propriétés retenues sur chaque ligne d'une table du Lexique-grammaire.
Parmi les grands dictionnaires de langue française consultés, les auteurs de LEXVALF ont eu systématiquement recours au Grand Robert (GR), au Petit Robert (PR), et au Trésor de la Langue Française (TLF) en particulier, qui constitue globalement une ressource très profitable par l'ampleur de la description des entrées, en particulier les compléments prépositionnels.
Dans le projet LEXVALF, l'ouvrage de J. Dubois et F. Dubois-Charlier, Les Verbes français (LVF), constitue également une ressource importante, à la fois pour l'inventaire des constructions et celui des emplois. Mais la ressource sans doute la plus déterminante pour LEXVALF est le Web (W) francophone. C'est dans ce corpus de plusieurs milliards de mots - en se limitant aux sources écrites formelles - que sont extraits des exemples pour les constructions verbales complexes du Lexique-grammaire qui n'étaient jusqu'alors exemplifiés qu'à partir d'énoncés construits par les chercheurs du LADL. C'est également dans ce vaste corpus que sont dégagés des exemples de patrons de constructions signalés nulle part ailleurs.
LEXVALF : Patrons de compléments
Dans LEXVALF sont codées les constructions des verbes recensés dans les tables du Lexique-grammaire. Pour chaque verbe étudié, LEXVALF affiche en premier lieu des patrons de compléments qui sont définis par des formules qui ne retiennent que des notations de catégories verbales (SN, Vinf, P, Ph, etc.), des relations syntaxiques (Sujet, etc.) et des constantes grammaticales (Subj pour subjonctif, V=être, P=de, P=à, etc.).
Les patrons de compléments ont été établis (Salkoff 1979, Valli 1980) à partir d'une exploitation manuelle des tables des verbes du Lexique-grammaire élaborées par l'équipe de M. Gross (LADL, Université de Paris VII) et mises à la disposition aujourd'hui par l'IGM.
Par exemple, le verbe justifier est décrit dans la Table 15 du Lexique-grammaire avec l'exemple suivant :
Max s'est justifié auprès du jury de son attitude. (LG)
Dans LEXVALF, cet emploi de justifier est décrit par le patron de complément 25 [P SN] [P SN], emploi pronominal seulement. Il est illustré par l'exemple ci-dessus et par des énoncés attestés extraits du Web (W) :
[ ...] ou par la nécessité de se justifier auprès de son interlocuteur de son refus de passer en mode visuel. (W)
Mais le premier homme n'a pas un rôle plus reluisant : il tente de se justifier auprès de Dieu en dénonçant sa compagne. (W)
Autre exemple, toujours avec le verbe justifier qui, pour le patron de complément 27 [P SN] [que Ph] avec P= auprès de, est illustré par l'exemple suivant :
(Jean + Cette affaire) justifie (à + auprès de) Max (E + de ce) qu'il a pris cette décision. (LG)
et doublé par un énoncé extrait du corpus du Web :
Ce document permettra à ses bénéficiaires de justifier auprès de leurs interlocuteurs qu'ils ont satisfait à la formalité de la déclaration. (W)
Dans tous les cas où le patron de complément retenu est illustré dans un des grands dictionnaires de langue française, - Grand Robert (GR), Petit Robert (PR), Trésor de la Langue française (TLF) -, est retenue l'illustration proposée, sauf en cas de réserves à propos du registre de l'exemple. Tel est le cas pour le patron de complément 5 [P SN], emploi pronominal seulement, avec P= par, pour le verbe signifier :
Chacun se signifie par son costume. (TLF)
ou du patron 17 [P:{pour,à} SN:sujet] [P:de Vinf] qui est donné dans les deux grands dictionnaires, avec les mêmes sélections :
Signifier à quelqu'un de faire quelque chose. (GR)
Il faut que je signifie à Mme Paulin de ne plus me mêler à ses commérages. (TLF)
Il arrive également que soit relevée l'existence d'un patron de complément noté dans les tables du Lexique-grammaire, par la mise en relation d'un certain nombre de propriétés mais illustré nulle part, ou avec des indications de sélection lexicale insuffisantes. C'est le cas, dans l'exemple suivant, pour un patron 5 [P SN], emploi pronominal seulement, P= à. Il donne lieu à une phrase-exemple dans la Table 7 du Lexique-grammaire :
Ida s'en tient au vin. (LG)
Le corpus du Web révèle l'existence d'énoncés qui montrent que le complément peut accepter le trait "humain" ou le trait "abstrait" :
Aujourd'hui, si l'on s'en tient aux seuls Iraniens déclarés [ ...] (W)
On veut donc s'en tenir aux critères d'inversibilité. (W)
Enfin, il arrive que le Lexique-grammaire n'identifie pas un patron de complément pourtant clairement attesté. C'est le cas, pour le verbe recevoir à la Table 39 du Lexique-grammire avec le patron de complément 39 [SN:sujet P:{comme,pour}{SN, N, SAdj}] ; de ce fait, il n'en propose pas une phrase exemple. Cependant le Web fournit plusieurs exemples avec des variantes dans la catégorie du second constituant :
Il leur a fait recevoir le dogme chrétien comme conforme à une certaines vision de [ ...] (W)
[ ...] recevoir le concile comme une grande force de ... (W)
[ ...] pouvoir vous recevoir comme artiste participant. (W)
LEXVALF : Propriétés grammaticales et sélections lexicales
Pour chaque entrée verbale, LEXVALF indique des propriétés grammaticales qui sous-catégorisent les verbes étudiés ainsi qu'un ensemble de restrictions grammaticales associées à l'occurrence de chacun des patrons de compléments. Est-ce que des catégorisations grammaticales aussi détaillées sont nécessaires ? La réponse n'est pas évidente si on se situe dans une perspective dictionnairique classique. Mais si on envisage de dédier également ce lexique à l'analyse syntaxique automatique, on peut montrer que l'incorporation des restrictions de sélection lexicale et grammaticale dans le lexique devrait permettre à un analyseur d'éviter deux écueils importants : d'une part, de fournir des analyses sémantiquement ou syntaxiquement incohérentes (ce qu'on appelle couramment des fausses analyses ou bien des analyses incorrectes), et d'autre part, d'éviter des pertes de temps considérables dans l'exploration d'embranchements de la grammaire qui ne peuvent aboutir à une analyse acceptable pour un énoncé donné.
Sous-catégorisations
verbales
Par exemple, certains verbes acceptent la pronominalisation en là d'un complément de type [à N], [dans N] dans un patron de complément [P SN], [SN P SN] : ce là ne constitue pas un ajout locatif :
Trouver son intérêt dans une affaire. (PR)
Trouver là son intérêt.
Cette propriété est indiquée dans l'entrée lexicale de trouver par la rubrique sous-catégorisation appropriée. Dans le cas où un analyseur essayera de trouver une occurrence de dans N pour le complément de trouver, la présence de cette mention lui permettra d'accepter là (dans la 2ème phrase) comme l'équivalent de ce groupe prépositionnel. Autre exemple, certains verbes se construisent impersonnellement à l'actif :
Il se trouve que la philosophie française est une sorte d'institution publique. (TLF)
Cette propriété est notée par une mention explicite lors de la première saisie du verbe. Autre exemple, certains verbes se construisent impersonnellement, au passif seulement :
Dans cette idée de se tourner vers l'avenir il a été réfléchi à des supports modernes de communication. (W)
Cette propriété est notée pour ces verbes. Dans ce cas également, il ne pourra être analysé comme un pronom personnel.
Propriétés spécifiques de certaines réalisations verbales
Il s'agit aussi bien de restrictions grammaticales qui conditionnent l'acceptation par le verbe d'un type donné de complément que de particularités de construction liées à l'emploi du verbe.
Prenons un exemple : il arrive qu'un verbe, généralement de construction non pronominale, accepte une formule de complément seulement s'il est construit pronominalement. Tel est le cas pour le patron de complément 5 [P SN], pour le verbe signifier :
Chacun se signifie par son costume. (TLF)
C'est également le cas, dans l'exemple suivant, pour un patron 5 [P SN], pour le verbe tenir :
Ida s'en tient au vin. (LG)
Mais dans ce cas, il faut noter une seconde restriction grammaticale associée à l'occurrence de cette construction : la présence d'une particule en inanalysable.
Les sélections lexicales
Ce dispositif, assez comparable à celui mis en place dans FrameNet, n'était pas totalement disponible dans les tables du Lexique-grammaire. C'est donc une originalité de LEXVALF que de caractériser les différents emplois d'un verbe par un patron de complément et un jeu de sélection lexicale sur chacun des arguments - N0 (sujet), N1 (complément 1) , N2 (complément 2) - et de sélections croisées.
En particulier pour les patrons de compléments 1 [SN], 5 [P SN], 24 [P SN] [SN], 25 [SN] [P SN] et 29 [P SN] [P SN], LEXVALF note les traits sémantiques que doivent vérifier sujets et compléments dans les constructions décrites (trait +/- humain, trait abstrait (et/ou prédicatif), les classes lexicales (noms de temps, noms parties du corps) qui sont acceptables pour un verbe donné.
Ainsi est décrit l'objet direct (Patron 1 [SN]) du verbe simplifier en retenant deux énoncés exemples :
Max a simplifié le problème. (LG)
L'ordonnance a simplifié le dispositif d'autorisation préalable. (W)
qui indiquent que le complément direct doit être N "abstrait" (le plus souvent un procès) et le sujet peut être un "humain" ou "abstrait". Pour un patron de complément comme les patrons 25, 26 et 29, sont notées des sélections croisées entre les deux compléments, comme ci-dessous dans les exemples du patron [SN] [P SN], avec le verbe sacrifier pour la préposition contre. Le sujet est régulièrement un nom "humain". Quant aux deux compléments, il sera spécifié que quand le premier est "humain" ou "concret", le second peut être "concret", "abstrait" :
L'actionnaire principal serait donc prêt à sacrifier Ribéry contre un gros chèque. (W)
On pourrait donc sacrifier sa Dame contre 3 pièces mineures plus 1 pion. (W)
Deux jeunes femmes (...) prêtes à sacrifier leur corps contre une Xbox 360. (W)
mais il pourrait être "humain" ; en revanche, si le premier est "abstrait", le second doit être également "abstrait" :
On ne doit pas sacrifier le progrès contre un sentiment de sécurité. (W)
Les sélections sont plus complexes avec le verbe semer, pour la préposition dans. Dans le cas où le premier complément est "concret", le second est "concret" ou "locatif" et le sujet est "humain" :
Max a semé du blé dans son champ. (LG)
Dans le cas où le premier complément est "abstrait", le second doit être également "abstrait", le sujet est "humain" ou "abstrait" (Max ou l'action de Max) :
Max a semé le désordre dans ses papiers. (LG)
LEXVALF
: Exemples et consultation du lexique électronique
Téléchargement
(ici)
des propriétés (patrons de compléments, sous-catégorisations,
restrictions grammaticales, constituants, sélections lexicales, etc.)
utilisés dans LEXVALF.
Téléchargement (ici) d'un exemple : les constructions et emplois du verbe commander produits par LEXVALF.
Consultation en
ligne du lexique électronique LEXVALF (ici).
Boons J-P., Guillet A., Ch. Leclère Ch.,1976, La structure des phrases simples en français. Constructions transitives, Droz, Genève- Paris.
Dubois J., Dubois-Charlier F., 1997, Les Verbes français, Larousse-Bordas, Paris.
Fillmore Ch., 1976, Frame semantics and the nature of language, in Origins and Evolution of Language and Speech, ed. by Stevan R. Harnad, Horst D. Steklis, & Jane Lancaster, 20-32. Annals of the New York Academy of Sciences, Vol. 280.
Gala N., Valli A., 2005, Building a computational lexicon of verbal syntactic constructions in French, in Proc. of PAPILLON, Workshop on Multilingual Lexical Databases.
Gross M., 1975, Méthodes en syntaxe, Hermann, Paris.
Guillet A., Leclère Ch., 1992, La structure des phrases simples en français. Constructions transitives locatives, Droz, Genève-Paris.
Juilland A., Brodin D., Davidovitch C., 1970, Frequency Dictionary of French Words, Mouton, The Hague.
Salkoff M., 1979, Analyse syntaxique du français, Grammaire en chaîne, John Benjamins, Amsterdam.
Salkoff M., Valli A., 2005, A dictionary of french verbal complementation, in Proc. of Language and Technology Conference. Human Language and Technologies as a Challenge for Computer Science and Linguistics. In memory of M. Gross and A. Zampolli, Poznan, Poland.
Salkoff M., Valli A., 2006, La constitution d'un lexique de la complémentation verbale du français, in Actes du Colloque international sur le lexique et la grammaire.
Valli A., 1980, Etablissement d'un lexique automatique de verbes français, Thèse de doctorat, LADL, Université Paris VII.
Van den Eynde K.,
Mertens P., 2003, La valence : l'approche pronominale et son application au
lexique verbal, Journal of French Language Studies 13, 63-104.
LEXVALF
s'inscrit dans le cadre de l'initiative FondamenTAL
dont l'objectif est de contribuer de façon substantielle au développement, à
l'enrichissement et à la diffusion de ressources linguistiques fondamentales
pour le traitement automatique des langues (TAL).