Le Projet CopuLex

T Russon Wooldridge; Astra Ikse-Vitols; Terry Nadasdi

doi:10.16995/dscn.223

1. Introduction

Le dictionnaire, ouvrage de référence, possède une structure conventionnelle qui en fait un outil de recherche documentaire. Il fonctionne à deux niveaux: à celui des adresses, généralement ordonnées de A à Z (macrostructure); et à celui des articles, ensembles d'informations linguistiques pour chaque mot-adresse (microstructure). La consultabilité d'un dictionnaire se mesure en termes de la rapidité avec laquelle l'usager peut repérer la bonne adresse dans la macrostructure et ensuite trouver l'information désirée dans la microstructure. Dans un dictionnaire moderne, la consultabilité de l'article est assurée par une structure récurrente dans laquelle, en principe, chaque adresse est toujours suivie du même type d'informations, données dans le même ordre et la même typographie, et où les espèces d'informations les plus fréquentes ("nom masculin", "verbe transitif", "vient du latin", etc.) sont présentées sous forme d'abréviations conventionnelles ("n. m.", "v. tr.", "( ... lat. ... )"). Les dictionnaires anciens avaient une structure moins rigoureuse et un contenu moins prévisible (Bray, 1989; Hausmann & Wiegand, 1989; Wooldridge, 1977: 97).

La macrostructure n'a guère changé depuis les origines de la lexicographie. Le modèle des familles lexicales classées par ordre alphabétique des mots chefs existe déjà dans les dictionnaires latins (monolingues et bilingues) du Moyen-Âge (Merrilees, Edwards & Megginson, 1992). Dans la tradition des dictionnaires généraux français, l'ordre alphabétique sans regroupement des dérivés apparaît dès la Renaissance dans les bilingues,[1] comme dès le premier receuil monolingue (Richelet 1680). En revanche, la microstructure, bien plus complexe, connaît une évolution lente, caractérisée par une codification et une récursivité progressives d'éléments et de modèles -- place, typographie, terminologie, abréviation conventionnelle -- proposés dans les premiers répertoires. Les étapes marquantes de cette évolution menant du Thresor de la langue françoyse de Jean Nicot (1606) au Trésor de la langue française du CNRS (en cours de publication) seraient Nicot pour la première microstructure complexe, Richelet-Furetière-Académie (fin 17^e s.) pour une première récursivité, Féraud (1787) pour la codification (surtout transcription phonétique et numérotation des sens et syntagmes), Hatzfeld & Darmesteter (fin 19^e s.) pour la consultabilité.

Le Projet CopuLex a pour but d'analyser, dans la tradition lexicographique française, l'histoire et l'évolution des systèmes de copules reliant les unités de traitement (adresses et sous-adresses) aux différentes informations (orthographe, prononciation, catégorie grammaticale, sens, emploi, étymologie, etc.) (Wooldridge, 1988).[2]

2. Le corpus

Le corpus d'étude comprend une vingtaine des principaux dictionnaires français monolingues généraux couvrant les quatre siècles de l'élaboration de la microstructure.

J. Nicot, Thresor de la langue françoyse, 1606.
P. Richelet, Dictionnaire françois, 2 vols, 1680.
A. Furetière, Dictionaire universel, 2 vols, 1690.
Dictionnaire de l'Académie françoise, 1^e éd., 2 vols, 1694.
Dictionnaire de Trévoux, 4^e éd., 6 vols, 1743.
Dictionnaire de l'Académie françoise, 4^e éd., 2 vols, 1762.
Abrégé du Dictionnaire de l'Académie, 1786.
Abbé Féraud, Dictionaire critique, 3 vols, 1787.
Dictionnaire de l'Académie française, 6^e éd., 2 vols, 1835.
M. Bescherelle, Dictionnaire national, 6^e éd., 2 vols, 1858.
É. Littré, Dictionnaire de la langue française, 5 vols, 1863-72 (impr. de 1878).
A. Hatzfeld & A. Darmesteter, Dictionnaire général, 2 vols, 1890-1900.
P. Robert, Dictionnaire alphabétique et analogique, 1^e éd., 6 vols, 1951-64.
J. Dubois et al., Dictionnaire du français contemporain, 1967.
P. Robert, Dictionnaire alphabétique et analogique: "Petit Robert", 1^e éd., 1967.
Grand Larousse de la langue française, 7 vols, 1971-8.
Trésor de la langue française, 14 vols parus sur 16, 1971-.
Lexis, 1975.
P. Robert, Dictionnaire alphabétique et analogique, 2^e éd., 9 vols, 1985.
A. Rey et al., Le Micro-Robert, 2^e éd., 1988.

Dans le corpus on trouve représentés:

les familles de dictionnaires: Académie, Furetière-Trévoux, Robert, Larousse (DFC et Lexis);
l'abrégement: Acad. 1762 --> Abrégé 1786; Robert --> Petit Robert --> Micro-Robert;
l'extension: DFC --> Lexis;
la concurrence synchronique: Richelet-Furetière-Académie; Petit Robert - Lexis.

Pour l'examen détaillé assisté par ordinateur, nous avons choisi l'échantillonnage suivant, le même pour tous les dictionnaires:

la section LOIN... à LOIS...;
les articles individuels GAGNER/GAIGNER et QUE.

L'échantillonnage inclut des mots monosémiques et des mots polysémiques; ces derniers sont représentatifs des différentes classes lexicales: le nom (LOINTAIN, LOISIR), le verbe (GAGNER), l'adjectif (LOINTAIN, LOISIBLE), l'adverbe (LOIN, LOISIBLEMENT), le mot outil (QUE).

3. La copule

La clé de la consultation du microarticle est la copule reliant l'unité de traitement à l'information désirée, selon la formule 'Sujet --> Prédicat'. L'ensemble des copules forme l'articulation des composants. En ce qui concerne l'Adresse principale, la copule doit pouvoir signifier au départ 'information sur le signe/signifiant/signifié':

A (signe)          -->      Catégorie grammaticale, Étymologie, Syntagmatique...
A (signifiant) -->      Graphie, Prononciation...
A (signifié)       -->      Sens (Définitions), Synonymie, Antonymie...

L'unité de traitement peut être complexe: Mot-adresse + Définition --> Exemple; Mot-adresse + Mot-en-contexte --> Synonyme. Nous avons défini quatre types de copules:

Positionnelle (place dans la microstructure)
Typographique (caractère, paragraphe, délimiteurs, alphanumérotation)
Linguistique (ex. "signifie")
Autonymique (ex. "v. tr.")

La consultation du dictionnaire implique deux modes de lecture: une lecture verticale pour repérer l'entrée et une lecture horizontale pour s'approprier l'information recherchée. À l'intérieur de la microstructure, le repérage d'une sous-entrée et celui de l'information nécessite une combinaison des deux. Plus la microstructure est codifiée, plus cette lecture diagonale tend vers la verticale; moins elle est codifiée, plus la lecture devient linéaire (et longue).

4. Le système vs. la compétence de l'utilisateur

Dans tout dictionnaire, il convient d'opposer ce qui relève du système utilisé par le lexicographe et ce qui revient à la compétence du consulteur, cette dernière devant compléter ce que le premier ne donne pas explicitement ou ne peut pas donner. Avant Féraud, on peut parler d'un manque de systématisation; par la suite, d'une limite pratique. Nous allons maintenant examiner de près deux situations qui demandent une interprétation des données du texte. Dans le premier cas (Trévoux 1743), il s'agit d'ambiguïté; dans le second (Lexis 1975), de structures implicites.

4.1. La mise en paragraphes

Notre étude se propose d'examiner la mise en paragraphes comme outil de structuration des informations. Le but précis de cette analyse est de voir comment cette technique peut être employée pour améliorer la consultabilité d'un dictionnaire. Après avoir examiné quelques emplois possibles de la mise en paragraphes, nous passerons à l'examen d'un dictionnaire en particulier, le Trévoux de 1743, afin de voir s'il respecte des règles régissant l'emploi efficace d'une division en paragraphes. Nous tiendrons surtout compte des contradictions entre la mise en paragraphes et l'information que ces segments contiennent.

Le choix du Trévoux se motive par le fait qu'à l'époque où ce dictionnaire a été réalisé, les outils typographiques exploités dans l'articulation des unités d'un dictionnaire étaient peu nombreux. Bien qu'on y trouve l'italique et même deux tailles de majuscules, le Trévoux n'a aucun système pour indiquer les divisions importantes à part la mise en paragraphes. Ainsi, l'utilisateur du Trévoux se trouve obligé de se fier aux seules divisions en paragraphes. Ceci fait qu'une mise en paragraphes cohérente de la matière lexicale du Trévoux serait primordiale pour la consultation de ce dictionnaire.

4.1.1. Emploi cohérent de la mise en paragraphes

Passons maintenant à ce qui constitue une mise en paragraphes cohérente. Après avoir amassé toutes les informations relatives à un mot-vedette donné, le lexicographe se trouve devant un bloc de données qu'il est censé organiser. Pour que le dictionnaire puisse être considéré comme un ouvrage de consultation, ce bloc doit être organisé systématiquement de sorte que l'usager puisse accéder facilement à l'information qu'il cherche. L'avantage d'une mise en paragraphes cohérente est qu'en principe elle permet à l'usager de prévoir la structure de chaque article. Ainsi, l'utilisateur pourra éviter les sections non pertinentes et aller directement à ce qui l'intéresse. Par contre, si la structure n'est pas cohérente, il sera obligé de lire chaque paragraphe, ce qui alourdira sa tâche.

Examinons d'abord quelques mises en paragraphes ayant une structure prévisible, c'est-à-dire qui améliore la consultabilité d'un dictionnaire. La Figure 1 présente trois exemples d'une mise en paragraphes bien structurée.

Le modèle A démontre qu'on peut se servir d'un changement de paragraphe pour indiquer qu'on traite d'une nouvelle occurrence d'un même type de structure complexe; il s'agit notamment de traiter des sens différents d'un même mot-vedette dans des paragraphes distincts. Dans ce type de structure, les exemples, les synonymes, l'étymologie, etc. se trouveraient, éventuellement, à l'intérieur de chaque paragraphe pour un sens donné. On peut dire que la structure A augmente la consultabilité d'un dictionnaire parce qu'elle permet à l'usager de prévoir où il trouvera les différentes parties du traitement sémantique du mot-vedette.

Dans B, la division en paragraphes sert à séparer des catégories d'information différentes; par exemple, traitement sémantique, syntagmes, synonymes, étymologie, emplois figurés, etc. Pour que ce genre de mise en paragraphes fonctionne bien, il faut que dans chaque article le même ordre soit respecté; chaque paragraphe doit aussi être étiqueté (genre "Syntagmes"), pour qu'une éventuelle absence de catégorie (synonymes, emploi figurés, par exemple) soit évidente.

La mise en paragraphes du modèle C démontre qu'on peut avoir une combinaison des deux premières structures, à condition qu'il y ait une filiation logique entre les paragraphes; c'est-à-dire qu'on peut avoir une suite de paragraphes tous reliés à un même traitement sémantique, suivie d'autres groupes de paragraphes fonctionnant de la même manière. L'avantage d'une telle organisation est qu'elle permet à l'utilisateur de trouver des groupes d'informations qui forment une unité.

Les trois types de mise en paragraphes que nous venons de décrire peuvent être employés pour favoriser la consultation d'un dictionnaire parce qu'ils sont tous systématiques et récurrents. Ils permettent à l'usager de trouver les informations particulières sans avoir à tout lire. Il est vrai que l'usager doit prendre le temps de s'y habituer, mais une fois habitué au système établi il pourra prévoir la structure de chaque article. Dans le Trévoux, on trouve des traits de chacune de ces structures, sans qu'aucune ne soit respectée systématiquement, c'est-à-dire qu'elles ne sont pas récurrentes. Ceci fait que l'utilisateur ne peut pas s'y fier pour prévoir la structure de paragraphe d'un article donné.

4.1.2. La mise en paragraphes dans le Trévoux

Examinons trois articles du Trévoux: GAGNER (20 paragraphes), LOIN (6) et QUE (5). La Figure 2, la Figure 3 et la Figure 4 donnent le texte intégral,[3] avec les numéros d'ordre des paragraphes et, en fin de paragraphe, des codes indiquant la nature du composant global de chaque paragraphe et son appartenance à la microstructure.[4] Dans les codes, le point d'interrogation signifie que le statut d'un paragraphe est particulièrement difficile à cerner.

Chacune des structures A, B et C est violée, ce qui mène à des contradictions entre la mise en paragraphes et l'information que ces paragraphes contiennent. Cela peut s'expliquer comme étant une contradiction entre la lecture verticale (où l'oeil s'arrête) et la lecture horizontale (ce qu'on y trouve). Nous allons distinguer ici trois contradictions principales. Chaque contradiction correspond à une violation des structures des modèles présentés à 4.1.1.

1. Division incohérente d'une même catégorie d'information (modèle A)

Comme nous l'avons déjà dit, la mise en paragraphes peut améliorer la consultabilité d'un dictionnaire si on se sert de ces coupures pour indiquer des acceptions différentes d'une même vedette. Nous constatons que, bien que cette technique soit exploitée par le Trévoux -- par exemple les paragraphes 4 et 5 de GAGNER présentent des sens nouveaux --, son utilisation est occasionnelle et donc imprévisible. Chaque paragraphe d'un article présente des informations variables: un sens précis (par exemple, G#1, G#4, G#5, G#11);[5] des informations étymologiques (G#2); une qualification d'emploi (G#10, G#12); une sous-vedette (G#3, G#17, G#19); une division grammaticale (L#3, L#6; Q#2, Q#3) ou bien un simple syntagme (G#13, G#16).

De plus, deux paragraphes successifs du Trévoux peuvent correspondre non seulement à deux sous-ensembles discrets (deux sens, deux emplois syntaxiques, etc.), mais aussi à deux parties du traitement d'un même sous-ensemble. Prenons à titre d'exemple le passage de G#8 à G#9. Bien qu'on trouve ici deux paragraphes distincts, le contenu nous révèle qu'il s'agit d'un même sens: "GAGNER, s'emploie aussi neutralement en ce sens". Le passage à la ligne correspond, dans ce cas, non à un changement sémantique, mais à un changement de fonctionnement syntaxique. De même, le traitement du syntagme que si, que non est réparti sur deux paragraphes (Q#4 et Q#5), le second servant à introduire un emploi nouveau ("est aussi un substantif").

2. Distribution incohérente des catégories distinctes (modèle B)

Prenons l'étymologie et les emplois dits proverbiaux. Dans l'article GAGNER, l'étymologie est donnée dans le deuxième paragraphe, comme c'est le cas pour d'autres articles, tels que BEC, LONG, LOYAL. Sa place varie cependant d'un article à l'autre: troisième paragraphe pour LOT, quatrième et cinquième pour BANDE, absente d'un grand nombre d'articles, dont LOIN et QUE. Les emplois proverbiaux de gagner sont regroupés dans le dernier paragraphe consacré à la forme gagner (G#18); en revanche, dans l'article LOIN la rubrique "On dit proverbialement" est placée dans l'avant-dernier paragraphe consacré à la forme loin.

3. Filiation incohérente (modèle C)

Le troisième type d'incohérence vient d'un manque d'enchaînement logique des paragraphes. Si les syntagmes de G#6 se rattachent clairement au traitement sémantique de G#7, les syntagmes gagner les devans (G#13) et gagner sa vie à filer/chanter (G#16) n'ont aucun lien avec les paragraphes (G#12, G#15) qui précèdent leur présentation. Le passage de G#8 à G#9 offre un exemple d'une filiation sémantique explicite: "s'emploie aussi neutralement en ce sens"; cependant, la charnière de filiation sémantique se réduit le plus souvent, soit à une formule énumérative -- type "se dit aussi pour", "on dit aussi" --, soit à une formule à valeur connective zéro -- type "on dit", "se dit en parlant du temps".

En fait, il est évidemment vain de faire ce genre d'exercice anachronique, de vouloir superposer sur un système venu en droite ligne des compilations cumulatives des siècles antérieurs une matrice d'organisation qui ne commence à se définir, dans la lexicographie française, qu'avec le Dictionaire critique de l'abbé Féraud. Dans le Trévoux, le paragraphe a encore la même fonction simple que dans la prose non métalinguistique, celle de former une certaine unité de pensée et de composition. Le 'sens' des articles du Trévoux est à chercher dans la genèse du dictionnaire; sur les vingt paragraphes de l'article GAGNER, par exemple, #1, #5, #8, #10, #11, #12, #13, #14, #15, #18, #19 et #20 correspondent, à quelques modifications près, aux douze paragraphes de l'article GAGNER-GAGNÉ de Furetière 1690, ouvrage duquel les différentes éditions du Trévoux constituent la continuation, et dans le même ordre.

4.2. Séquences à fonction double dans Lexis 1975

L'exemple d'emploi a pour rôle principal d'illustrer le mot-adresse; comme tel, il est le prédicat d'un énoncé lexicographique dont le sujet est le mot-adresse:

"Le mot A peut s'employer dans l'exemple B"

Les choses ne sont pas aussi simples dans Lexis. Dans les sections des quatre macro-articles GAGNER correspondant aux emplois contemporains transitifs, intransitifs et pronominaux du verbe gagner, il y a quelques 81 séquences imprimées en italique et présentées comme actualisations du mot en contexte. Sept séquences sont marquées, étant des exemples signés de noms d'auteurs; toutes les autres ont été forgées par le lexicographe. Malgré l'absence d'étiquettes ou de distinctions typographiques, on peut constater que ces séquences forgées se situent à différents points de l'axe discours <--> langue: phrase libre (Cette nouvelle mise en pages nous fait gagner un paragraphe.), phrase lexicalisée (Il l'a bien gagné.), syntagme canonique concret (gagner un lot), syntagme canonique virtuel (gagner quelque chose). Exemples donc autant potentiels que réels. Qu'ils soient unités de langue ou unités de discours, ils sont le plus souvent suivis de compléments d'information -- marques de niveau de langue, paraphrases ou synonymes; par exemple:

1) Gagner quelque chose (moyen de subsistance, récompense), l'acquérir par son travail:

2) Gagner son biftek (pop.) [= gagner tout juste sa vie].

3) Gagner le Pérou (= des sommes énormes).

4) Gagner le maquis (syn. PRENDRE).

5) C'est toujours ça de gagné (fam.) [= c'est toujours ça de pris].

6) Il ne gagne pas lourd (= peu).

7) Je suis sorti par ce froid, j'ai gagné un bon rhume (syn. plus usuels: ATTRAPER, PRENDRE, fam. CHIPER).

4.2.1. Cycle et recyclage

À un premier niveau (cycle 1), l'exemple/syntagme est prédicat d'énoncé:

"Un emploi possible de gagner au sens d''acquérir' est C'est toujours ça de gagné."

À un deuxième niveau (cycle 2), l'exemple/syntagme passe du côté du sujet ou adresse d'énoncé:

"C'est toujours ça de gagné signifie 'c'est toujours ça de pris'."

Ce qui peut être représenté de la façon suivante:

Cycle 1: A --> B

Cycle 2: B' --> C

En fait, B ne change pas de côté; c'est un élément de B -- B' -- qui acquiert la fonction de sujet d'énoncé. Reprenons les items 1-7 en dégageant cette fois l'élément de l'exemple/syntagme qui correspond à l'adresse de l'énoncé définitoire ou synonymique du cycle 2.

8a) Gagner quelque chose (moyen de subsistance, récompense) [...]

--> quelque chose = moyen de substance, récompense

8b) Gagner quelque chose [...] l'acquérir par son travail:

--> Gagner quelque chose = l'acquérir par son travail

9) Gagner son biftek [...] [= gagner tout juste sa vie].

--> Gagner son biftek = gagner tout juste sa vie

10) Gagner le Pérou (= des sommes énormes).

--> le Pérou = des sommes énormes

11) Gagner le maquis (syn. PRENDRE).

--> Gagner = PRENDRE

12) C'est toujours ça de gagné [...] [= c'est toujours ça de pris].

--> C'est toujours ça de gagné = c'est toujours ça de pris

13) Il ne gagne pas lourd (= peu).

--> ne... pas lourd = peu

14) Je suis sorti par ce froid, j'ai gagné un bon rhume (syn. plus usuels ATTRAPER, PRENDRE, fam. CHIPER).

--> j'ai gagné = ATTRAPER, PRENDRE, CHIPER

4.2.2. Le travail analytique requis de la part de l'utilisateur

Pour extraire B' de B, le consulteur doit faire preuve d'une compétence métalinguistique et linguistique sophistiquée. Il ne lui suffit pas de déterminer quelle partie de B correspond au sujet de C; il doit aussi dans beaucoup de cas tenir compte de différents types de transformation. Pour les exemples/ syntagmes de gagner dans Lexis, nous avons trouvé les types de transformations syntaxiques suivants.

1. L'anaphore: le consulteur doit retrouver l'antécédent

15) Gagner quelque chose [...], l'acquérir par son travail:

--> quelque chose = l'

16) Gagner quelqu'un, l'envahir progressivement.

--> quelqu'un = l'

17) Gagner quelqu'un, gagner la sympathie, l'affection, les bonnes grâces, etc., de quelqu'un, se rendre cette personne favorable, se concilier sa sympathie, etc.

--> quelqu'un = de quelqu'un... cette personne... sa

18) Gagner des témoins, gagner ses gardiens, les corrompre, les acheter pour se les réconcilier.

--> des témoins... ses gardiens = les... les... les

19) Y gagner [...], avoir du bénéfice, de l'avantage à quelque chose.

--> Y = à quelque chose

20) Il l'a bien gagné ([...] syn. fam. IL NE L'A PAS VOLÉ).

--> l' = L').

Remarquons: pour l'item 18, que se aussi est une reprise anaphorique du sujet de verbe virtuel; pour 19, que y est anaphorique dans le texte potentiel d'où est extrait y gagner; pour 20, que l' est une anaphore lexicalisée, donc vide sur le plan syntaxique.

2. La lemmatisation: l'utilisateur doit retrouver la forme conjuguée

21) Je suis sorti par ce froid, j'ai gagné un bon rhume (syn. usuels ATTRAPER, PRENDRE, fam. CHIPER).

--> j'ai gagné = ATTRAPER, PRENDRE, CHIPER

22) J'ai été gagné par son amabilité (syn. CONQUÉRIR).

--> J'ai été gagné = CONQUÉRIR

23) Il n'a gagné que du ridicule dans cette équipée (syn. RAPPORTER).

--> Il... a gagné = RAPPORTER

Remarquons: que dans 23, l'analyse est compliquée par la négation.

3. Variantes syntaxiques

24) Gagner son biftek [...] [= gagner tout juste sa vie].

--> son biftek = tout juste sa vie

25) Il gagne gros (= beaucoup d'argent).

--> gros = beaucoup d'argent

26) Y gagner, gagner à (et un nom), à ce que (et le subj.), avoir du bénéfice, de l'avantage à quelque chose.

--> Y... à + nom... à ce que + subj. = à quelque chose

4. Négatif vs. positif

27) Il ne gagne pas lourd (= peu).

--> ne... pas lourd = peu

28) Il l'a bien gagné ([...] IL NE L'A PAS VOLÉ).

--&gt: bien gagné = NE... PAS VOLÉ

5. Positif vs. comparatif

29) Le temps nous gagne (= va plus vite que nous).

--> gagne = va plus vite que

4.2.3. Cycles complexes, ou Séquences à fonction multiple

Considérons les séquences suivantes:

30) Gagner quelque chose (moyen de subsistance, récompense), l'acquérir par son travail:

31) Gagner quelque chose (compétition, lutte), remporter la victoire:

32) Gagner quelque chose (maladie, événement fâcheux), l'acquérir involontairement [...]:

Dans chacun de ces items, le cycle 2 se réalise en deux temps:

Cycle 2a:B' --> C

Cycle 2b:B" --> D

Il y d'abord une mise en équivalence entre "quelque chose" et un complément de verbe plus spécifique représentant une restriction sémantique (moyen de subsistance, récompense, compétition, lutte, maladie, événement fâcheux): "gagner quelque chose, quand quelque chose = moyen de subsistance ou récompense", etc. Dans le cycle 2a, B' est plus petit que B: B' < B. "Gagner quelque chose" ayant été qualifié dans le cycle 2a, il est ensuite défini dans le cycle 2b: "gagner quelque chose, c'est-à-dire gagner un moyen de subsistance, gagner une récompense, signifie 'l'acquérir par son travail'", etc. Dans le cycle 2b, B" est plus grand que B: B" > B.

4.2.4. Lecture cyclique

Si l'on a opposé de façon théorique une lecture verticale à une lecture horizontale du texte dictionnairique pour décrire la tendance du consulteur à faire une lecture plus ou moins rapide, il convient ici de postuler un phénomène que l'on pourrait appeler la lecture cyclique, qui serait une lecture hyperhorizontale. Nous avons vu cinq types d'analyse syntaxique que le consultateur doit pouvoir faire pour arriver à l'information désirée. Il est nécessaire de considérer qu'ici déjà la lecture horizontale est plus qu'une tendance. Mais c'est surtout dans le cycle complexe qu'il faut abandonner l'idée qu'en dégageant l'information ainsi présentée la lecture pourrait retenir un élément vertical quelconque. L'information acquise à une première étape dans la réalisation du deuxième cycle (B --> B') doit être réappliquée par le consulteur dans la réalisation de la deuxième étape (B --> B").

5. Conclusion

Lorsqu'on regarde l'ensemble des dictionnaires modernes, on constate que le manque de systématisation, compréhensible du temps des révérends pères de Trévoux, n'a pas entièrement disparu, malgré les énormes progrès faits grâce à la métalexicographie, l'informatique et la théorie de l'information. Pour prendre le cas du Trésor de la langue française, le manque d'uniformisation -- dû aux changements de méthode et de typographie, aux variations dans les pratiques rédactionnelles individuelles -- rend bien plus ardue une éventuelle informatisation de cet ouvrage que ne fut le cas pour l'Oxford English Dictionary ou le Robert, par exemple (Gorcy, 1990a; Gorcy, 1990b; Gorcy & Henry, 1990; Henry, 1990).

En revanche, l'implicitation, dont nous avons observé une manifestation dans Lexis, est systématique, systémique et nécessaire dans tout dictionnaire général destiné à être lu sur papier par un être humain. Dans ce contexte, les impératifs économiques de l'éditeur ou de l'imprimeur rejoignent l'économie linguistique du lecteur. Le livre est essentiellement un médium linéaire; dans la plupart des genres livresques (dont le dictionnaire), la ligne, la colonne, la page ne sont que des unités typographiques dénuées de sens textuel. La structure profonde de la microstructure, bi-dimensionnelle, doit s'accommoder de la linéarité de sa réalisation de surface. L'explicitation totale, du type 'dictionnaire explicatif et combinatoire', rend le texte incompréhensible pour un utilisateur de dictionnaire général. Le principe de l'implicitation est basé sur la double compétence linguistique et textuelle (dictionnairique, dans le cas présent) que tout lecteur ou consulteur doit nécessairement avoir. L'on peut constater cependant, non sans ironie, qu'un petit dictionnaire comme le Dictionnaire du français contemporain -- d'où est issu Lexis et qui contient la presque totalité des séquences étudiées dans la section 4.2 ci-dessus --, ouvrage "destiné à l'ensemble de ceux qui, ayant acquis les bases élémentaires de la langue, visent à affermir ou à perfectionner l'usage qu'ils ont du français" (Avant-propos), demande un travail analytique d'explicitation de la part de l'utilisateur plus grand qu'un autre dictionnaire Larousse, le Grand Larousse de la langue française, destiné celui-ci au "francophone cultivé" (Préface).

Dans la pratique de l'informatisation de dictionnaires papier (OED, Robert), on compte encore sur la compétence de l'utilisateur pour résoudre les ellipses de l'original. Seul un dictionnaire fait pour ordinateur, jouissant, outre les capacités quasi illimitées de stockage de données de la machine, de l'expectative chez l'utilisateur d'un affichage bi-dimensionnel -- voire tri-dimensionnel (hypertexte) --, peut se permettre une articulation explicite totale.

Notes

[1] Voir, par exemple, Cotgrave 1611.

[2] Les travaux sont subventionnés par le Conseil de recherches en sciences humaines du Canada.

[3] La mise en paragraphes de l'original a été respectée, mais non la mise en lignes. Nous avons omis de l'article LOIN trois citations en vers.

[4] Et = étymologie; G = catégorisation grammaticale; Qe = qualification d'emploi; S = traitement sémantique, sens; St = syntagme; Sv = sous-vedette; 1, 2, etc.: S1 = sens 1, G1 = catégorie grammaticale 1; -- = subordination: x--y = y est subordonné à x.

[5] G#1 = GAGNER, para. 1; L#1 = LOIN, para. 1; Q#1 = QUE, para. 1.

Bibliographie

BRAY, L. (1989). "Consultabilité et lisibilité du dictionnaire: aspects formels", Encyclopédie internationale de lexicographie. Berlin & New York: Walter de Gruyter, vol. 1: 135-46.
GORCY, G. (1990a). "L'informatisation d'un dictionnaire: l'exemple du Trésor de la langue française", Encyclopédie internationale de lexicographie. Berlin & New York: Walter de Gruyter, vol. 2: 1672-8.
GORCY, G. (1990b). "Le Trésor de la langue française (TLF): son originalité et les voies ouvertes par son informatisation", Dictionnairique et lexicographie. [Paris]: Didier, 1: 187-207.
GORCY, G. & F. HENRY (1990). "Informatisation du Trésor de la langue française (TLF): problèmes et perspectives", Computational Lexicology and Lexicography. Pisa: Giardini, vol. 1: 305-49.
HAUSMANN, Franz Josef & H.E. WIEGAND (1989). "Component Parts and Structures of General Monolingual Dictionaries: A Survey", Encyclopédie internationale de lexicographie. Berlin & New York: Walter de Gruyter, vol. 1: 328-60.
HENRY, F. (1990). "Informatisation du Trésor de la langue française, problèmes et perspectives: deuxième approche", Cahiers de lexicologie, 56-57: 201-12.
MERRILEES, Brian, W. EDWARDS & D. MEGGINSON (1992). "Editing and Concording the Dictionarius of Firmin Le Ver (1440)", CCH Working Papers, 2: 9-19 and CH Working Papers, B.5.
WOOLDRIDGE, Terence R. (1977). Les Débuts de la lexicographie française. Toronto & Buffalo: University of Toronto Press.
WOOLDRIDGE, Terence R. (1988). "Les vocabulaire et fréquence métalinguistiques du discours lexicographique des principaux dictionnaires généraux monolingues français des 16^e-20^e siècles", Travaux de linguistique et de philologie, 36: 305-13.

Abstract

How to Cite

Downloads

799

169

1. Introduction

2. Le corpus

3. La copule

4. Le système vs. la compétence de l'utilisateur

4.1. La mise en paragraphes

4.1.1. Emploi cohérent de la mise en paragraphes

4.1.2. La mise en paragraphes dans le Trévoux

4.2. Séquences à fonction double dans Lexis 1975

4.2.1. Cycle et recyclage

4.2.2. Le travail analytique requis de la part de l'utilisateur

4.2.3. Cycles complexes, ou Séquences à fonction multiple

4.2.4. Lecture cyclique

5. Conclusion

Notes

Bibliographie

Share

Authors

Downloads

Issue

Publication details

Licence

Identifiers

File Checksums (MD5)

Table of Contents

Abstract

How to Cite

Downloads

799

169

1. Introduction

2. Le corpus

3. La copule

4. Le système vs. la compétence de l'utilisateur

4.1. La mise en paragraphes

4.1.1. Emploi cohérent de la mise en paragraphes

4.1.2. La mise en paragraphes dans le Trévoux

4.2. Séquences à fonction double dans Lexis 1975

4.2.1. Cycle et recyclage

4.2.2. Le travail analytique requis de la part de l'utilisateur

4.2.3. Cycles complexes, ou Séquences à fonction multiple

4.2.4. Lecture cyclique

5. Conclusion

Notes

Bibliographie

Share

Authors

Downloads

Issue

Publication details

Licence

Identifiers

File Checksums (MD5)

Table of Contents

Non Specialist Summary