MAŃCZAK, Witold, linguiste, professeur
retraité de l’Université de Cracovie, auteur de 940 publications (dont 24
livres), Zakątek 13/59, 30076 Kraków, Pologne, witold.manczak@gmail.com
Le problème fondamental de la
linguistique est celui des critères de vérité. Malheureusement, cette question
constitue un tabou. Étant donné que la linguistique existe depuis de mille ans
et que la Bibliographie linguistique
a enregistré, pour l’année 2001, 21 000 travaux, il en résulte que les
linguistes en ont publié, au total, plusieurs centaines de milliers, et
pourtant aucun de ces derniers n’a été consacré aux critères de vérité. Même le
terme « critères de vérité » n’est jamais employé par les linguistes.
C’est une chose extrêmement étrange, si l’on considère que les linguistes sont
unanimes pour dire que la linguistique est une science, et que la science n’est
pas autre chose qu’une recherche de la vérité. Pourquoi donc les linguistes
gardent-ils un secret sur la question de savoir comment ils distinguent le vrai
du faux dans leur discipline?
Cette énigme m’a intrigué depuis
longtemps. Comme les travaux linguistiques ne fournissent aucun renseignement
susceptible de résoudre cette question, j’ai commencé à observer comment les
linguistes réagissent quand ils apprennent une opinion qui leur était inconnue
auparavant. A mon grand étonnement, j’ai constaté que les linguistes n’ont
jamais l’intention de vérifier l’opinion en question, mais s’intéressent
uniquement à la question de savoir qui partage cette opinion. S’ils apprennent
que cette opinion est partagée par une ou plusieurs autorités, ils considèrent
cette opinion comme vraie. Si, au contraire, ils apprennent que cette opinion
provient de quelqu’un qui n’a pas la réputation d’être une autorité, cette vue
leur paraît fausse. Il en résulte que le critère de vérité utilisé par les
linguistes est le suivant : X a formulé une opinion, X est une autorité,
par conséquent cette opinion est vraie ; Y a formulé une opinion, Y n’est
pas une autorité, par conséquent cette opinion est fausse. Évidemment, ce
critère de vérité est médiéval, non scientifique, et c’est la raison pour
laquelle les linguistes préfèrent ne pas en parler.
Dans cet état de choses, il m’est venu à
l’esprit de réfléchir sur les critères de vérité susceptibles d’être employés
en linguistique et je suis arrivé à la conclusion que les linguistes peuvent
recourir à la statistique (et, exceptionnellement, à l’expérience) et que, dans
la science du langage, il y a beaucoup d’opinions qui s’appuient sur la foi en
l’infaillibilité des autorités et qui sont infirmées par des données
statistiques. Voici quelques exemples.
1) Dans toutes les langues, la forme des
mots dépend de trois facteurs principaux, non seulement du développement
phonétique régulier et du développement analogique, mais aussi de ce que
j’appelle un développement phonétique irrégulier dû à la fréquence (Le développement phonétique des langues
romanes et la fréquence, Kraków, 1969; Słowiańska
fonetyka historyczna a frekwencja, Kraków, 1977; Frequenzbedingter unregelmäßiger Lautwandel in den germanischen
Sprachen, Wrocław, 1987; Etymologia
przyimka dla a nieregularny rozwój
fonetyczny spowodowany frekwencją, Prace Filologiczne 60, 2011, p.
189–195).
2) La « norme » de Bartoli
d’après laquelle les aires latérales sont plus archaïques que les aires
centrales, est infirmée par des données statistiques (La Roumanie et l’Espagne sont-elles des territoires archaïques de la
Romania ?, Limba românǎ, limbǎ romanicǎ. Omagiu acad. M. Sala la
împlinirea a 75 de ani, Bucureşti, p. 313–317).
3) Depuis 1925, où Meillet a introduit
la notion de « case vide », on imagine que l’évolution phonétique
consiste à remplir des « cases vides » dans les systèmes
phonologiques. Mais j’ai examiné un grand nombre de faits et suis arrivé à la
conclusion que ce n’est pas la symétrie, mais l’asymétrie qui caractérise les
langues, qu’il est possible de formuler une loi d’après laquelle les éléments
linguistiques plus employés sont plus différenciés que les éléments moins
utilisés (Do the “cases vides” exist?,
Linguistique générale et linguistique indo-européenne, Kraków, 2008, p. 59–62).
4) La théorie des laryngales est
infirmée par des données statistiques (Critique
de la théorie des laryngales, Analecta Indoeuropaea Cracoviensia I. Safarewicz
memoriae dicata, Cracoviae, 1995, p. 237–247 ; Encore un argument contre la théorie des laryngales, Lingua
Posnaniensis 46, 2004, p. 41–44).
5) A mon avis, la règle de Verner exige
une révision (La restriction de la règle
de Verner à la position médiane et le sort du s final en germanique, Historische Sprachforschung 103, 1990, p.
92–101 ; La règle de Verner
s’applique-t-elle à la position finale ?, Historische Sprachforschung
109, 1996, p. 110–116).
6) A la lumière de données statistiques,
le vieux slave est un compromis entre le dialecte macédo-bulgare et le parler
moravo-pannonien (Przedhistoryczne
migracje Słowian i pochodzenie języka staro-cerkiewno-słowiańskiego,
Kraków, 2004; Pochodzenie języka
staro-cerkiewno-słowiańskiego a Kodeks zografski, Warszawa, 2006).
7) A la lumière de données statistiques,
l’habitat primitif des Indo-Européens est identique avec celui des Slaves (De la préhistoire des peuples indo-européens,
Kraków, 1992 ; L’habitat primitif
des Indo-Européens se trouvait-il vraiment en Arménie ? ; Folia
Orientalia 33, 1997, p. 65–74).
8) L’orientaliste allemand Ludolf (17e
s.) a été le premier à affirmer que « die Sprachverwandtschaft offenbart
sich nicht im Wörterbuch, sondern in der Grammatik ». Mais on peut
justifier la division des langues indo-européennes en germaniques, slaves,
baltes, romanes, etc. uniquement par des convergences lexicales, et non
flexionnelles ou phonétiques (La
classification des langues romanes, Kraków, 1991, p. 22–36).
9) Le problème numéro un de l’étymologie
romane est celui des verbes ayant pour sens « aller » : fr. aller, it. andare, esp. andar, prov.
ana, etc. Depuis le 16e siècle, on a,
au total, proposé une soixantaine d’étymologies, ce qui est un record, et cela
non seulement pour l’étymologie romane. Parmi les chercheurs, il y a des
adhérents à la monogenèse (affirmant que toutes ces formes proviennent, par
exemple, de ambulare) et des adeptes
de la polygenèse (prétendant, par exemple, que aller < *advehulare, andar < *am(bi)vehitare, ana <
*amvehinare). Le calcul des
probabilités permet de trancher cette question en faveur de la monogenèse (Une étymologie romane controversée : aller,
andar, etc., Revue roumaine de
linguistique 19, 1974, p. 89–101 ; Étymologie
de fr. aller, esp. andar, etc. et calcul des probabilités, Revue
roumaine de linguistique 20, 1975, p. 735–739.
10) Depuis 1435, on affirme que les
langues romanes proviennent du latin vulgaire, mais, à la lumière de données
statistiques, elles sont issues du latin classique (Le problème de l’origine des langues romanes dans le livre de H. Lüdtke
et celui de R. Kiesler, Actes du XXVe Congrès International de
Linguistique et de Philologie Romanes, t. VI, Berlin, 2010, p. 207–211).
11) Depuis Jordanès, c’est-à-dire depuis
1400 ans, on estime que l’habitat primitif des Goths se trouvait en
Scandinavie. Mais la comparaison de textes parallèles en gotique, allemand
supérieur, moyen allemand, bas allemand, danois et suédois a révélé que
l’habitat primitif des Goths se trouvait dans la partie la plus méridionale de
la Germanie ancienne (Le mythe de
l’origine scandinave des Goths, L’art de la philologie. Mélanges en
l’honneur de L. Löfstedt, Helsinki, 2007, p. 137–145).
12) La division des mots en toniques et
atones (articles, pronoms, prépositions, etc.), qui remonte à l’Antiquité, est
le résultat d’une fausse généralisation. Il est vrai qu’il y a des homonymies le vent = levant, à voir = avoir, et moi = émoi et que les
syllabes le-, a-, é- dans levant, avoir, émoi sont atones,
mais il est erroné d’en conclure que le,
à, et sont atones parce que les mots « toniques » sont
traités de la même manière. Dix vers,
vingt cœurs, va tôt, prononcés sans pauses, sont homonymes de divers, vainqueur, Watteau, où
les syllabes di-, vain-, Wa- sont atones. On affirme que Long
vient = mot tonique + mot tonique, alors que l’on vient = proclitique + mot tonique, mais une expérience bien
simple prouve que ces expressions sont homonymes (La division des mots en toniques et atones est-elle justifiée ?,
Lingua Posnaniensis 32–33, 1991, p. 181–185).
13) Depuis l’Antiquité, on discute la
question de savoir en quoi consiste la différence entre noms propres et noms
communs. On a jusqu’ici proposé une dizaine de définitions du nom propre, dont
aucune ne s’applique à tous les noms propres. A mon avis, la différence entre
noms propres et noms communs consiste en ce que les noms communs sont, dans la
grande majorité des cas, traduits d’une langue à l’autre, tandis que les noms
propres ne le sont presque jamais. Par exemple, un nom commun comme ville est traduit en italien par città, en anglais par town, etc., alors qu’un nom propre comme
Paris ne l’est pas, cf. it. Parigi, angl. Paris, etc. Parmi toutes les définitions du nom propre, la mienne
souffre le moins d’exceptions (La notion
de nom propre, Proceedings of 13th International Congress of
Onomastic Sciences, Kraków, 1982, p. 101–106).