Après avoir présenté, au chapitre précédent, les principales théories concernant lévolution des langues, nous nous proposons maintenant délaborer un premier modèle linguistique assez général qui devra mettre en évidence les différents problèmes qui se posent en vue dune implémentation sur lordinateur. Nous distinguerons entre un modèle idéal qui est censé être aussi près de lévolution réelle que possible et un modèle pratique qui contient certaines simplifications.
Toutes les théories présentées jusquici ont essayé de révéler les mécanismes responsables des changements phonétiques. Ces mécanismes étaient censés expliquer des faits réels et ils étaient dès lors considérés comme des « vérités linguistiques ». Les chercheurs ne se limitaient pas à « décrire », mais il se proposaient de découvrir les véritables « causes » de ces changements : ainsi, tel mot aurait été substitué par tel autre parce que, à un moment donné de lévolution, il y aurait eu un conflit homonymique ; ou telle consonne sourde serait devenue sonore parce quelle se trouvait entre deux voyelles et quelle aurait donc subi une assimilation.
Lorsquon se propose de simuler (notons bien ce mot) des changements phonétiques sur un ordinateur, les choses se présentent de manière un peu différente : les évolutions calculées ne seront pas considérées comme des faits réels, mais comme des simples représentations de faits réels. Une simulation est donc moins « explicative » que « descriptive ». Cest ce que Hartmann dira de manière très claire dans lintroduction à son programme(1) : « PHONO and models testable by it make no claim as to whether rules "describe", "explain", "cause", "reflect", or merely "correspond to" actual sound changes ». Lorsquun t intervocalique passe donc à un d, lordinateur ne dira rien sur le pourquoi de ce changement : quil soit dû à une assimilation ou à un autre phénomène linguistique na pour lui pas la moindre importance. Il se contentera de vérifier que le t soit entouré de deux voyelles (ce qui correspond à la condition qui doit être remplie pour que la transformation puisse se produire) et substituera ensuite d à t.
Toute simulation est basée sur un modèle dont le but est de représenter de manière schématisée des faits réels. Dun point de vu abstrait, un modèle se compose de trois éléments essentiels : les faits (ou données), les relations (ou structures) et les opérations (ou transformations). Tous les trois sont intimement liés les uns aux autres : un fait considéré en dehors des relations quil maintient avec dautres faits na donc (par définition) aucune valeur déterminée. De même, une opération ne peut effectuer aucune transformation sur les faits si elle ne tient pas compte des structures de ceux-ci. Afin de pouvoir mieux illustrer ce que nous entendons par « modèle », nous pourrions prendre lexemple dun jeu de billard : celui-ci se compose de faits (une série de boules numérotées) arrangés dans une certaine structure (une table où chaque boule a une place bien déterminée) et sur lesquels seffectuent des opérations (les coups de queues des deux joueurs)(2).
Quant aux opérations, elles transforment typiquement un état A (appelé input) en un état B (appelé output). On peut distinguer entre des opérations simples, responsables de ce quon pourrait appeler des « transformation minimales », et des opérations complexes qui sont construites à partir des opérations simples, le procédé le plus fréquent étant celui denchaîner les opérations de sorte que loutput de lune devient linput de la suivante. Dans un jeu de billard, une opération simple serait par exemple un coup de queue donné par un des deux joueurs : au cours de celle-ci, une certaine disposition des boules (celle avant le coup) est transformée en une nouvelle disposition des boules après le coup. Une suite de plusieurs coups pourrait être considérée comme une opération complexe.
Dun point de vu conceptuel, un jeu de billard ne diffère en rien dun modèle étymologique et si nous voulions les comparer nous pourrions dire que les boules correspondent aux mots que nous calculons, les coups de queue aux règles linguistiques et la table à un espace de calcul où il existe des bandes symboliques tout à fait analogues à celles physiques dune table de billard. Nous nen donnons quun exemple, la transformation dun phonème sonore (d) en un phonème sourd (t).
De même que la bande physique du billard répond au coup de queue en transformant le mouvement +y en y, celle symbolique du modèle étymologique peut intervenir pour transformer le trait [+son] en [son].
Il est clair que le modèle étymologique ne pourra être aussi simple que nous venons de le peindre et cela est dû surtout au grand nombre de faits quil doit être susceptible dintégrer : le calcul peut en effet dépendre dune grande quantité de facteurs parmi lesquels nous pouvons mentionner la structure phonologique du mot, le temps, mais aussi toute une série de variables qui semblent assez difficiles à cerner, tels que des facteurs grammaticaux, sémantiques, lexicaux, syntaxiques, etc. À ces faits correspondent autant de structures différentes : ainsi, la variable de temps ne pourra pas être traitée de la même façon que la structure phonologique du mot. Tandis que ces deux variables présentent des structures qui sont encore relativement faciles à déterminer (un axe temporel et un système phonologique), les derniers facteurs cités semblent plus difficiles : comment tenir compte des paradigmes grammaticaux, des rapprochements lexicaux entre les mots, des effets prosodiques dus à la syntaxe ? Ces structures sont, de plus, susceptibles de varier selon les langues (le latin, par exemple, na pas les mêmes catégories grammaticales que le français moderne). Il conviendrait donc davoir des structures suffisamment génériques pour sadapter à différents types dinformations.
Après avoir introduit les termes « données », « structure » et « opération », nous pouvons dès maintenant répondre à une des questions fondamentales concernant le programme, à savoir quels phénomènes linguistiques sont théoriquement susceptibles dêtre simulés par un ordinateur. La réponse est simple : en partant du principe quun ordinateur ne peut quêtre rigoureusement logique (ou mécanique, si lon préfère) on peut dire que tout phénomène conforme aux deux règles suivantes peut, en théorie, être simulé :
Le phénomène doit être régulier, ou formulé dune manière un peu moins exigeante plus un phénomène est régulier, plus les résultats de la simulation pourront correspondre aux faits réels. On pourrait parler, ici, dune restriction extérieure (scientifique) qui na donc rien à voir avec le modèle.
Le phénomène doit être représentable à lintérieur du modèle, ce qui veut dire que celui-ci doit offrir les données, les structures et les opérations qui sont nécessaires pour tenir compte de tous les aspects impliqués dans la transformation. Il sagit ici dune restriction intérieure (technique) qui dépend directement de lefficacité du modèle.
Lorsquon se propose de développer un programme qui serve doutil linguistique, on a donc intérêt à réduire les restrictions intérieures à un minimum. De cette façon, lordinateur devient un instrument idéal pour déterminer la régularité ou lirrégularité des transformations linguistiques.
Après ces considérations dordre général, nous pouvons maintenant présenter un premier modèle concret de lévolution linguistique. Ce modèle est basé sur la théorie ensembliste telle quon lutilise en mathématiques. Il considère les langues comme des ensembles dunités lexicales qui subissent des changements :
Nous avons, dune part, une « langue de départ » (L1) contenant un certain nombre (n Î Ð) déléments lexicaux (m1, m2, ..., mn) et, dautre part, un ensemble ordonné dopérations ou, comme nous préférons les nommer, de règles (r1, r2, ..., ri-1, i Î Ð). Chaque règle rx crée un nouvel ensemble Lx+1 à partir dun ensemble Lx existant (0 < x < i, x Î Ð) en transformant un certain nombre (0 < t £ n, t Î Ð) déléments m Î Lx (ce qui sous-entend, en même temps, que nt éléments sont laissés intacts).
En termes mathématiques, nous pouvons considérer les règles comme des fonctions qui, appliquées de manière ordonnée les unes après les autres, constituent une fonction principale F :
Théoriquement, nous pourrions donc dire pour nimporte quel élément mx Î L1 (0 < x £ n, x Î Ð) que mx* = F(mx) est son élément correspondant dans Li. Mais les choses ne sont, évidemment, pas aussi simples que cela.
Lorsque nous considérons, par exemple, les deux mots latins EQUAM et EQUUM, nous constatons que lun a donné yegua « jument » en espagnol, tandis que lautre na pas laissé de traces. Cela veut dire quil nexiste pas de y Î Li de sorte que F(x) (!)=(!) y. Nous devons donc conclure que la fonction F(x) nest pas définie pour certains éléments x Î L1 (3). Schématiquement, ce cas se présente de la façon suivante :
De même, il est possible que, dans la langue réelle disons Lr que lensemble Li est censé représenter, il existe des éléments qui ne font pas partie de Li. Mathématiquement parlant : (x Î Lr) Ù (x Ï Li) Ù (Li Ì Lr) :
Dun point de vue linguistique, ces mots peuvent être considérés comme des néologismes, des dérivations (formation dun nouveau mot à partir dune racine et dun suffixe qui existent déjà dans la langue), des mots demprunt, etc.
Le modèle tel que nous venons de le présenter sous-entend, en principe, que chaque règle sapplique simultanément à tous les mots, cest-à-dire que tous les éléments (m1, m2, ..., mn) sont calculés en parallèle. Même si, du point de vue théorique, les choses se sont sûrement passées de la sorte, il est évident quà cause du nombre assez élevé de mots qui existent dans une langue, même un ordinateur puissant risque de ne pas disposer de suffisamment de mémoire pour représenter toutes ces données.
Pour un ordinateur, il est donc préférable que les évolutions soient calculées de manière individuelle. Ceci est en effet possible encore que cette réduction ne reste pas sans conséquences pour le nombre de phénomènes qui pourront être simulés. Il est par exemple évident que, dans ce cas, les conflits homonymiques ou les analogies (qui constituent des espèces de phénomènes « transversaux », par opposition aux évolutions « linéaires » décrites par les règles phonétiques) ne pourront pas être calculés.
Jusquà maintenant, nous sommes partis du principe que les transformations décrites par les règles étaient univoques dans le sens où elles ne peuvent donner lieu quà une seule ligne évolutive. Cela nest pourtant pas le cas, comme le montrent les deux exemples latins DOMINUM et HOMINEM qui ont donné dueño et hombre en espagnol : le phénomène le plus remarquable dans lévolution de ces mots, consiste dans le fait quaprès la syncope du i, le groupe consonantique mn a évolué de deux façons différentes(4) :
DOMINU(M) > domnu > domno > duemno > duenno > dueño
HOMINE(M) > homne > homre > hombre
Dans le premier cas, le groupe subit une assimilation et se palatalise ensuite. Dans le deuxième, il subit au contraire une dissimilation, ce qui conduit à linsertion dune consonne épenthétique b. Afin que les deux évolutions puissent être poursuivies, le programme doit permettre dutiliser des règles qui décrivent plusieurs évolutions possibles (cest ce que nous appellerons par la suite des « évolutions multiples »). Notons que dans notre exemple, il y a encore une deuxième ambiguïté à résoudre : les deux mots contiennent un o ouvert tonique qui, en général, se diphtongue en espagnol (pour donner [wé]). Mais lorsque la voyelle se trouve devant une consonne nasale, il y a de nouveau deux évolutions possibles : soit le o se diphtongue, soit il passe à o fermé. En tout, nous avons donc quatre évolutions possibles :
Pour DOMINU(M)
Pour HOMINE(M)
Nous voyons que les deux solutions correctes sont diamétralement opposées. En effet, rien ne nous permet de savoir à lavance quelle évolution sera choisie par le mot, de sorte quil est nécessaire de tenir compte de toutes les évolutions possibles si nous ne voulons pas omettre la correcte.
La bifurcation des évolutions peut paraître problématique, puisquon aboutit à un nombre assez élevé dévolutions que lordinateur doit gérer. Le nombre exact des bifurcations après n règles peut être calculé à laide de la formule récursive
où e(n) est le nombre des évolutions possibles de la n-ième règle et b(n) la somme de toutes les évolutions possibles jusquà la n-ième règle. Comme seules les règles avec e(n) > 1 augmentent le nombre des évolutions, on peut dire que le nombre des règles est indifférent. Dans un ensemble hypothétique de n règles, on peut donc dire que sil y a m règles avec au moins deux évolutions possibles, le nombre maximal des évolutions est > 2(m) (si toutes les règles à deux évolutions sont appliquées). La croissance du nombre des évolutions est donc exponentielle, ce qui risque de poser des problèmes dans la gestion de ces dernières par lordinateur, problème que nous rencontrerons encore à plusieurs reprises dans les prochains chapitres.
Les lois phonétiques nagissent que pendant un certain temps de sorte quil est nécessaire dintégrer cette variable dans le calcul. A première vue, cette tâche semble simple : en supposant quil doit être possible de déterminer, pour chaque loi phonétique le moment précis où elle a provoqué le changement, le seul travail à faire consisterait à mettre les règles dans un ordre chronologique (séquentiel). Chaque ensemble Lx (1 < x £ i) constituerait donc une « tranche de temps » synchronique dont la date correspondrait à celle de la règle qui la produite.
Mais, une fois de plus, les choses ne sont pas aussi simples : il est souvent difficile de déterminer le moment exact dune loi phonétique puisque celles-ci sétendent sur un espace plus ou moins long sur laxe temporel. À cause dune simultanéité partielle, certaines lois peuvent se « chevaucher ». En dautres termes, il est possible que plusieurs lois phonétiques entrent en compétition entre elles. Dans de tels cas, leur ordre dapplication est souvent imprévisible et peut différer de mot en mot. Prenons les deux exemples lat. SOLITUM > esp. sueldo et lat. SOLUTUM > esp. suelto. Tandis que, dans le premier, la sonorisation a lieu avant la syncope, elle ne se produit pas dans le deuxième où la syncope, de toute évidence, est antérieure(5).
Une possibilité relativement facile de tenir compte de ces chevauchements peut être celle dadmettre des « évolutions multiples ». Dans lexemple discuté, nous pourrions donc formuler une règle qui dirait que lorsque une consonne intervocalique se situe après une voyelle atone interne (qui est susceptible de tomber) celle-ci peut ou non se sonoriser. Grâce à ce petit artifice il est effectivement possible de simuler la simultanéité de certaines lois phonétiques tout en conservant lordre séquentiel des règles ce qui simplifie le calcul.
A lintérieur du lexique dune langue, on distingue, en général, entre les mots populaires, qui ont été transmis par une tradition orale ininterrompue(6), et les cultismes qui, empruntés à une autre langue, nont pas suivi cette évolution (exception faite de quelques petites modifications qui peuvent se produire dans les terminaisons(7)) et qui sont donc restés « tels quels ». On distingue, outre cela, les sémi-cultismes qui sont considérés comme des espèces d« hybrides » dans le sens où ils participent à certains changements populaires tout en restant indifférents à dautres(8).
Afin de pouvoir réfléchir de manière systématique sur les cultismes et les sémi-cultismes, nous commençons par admettre deux hypothèses : (1) nous considérons quil ny a pas de vraie différence entre les cultismes et les sémi-cultismes étant donné que les deux se caractérisent essentiellement par une non-participation quelle soit partielle ou totale à lévolution populaire, et (2) nous supposons quil existe pour tout (sémi-)cultisme un moment x à partir duquel il suit lévolution phonétique régulière (au même titre que les mots populaires)(9). Nous supposons, en dautres termes, que tout (sémi-)cultisme se transformera, tôt ou tard, en mot populaire et subira, à partir de là, tous les changements phonétiques de ceux-ci.
En partant de ces deux hypothèses, nous devons dabord nous demander à quel moment exactement les (sémi-)cultismes « entrent » dans la langue ou plutôt, formulé dans loptique de notre modèle, à quel moment ils entrent dans la chaîne du calcul (constituée par les règles r1, r2, ... ri). On peut simaginer deux scénarios : soit (1) les cultismes suivent le calcul dès le début (et dans ce cas ils existent parallèlement aux mots populaires sans pourtant subir les évolutions phonétiques de ceux-ci), soit (2) ils y entrent plus tard (par exemple au moment où ils commencent à participer à lévolution phonétique des mots populaires).
Dans le premier cas, vu que tant les mots populaires que les (sémi-)cultismes font partie du calcul, les règles r1, r2, ..., rx-1 doivent forcément décrire deux évolutions possibles : (1) lévolution des mots populaires et (2) la non-évolution (ou évolution « zéro ») des (sémi-)cultismes. Dans le deuxième cas, les règles r1, r2, ..., rx-1 ne décriraient quune seule évolution, à savoir celle des mots populaires. La non-évolution des cultismes serait donc simulée par la non-application des règles r1, r2, ..., rx-1.
Si nous optons pour le premier type de calcul, nous ne pourrons éviter de produire un grand nombre dévolutions (problème auquel nous avons déjà fait allusion et qui se présente ici sous forme aggravée) : étant donné que chaque règle pourrait avoir au moins deux évolutions (celle populaire et celle savante), le nombre dévolutions théoriquement possibles sélèverait à au moins 2(n) possibilités pour n règles. Il est certes vrai que certaines possibilités peuvent être exclues par avance (ainsi, la règle qui décrit lassourdissement du s intervocalique en espagnol moderne semble sappliquer dans tous les cas, même dans le cultismes, de sorte quil ne serait pas nécessaire de faire bifurquer la ligne du calcul), mais même en soustrayant ces cas, il reste un nombre très élevé de possibilités. Nous pourrions aussi penser à trouver des critères qui permettent de déterminer si un mot est un cultisme ou non (ce qui simplifierait donc au moins le calcul des mots populaires), mais cela est évidemment tout sauf un problème trivial(10). Il semble donc indispensable dopter pour le deuxième type de calcul et de simuler la non-évolution des (sémi-)cultismes par la non-application de certaines règles.
Nous étions partis de lhypothèse quà partir dun certain moment x, tout (sémi-)cultisme devient un mot populaire de telle sorte quil suit une évolution phonétique régulière. Il se trouve que cette hypothèse est elle aussi fausse (ou quelle nest, au moins, pas entièrement correcte). Si nous prenons, par exemple, lévolution du mot latin CLERICUM qui a donné clérigo en espagnol, nous constatons que ce mot présente à la fois des traits populaires (perte du m final, ouverture de la voyelle finale, sonorisation du k intervocalique) et des traits savants (il ny a pas de syncope, le groupe initial kl aurait dû aboutir à ll (par palatalisation) ; si le mot avait suivi toute lévolution populaire, le résultat serait probablement *llergo). Ce qui est curieux, cest que du point de vue chronologique, la sonorisation du k intervocalique est probablement antérieure à la palatalisation du groupe initial kl(11). Nous avons donc à faire à un mot qui, au début, se comporte comme un mot populaire pour se rapprocher ensuite des cultismes.
Face à ce dilemme, que faire ? Tout dabord, il semble, en effet, que nous devons définitivement abandonner notre deuxième hypothèse : un (sémi-)cultisme, même sil participe à un changement x, na aucune raison de participer à un autre changement y postérieur à x. Nous pourrions même être tentés de conclure que tout changement linguistique indépendamment du moment où il se produit est forcément ambigu dans le sens où il peut ou non se produire. Sil en était ainsi, la grande question que lon devrait se poser est celle de savoir comment on peut simuler cet état de faits. Une première possibilité, insatisfaisante comme nous lavons déjà dit, puisquelle mène à une croissance exponentielle des évolutions à calculer, consiste à admettre des règles qui décrivent, à chaque fois, deux évolutions possibles (celle populaire et celle savante). Une autre possibilité consisterait peut-être à abandonner lidée de la séquentialité des règles : il faudrait alors élaborer un modèle complètement différent qui permette de mieux tenir compte de lextension temporelle des lois phonétiques (et par là des « chevauchements » possibles entre elles). Il faudrait se demander, dans ce cas, sil nexiste pas différents types de lois phonétiques(12).
Ces considérations ont montré que le problème des (sémi-)cultismes est tout sauf trivial, et il semble, en effet, quil ne peut pas être résolu pour linstant. Car même si nous savons que leur calcul sera toujours déficient dans un modèle de règles séquentielles, aucune autre approche ne semble soffrir pour le moment.
Si lintégration de la variable temporelle sest déjà avérée quelque peu difficile (nous avons soulevé, notamment, les problèmes en rapport avec la séquentialité des règles), la dimension spatiale semble encore plus complexe. Il se trouve que lévolution dune langue ne dépend pas seulement des lois phonétiques et de lextension géographique de celles-ci , mais aussi de ce que nous appellerons des « phénomènes de migration » : par ce terme, nous nous référons à ce quune langue peut, au cours du temps, amplifier ou réduire le territoire géographique quelle occupe. Le latin, par exemple, nétait, au début, quun dialecte parmi dautres qui était parlé dans une petite région appelée LATIUM. Petit à petit, ce dialecte a commencé à gagner du terrain et sest finalement répandu sur le territoire que nous nommons aujourdhui la ROMANIA.
Si nous voulons tenir compte des phénomènes spatiaux, nous sommes donc obligés dintroduire un nouveau type de règles que nous appellerons des « règles de migration ». Celles-ci décrivent la propagation dune langue plus précisément de ses éléments lexicaux dans lespace géographique :
Nous avons donc un espace géographique (G) dont une certaine partie (E1) est, à un moment donné (ici désigné par 1), occupée par une langue qui, à la suite dune migration (décrite par la règle rm), sétend (à un moment 2) sur un espace plus grand (E2). Dans cet exemple, lextension E1 fait partie de lextension E2, mais cela nest pas forcément nécessaire.
Nous avons maintenant envisagé le problème du point de vue de la migration. Il ne faut pas oublier, cependant, que les lois phonétiques ont elles aussi une extension géographique bien déterminée. Ces deux problèmes extension du lexique et extension des lois phonétiques sont intimement liés et ne peuvent être traités indépendamment. Imaginons, par exemple, le cas suivant : nous avons une langue qui, à un moment donné, a une extension lexicale E1 et qui sétend ensuite sur un territoire plus grand que nous appelons E2 (extension qui est décrite par la règle de migration rm). Une fois que cette expansion est terminée, une loi phonétique affecte une partie de E2 de telle sorte quelle touche à la fois des régions de lancienne zone (E1) et de la zone nouvellement conquise (E2 \ E1) :
On peut maintenant inverser la perspective et dire que ce nest pas la loi phonétique qui affecte une certaine partie de la distribution des éléments lexicaux, mais que, au contraire, ce sont les éléments lexicaux qui sétendent sur des zones qui, plus tard, seront affectées par des lois phonétiques. Schématiquement :
Avec :
Lextension de la loi phonétique se définit donc comme Ep = Ep1 È Ep2. On aura remarqué que les définitions sont circulaires ce qui veut dire que le linguiste doit dabord, à laide dune recherche empirique, déterminer les limites à la fois de lextension lexicale à différents moments historiques (ce qui correspond à E1 et E2) et celle de lextension phonétique (Ep) afin de pouvoir en déduire les zones C, D, Ep1 et Ep2.
La deuxième perspective semble plus efficace dans la mesure où elle permet à la fois de décrire la migration et de déterminer exactement quelles zones de E1 et E2 ont été affectées par la loi phonétique :
Ainsi, chaque zone (C, D, Ep1, Ep2) décrit une région linguistique à la fois homogène et potentiellement différente(13).
Dans un des chapitres précédents, nous avons montré que DOMINUM et HOMINEM peuvent avoir au moins quatre évolutions possibles. Nous avons dit que cette ambiguïté dans lévolution était due à la non-univocité de la loi phonétique. Quoique cette explication semble assez crédible, on pourrait aussi simaginer dautres processus qui aboutiraient au même résultat. On peut simaginer, par exemple, que deux mots qui présentent des contextes phonétiques identiques (ou similaires) évoluent de manière différente dû au fait que cette évolution a lieu dans deux endroits différents (par exemple deux zones dialectales voisines qui ne subissent pas les mêmes changements phonétiques). Il se peut quun des deux mots soit ensuite transféré dans lautre et que, une fois installé dans le dialecte voisin, ne soit plus reconnu comme un emprunt. En oubliant quil y a eu un phénomène de migration, on pourrait donc avoir limpression que les contextes phonétiques identiques ont évolué de deux manières différentes à lintérieur de la même zone. Schématiquement, ce cas se présente comme suit :
La différence dans lévolution sexplique donc ici par une combinaison de deux règles phonétiques différentes (pa et pb) et dune règle de migration (rm). Notons que Charles L. Eastlack mentionne cette possibilité pour hembra et dueña(14).
Nous avons vu que lespace peut être intégré dans le modèle à laide dintersections spatiales qui peuvent se produire entre les extensions des différentes migrations, entre les extensions des différentes lois phonétiques ou, finalement, entre les deux types dextensions. Vu les nombreuses possibilités qui existent pour que des intersections se produisent, on peut se demander à combien dintersections on doit théoriquement sattendre. Du point de vue mathématique, le problème est vite résolu : lorsquon a un ensemble de base (disons B) et un certain nombre (n) de sous-ensembles par rapport à lensemble de base, il existe, en principe, 2(n) combinaisons possibles. À nouveau, nous avons donc affaire à une variable qui augmente de manière exponentielle le nombre des évolutions que lordinateur doit gérer.
Face au grand nombre de zones géographiques différentes, nous avons intérêt à trouver une solution qui permette de minimiser leffort de calcul. Une telle solution soffre effectivement : au lieu de calculer toutes les zones simultanément, on peut se limiter à une seule zone. Outre cela, on peut laisser de côté laspect de la migration. Un schéma peut illustrer cette approche simplifiée du problème :
Nous avons donc un espace géographique (G) et quatre lois phonétiques (r1, r2, r3, r4) avec des extensions géographiques différentes. Au lieu de calculer toutes les zones, on peut se limiter à une zone particulière, par exemple Z1 ou Z2. Suivant la région que lon choisit, lensemble de règles qui sapplique aux mots est différent : dans le cas de Z1, toutes les règles entrent en jeu, tandis que dans celui de Z2, seuls r2 et r3 sappliquent.
Lorsquon ne calcule quune seule zone, le problème de la migration devient inexistant : il faut tout simplement déterminer le moment où la zone a été envahie par la langue(15) et, à partir de là, appliquer toutes les règles postérieures.
Jusquà maintenant, nous sommes partis du principe que nous calculerions la langue moderne à partir de la langue ancienne. On peut se demander, pourtant, si on ne peut pas inverser la direction du calcul, ce qui signifierait donc revenir à lancienne langue à partir de la langue moderne.
Nous avons considéré les règles comme des fonctions mathématiques qui, toutes ensemble, constituent une fonction principale :
Nous serions donc intéressés par la fonction inverse de F qui se définirait comme
La fonction principale F peut être inversée si (et uniquement si) toutes les sous-fonctions (règles) peuvent être inversées. En termes mathématiques, cela nest possible que si les fonctions en question sont bijectives, cest-à-dire à la fois injectives et surjectives. Or, il se trouve que nos fonctions ne sont ni lun ni lautre comme nous le montrent les contre-exemples suivants(16) :
non-surjectivité : | nous pouvons citer modem, acronyme composé à partir des mots anglais modulator + demodulator. Ce mot na donc aucun antécédent, mais a été formé directement à partir de deux éléments de la langue moderne. |
non-injectivité : | le mot français [so] auquel correspondent quatre graphies saut, sot, sceau, seau dont chacune provient dun étimon latin différent, à savoir SALTUM (latin classique), SOTTUM (bas latin à partir du XIe siècle), SIGILLUM (latin classique), *SITELLUM (latin vulgaire, dérivé du latin classique SITULUM). |
Même si, en principe, la fonction F nest pas bijective, on peut supposer quil existe, malgré tout, certaines possibilités dinversion du fait que toutes les sous-fonctions ne sont pas aussi non bijectives que dautres. Il faut admettre, cependant, que ces possibilités sont plutôt limitées : on constate, en général, une réduction considérable du matériel phonétique lorsquon passe de la langue ancienne à la langue moderne (cf. le mot latin AUGUSTUM huit phonèmes qui a donné août en français et qui, selon la prononciation que lon adopte, sest réduit à un [u] ou deux [ut] phonèmes). Tout compte fait, il semble donc plus facile de calculer de la langue ancienne à la langue moderne quà linverse. Dans ce dernier cas, la méthode historique-comparative semble nettement plus fructueuse.
Nous avons présenté toute une série de réflexions sur la manière dont lévolution diachronique dune langue peut ou devrait être simulée sur un ordinateur. Nous aimerions maintenant reprendre encore une fois tous ces éléments dans lensemble afin de pouvoir situer ensuite lapproche que nous avons choisi pour ETYMO. Voici donc un tableau synoptique des idées présentées :
|
modèle idéal |
modèle pratique |
Données et structures |
- données phonétiques avec une structure phonologique - système de traits distinctifs (phonologiques et autres) |
idem |
Opérations |
- implications logiques du type « SI x, alors y » - formalisme qui permette de tenir compte des évolutions multiples (cf. « SI x, ALORS y1 ou y2 ou ... ou yn ») |
idem |
Calcul du lexique |
- parallèle (simultané) - possibilité de simuler des conflits homonymiques (ou dautres phénomènes « transversaux ») |
- individuel - seules les descendances « linéaires » peuvent être simulées |
Intégration du temps |
- ordre séquentiel des règles - evtl. un autre modèle avec différents types de règles (p. ex. règles locales vs règles universelles) |
idem |
Intégration de lespace |
calcul simultané de plusieurs zones (= intersections entre les extensions des migrations et celles des lois phonétiques) |
- une seule zone est calculée - les règles sorganisent en fonction de la zone choisie - les phénomènes de migrations sont laissés de côté |
Types de règles |
- règles de migration - règles phonétiques |
règles phonétiques |
Evolutions non-univoques |
deux possibilités :
|
une seule possibilité : règle phonétique non univoque |
(Sémi-)cultismes |
deux possibilités :
=> aucune des deux solutions nest satisfaisante |
idem |
Dans cette grille, ETYMO suit exactement le modèle pratique, ce qui veut dire quil est loin dêtre un programme étymologique idéal. Néanmoins, nous le considérons comme une bonne base à partir de laquelle on peut étendre le modèle. Parmi les aspects non intégrés, la dimension spatiale est sans doute lun des plus urgents. Le calcul individuel des mots, par contre, constitue un défaut de moindre importance.
1 Voir le fichier README.TXT (section 1.3) dans le répertoire PHONO sur le CD-ROM qui accompagne ce travail. Voir aussi le chapitre , p. et lannexe.
2 Notons que cet exemple est extrêmement simplifié car la simulation dun jeu de billard exige non seulement un modèle physique qui est capable de calculer le mouvement des boules , mais aussi des faits et des structures symboliques tels que la règle selon laquelle la boule noire ne peut pas être jouée au début dune partie ou le fait quune boule appartient à lun ou lautre joueur.
3 Vu que F(x) est une fonction composée du type rn( rn-1( rn-2( ... r2( r1( x )) ... ))) on pourrait dire quau moins une des fonctions rj(x), 0 < j £ n, est non définie par rapport à x et que, par conséquent, toutes les fonctions subséquentes rk(x), j < k £ n, sont, elles aussi, non définies.
4 Nous ne donnons ici que les pas principaux de lévolution.
5 Ces phénomènes sont considérablement complexes de sorte que nous ne pouvons en donner ici quune vision très réduite. Pour plus de détails, voir Carmen Pensado Ruiz, op. cit., 1984.
6 « Palabras populares o patrimoniales son aquellas que se han transmitido en una lengua determinada a través de un uso oral ininterrumpido ». Cest nous qui soulignons. Penny, op. cit., 1993, p. 34.
7 « Son palabras cultas aquellas que el español ha tomado en préstamo del latín (clásico o medieval), a través de la escritura. Tales préstamos, que eran ya frecuentes en la Edad Media, se han dado en todas las épocas y no han sufrido la evolución propia de las voces populares, sino apenas pequeñas modificaciones en sus terminaciones para ajustarse a las estructuras morfológicas del español ». Penny, op. cit., 1993, p. 34.
8 En effet, les définitions ne sont pas très claires et Ralph Penny le dit lui-même : « Ha habido una amplia controversia sobre la definición precisa del término semicultismo [..]. Catalogamos así las palabras que, aunque han sido heredadas oralmente del latín vulgar (en esto coinciden con las patrimoniales), han experimentado una remodelación, generalmente durante el período medieval, por influencia del latín, que era en esa época la lengua empleada en la iglesia, en los tribunales, etc. Debido a su transmisión oral, los semicultismos han conocido algunos de los cambios propios de las voces populares (pero no todos, por definición) ». Penny, op. cit., 1993, p. 34.
9 Hypothèse qui est évidemment fort douteuse, comme nous le montrerons par la suite.
10 Evidemment, on pourrait penser à la fréquence dun mot ou alors au nombre de locuteurs qui lutilisent (en tenant compte du fait que les cultismes sont, en général, des mots peu fréquents et qui sont utilisés par un nombre souvent assez restreint de locuteurs). Mais cette information, doù provient-elle? Une bonne simulation calcule le passage dun état A à un état B en ne recourant quaux éléments disponibles dans A. Or, la fréquence dun mot, justement, peut changer au cours des siècles. Il faudrait donc trouver un critère dans A qui permette de prévoir la fréquence dun mot pour nimporte quelle phase intermédiaire entre A et B. Même si nous supposions que cela fût théoriquement possible, une telle simulation dépasserait largement le domaine linguistique et devrait donc inclure des aspects beaucoup plus complexes.
11 Nous nous basons ici sur la liste de règles établie par Coloma Lleal, « Unos apuntes de fonética diacrónica ».
12 On pourrait distinguer, par exemple, entre des lois phonétiques « locales », limitées dans lespace et dans le temps, et des lois phonétiques « universelles » qui seraient donc valables à nimporte quel moment et peut-être aussi à nimporte quel point géographique. Une telle loi universelle pourrait être, par exemple, la fusion de deux voyelles identiques, phénomène qui au moins comme tendance a été en vigueur à nimporte quel moment de lévolution diachronique de lespagnol. Nous devons impérativement mentionner, à cet endroit, le programme PHONO de Lee Hartmann qui distingue entre des « règles séquentielles » et des « règles persistantes ». Voir ch. , p. ).
13 Nous écrivons « potentiellement différent » parce que, dans lexemple que nous avons décrit, les zones C et D ne seront probablement pas différentes du point de vue phonétique. Mais on peut sans problème simaginer des cas ou C et D seraient différents (il pourrait par exemple y avoir une loi phonétique qui naffecte que C ou D).
14 Charles Eastlack, op. cit., 1977, p. 85.
15 Si toute la région na pas été colonisée en même temps, il faudrait alors la diviser en dautres zones et calculer séparément chacune de celles-ci.
16 Voir aussi ch. , p. .
Retour à la page principale | << Chapitre précédent | Chapitre suivant >> |