Après avoir présenté le travail qui a été réalisé pour ETYMO jusque-là, il peut être intéressant de tourner le regard vers lavenir : le projet, pourra-t-il être continué et, le cas échéant, quelle est la voie à suivre ? Afin de bien pouvoir répondre à cette question, il faut se la poser tant au niveau pratique que théorique (cest-à-dire linguistique). Quant à laspect pratique, il faut, outre cela, distinguer entre les deux versions, UNIX et MS-DOS.
A lheure actuelle, la version MS-DOS a certainement atteint ses limites. En tant que programme « expérimental » qui, faute de mieux, avait été construit sur une base minimale, ses structures ont dû être modifiées à plusieurs reprises au long de son implémentation, ce qui a mené à un programme certes fonctionnel, mais contenant de nombreuses « solutions de secours » qui essayent de corriger, tant bien que mal, des fautes de conception plus fondamentales. Arrivés au bout de lexpérience, nous constatons donc que malgré les nombreux mérites que nous avons présentés au cours de ce travail, cette version est peu extensible.
Cest la raison pour laquelle nous considérons quil faudrait, dorénavant, revenir à la version UNIX qui, en vue dune continuation du projet, semble nettement plus prometteuse. Il est vrai que son implémentation a dû être abandonnée de manière assez précipitée. Malgré les résultats plutôt modestes que cette version a fournis jusque-là, il ny a pas de doute quelle dispose dun grand potentiel dextensibilité : le parser ainsi que les structures des données constituent une base suffisamment large et solide pour y intégrer toutes les fonctionnalités dont lutilité et la justesse ont pu être démontrées grâce à la version MS-DOS.
Du point de vue théorique, il existe toute une série daméliorations dont lintégration dans le programme serait souhaitable. Ces améliorations découlent directement des points faibles du « modèle pratique » que nous avons présenté au chapitre , p. :
Dimension géographique : Lintégration de cette variable permettrait, entre autre, de calculer simultanément lévolution de plusieurs dialectes et/ou langues. Le modèle impliquerait lintroduction dun nouveau type de règles qui décrirait la migration des unités lexicales (voir ch. , p. ). Linformation géographique en tant que telle pourrait éventuellement être sauvegardée comme un type particulier de traits non phonologiques qui subiraient un traitement spécifique.
Calcul parallèle des évolutions : Le calcul simultané des différentes évolutions offrirait la possibilité deffectuer des opérations qui nagiraient plus sur laxe diachronique, mais synchronique de la langue(1). A nouveau, le calcul exigerait lintroduction dun nouveau formalisme qui permette de décrire les opérations synchroniques.
Dictionnaires électroniques : La création dune (ou de plusieurs) base(s) de données centrale(s) présenterait de nombreux avantages (tels que la compilation de vastes corpus de mots grâce à une collaboration indépendante de plusieurs chercheurs individuels). La gestion automatique dune telle base de donnée devrait dans ce cas être effectué par le programme lui-même.
Parmi les améliorations mineures quil serait souhaitable dapporter au programme, il faut surtout mentionner le formalisme des règles : lexpérience a montré que malgré la complexité que nous avons pu atteindre dans la version MS-DOS, certains phénomènes restent difficiles à exprimer(2). De même, il faudrait réfléchir encore une fois au problème de lordre séquentiel des règles : correspond-il vraiment à une réalité ou est-ce une solution trop simple ? Faudrait-il distinguer deux (voir plusieurs) types de règles différentes ?(3) Il serait aussi pensable que les règles sorganisent en groupe : dans ce cas, il se pourrait que les groupes obéissent à un ordre séquentiel, tandis que les règles peuvent « interchanger » leur place à lintérieur de ceux-ci.
Quoiquil en soit, il est évident que laventure des étymologies informatiques ne fait que commencer et quil reste encore de nombreuses batailles à livrer. Pour nous, pourtant, le travail sachève là : à dautres de prendre le relais et de continuer ce que nous avons amorcé. Cest dans ce sens et dans cet espoir aussi que nous joignons à ce travail les sources des programmes ainsi que toute information supplémentaire et les mettons ainsi à disposition de ceux ou celles qui sont prêt(e)s à accepter le défi. Dores et déjà, nous leur souhaitons « bon courage ! ».
1 On pourrait ainsi tenter de simuler des phénomènes tels que des « collisions homonymiques » ou des « attractions analogiques ».
2 Prenons lexemple du formalisme VaVb > Va[+x]Vb[+y] utilisé par Coloma Lleal : dans cette règle, la voyelle Va doit être différente de la voyelle Vb. Du fait quETYMO ne dispose pas, pour linstant, dun tel formalisme, les différentes voyelles doivent être énumérées une par une, ce qui est laborieux.
3 Comme Lee Hartmann qui distingue entre transient rules et persistent rules, voir ch. , p. .
Retour à la page principale | << Chapitre précédent | Chapitre suivant >> |