Perspectives

Après avoir présenté le travail qui a été réalisé pour ETYMO jusque-là, il peut être intéressant de tourner le regard vers l’avenir : le projet, pourra-t-il être continué et, le cas échéant, quelle est la voie à suivre ? Afin de bien pouvoir répondre à cette question, il faut se la poser tant au niveau pratique que théorique (c’est-à-dire linguistique). Quant à l’aspect pratique, il faut, outre cela, distinguer entre les deux versions, UNIX et MS-DOS.

A l’heure actuelle, la version MS-DOS a certainement atteint ses limites. En tant que programme « expérimental » qui, faute de mieux, avait été construit sur une base minimale, ses structures ont dû être modifiées à plusieurs reprises au long de son implémentation, ce qui a mené à un programme certes fonctionnel, mais contenant de nombreuses « solutions de secours » qui essayent de corriger, tant bien que mal, des fautes de conception plus fondamentales. Arrivés au bout de l’expérience, nous constatons donc que malgré les nombreux mérites que nous avons présentés au cours de ce travail, cette version est peu extensible.

C’est la raison pour laquelle nous considérons qu’il faudrait, dorénavant, revenir à la version UNIX qui, en vue d’une continuation du projet, semble nettement plus prometteuse. Il est vrai que son implémentation a dû être abandonnée de manière assez précipitée. Malgré les résultats plutôt modestes que cette version a fournis jusque-là, il n’y a pas de doute qu’elle dispose d’un grand potentiel d’extensibilité : le parser ainsi que les structures des données constituent une base suffisamment large et solide pour y intégrer toutes les fonctionnalités dont l’utilité et la justesse ont pu être démontrées grâce à la version MS-DOS.

Du point de vue théorique, il existe toute une série d’améliorations dont l’intégration dans le programme serait souhaitable. Ces améliorations découlent directement des points faibles du « modèle pratique » que nous avons présenté au chapitre , p. :

Dimension géographique : L’intégration de cette variable permettrait, entre autre, de calculer simultanément l’évolution de plusieurs dialectes et/ou langues. Le modèle impliquerait l’introduction d’un nouveau type de règles qui décrirait la migration des unités lexicales (voir ch. , p. ). L’information géographique en tant que telle pourrait éventuellement être sauvegardée comme un type particulier de traits non phonologiques qui subiraient un traitement spécifique.
Calcul parallèle des évolutions : Le calcul simultané des différentes évolutions offrirait la possibilité d’effectuer des opérations qui n’agiraient plus sur l’axe diachronique, mais synchronique de la langue(1). A nouveau, le calcul exigerait l’introduction d’un nouveau formalisme qui permette de décrire les opérations synchroniques.
Dictionnaires électroniques : La création d’une (ou de plusieurs) base(s) de données centrale(s) présenterait de nombreux avantages (tels que la compilation de vastes corpus de mots grâce à une collaboration indépendante de plusieurs chercheurs individuels). La gestion automatique d’une telle base de donnée devrait dans ce cas être effectué par le programme lui-même.

Parmi les améliorations mineures qu’il serait souhaitable d’apporter au programme, il faut surtout mentionner le formalisme des règles : l’expérience a montré que malgré la complexité que nous avons pu atteindre dans la version MS-DOS, certains phénomènes restent difficiles à exprimer(2). De même, il faudrait réfléchir encore une fois au problème de l’ordre séquentiel des règles : correspond-il vraiment à une réalité ou est-ce une solution trop simple ? Faudrait-il distinguer deux (voir plusieurs) types de règles différentes ?(3) Il serait aussi pensable que les règles s’organisent en groupe : dans ce cas, il se pourrait que les groupes obéissent à un ordre séquentiel, tandis que les règles peuvent « interchanger » leur place à l’intérieur de ceux-ci.

Quoiqu’il en soit, il est évident que l’aventure des étymologies informatiques ne fait que commencer et qu’il reste encore de nombreuses batailles à livrer. Pour nous, pourtant, le travail s’achève là : à d’autres de prendre le relais et de continuer ce que nous avons amorcé. C’est dans ce sens – et dans cet espoir aussi – que nous joignons à ce travail les sources des programmes ainsi que toute information supplémentaire et les mettons ainsi à disposition de ceux ou celles qui sont prêt(e)s à accepter le défi. D’ores et déjà, nous leur souhaitons « bon courage ! ».

1 On pourrait ainsi tenter de simuler des phénomènes tels que des « collisions homonymiques » ou des « attractions analogiques ».

2 Prenons l’exemple du formalisme V_aV_b > V_a[+x]V_b[+y] utilisé par Coloma Lleal : dans cette règle, la voyelle V_adoit être différente de la voyelle V_b. Du fait qu’ETYMO ne dispose pas, pour l’instant, d’un tel formalisme, les différentes voyelles doivent être énumérées une par une, ce qui est laborieux.

3 Comme Lee Hartmann qui distingue entre transient rules et persistent rules, voir ch. , p. .

Retour à la page principale

<< Chapitre précédent

Chapitre suivant >>