Les résultats obtenus dans le calcul sont soit affichés directement à lécran (calcul de mots individuels), soit sauvegardés dans un fichier (calcul dun corpus). Dans le premier cas, le résultat est très détaillé : il est possible dobtenir des informations spécifiques pour chaque pas évolutif. Dans le deuxième cas, les résultats se présentent sous forme statistique et seules les évolutions finales sont indiquées.
Lorsquon calcule des mots individuels, le résultat est affiché immédiatement à lécran sous forme dun « arbre évolutif ». Voici, à titre dexemple, larbre évolutif de HOMINEM(1) :
#hò[+ton]|mi|nem# | #ò[ton]|mi|nem# | #ò[+ton]|mi|ne# | #ò[+ton]m|ne# +--------------------+----------------+ #ó[+ton]m|ne# #ò[+ton]m|ne# +----------+--------+ | #ó[+ton]|n[+long]e# #ó[+ton]m|re# #wé[+ton]m|ne# | | +---------+---------+ #ó[+ton]|ñe# #ó[+ton]m|bre# #wé[+ton]|n[+long]e# #wé[+ton]m|re# (1) (2) | | #wé[+ton]|ñe# #wé[+ton]m|bre# (3) (4)
Le mot de départ reçoit automatiquement le focus qui est marqué par les caractères « >..< ». Lutilisateur a la possibilité de le déplacer à laide des touches
|
Au bas de lécran, le programme affiche des informations valables pour le « pas évolutif » qui porte le focus :
|
Les différentes entrées désignent ici :
ENTREE |
SIGNIFICATION |
Word |
évolution actuelle |
Rule |
règle utilisée |
Comm |
commentaire |
Grammar |
traits non phonologiques (grammaticaux, sémantiques, prosodiques etc.) |
Time |
date de la forme |
Il existe aussi la possibilité de sauvegarder les évolutions. Pour ce faire, on a le choix entre une copie de larbre entier ou dune seule branche de celui-ci. Dans le premier cas, il suffit dappuyer sur la touche <t> (cf. tree). Dans le deuxième cas, il faut dabord placer le focus sur un des points finaux de larbre (désignés par (1), (2), (3) et (4) dans le schéma ci-dessus) et appuyer ensuite sur la touche <s> (cf. single evolution). Dans les deux cas, les données sont ajoutées au fichier RESULTS.TXT (si le fichier contient déjà des évolutions, celles-ci ne sont donc pas effacées).
Lorsquon calcule un corpus de mots, les résultats sont trop nombreux pour être affichés à lécran. Ils sont donc sauvegardés dans plusieurs fichiers que nous décrirons par la suite.
Le fichier STAT.LOG contient, pour chaque mot du corpus, une entrée qui se présente comme suit :
INPUT : a CORR : (1) e1 (2) e2 .. (m) em CALC : (1) c1 (2) c2 .. (n) cn EXPECTED - HITS : e1 : result e2 : result : em : result CALCULATED - HITS : c1 : result c2 : result : cn : result TOTAL HITS - EXPECTED : te / m TOTAL HITS - CALCULATED : tc / n
Les différentes variables désignent :
VARIABLE |
SIGNIFICATION |
a |
létimon qui a été utilisé comme input |
e1, e2, .., em |
évolutions correctes « attendues » (expected)(2) |
c1, c2, .., cn |
évolutions calculées (calculated) |
Dans la section « EXPECTED HITS », lordinateur indique, pour chaque évolution attendue si elle a été calculée ou non (« oui » si result = 1, « non » si result = 0). Inversement, il indique, dans la section « CALCULATED HITS », pour chaque évolution calculée si elle était attendue ou non. Il calcule ensuite le nombre total des « buts » (hits), cest-à-dire te pour les évolutions attendues, tc pour les évolutions calculées. Dans un cas idéal, on devrait donc avoir
te = m tc = n te = tc (m = n)
ce qui voudrait dire que lordinateur a calculé autant dévolutions quil en existe de correctes (n = m), et que toutes les évolutions calculées étaient comprises dans les évolutions correctes (tc = n) et vice versa (te = m).
Afin dévaluer le succès global du calcul, ETYMO ajoute un résumé statistique (statistical summary) à la fin du fichier qui contient les informations suivantes :
Given words : G Expected evolutions : E Correct calculations : C Saturation : - ideal s1 - sufficient s2 - partial s3 - insufficient s4
Quant aux variables G, E et C, elles définissent :
G | = | nombre de mots contenus dans le corpus | ||
| ||||
E | = | G Sei i=0 | ei = nombre des évolutions attendues du mot i | |
C | = | G S ci i=0 | ci = nombre des évolutions correctes du calcul i |
Quant aux variables s1, .., s4, elles indiquent la saturation qui a été atteinte pour chaque évolution. Chaque type de saturation est défini par les conditions logiques suivantes :
s1 <=> m = n = te = tc s2 <=> (n > m) et (te = tc = m) s3 <=> (te < m) et (te > 0) s4 <=> (te = 0)
Les variables s1, .., s4 indiquent pour chaque type la somme des évolutions qui correspond à ces critères, de manière que
s1 + s2 + s3 + s4 = G
En termes plus simples, les différents types de saturations signifient donc :
ideal(s1) : | Le nombre des évolutions calculées correspond au nombre des évolutions attendues. Toutes les évolutions attendues ont été calculées et il nexiste pas dévolutions superflues. | |
sufficient (s2) : | Toutes les évolutions attendues ont été calculées, mais il existe des évolutions superflues. | |
partial (s3) : | Seule une partie des évolutions attendues a été calculée correctement. Il peut y avoir des évolutions superflues. | |
insufficient (s4) : | Aucune des évolutions attendues na été calculée. Il peut y avoir des évolutions superflues. |
Le fichier RULES.LOG indique pour chaque règle à quel(s) mot(s) elle à été appliquée et combien de fois elle a été utilisée pendant le calcul du corpus :
Rule(line): frequency | words concerned r1( l1): f1 | w1 w2 .. wf1 r2( l2): f2 | w1 w2 .. wf2 : : : rn( ln): fn | w1 w2 .. wfn
Les différentes variables signifient :
VARIABLES |
SIGNIFICATION |
rx |
numéro de la règle |
lx |
ligne où rx se trouve dans le catalogue de règles |
fx |
nombre de fois que rx a été utilisée |
w1 .. wfx |
mots qui ont été affectés par rx (le programme indique la ligne où le mot apparaît dans le corpus) |
Etant donné quune règle peut sappliquer plusieurs fois au même mot, on peut avoir des cas où wn = wn+1.
Le fichier RULES.LOG peut être utile pour détecter (et éventuellement éliminer) des règles non productives (cest-à-dire des règles qui ne sappliquent à aucun mot)(3).
Le fichier WORDS.LOG indique pour chaque mot du corpus les règles qui ont été utilisées lors du calcul :
Word : rules used 1: r1,1 .. rn,1 : : m: r1,m .. rn,m
où les variables désignent :
VARIABLE |
SIGNIFICATION |
m |
nombre de mots contenus dans le corpus |
r1,x .. rn,x |
règles utilisées |
WORDS.LOG contient donc, pour lessentiel, les mêmes informations que RULES.LOG sauf quelles sont présentées dune façon différente.
1 Cet exemple, calculé à lorigine avec le catalogue joint sur CD-ROM, a été simplifié pour des raisons de place.
2 Voir ch. , p. .
3 Lélimination de règles superflues peut être effectuée de manière automatique par le programme CONDENSE.EXE qui a également été inclus sur le CD-ROM. Lisez les informations affichées à lécran lors du démarrage.
Retour à la page principale | << Chapitre précédent | Chapitre suivant >> |