[GramOOo] [tagging] ordre des règles et plusieurs passages

L'ordre des règles est très important dans Gramadoir. La première que trouve le programme est appliquée. Il faut donc mettre les plus générales à la fin.
Si le contexte qui sert à désambiguïser est lui même ambigu, la règle ne s'applique pas.
Prenons les trois mots suivants:

<line> <R pers suj 3 f s>elle</R> <V etre ind pres 3 s>est</V> <V ppa f s>prise</V> </line>

"Elle" n'est pas ambigu. Il permet de désambiguïser "est" qui peut être un nom, un adjectif ou le verbe être. S'il est précédé d'un pronom personnel, alors c'est un verbe. Ensuite, il faut que la règle qui concerne la désambiguïsation du participe passé soit placée après, sinon, elle ne va pas s'appliquer si "est" n'est pas encore desambiguïsé. Mais par contre, il faut qu'elle soit placé avant les règles sur l'indicatif sinon prise sera étiqueté :

<V ind pres 1 s>prise</V>        (verbe priser)

Prenons maintenant le cas "il s'est tu". Mettons de côté le problème du pronom "se" car nous en l'avons pas encore traité. Si l'on place la règle des participes après celle qui dit que "tu" par défaut et un pronom personnel (de même que "il"), on aura:

<line> <R pers suj 3 m s>il</R> s' <V etre ind pres 3 s>est</V> <R pers suj 2 s>tu</R> </line>.

"Tu" est étiqueté comme un pronom personnel.
Ceci est problèmatique car la règle des pronoms personnels nécessite d'être placée avant la désambiguïsation de verbes sinon cette dernière ne peut pas se faire.

On pourrait donc avoir besoin de deux passages pour l'application des règles. Mais ceci serait-il vraiment nécessaire? Le mot n'attendra pas le deuxième passage pour se désambiguïser, il matchera la première règle qu'il trouvera.

Important announcement: Join the Nuxeo team and contribute to the Nuxeo project! We have open positions in France and the UK for open source Java EE developers and sales engineers, both junior and senior.

Like this post? Share it:


Trackback Pings

Trackback URL for this entry:
http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_29_gramooo_tagging_ordre/tbping
Posted by Myriam Lechelt @ 03/29/2005 09:58 AM. - Categories: openoffice -  0 comments

Nuxeo Bloggers: Log in!
Nuxeo - Indesko - Nuxeo 5 Project
All content is copyrighted by their author.
CPSSkins is Copyright © 2003-2006 by Jean-Marc Orliaguet. | CPS is Copyright © 2002-2006 by Nuxeo SAS.