|
|
|
[GramOOo] [tagging] petit test
J'ai testé notre tagger avec le petit texte suivant :
Voici une blague de Toto qui fait du surf. Seulement, sur la piste, la neige est mauvaise, elle a fondu. Et Toto qui ne sait pas surfer se casse la figure. Alors il hurle: "Dorénavant je ne ferai plus de surf le week-end de Pâques !" Les personnes qui ont skié ce week-end comprendront. Je sais, ce texte ne fait pas trop rigoler. Je voulais voir la façon dont il était désambiguïsé. Il est désambiguïsé ! Voici la sortie du tagger sans qu'aucune règle ne soit appliquée: Les mots ambigus sont entre balises <B></B> <?xml version="1.0" encoding="utf-8" standalone="no"?> <!DOCTYPE teacs SYSTEM "/dtds/gramadoir.dtd"> <teacs> <line> <B><Z><A/><P/></Z> Voici</B> <B><Z><D f s/><J f s/><N f s/></Z>une</B> <B><Z><N f s/><V imp pres 2 s/><V ind pres 1 s/><V ind pres 3 s/><V sub pres 1 s/><V sub pres 3 s/></Z>blague</B> <P>de</P> <N m s>Toto</N> <R rel e sp>qui</R> <B><Z><J m s/><N m s/><V ind pres 3 s/><V ppa m s/></Z>fait</B> <D m s>du</D> <N m s>surf</N>. </line> <line> <A>Seulement</A>, <B><Z><J m s/><P/></Z>sur</B> <B><Z><D f s/><N m sp/><R pers obj 3 f s/></Z>la</B> <N f s>piste</N>, <B><Z><D f s/><N m sp/><R pers obj 3 f s/></Z>la</B> <B><Z><N f s/><V ind pres 3 s/><V sub pres 3 s/></Z>neige</B> <B><Z><J e p/><J e s/><N m s/><V etre ind pres 3 s/></Z>est</B> <B><Z><J f s/><N f s/></Z>mauvaise</B>, <R pers suj 3 f s>elle</R> <B><Z><N m sp/><V avoir ind pres 3 s/></Z>a</B> <B><Z><J m s/><N m s/><V ppa m s/></Z>fondu</B>. </line> <line> <C coor>Et</C> <N m s>Toto</N> <R rel e sp>qui</R> <A>ne</A> <V ind pres 3 s>sait</V> <B><Z><A/><N m sp/></Z>pas</B> <V inf>surfer</V> <R pers obj 3 sp>se</R> <B><Z><N f s/><N m s/><V imp pres 2 s/><V ind pres 1 s/><V ind pres 3 s/><V sub pres 1 s/><V sub pres 3 s/></Z>casse</B> <B><Z><D f s/><N m sp/><R pers obj 3 f s/></Z>la</B> <B><Z><N f s/><V imp pres 2 s/><V ind pres 1 s/><V ind pres 3 s/><V sub pres 1 s/><V sub pres 3 s/></Z>figure</B>. </line> <line> <A>Alors</A> <R pers suj 3 m s>il</R> <B><Z><V imp pres 2 s/><V ind pres 1 s/><V ind pres 3 s/><V sub pres 1 s/><V sub pres 3 s/></Z>hurle</B>: "<A>Dorénavant</A> <R pers suj 1 s>je</R> <A>ne</A> <V ind futu 1 s>ferai</V> <B><Z><A/><D e p/><D e s/><N m sp/><V ind psim 1 s/><V ind psim 2 s/><V ppa m p/></Z>plus</B> <P>de</P> <N m s>surf</N> <B><Z><D m s/><R pers obj 3 m s/></Z>le</B> <N m s>week-end</N> <P>de</P> <N f p>Pâques</N> !" </line> <line> <R pers suj 1 s>Je</R> <B><Z><V ind pres 1 s/><V ind pres 2 s/></Z>sais</B>, <B><Z><D m s/><R dem e s/></Z>ce</B> <N m s>texte</N> <A>ne</A> <B><Z><J m s/><N m s/><V ind pres 3 s/><V ppa m s/></Z>fait</B> <B><Z><A/><N m sp/></Z>pas</B> <A>trop</A> <V inf>rigoler</V>. </line> <line> <B><Z><D e p/><R pers obj 3 p/></Z>Les</B> <N f p>personnes</N> <R rel e sp>qui</R> <V avoir ind pres 3 p>ont</V> <V ppa m s>skié</V> <B><Z><D m s/><R dem e s/></Z>ce</B> <N m s>week-end</N> <V ind futu 3 p>comprendront</V>. </line> <line> <R pers suj 1 s>Je</R> <B><Z><V ind impa 1 s/><V ind impa 2 s/></Z>voulais</B> <V inf>voir</V> <B><Z><D f s/><N m sp/><R pers obj 3 f s/></Z>la</B> <N f s>façon</N> <R rel e sp>dont</R> <R pers suj 3 m s>il</R> <V etre ind impa 3 s>était</V> <B><Z><J m s/><V ppa m s/></Z>désambiguïsé</B>. </line> </teacs> Et voici la sortie après application des règles : <?xml version="1.0" encoding="utf-8" standalone="no"?> <!DOCTYPE teacs SYSTEM "/dtds/gramadoir.dtd"> <teacs> <line> <P>Voici</P> <D f s>une</D> <N f s>blague</N> <P>de</P> <N m s>Toto</N> <R rel e sp>qui</R> <V ind pres 3 s>fait</V> <D m s>du</D> <N m s>surf</N>. </line> <line> <A>Seulement</A>, <P>sur</P> <D f s>la</D> <N f s>piste</N>, <D f s>la</D> <N f s>neige</N> <V etre ind pres 3 s>est</V> <J f s>mauvaise</J>, <R pers suj 3 f s>elle</R> <V avoir ind pres 3 s>a</V> <V ppa m s>fondu</V>. </line> <line> <C coor>Et</C> <N m s>Toto</N> <R rel e sp>qui</R> <A>ne</A> <V ind pres 3 s>sait</V> <A>pas</A> <V inf>surfer</V> <R pers obj 3 sp>se</R> <V ind pres 1 s>casse</V> <D f s>la</D> <N f s>figure</N>. </line> <line> <A>Alors</A> <R pers suj 3 m s>il</R> <V ind pres 1 s>hurle</V>: "<A>Dorénavant</A> <R pers suj 1 s>je</R> <A>ne</A> <V ind futu 1 s>ferai</V> <A>plus</A> <P>de</P> <N m s>surf</N> <D m s>le</D> <N m s>week-end</N> <P>de</P> <N f p>Pâques</N> !" </line> <line> <D e s>Les</D> <N f p>personnes</N> <R rel e sp>qui</R> <V avoir ind pres 3 p>ont</V> <V ppa m s>skié</V> <D m s>ce</D> <N m s>week-end</N> <V ind futu 3 p>comprendront</V>. </line> <line> <R pers suj 1 s>Je</R> <V ind pres 1 s>sais</V>, <D m s>ce</D> <N m s>texte</N> <A>ne</A> <V ind pres 3 s>fait</V> <A>pas</A> <A>trop</A> <V inf>rigoler</V>. </line> <line> <R pers suj 1 s>Je</R> <V ind impa 1 s>voulais</V> <V inf>voir</V> <D f s>la</D> <N f s>façon</N> <R rel e sp>dont</R> <R pers suj 3 m s>il</R> <V etre ind impa 3 s>était</V> <V ppa m s>désambiguïsé</V>. </line> <line> <R pers suj 3 m s>Il</R> <V etre ind pres 3 s>est</V> <V ppa m s>désambiguïsé</V> ! </line> </teacs> Important announcement: Join the Nuxeo team and contribute to the Nuxeo project! We have open positions in France and the UK for open source Java EE developers and sales engineers, both junior and senior. Trackback PingsTrackback URL for this entry:
http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_29_gramooo_tagging_petit/tbping
Posted by Myriam Lechelt @ 03/29/2005 07:40 PM.
-
Categories:
openoffice
-
0 comments
|
Nuxeo Bloggers: Log in! Search Nuxeo Blogs
About this blog
Myriam Lechelt
Categories
Nuxeo Bloggers
Photos and Pictures
|
|
Nuxeo -
Indesko -
Nuxeo 5 Project
All content is copyrighted by their author. CPSSkins is Copyright © 2003-2006 by Jean-Marc Orliaguet. | CPS is Copyright © 2002-2006 by Nuxeo SAS. |