<?xml version="1.0" encoding="ISO-8859-15"?>
<feed version="0.3" xmlns="http://purl.org/atom/ns#"
      xmlns:dc="http://purl.org/dc/elements/1.1/">
  <title mode="escaped" type="text/html">Myriam Lechelt</title>
  <tagline>ATOM Feed - Myriam Lechelt</tagline>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt" />
  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt</id>
  <generator url="http://cps-project.org" version="3">CPS</generator>
  <modified>2005-02-13 14:45:41</modified>

  <link rel="service.feed"
        href=" http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/atomFeed"
        title="Myriam Lechelt" type="application/atom+xml" />
  <link rel="service.post"
        href=" http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/postAtom"
        title="Myriam Lechelt" type="application/atom+xml" />
  <link rel="service.categories"
        href=" http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/atomCategories"
        title="Myriam Lechelt" type="application/atom+xml" />

  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Mémoire et Slides</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_11_30_gramooo-memoire-slides" />
  <issued>2005-12-05T12:10:40Z</issued>
  <modified>2005-12-05T12:10:40Z</modified>
  <created>2005-11-30T15:48:15Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>indesko</dc:subject>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">Voici le mémoire de stage et les slides de soutenance de Myriam
   
   La qualité de son travail linguistique a été souligné par ses examinateurs.
  Ce rapport est assurément un document fondateur pour plusieurs
  développements ultérieurs pour des outils linguistiques libres.
   
   Son travail préliminaire est intégré à Gramadoir, correcteur grammatical
  libre de Kevin Scannel, de ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">Voici le mémoire de stage et les slides de soutenance de Myriam&lt;br /&gt;
   &lt;br /&gt;
   La qualité de son travail linguistique a été souligné par ses examinateurs.
  Ce rapport est assurément un document fondateur pour plusieurs
  développements ultérieurs pour des outils linguistiques libres.&lt;br /&gt;
   &lt;br /&gt;
   Son travail préliminaire est intégré à Gramadoir, correcteur grammatical
  libre de Kevin Scannel, de l'université de Saint Louis, disponible ici : &lt;a
  href="http://borel.slu.edu/gramadoir/"&gt;http://borel.slu.edu/gramadoir/&lt;/a&gt;&lt;br /&gt;

  &lt;br /&gt;
  Laurent Godard.&lt;br /&gt;
   &lt;br /&gt;</content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_11_30_gramooo-memoire-slides</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_11_30_gramooo-memoire-slides/atom?2005_11_30_gramooo-memoire-slides"
        title="Edit Here - [GramOOo] Mémoire et Slides" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Bilan</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_05_30_gramooo_bilan" />
  <issued>2005-06-02T09:59:13Z</issued>
  <modified>2005-06-02T09:59:13Z</modified>
  <created>2005-05-30T12:45:48Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  J'arrive bientôt à la fin de mon stage chez  Nuxeo/Indesko.
   Le projet du correcteur grammatical n'est évidemment pas fini, mais nous
  arrivons à quelques résultats encourageants pour la suite.
   
   D'ici à la fin du mois, sera disponible mon rapport de stage. Celui-ci
  présentera tout le travail effectué, les résultats, les limites du système
  et les perspectives futures.
 ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  J'arrive bientôt à la fin de mon stage chez&amp;nbsp; Nuxeo/Indesko.&lt;br /&gt;
   Le projet du correcteur grammatical n'est évidemment pas fini, mais nous
  arrivons à quelques résultats encourageants pour la suite.&lt;br /&gt;
   &lt;br /&gt;
   D'ici à la fin du mois, sera disponible mon rapport de stage. Celui-ci
  présentera tout le travail effectué, les résultats, les limites du système
  et les perspectives futures.&lt;br /&gt;
   Il servira de guide à quiconque continuera le projet.&lt;br /&gt;
   &lt;br /&gt;
   Ce stage marquant la fin de mes études, j'aurai moi-même la possibilité d'y
  contribuer encore un peu...&lt;br /&gt;
   &lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_05_30_gramooo_bilan</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_05_30_gramooo_bilan/atom?2005_05_30_gramooo_bilan"
        title="Edit Here - [GramOOo] Bilan" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] petite réctification</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_29_gramooo_petite" />
  <issued>2005-04-29T09:25:03Z</issued>
  <modified>2005-04-29T09:25:03Z</modified>
  <created>2005-04-29T09:12:48Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  A mon grand regret, j'ai appris que malgré que était considéré comme
  correct par l'accadémie française.
   
   J'ai donc retiré cette règle de mon correcteur, qui dorénavant ne marquera
  plus malgré que comme faux.
 </summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  A mon grand regret, j'ai appris que &lt;i&gt;malgré que&lt;/i&gt; était considéré comme
  correct par l'accadémie française.&lt;br /&gt;
   &lt;br /&gt;
   J'ai donc retiré cette règle de mon correcteur, qui dorénavant ne marquera
  plus &lt;i&gt;malgré que&lt;/i&gt; comme faux.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_04_29_gramooo_petite</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_29_gramooo_petite/atom?2005_04_29_gramooo_petite"
        title="Edit Here - [GramOOo] petite réctification" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Premiers exemples de fautes corrigées</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_27_gramooo_quelques" />
  <issued>2005-05-03T12:07:20Z</issued>
  <modified>2005-05-03T12:07:20Z</modified>
  <created>2005-04-27T06:58:00Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">Nous avons choisi de continuer avec l'outil Gramadoir pour la phase de
  grammaire.
   Après la création de quelques règles, on peut montrer quelques exemples de
  sortie.
   Gramadoir renvoie la phrase, les fautes sont notées en rouge et sur la
  deuxième ligne apparaît un message qui décrit l'erreur.
   
   Il faut préciser que ces messages ne sont pas définitifs. Pour le moment,
  nous ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">Nous avons choisi de continuer avec l'outil Gramadoir pour la phase de
  grammaire.&lt;br /&gt;
   Après la création de quelques règles, on peut montrer quelques exemples de
  sortie.&lt;br /&gt;
   Gramadoir renvoie la phrase, les fautes sont notées en rouge et sur la
  deuxième ligne apparaît un message qui décrit l'erreur.&lt;br /&gt;
   &lt;br /&gt;
   Il faut préciser que ces messages ne sont pas définitifs. Pour le moment,
  nous avons juste testé si les règles s'appliquaient correctement. Nous
  reviendrons sur le sujet. &lt;br /&gt;
   &lt;br /&gt;
   Voici donc une copie de la console qui donne la sortie de Gramadoir:&lt;br /&gt;
   &lt;span style="color: rgb(0, 0, 153);"&gt;&lt;br /&gt;
  &lt;/span&gt; 1: Ceci est &lt;b&gt;&lt;span style="color: rgb(255, 0, 0);"&gt;un
  tests&lt;/span&gt;&lt;/b&gt; avec des grosse fautes .&lt;br /&gt;
   Faute d'accord.&lt;br /&gt;
   &lt;br /&gt;
   1: Ceci est un tests avec &lt;b&gt;&lt;span style="color: rgb(255, 0, 0);"&gt;des
  grosse fautes&lt;/span&gt;&lt;/b&gt; .&lt;br /&gt;
   Faute d'accord.&lt;br /&gt;
   &lt;span style="color: rgb(0, 0, 153);"&gt;&lt;br /&gt;
  &lt;/span&gt; 1: &lt;b style="color: rgb(255, 0, 0);"&gt;Malgré que&lt;/b&gt; je sois
  linguiste , je rédigent des fautes énorme.&lt;br /&gt;
   Cette combinaison de mots n'est pas correcte.&lt;br /&gt;
   &lt;br /&gt;
   1:Malgré que je sois linguiste , &lt;b style="color: rgb(255, 0, 0);"&gt;je
  rédigent&lt;/b&gt; des fautes énorme.&lt;br /&gt;
   Faute d'accord entre le sujet et le verbe.&lt;br /&gt;
   &lt;br /&gt;
   1:Malgré que je sois linguiste , je rédigent &lt;b
  style="color: rgb(255, 0, 0);"&gt;&lt;span
  style="color: rgb(255, 0, 0);"&gt;des&lt;/span&gt; fautes énorme&lt;/b&gt;.&lt;br /&gt;
   Faute d'accord.&lt;br /&gt;
   &lt;br /&gt;
   2: &lt;b style="color: rgb(255, 0, 0);"&gt;Se test&lt;/b&gt; montre que sa
  fonctionne.&lt;br /&gt;
   Faute.&lt;br /&gt;
   &lt;br /&gt;
   2: Se test montre que &lt;b&gt;&lt;span style="color: rgb(255, 0, 0);"&gt;sa
  fonctionne&lt;/span&gt;&lt;/b&gt;.&lt;br /&gt;
   Faute.&lt;br /&gt;
   &lt;br /&gt;
   3: &lt;b&gt;&lt;span style="color: rgb(255, 0, 0);"&gt;Elles sont recherché&lt;/span&gt;&lt;/b&gt;
  mes fautes .&lt;br /&gt;
   Faute d'accord du participe passé.&lt;br /&gt;
   &lt;br style="color: rgb(0, 0, 0);" /&gt;
   4: &lt;b style="color: rgb(255, 0, 0);"&gt;ils parle&lt;/b&gt; de ça soeur&lt;br /&gt;
   Faute d'accord.&lt;br /&gt;
   &lt;br /&gt;
   4: ils parle de &lt;b&gt;&lt;span style="color: rgb(255, 0, 0);"&gt;ça
  soeur&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;
   Faute.&lt;br /&gt;
   &lt;br style="color: rgb(0, 0, 0);" /&gt;
   &lt;br style="color: rgb(0, 0, 0);" /&gt;
   &lt;br /&gt;</content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_04_27_gramooo_quelques</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_27_gramooo_quelques/atom?2005_04_27_gramooo_quelques"
        title="Edit Here - [GramOOo] Premiers exemples de fautes corrigées" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] tests de règles grammaticales et construction des règles</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_22_gramooo_tests_regles" />
  <issued>2005-04-22T11:49:49Z</issued>
  <modified>2005-04-22T11:49:49Z</modified>
  <created>2005-04-22T09:09:49Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Je suis en train de tester quelques règles grammaticales sur les deux
  moteurs, Gramadoir et Languagetool, pour voir celui qui serait le mieux
  adaptable au français.
   
   Nous l'avons dit, nous aurons besoin de travailler sur deux niveaux, que
  nous avons appelés "intrachunk" et "interchunk". Le premier concerne les
  règles qui définissent des erreurs au sein d'un chunk, à savoir ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Je suis en train de tester quelques règles grammaticales sur les deux
  moteurs, Gramadoir et Languagetool, pour voir celui qui serait le mieux
  adaptable au français.&lt;br /&gt;
   &lt;br /&gt;
   Nous l'avons dit, nous aurons besoin de travailler sur deux niveaux, que
  nous avons appelés "intrachunk" et "interchunk". Le premier concerne les
  règles qui définissent des erreurs au sein d'un chunk, à savoir des accords
  de type nom-adjectifs. Le deuxième niveau va permettre de corriger des
  fautes d'accords sujet-verbes par exemple.&lt;br /&gt;
   &lt;br /&gt;
   Nous commencerons par les règles intrachunks.&lt;br /&gt;
   Un exemple avec Gramadoir:&lt;br /&gt;
   &lt;b&gt;&amp;lt;D f s&amp;gt;ANYTHING&amp;lt;/D&amp;gt; &amp;lt;J f p&amp;gt;ANYTHING&amp;lt;/J&amp;gt; &amp;lt;N f
  s&amp;gt;ANYTHING&amp;lt;/N&amp;gt;:ERREURACCORD&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   Un déterminant fémin singulier, suivit d'un adjectif féminin pluriel,
  suivit d'un nom féminin singulier est une faute, car il n'y a pas
  unification du trait nombre.&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;D m s&amp;gt;ANYTHING&amp;lt;/D&amp;gt; &amp;lt;J f p&amp;gt;ANYTHING&amp;lt;/J&amp;gt; &amp;lt;N f
  s&amp;gt;ANYTHING&amp;lt;/N&amp;gt;:ERREURACCORD&lt;br /&gt;
  &lt;/b&gt; &lt;b&gt;&amp;lt;D f s&amp;gt;ANYTHING&amp;lt;/D&amp;gt; &amp;lt;J f s&amp;gt;ANYTHING&amp;lt;/J&amp;gt;
  &amp;lt;N m s&amp;gt;ANYTHING&amp;lt;/N&amp;gt;:ERREURACCORD&lt;br /&gt;
  &lt;/b&gt; &lt;b&gt;&amp;lt;D f p&amp;gt;ANYTHING&amp;lt;/D&amp;gt; &amp;lt;J f p&amp;gt;ANYTHING&amp;lt;/J&amp;gt;
  &amp;lt;N f s&amp;gt;ANYTHING&amp;lt;/N&amp;gt;:ERREURACCORD&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   Notre lexique comporte 6 types de déterminants, 9 d'adjectifs et 9 de noms,
  plus de nombreux verbes. Je vous laisse calculer le nombre de combinaisons
  possibles pour décrire les erreurs... En effet, les systèmes décrivent des
  règles d'erreurs et supposent donc de prévoir toutes les erreurs possibles
  (ou du moins le plus possibles).&lt;br /&gt;
   &lt;br /&gt;
   C'est pour cela que nous avons décidé de générer automatiquement les
  règles. Nous commençons par générer toutes les combinaisons possibles et
  nous supprimons celles qui sont correctes.&lt;br /&gt;
   &lt;br /&gt;
  Pour l'instant nous n'avons généré que les cas suivants:&lt;br /&gt;
  &lt;b&gt;&amp;lt;D ...&amp;gt; &amp;lt;N ...&amp;gt;&lt;br /&gt;
  &lt;/b&gt;&lt;b&gt;&amp;lt;D ...&amp;gt; &amp;lt;J ...&amp;gt; &amp;lt;N ...&amp;gt;&lt;br /&gt;
  &amp;lt;&lt;/b&gt;&lt;b&gt;D ...&amp;gt; &amp;lt;J ...&amp;gt;&lt;/b&gt; &lt;b&gt;&amp;lt;J ...&amp;gt;&lt;/b&gt; &lt;b&gt;&amp;lt;N
  ...&amp;gt;&lt;/b&gt;&lt;br /&gt;
  Nous obtenons alors 4244 règles d'erreurs.&lt;br /&gt;
  &lt;br /&gt;
   Reste à savoir si les systèmes ne seront pas "perturbés" par de si
  nombreuses règles... &lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_04_22_gramooo_tests_regles</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_22_gramooo_tests_regles/atom?2005_04_22_gramooo_tests_regles"
        title="Edit Here - [GramOOo] tests de règles grammaticales et construction des règles" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] nécessité d'un segment intermédiaire entre les mots et la phrase</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_15_gramooo_necessite_d" />
  <issued>2005-04-15T09:46:51Z</issued>
  <modified>2005-04-15T09:46:51Z</modified>
  <created>2005-04-15T07:07:58Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  En examinant quelques fautes de français, et en se demandant comment il est
  possible de les corriger, on se rend vite compte de la difficulté à laquelle
  on est confronté.
   
   Nous avons désambiguïsé les mots par rapport au contexte immédiat, gauche
  ou droit. On voit bien qu'on pourra faire la même chose pour corriger un
  accord entre un nom et un adjectif par exemple.
   Si ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  En examinant quelques fautes de français, et en se demandant comment il est
  possible de les corriger, on se rend vite compte de la difficulté à laquelle
  on est confronté.&lt;br /&gt;
   &lt;br /&gt;
   Nous avons désambiguïsé les mots par rapport au contexte immédiat, gauche
  ou droit. On voit bien qu'on pourra faire la même chose pour corriger un
  accord entre un nom et un adjectif par exemple.&lt;br /&gt;
   Si un adjectif masculin singulier est suivit d'un nom féminin singulier, il
  y a faute, car il n'y a pas concordance, unification des traits.&lt;br /&gt;
   &lt;br /&gt;
   Mais prenons la phrase suivante:&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;nbsp; *&amp;nbsp; La grève des lycéens
  continuent.&lt;/b&gt;&lt;br /&gt;
   ( l'astérisque signifie que la phrase est agramaticale)&lt;br /&gt;
   &lt;br /&gt;
   Comment le programme va-t-il détecter que&amp;nbsp; le verbe &lt;i&gt;continuer&lt;/i&gt;
  doit s'accorder avec&amp;nbsp; le nom &lt;i&gt;grève&lt;/i&gt; et non pas &lt;i&gt;lycéens&lt;/i&gt; si
  on se base uniquement sur le contexte immédiat?&lt;br /&gt;
   Nous avons besoin d'un segment intermédiaire entre les mots et la phrase.
  On parle de syntagme (groupe) ou de chunk (notion introduite par
  Abney).&lt;br /&gt;
   Pour l'exemple, on pourrait effectuer le découpage suivant:&lt;br /&gt;
   &lt;br /&gt;
   &amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;nbsp; &lt;b&gt;*&lt;/b&gt; &lt;b&gt;&lt;span
  style="color: rgb(255, 102, 102);"&gt;[&lt;/span&gt;La grève &lt;span
  style="color: rgb(255, 204, 0);"&gt;[&lt;/span&gt;des lycéens&lt;span
  style="color: rgb(255, 204, 0);"&gt;]&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span
  style="color: rgb(255, 102, 102);"&gt;]&lt;/span&gt; &lt;span
  style="color: rgb(51, 204, 0);"&gt;[&lt;/span&gt;continuent&lt;span
  style="color: rgb(51, 204, 0);"&gt;]&lt;/span&gt;.&lt;br /&gt;
  &lt;br /&gt;
   &lt;span style="color: rgb(255, 102, 102);"&gt;[ ]&lt;/span&gt;&lt;/b&gt; est un syntagme
  nominal (SN)&lt;b&gt;&lt;br /&gt;
   &lt;span style="color: rgb(51, 204, 0);"&gt;[ ]&lt;/span&gt;&lt;/b&gt; est un syntagme verbal
  (SV)&lt;b&gt;&lt;br /&gt;
   &lt;span style="color: rgb(255, 204, 0);"&gt;[ ]&lt;/span&gt;&lt;/b&gt; est un syntagme
  prépositionnel (SP)&lt;br /&gt;
   &lt;br /&gt;
   Chaque syntagme comporte une tête qui est l'élément principal: nom, verbe,
  préposition (ici &lt;i&gt;de&lt;/i&gt; car &lt;i&gt;des&lt;/i&gt; est la contraction de &lt;i&gt;de
  les&lt;/i&gt;), etc.&lt;br /&gt;
   Le SN s'accorde avec le SV. Si le propriétés du SN ne correspondent pas à
  celles du SV, alors il y a faute.&lt;br /&gt;
   Ici, le SN est féminin singulier, le verbe est au pluriel, il y a pas
  d'unification de traits, il y a faute.&lt;br /&gt;
   &lt;br /&gt;
   Si notre outil ne se limite pas seulement aux mots et permet la notion de
  groupes supérieurs, nous pourrons alors corriger bien des fautes.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_04_15_gramooo_necessite_d</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_15_gramooo_necessite_d/atom?2005_04_15_gramooo_necessite_d"
        title="Edit Here - [GramOOo] nécessité d'un segment intermédiaire entre les mots et la phrase" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] Précision et décision, fin du tagging</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_08_gramooo_tagging" />
  <issued>2005-04-08T14:36:56Z</issued>
  <modified>2005-04-08T14:36:56Z</modified>
  <created>2005-04-08T14:05:18Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous arrivons à la fin du temps que nous avions fixé pour l'étape de
  tagging.
   Bien sûr, il reste encore beaucoup de travail, on ne peut pas avoir un
  excellent outil en si peu de temps.
   
   Toujours est-il que nous avons atteint  98,47 % de décision et 84,4 %
  de précision (uniquement sur les catégories grammaticales).
   Nous avons pu améliorer notre base de règles ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous arrivons à la fin du temps que nous avions fixé pour l'étape de
  tagging.&lt;br /&gt;
   Bien sûr, il reste encore beaucoup de travail, on ne peut pas avoir un
  excellent outil en si peu de temps.&lt;br /&gt;
   &lt;br /&gt;
   Toujours est-il que nous avons atteint&amp;nbsp; 98,47 % de décision et 84,4 %
  de précision (uniquement sur les catégories grammaticales).&lt;br /&gt;
   Nous avons pu améliorer notre base de règles "brutes" (règles par défaut),
  grâce à &lt;a href="http://users.info.unicaen.fr/%7Egiguet/taln98/"&gt;un article
  de J. Vergne et E. Giguet.&lt;br /&gt;
  &lt;/a&gt; &lt;br /&gt;
   Même si le tagger n'est pas parfait, ceci pourra faire l'objet d'un
  prochain travail, nous commençons maintenant l'étape de détection d'erreurs
  grammaticales.&lt;br /&gt;
   &lt;br /&gt;
   La première chose à faire, est de choisir parmi les deux outils dévellopés
  libres dont nous disposons : continuer avec &lt;a
  href="http://borel.slu.edu/gramadoir/"&gt;Gramadoir&lt;/a&gt;, ou choisir &lt;a
  href="http://www.danielnaber.de/languagetool/"&gt;Language tool&lt;/a&gt;?&lt;br /&gt;
   &lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_04_08_gramooo_tagging</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_08_gramooo_tagging/atom?2005_04_08_gramooo_tagging"
        title="Edit Here - [GramOOo] [tagging] Précision et décision, fin du tagging" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] Précision et décision (premiers résulats)</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_05_gramooo_tagging" />
  <issued>2005-04-05T14:42:32Z</issued>
  <modified>2005-04-05T14:42:32Z</modified>
  <created>2005-04-05T08:10:19Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous avons pu nous procurer les outils de la campagne de GRACE afin de mesurer l'avancement
  de notre tagger.
   Nous avions déjà mesuré la décision qui atteint, après l'ajout de quelques
  règles "brutes", un taux de 97%. Cela signifie que 97 mots reconnus sur 100
  (les mots inconnus n'entrent pas en compte) ne sont pas ambigus. 
   Pour mesurer si ces mots sont correctement ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous avons pu nous procurer les outils de la campagne de &lt;a
  href="http://m17.limsi.fr/TLP/grace/"&gt;GRACE&lt;/a&gt; afin de mesurer l'avancement
  de notre tagger.&lt;br /&gt;
   Nous avions déjà mesuré la décision qui atteint, après l'ajout de quelques
  règles "brutes", un taux de 97%. Cela signifie que 97 mots reconnus sur 100
  (les mots inconnus n'entrent pas en compte) ne sont pas ambigus. &lt;br /&gt;
   Pour mesurer si ces mots sont correctement étiquetés, il nous faut le taux
  de précision. Pour le moment, comme nous travaillons encore sur ces mesures
  nous avons pu comparer uniquement les catégories grammaticales (noms,
  verbes, pronoms, etc.) et nous avons obtenu un taux de 73%. &lt;br /&gt;
   73% des mots sont donc étiquetées correctement vis-à-vis de leurs
  catégories grammaticales. &lt;br /&gt;
   La perfection serait évidemment d'atteindre 100 % tant en décision qu'en
  précision (ce qui se traduit par une position&amp;nbsp; en haut à droite sur le
  graphique &lt;a
  href="http://www.limsi.fr/TLP/grace/www/res.06.11.98.gif"&gt;décision/précision&lt;/a&gt;).&lt;br /&gt;

   Mais en attendant, il nous faut faire un choix en fonction du moteur de
  grammaire qui va détecter les fautes.&lt;br /&gt;
   Peut-on garder des ambiguïtés ou faut-il que chaque mot ne comporte
  absolument qu'une seule étiquette quitte à ce que celle-ci ne soit pas
  forcément correcte? En effet, gagner en décision peut faire perdre en
  précision et inversement.&lt;br /&gt;
   Les règles "brutes" qui disent par exemple que "&lt;i&gt;n'importe quel nom
  ambigu est un nom&lt;/i&gt;", permettent de friser les 100% de décision (les mots
  ne sont plus ambigus). Mais elles nécessitent d'être affinées si l'on veut
  progresser en précision.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_04_05_gramooo_tagging</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_04_05_gramooo_tagging/atom?2005_04_05_gramooo_tagging"
        title="Edit Here - [GramOOo] [tagging] Précision et décision (premiers résulats)" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] petit test</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_29_gramooo_tagging_petit" />
  <issued>2005-03-30T10:27:55Z</issued>
  <modified>2005-03-30T10:27:55Z</modified>
  <created>2005-03-29T17:38:10Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  J'ai testé notre tagger avec le petit texte suivant :
   
   Voici une blague de Toto qui fait du surf. Seulement, sur la piste, la
  neige est mauvaise, elle a fondu. Et Toto qui ne sait pas surfer se casse la
  figure. Alors il hurle:
   "Dorénavant je ne ferai plus de surf le week-end de Pâques !"
   Les personnes qui ont skié ce week-end comprendront. Je sais, ce texte ne
  fait ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  J'ai testé notre tagger avec le petit texte suivant :&lt;br /&gt;
   &lt;br /&gt;
   &lt;i&gt;Voici une blague de Toto qui fait du surf. Seulement, sur la piste, la
  neige est mauvaise, elle a fondu. Et Toto qui ne sait pas surfer se casse la
  figure. Alors il hurle:&lt;br /&gt;
   "Dorénavant je ne ferai plus de surf le week-end de Pâques !"&lt;br /&gt;
   Les personnes qui ont skié ce week-end comprendront. Je sais, ce texte ne
  fait pas trop rigoler. Je voulais voir la façon dont il était désambiguïsé.
  Il est désambiguïsé !&lt;/i&gt;&lt;br /&gt;
   &lt;br /&gt;
   Voici la sortie du tagger sans qu'aucune règle ne soit appliquée:&lt;br /&gt;
   Les mots ambigus sont entre balises &amp;lt;B&amp;gt;&amp;lt;/B&amp;gt;&lt;br /&gt;
   &lt;br /&gt;
   &amp;lt;?xml version="1.0" encoding="utf-8" standalone="no"?&amp;gt;&lt;br /&gt;
   &amp;lt;!DOCTYPE teacs SYSTEM "/dtds/gramadoir.dtd"&amp;gt;&lt;br /&gt;
   &amp;lt;teacs&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;A/&amp;gt;&amp;lt;P/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;
  &lt;span style="color: rgb(0, 0, 0);"&gt;Voici&lt;/span&gt;&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D f
  s/&amp;gt;&amp;lt;J f s/&amp;gt;&amp;lt;N f s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;une&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;N f
  s/&amp;gt;&amp;lt;V imp pres 2 s/&amp;gt;&amp;lt;V ind pres 1 s/&amp;gt;&amp;lt;V ind pres 3
  s/&amp;gt;&amp;lt;V sub pres 1 s/&amp;gt;&amp;lt;V sub pres 3
  s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;blague&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;
  &amp;lt;P&amp;gt;&lt;b&gt;de&lt;/b&gt;&amp;lt;/P&amp;gt; &amp;lt;N m s&amp;gt;&lt;b&gt;Toto&lt;/b&gt;&amp;lt;/N&amp;gt; &amp;lt;R rel e
  sp&amp;gt;&lt;b&gt;qui&lt;/b&gt;&amp;lt;/R&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;J m
  s/&amp;gt;&amp;lt;N m s/&amp;gt;&amp;lt;V ind pres 3 s/&amp;gt;&amp;lt;V ppa m
  s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;fait&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;D m
  s&amp;gt;&lt;b&gt;du&lt;/b&gt;&amp;lt;/D&amp;gt; &amp;lt;N m s&amp;gt;&lt;b&gt;surf&lt;/b&gt;&amp;lt;/N&amp;gt;.
  &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;A&amp;gt;&lt;b&gt;Seulement&lt;/b&gt;&amp;lt;/A&amp;gt;, &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;J m
  s/&amp;gt;&amp;lt;P/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;sur&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D f
  s/&amp;gt;&amp;lt;N m sp/&amp;gt;&amp;lt;R pers obj 3 f s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;la&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;N f
  s&amp;gt;&lt;b&gt;piste&lt;/b&gt;&amp;lt;/N&amp;gt;, &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D f
  s/&amp;gt;&amp;lt;N m sp/&amp;gt;&amp;lt;R pers obj 3 f s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;la&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;N f
  s/&amp;gt;&amp;lt;V ind pres 3 s/&amp;gt;&amp;lt;V sub pres 3
  s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;neige&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;J e
  p/&amp;gt;&amp;lt;J e s/&amp;gt;&amp;lt;N m s/&amp;gt;&amp;lt;V etre ind pres 3
  s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;est&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;J f
  s/&amp;gt;&amp;lt;N f s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;mauvaise&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;, &amp;lt;R pers suj 3 f
  s&amp;gt;&lt;b&gt;elle&lt;/b&gt;&amp;lt;/R&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;N m
  sp/&amp;gt;&amp;lt;V avoir ind pres 3 s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;a&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;J m
  s/&amp;gt;&amp;lt;N m s/&amp;gt;&amp;lt;V ppa m s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;fondu&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;C coor&amp;gt;&lt;b&gt;Et&lt;/b&gt;&amp;lt;/C&amp;gt; &amp;lt;N m
  s&amp;gt;&lt;b&gt;Toto&lt;/b&gt;&amp;lt;/N&amp;gt; &amp;lt;R rel e sp&amp;gt;&lt;b&gt;qui&lt;/b&gt;&amp;lt;/R&amp;gt;
  &amp;lt;A&amp;gt;&lt;b&gt;ne&lt;/b&gt;&amp;lt;/A&amp;gt; &amp;lt;V ind pres 3 s&amp;gt;&lt;b&gt;sait&lt;/b&gt;&amp;lt;/V&amp;gt;
  &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;A/&amp;gt;&amp;lt;N m
  sp/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;pas&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;V
  inf&amp;gt;&lt;b&gt;surfer&lt;/b&gt;&amp;lt;/V&amp;gt; &amp;lt;R pers obj 3 sp&amp;gt;&lt;b&gt;se&lt;/b&gt;&amp;lt;/R&amp;gt;
  &lt;span style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;N f
  s/&amp;gt;&amp;lt;N m s/&amp;gt;&amp;lt;V imp pres 2 s/&amp;gt;&amp;lt;V ind pres 1 s/&amp;gt;&amp;lt;V ind
  pres 3 s/&amp;gt;&amp;lt;V sub pres 1 s/&amp;gt;&amp;lt;V sub pres 3
  s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;casse&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D f
  s/&amp;gt;&amp;lt;N m sp/&amp;gt;&amp;lt;R pers obj 3 f s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;la&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;N f
  s/&amp;gt;&amp;lt;V imp pres 2 s/&amp;gt;&amp;lt;V ind pres 1 s/&amp;gt;&amp;lt;V ind pres 3
  s/&amp;gt;&amp;lt;V sub pres 1 s/&amp;gt;&amp;lt;V sub pres 3
  s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;figure&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;A&amp;gt;&lt;b&gt;Alors&lt;/b&gt;&amp;lt;/A&amp;gt; &amp;lt;R pers suj 3 m
  s&amp;gt;&lt;b&gt;il&lt;/b&gt;&amp;lt;/R&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;V imp pres 2
  s/&amp;gt;&amp;lt;V ind pres 1 s/&amp;gt;&amp;lt;V ind pres 3 s/&amp;gt;&amp;lt;V sub pres 1
  s/&amp;gt;&amp;lt;V sub pres 3 s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;hurle&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;:
  &amp;amp;quot;&amp;lt;A&amp;gt;&lt;b&gt;Dorénavant&lt;/b&gt;&amp;lt;/A&amp;gt; &amp;lt;R pers suj 1
  s&amp;gt;&lt;b&gt;je&lt;/b&gt;&amp;lt;/R&amp;gt; &amp;lt;A&amp;gt;&lt;b&gt;ne&lt;/b&gt;&amp;lt;/A&amp;gt; &amp;lt;V ind futu 1
  s&amp;gt;&lt;b&gt;ferai&lt;/b&gt;&amp;lt;/V&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;A/&amp;gt;&amp;lt;D e
  p/&amp;gt;&amp;lt;D e s/&amp;gt;&amp;lt;N m sp/&amp;gt;&amp;lt;V ind psim 1 s/&amp;gt;&amp;lt;V ind psim 2
  s/&amp;gt;&amp;lt;V ppa m p/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;plus&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;
  &amp;lt;P&amp;gt;&lt;b&gt;de&lt;/b&gt;&amp;lt;/P&amp;gt; &amp;lt;N m s&amp;gt;&lt;b&gt;surf&lt;/b&gt;&amp;lt;/N&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D m
  s/&amp;gt;&amp;lt;R pers obj 3 m s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;le&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;N m
  s&amp;gt;&lt;b&gt;week-end&lt;/b&gt;&amp;lt;/N&amp;gt; &amp;lt;P&amp;gt;&lt;b&gt;de&lt;/b&gt;&amp;lt;/P&amp;gt; &amp;lt;N f
  p&amp;gt;&lt;b&gt;Pâques&lt;/b&gt;&amp;lt;/N&amp;gt; !&amp;amp;quot; &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;R pers suj 1 s&amp;gt;&lt;b&gt;Je&lt;/b&gt;&amp;lt;/R&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;V ind pres 1
  s/&amp;gt;&amp;lt;V ind pres 2 s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;sais&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;, &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D m
  s/&amp;gt;&amp;lt;R dem e s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;ce&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;N m
  s&amp;gt;&lt;b&gt;texte&lt;/b&gt;&amp;lt;/N&amp;gt; &amp;lt;A&amp;gt;&lt;b&gt;ne&lt;/b&gt;&amp;lt;/A&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;J m
  s/&amp;gt;&amp;lt;N m s/&amp;gt;&amp;lt;V ind pres 3 s/&amp;gt;&amp;lt;V ppa m
  s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;fait&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;A/&amp;gt;&amp;lt;N m
  sp/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;pas&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;
  &amp;lt;A&amp;gt;&lt;b&gt;trop&lt;/b&gt;&amp;lt;/A&amp;gt; &amp;lt;V inf&amp;gt;&lt;b&gt;rigoler&lt;/b&gt;&amp;lt;/V&amp;gt;.
  &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D e
  p/&amp;gt;&amp;lt;R pers obj 3 p/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;Les&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;N f
  p&amp;gt;&lt;b&gt;personnes&lt;/b&gt;&amp;lt;/N&amp;gt; &amp;lt;R rel e sp&amp;gt;&lt;b&gt;qui&lt;/b&gt;&amp;lt;/R&amp;gt; &amp;lt;V
  avoir ind pres 3 p&amp;gt;&lt;b&gt;ont&lt;/b&gt;&amp;lt;/V&amp;gt; &amp;lt;V ppa m
  s&amp;gt;&lt;b&gt;skié&lt;/b&gt;&amp;lt;/V&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D m
  s/&amp;gt;&amp;lt;R dem e s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;ce&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;N m
  s&amp;gt;&lt;b&gt;week-end&lt;/b&gt;&amp;lt;/N&amp;gt; &amp;lt;V ind futu 3
  p&amp;gt;&lt;b&gt;comprendront&lt;/b&gt;&amp;lt;/V&amp;gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;R pers suj 1 s&amp;gt;&lt;b&gt;Je&lt;/b&gt;&amp;lt;/R&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;V ind impa 1
  s/&amp;gt;&amp;lt;V ind impa 2 s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;voulais&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;V
  inf&amp;gt;&lt;b&gt;voir&lt;/b&gt;&amp;lt;/V&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;D f
  s/&amp;gt;&amp;lt;N m sp/&amp;gt;&amp;lt;R pers obj 3 f s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;la&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt; &amp;lt;N f
  s&amp;gt;&lt;b&gt;façon&lt;/b&gt;&amp;lt;/N&amp;gt; &amp;lt;R rel e sp&amp;gt;&lt;b&gt;dont&lt;/b&gt;&amp;lt;/R&amp;gt; &amp;lt;R
  pers suj 3 m s&amp;gt;il&amp;lt;/R&amp;gt; &amp;lt;V etre ind impa 3
  s&amp;gt;&lt;b&gt;était&lt;/b&gt;&amp;lt;/V&amp;gt; &lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;B&amp;gt;&lt;/span&gt;&amp;lt;Z&amp;gt;&amp;lt;J m
  s/&amp;gt;&amp;lt;V ppa m s/&amp;gt;&amp;lt;/Z&amp;gt;&lt;b&gt;désambiguïsé&lt;/b&gt;&lt;span
  style="color: rgb(255, 153, 0);"&gt;&amp;lt;/B&amp;gt;&lt;/span&gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;/teacs&amp;gt;&lt;br /&gt;
   &lt;br /&gt;
   Et voici la sortie après application des règles :&lt;br /&gt;
   &lt;br /&gt;
   &amp;lt;?xml version="1.0" encoding="utf-8" standalone="no"?&amp;gt;&lt;br /&gt;
   &amp;lt;!DOCTYPE teacs SYSTEM "/dtds/gramadoir.dtd"&amp;gt;&lt;br /&gt;
   &amp;lt;teacs&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;P&amp;gt;Voici&amp;lt;/P&amp;gt; &amp;lt;D f s&amp;gt;une&amp;lt;/D&amp;gt; &amp;lt;N f
  s&amp;gt;blague&amp;lt;/N&amp;gt; &amp;lt;P&amp;gt;de&amp;lt;/P&amp;gt; &amp;lt;N m s&amp;gt;Toto&amp;lt;/N&amp;gt;
  &amp;lt;R rel e sp&amp;gt;qui&amp;lt;/R&amp;gt; &amp;lt;V ind pres 3 s&amp;gt;fait&amp;lt;/V&amp;gt; &amp;lt;D m
  s&amp;gt;du&amp;lt;/D&amp;gt; &amp;lt;N m s&amp;gt;surf&amp;lt;/N&amp;gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;A&amp;gt;Seulement&amp;lt;/A&amp;gt;, &amp;lt;P&amp;gt;sur&amp;lt;/P&amp;gt; &amp;lt;D f
  s&amp;gt;la&amp;lt;/D&amp;gt; &amp;lt;N f s&amp;gt;piste&amp;lt;/N&amp;gt;, &amp;lt;D f s&amp;gt;la&amp;lt;/D&amp;gt;
  &amp;lt;N f s&amp;gt;neige&amp;lt;/N&amp;gt; &amp;lt;V etre ind pres 3 s&amp;gt;est&amp;lt;/V&amp;gt; &amp;lt;J
  f s&amp;gt;mauvaise&amp;lt;/J&amp;gt;, &amp;lt;R pers suj 3 f s&amp;gt;elle&amp;lt;/R&amp;gt; &amp;lt;V
  avoir ind pres 3 s&amp;gt;a&amp;lt;/V&amp;gt; &amp;lt;V ppa m s&amp;gt;fondu&amp;lt;/V&amp;gt;.
  &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;C coor&amp;gt;Et&amp;lt;/C&amp;gt; &amp;lt;N m s&amp;gt;Toto&amp;lt;/N&amp;gt; &amp;lt;R
  rel e sp&amp;gt;qui&amp;lt;/R&amp;gt; &amp;lt;A&amp;gt;ne&amp;lt;/A&amp;gt; &amp;lt;V ind pres 3
  s&amp;gt;sait&amp;lt;/V&amp;gt; &amp;lt;A&amp;gt;pas&amp;lt;/A&amp;gt; &amp;lt;V inf&amp;gt;surfer&amp;lt;/V&amp;gt;
  &amp;lt;R pers obj 3 sp&amp;gt;se&amp;lt;/R&amp;gt; &amp;lt;V ind pres 1 s&amp;gt;casse&amp;lt;/V&amp;gt;
  &amp;lt;D f s&amp;gt;la&amp;lt;/D&amp;gt; &amp;lt;N f s&amp;gt;figure&amp;lt;/N&amp;gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;A&amp;gt;Alors&amp;lt;/A&amp;gt; &amp;lt;R pers suj 3 m s&amp;gt;il&amp;lt;/R&amp;gt;
  &amp;lt;V ind pres 1 s&amp;gt;hurle&amp;lt;/V&amp;gt;:
  &amp;amp;quot;&amp;lt;A&amp;gt;Dorénavant&amp;lt;/A&amp;gt; &amp;lt;R pers suj 1 s&amp;gt;je&amp;lt;/R&amp;gt;
  &amp;lt;A&amp;gt;ne&amp;lt;/A&amp;gt; &amp;lt;V ind futu 1 s&amp;gt;ferai&amp;lt;/V&amp;gt;
  &amp;lt;A&amp;gt;plus&amp;lt;/A&amp;gt; &amp;lt;P&amp;gt;de&amp;lt;/P&amp;gt; &amp;lt;N m s&amp;gt;surf&amp;lt;/N&amp;gt;
  &amp;lt;D m s&amp;gt;le&amp;lt;/D&amp;gt; &amp;lt;N m s&amp;gt;week-end&amp;lt;/N&amp;gt;
  &amp;lt;P&amp;gt;de&amp;lt;/P&amp;gt; &amp;lt;N f p&amp;gt;Pâques&amp;lt;/N&amp;gt; !&amp;amp;quot;
  &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;D e s&amp;gt;Les&amp;lt;/D&amp;gt; &amp;lt;N f p&amp;gt;personnes&amp;lt;/N&amp;gt;
  &amp;lt;R rel e sp&amp;gt;qui&amp;lt;/R&amp;gt; &amp;lt;V avoir ind pres 3 p&amp;gt;ont&amp;lt;/V&amp;gt;
  &amp;lt;V ppa m s&amp;gt;skié&amp;lt;/V&amp;gt; &amp;lt;D m s&amp;gt;ce&amp;lt;/D&amp;gt; &amp;lt;N m
  s&amp;gt;week-end&amp;lt;/N&amp;gt; &amp;lt;V ind futu 3 p&amp;gt;comprendront&amp;lt;/V&amp;gt;.
  &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;R pers suj 1 s&amp;gt;Je&amp;lt;/R&amp;gt; &amp;lt;V ind pres 1
  s&amp;gt;sais&amp;lt;/V&amp;gt;, &amp;lt;D m s&amp;gt;ce&amp;lt;/D&amp;gt; &amp;lt;N m s&amp;gt;texte&amp;lt;/N&amp;gt;
  &amp;lt;A&amp;gt;ne&amp;lt;/A&amp;gt; &amp;lt;V ind pres 3 s&amp;gt;fait&amp;lt;/V&amp;gt;
  &amp;lt;A&amp;gt;pas&amp;lt;/A&amp;gt; &amp;lt;A&amp;gt;trop&amp;lt;/A&amp;gt; &amp;lt;V
  inf&amp;gt;rigoler&amp;lt;/V&amp;gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;R pers suj 1 s&amp;gt;Je&amp;lt;/R&amp;gt; &amp;lt;V ind impa 1
  s&amp;gt;voulais&amp;lt;/V&amp;gt; &amp;lt;V inf&amp;gt;voir&amp;lt;/V&amp;gt; &amp;lt;D f s&amp;gt;la&amp;lt;/D&amp;gt;
  &amp;lt;N f s&amp;gt;façon&amp;lt;/N&amp;gt; &amp;lt;R rel e sp&amp;gt;dont&amp;lt;/R&amp;gt; &amp;lt;R pers suj
  3 m s&amp;gt;il&amp;lt;/R&amp;gt; &amp;lt;V etre ind impa 3 s&amp;gt;était&amp;lt;/V&amp;gt; &amp;lt;V ppa m
  s&amp;gt;désambiguïsé&amp;lt;/V&amp;gt;. &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;line&amp;gt; &amp;lt;R pers suj 3 m s&amp;gt;Il&amp;lt;/R&amp;gt; &amp;lt;V etre ind pres 3
  s&amp;gt;est&amp;lt;/V&amp;gt; &amp;lt;V ppa m s&amp;gt;désambiguïsé&amp;lt;/V&amp;gt; !
  &amp;lt;/line&amp;gt;&lt;br /&gt;
   &amp;lt;/teacs&amp;gt;&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_29_gramooo_tagging_petit</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_29_gramooo_tagging_petit/atom?2005_03_29_gramooo_tagging_petit"
        title="Edit Here - [GramOOo] [tagging] petit test" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] ordre des règles et plusieurs passages</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_29_gramooo_tagging_ordre" />
  <issued>2005-03-29T08:12:54Z</issued>
  <modified>2005-03-29T08:12:54Z</modified>
  <created>2005-03-29T07:52:30Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  L'ordre des règles est très important dans Gramadoir. La première que trouve
  le programme est appliquée. Il faut donc mettre les plus générales à la
  fin.
   Si le contexte qui sert à désambiguïser est lui même ambigu, la règle ne
  s'applique pas.
   Prenons les trois mots suivants:
   
   &amp;lt;line&amp;gt; &amp;lt;R pers suj 3 f s&amp;gt;elle&amp;lt;/R&amp;gt; &amp;lt;V etre ind pres
  3 ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  L'ordre des règles est très important dans Gramadoir. La première que trouve
  le programme est appliquée. Il faut donc mettre les plus générales à la
  fin.&lt;br /&gt;
   Si le contexte qui sert à désambiguïser est lui même ambigu, la règle ne
  s'applique pas.&lt;br /&gt;
   Prenons les trois mots suivants:&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;line&amp;gt; &amp;lt;R pers suj 3 f s&amp;gt;elle&amp;lt;/R&amp;gt; &amp;lt;V etre ind pres
  3 s&amp;gt;est&amp;lt;/V&amp;gt; &amp;lt;V ppa f s&amp;gt;prise&amp;lt;/V&amp;gt;
  &amp;lt;/line&amp;gt;&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   "&lt;i&gt;Elle&lt;/i&gt;" n'est pas ambigu. Il permet de désambiguïser "&lt;i&gt;est&lt;/i&gt;" qui
  peut être un nom, un adjectif ou le verbe être. S'il est précédé d'un pronom
  personnel, alors c'est un verbe. Ensuite, il faut que la règle qui concerne
  la désambiguïsation du participe passé soit placée après, sinon, elle ne va
  pas s'appliquer si "&lt;i&gt;est&lt;/i&gt;" n'est pas encore desambiguïsé. Mais par
  contre, il faut qu'elle soit placé avant les règles sur l'indicatif sinon
  prise sera étiqueté : &lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;V ind pres 1 s&amp;gt;prise&amp;lt;/V&amp;gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;
  &amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/b&gt; (verbe priser)&lt;br /&gt;
   &lt;br /&gt;
   Prenons maintenant le cas "&lt;i&gt;il s'est tu&lt;/i&gt;". Mettons de côté le problème
  du pronom "&lt;i&gt;se&lt;/i&gt;" car nous en l'avons pas encore traité. Si l'on place
  la règle des participes après celle qui dit que "&lt;i&gt;tu&lt;/i&gt;" par défaut et un
  pronom personnel (de même que "&lt;i&gt;il&lt;/i&gt;"), on aura:&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;line&amp;gt; &amp;lt;R pers suj 3 m s&amp;gt;il&amp;lt;/R&amp;gt; s' &amp;lt;V etre ind pres
  3 s&amp;gt;est&amp;lt;/V&amp;gt; &amp;lt;R pers suj 2 s&amp;gt;tu&amp;lt;/R&amp;gt;
  &amp;lt;/line&amp;gt;.&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   "&lt;i&gt;Tu&lt;/i&gt;" est étiqueté comme un pronom personnel.&lt;br /&gt;
   Ceci est problèmatique car la règle des pronoms personnels nécessite d'être
  placée avant la désambiguïsation de verbes sinon cette dernière ne peut pas
  se faire.&lt;br /&gt;
   &lt;br /&gt;
   On pourrait donc avoir besoin de deux passages pour l'application des
  règles. Mais ceci serait-il vraiment nécessaire? Le mot n'attendra pas le
  deuxième passage pour se désambiguïser, il matchera la première règle qu'il
  trouvera.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_29_gramooo_tagging_ordre</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_29_gramooo_tagging_ordre/atom?2005_03_29_gramooo_tagging_ordre"
        title="Edit Here - [GramOOo] [tagging] ordre des règles et plusieurs passages" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] progression</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_22_gramooo_tagging" />
  <issued>2005-03-23T09:32:55Z</issued>
  <modified>2005-03-23T09:32:55Z</modified>
  <created>2005-03-22T14:56:24Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Aujourd'hui nous avons atteint un taux de mots non ambigus de 77% (le taux
  sans aucune règle était de 54%). C'est un bon avancement au niveau de la
  quantité à désambiguïser. Mais cela ne veut pas dire que 77% de mots sont
  bien étiquetés, cela signifie que 77% des mots n'ont qu'un seul tag. D'où
  l'importance de taux tels que "précision" et "décision" qui mesurent à la
  fois le ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Aujourd'hui nous avons atteint un taux de mots non ambigus de 77% (le taux
  sans aucune règle était de 54%). C'est un bon avancement au niveau de la
  quantité à désambiguïser. Mais cela ne veut pas dire que 77% de mots sont
  bien étiquetés, cela signifie que 77% des mots n'ont qu'un seul tag. D'où
  l'importance de taux tels que "précision" et "décision" qui mesurent à la
  fois le nombre de mots non ambigus et le nombre de mots correctement
  étiquetés.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_22_gramooo_tagging</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_22_gramooo_tagging/atom?2005_03_22_gramooo_tagging"
        title="Edit Here - [GramOOo] [tagging] progression" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] difficulté de désambiguïser ce qui n'est pas parfait</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_21_gramooo_tagging" />
  <issued>2005-03-22T08:12:56Z</issued>
  <modified>2005-03-22T08:12:56Z</modified>
  <created>2005-03-21T14:24:53Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous devons garder à l'esprit que les règles vont servir à désambiguïser non
  seulement des phrases correctes, mais aussi et surtout des phrases
  fausses.
   Comme la désambiguïsation se fait sur le contexte droit ou gauche, il faut
  tenir compte du fait qu'il puisse contenir des erreurs.
   Imaginons que l'utilisateur écrive:
       Des chats noir
  
   Et que l'on ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous devons garder à l'esprit que les règles vont servir à désambiguïser non
  seulement des phrases correctes, mais aussi et surtout des phrases
  fausses.&lt;br /&gt;
   Comme la désambiguïsation se fait sur le contexte droit ou gauche, il faut
  tenir compte du fait qu'il puisse contenir des erreurs.&lt;br /&gt;
   Imaginons que l'utilisateur écrive:&lt;br /&gt;
   &lt;i&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp; Des chats noir&lt;br /&gt;
  &lt;br /&gt;
  &lt;/i&gt; Et que l'on ait la règle suivante:&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;N m s&amp;gt;ANYTHING&amp;lt;/N&amp;gt;
  &amp;lt;B&amp;gt;&amp;lt;Z&amp;gt;ANYJMS&amp;lt;/Z&amp;gt;ANYTHING&amp;lt;/B&amp;gt;:&amp;lt;J m s&amp;gt;&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   Cette règle ne va désambiguïser seulement les adjectifs maculins singuliers
  qui sont précédés de noms masculins singuliers. Elle ne désambiguïse que ce
  qui est correct grammaticalement et ne désambiguisera donc pas l'exemple
  ci-dessus car &lt;i&gt;chats&lt;/i&gt; est pluriel et &lt;i&gt;noir&lt;/i&gt; singulier. Par
  conséquent, on ne pourra pas corriger cette faute.&lt;br /&gt;
   Ici la solution est de généraliser le nom qui précède:&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;N&amp;gt;ANYTHING&amp;lt;/N&amp;gt;
  &amp;lt;B&amp;gt;&amp;lt;Z&amp;gt;ANYJMS&amp;lt;/Z&amp;gt;ANYTHING&amp;lt;/B&amp;gt;:&amp;lt;J m s&amp;gt;&lt;/b&gt;&lt;br /&gt;
   (un adjectif masculin singulier ambigu précédé de n'importe quel nom est un
  adjectif masculin singulier).&lt;br /&gt;
   &lt;br /&gt;
   Un autre exemple et celui de &lt;i&gt;ne ... pas&lt;/i&gt;.&lt;br /&gt;
   J'ai créé une règle qui dit que si le mot &lt;i&gt;pas&lt;/i&gt; est précédé de
  &lt;i&gt;ne,&lt;/i&gt; alors il n'est pas un nom mais un adverbe:&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;[Nn]e ANYTHING &amp;lt;B&amp;gt;pas&amp;lt;/B&amp;gt;:&amp;lt;A&amp;gt;&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   Or, il nous arrive souvent d'oublier le &lt;i&gt;ne&lt;/i&gt; pour la négation. Dans ce
  cas, ma règle ne pourra pas désambiguïser &lt;i&gt;pas,&lt;/i&gt; et on ne pourra donc
  pas&amp;nbsp; corriger cette faute. &lt;br /&gt;
   &lt;br /&gt;
   Les règles de désambiguïsation (qu'elles soient manuelles ou basées sur une
  méthode statistique) sont des règles contextuelles (se basent sur le
  contexte) et présupposent donc une cohérence morphosyntaxique. Or, le but
  d'un correcteur grammatical est justement de repérer des fautes de cohérence
  morphosyntaxique. &lt;br /&gt;
   Il faut donc tenir compte de cela lors de la création des règles de
  desambiguïsation.&lt;br /&gt;
   &lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_21_gramooo_tagging</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_21_gramooo_tagging/atom?2005_03_21_gramooo_tagging"
        title="Edit Here - [GramOOo] [tagging] difficulté de désambiguïser ce qui n'est pas parfait" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] évaluation de la progression</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_18_gramooo_tagging" />
  <issued>2005-03-23T09:33:47Z</issued>
  <modified>2005-03-23T09:33:47Z</modified>
  <created>2005-03-18T15:31:34Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous avons sorti quelques chiffres afin de mesurer l'avancement de notre
  tagger.
   Sans qu'aucune règle ne soit appliquée (ni aucune fréquence car elles
  n'entreront en jeu que s'il y a échec des règles), Gramadoir donne 60% de
  mots non ambigus, soit 6 mots sur 10.
   Avec des règles désambiguïsant uniquement les detérminants "le" et "la", on
  gagne 2%. On passe à 65% de non ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous avons sorti quelques chiffres afin de mesurer l'avancement de notre
  tagger.&lt;br /&gt;
   Sans qu'aucune règle ne soit appliquée (ni aucune fréquence car elles
  n'entreront en jeu que s'il y a échec des règles), Gramadoir donne 60% de
  mots non ambigus, soit 6 mots sur 10.&lt;br /&gt;
   Avec des règles désambiguïsant uniquement les detérminants "le" et "la", on
  gagne 2%. On passe à 65% de non ambigüs avec quelques règles sur les
  déterminants, les noms et les adjectifs.&lt;br /&gt;
   Notons que ces dernières ne sont pas encore optimales et vont être
  améliorées. Le gain qu'elles apportent devrait être bien plus conséquent. En
  effet, les SN (= syntagmes nominaux, c'est-à-dire notament déterminant, nom,
  adjectif) sont nombreux dans la langue et les noms sont très souvent
  ambigüs.&lt;br /&gt;
   &lt;br /&gt;
   Nous allons également utiliser les taux de précision et de décision définis
  par la campagne d'évaluation de GRACE (&lt;a
  href="http://www.up.univ-mrs.fr/veronis/Atala/TALN/pdf/A76.pdf"&gt;http://www.up.univ-mrs.fr/veronis/Atala/TALN/pdf/A76.pdf&lt;/a&gt;)
  et qui servent à évaluer des taggers et différents outils linguistiques. La
  précision mesure la capacité à donner un tag, la décision, la capacité à
  donner le bon.&lt;br /&gt;
   Grâce à ces taux nous pourrons voir l'avancement de notre travail de
  manière précise. &lt;br /&gt;
   &lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_18_gramooo_tagging</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_18_gramooo_tagging/atom?2005_03_18_gramooo_tagging"
        title="Edit Here - [GramOOo] [tagging] évaluation de la progression" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[gramOOo] [tagging] premières règles</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_15_gramooo_installation" />
  <issued>2005-03-16T08:42:39Z</issued>
  <modified>2005-03-16T08:42:39Z</modified>
  <created>2005-03-15T16:11:10Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">Les choses avancent!
   Voici un exemple de sortie avant qu'aucune règle de désambiguïsation ne
  soit appliquée.
   
   &amp;lt;B&amp;gt;&amp;lt;Z&amp;gt;&amp;lt;D m s/&amp;gt;&amp;lt;N m s/&amp;gt;&amp;lt;R pers obj 3 m
  s/&amp;gt;&amp;lt;/Z&amp;gt;le&amp;lt;/B&amp;gt; &amp;lt;B&amp;gt;&amp;lt;Z&amp;gt;&amp;lt;A/&amp;gt;&amp;lt;J m s/&amp;gt;&amp;lt;N
  m s/&amp;gt;&amp;lt;/Z&amp;gt;petit&amp;lt;/B&amp;gt; &amp;lt;N m s&amp;gt;test&amp;lt;/N&amp;gt;
   
   Les tags &amp;lt;B&amp;gt; et &amp;lt;Z&amp;gt; servent à marquer les ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">Les choses avancent!&lt;br /&gt;
   Voici un exemple de sortie avant qu'aucune règle de désambiguïsation ne
  soit appliquée.&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;B&amp;gt;&amp;lt;Z&amp;gt;&amp;lt;D m s/&amp;gt;&amp;lt;N m s/&amp;gt;&amp;lt;R pers obj 3 m
  s/&amp;gt;&amp;lt;/Z&amp;gt;le&amp;lt;/B&amp;gt; &amp;lt;B&amp;gt;&amp;lt;Z&amp;gt;&amp;lt;A/&amp;gt;&amp;lt;J m s/&amp;gt;&amp;lt;N
  m s/&amp;gt;&amp;lt;/Z&amp;gt;petit&amp;lt;/B&amp;gt; &amp;lt;N m s&amp;gt;test&amp;lt;/N&amp;gt;&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   Les tags &amp;lt;B&amp;gt; et &amp;lt;Z&amp;gt; servent à marquer les mots ambigus.&lt;br /&gt;
   "Le" était donc étiqueté comme un déterminant, un nom et un pronom
  personnel objet .&lt;br /&gt;
   "petit" était un adverbe (erreur dans le lexique probablement), un adjectif
  et un nom.&lt;br /&gt;
   &lt;br /&gt;
   J'ai appliqué trois premières règles très simples selon la structure de
  Gramadoir:&lt;br /&gt;
   &lt;br /&gt;
   &lt;b&gt;&amp;lt;B&amp;gt;[Pp]etit&amp;lt;/B&amp;gt; &amp;lt;N&amp;gt;ANYTHING&amp;lt;/N&amp;gt;:&amp;lt;J m
  s&amp;gt;&lt;br /&gt;
   &amp;lt;B&amp;gt;[Ll]e&amp;lt;/B&amp;gt; &amp;lt;N&amp;gt;ANYTHING&amp;lt;/N&amp;gt;:&amp;lt;D m s&amp;gt;&lt;br /&gt;
   &amp;lt;B&amp;gt;[Ll]e&amp;lt;/B&amp;gt; &amp;lt;J&amp;gt;ANYTHING&amp;lt;/J&amp;gt;:&amp;lt;D m s&amp;gt;&lt;br /&gt;
  &lt;/b&gt; &lt;br /&gt;
   La première signifie que si le mot ambigu "petit" (avec ou sans majuscule)
  est suivit par n'importe quel mot qui est un nom, alors il est un adjectif
  masculin singulier.&lt;br /&gt;
   La deuxième et la troisième signifient : si le mot ambigu "le" est suivit
  par un nom ou un adjectif alors il est un déterminant masculin
  singulier.&lt;br /&gt;
   &lt;br /&gt;
   Après application de ces règles la sortie est donc:&lt;br /&gt;
  &lt;br /&gt;
   &lt;b&gt;&amp;lt;D m s&amp;gt;le&amp;lt;/D&amp;gt; &amp;lt;J m s&amp;gt;petit&amp;lt;/J&amp;gt; &amp;lt;N m
  s&amp;gt;test&amp;lt;/N&amp;gt;&lt;/b&gt;&lt;br /&gt;
   &lt;br /&gt;
   Ces pemières règles appliquées, nous pourrons maintenant en construire de
  plus générales grâce à des expressions régulières.&lt;br /&gt;</content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_15_gramooo_installation</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_15_gramooo_installation/atom?2005_03_15_gramooo_installation"
        title="Edit Here - [gramOOo] [tagging] premières règles" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[gramOOo] [tagging] Gramadoir, quelques fichiers importants</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_16_gramooo_tagging" />
  <issued>2005-03-21T14:23:11Z</issued>
  <modified>2005-03-21T14:23:11Z</modified>
  <created>2005-03-16T07:05:36Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Quelques mots sur les principaux fichiers de Gramadoir.
   - lexicon-fr.txt : contient toutes les formes fléchies du lexique avec le
  nombre qui correspond à leur tag.
   - pos-fr.txt : liste tous les tags et le nombre qui leur correspond
   - aonchiall-fr.in : répertorie les règles de désambiguïsation du
  tagging
   - macra-fr.meta.pl : macro qui permet de définir des mots qui ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Quelques mots sur les principaux fichiers de Gramadoir.&lt;br /&gt;
   - lexicon-fr.txt : contient toutes les formes fléchies du lexique avec le
  nombre qui correspond à leur tag.&lt;br /&gt;
   - pos-fr.txt : liste tous les tags et le nombre qui leur correspond&lt;br /&gt;
   - aonchiall-fr.in : répertorie les règles de désambiguïsation du
  tagging&lt;br /&gt;
   - macra-fr.meta.pl : macro qui permet de définir des mots qui globalisent
  certains mots pour les règles, à l'aide d'expressions régulières (ex si l'on
  veut dire "n'importe quoi" ou "tous les adjectifs").&lt;br /&gt;
   - unigram-fr-txt : liste les tags par fréquences.&lt;br /&gt;
   &lt;br /&gt;
   Pour plus de détails : &lt;a
  href="http://borel.slu.edu/gramadoir/manual/c409.html"&gt;http://borel.slu.edu/gramadoir/manual/c409.html&lt;/a&gt;&lt;br /&gt;

 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_16_gramooo_tagging</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_16_gramooo_tagging/atom?2005_03_16_gramooo_tagging"
        title="Edit Here - [gramOOo] [tagging] Gramadoir, quelques fichiers importants" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[gramOOo] [tagging] installation de Gramadoir</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_15_gramooo_tagging" />
  <issued>2005-03-16T07:03:54Z</issued>
  <modified>2005-03-16T07:03:54Z</modified>
  <created>2005-03-15T16:31:16Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Quelques mots sur l'installation de Gramadoir-fr.
   Vous devez avoir deux dossiers : 
   - engine  
   - gramadoir-fr-0.01
   Ensuite, il faut taper les lignes de commande suivantes:
   $ cd engine
   $ ./configure
   $ cd ../gramadoir-fr-0.01
   $ ./configure
   $ make rebuildlex
   
   Ensuite, il n'y a plus qu'à suivre les indications sur le site de Kevin P.
  Scannell ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Quelques mots sur l'installation de Gramadoir-fr.&lt;br /&gt;
   Vous devez avoir deux dossiers : &lt;br /&gt;
   - engine&amp;nbsp; &lt;br /&gt;
   - gramadoir-fr-0.01&lt;br /&gt;
   Ensuite, il faut taper les lignes de commande suivantes:&lt;br /&gt;
   $ cd engine&lt;br /&gt;
   $ ./configure&lt;br /&gt;
   $ cd ../gramadoir-fr-0.01&lt;br /&gt;
   $ ./configure&lt;br /&gt;
   $ make rebuildlex&lt;br /&gt;
   &lt;br /&gt;
   Ensuite, il n'y a plus qu'à suivre les indications sur le site de Kevin P.
  Scannell (&lt;a
  href="http://borel.slu.edu/gramadoir/manual/x378.html"&gt;http://borel.slu.edu/gramadoir/manual/x378.html&lt;/a&gt;)
  :&lt;br /&gt;
   &lt;br /&gt;
   $ make&lt;br /&gt;
   (dans le dossier gramadoir-fr-0.01)&lt;br /&gt;
   $ cd Lingua-FR-Gramadoir&lt;br /&gt;
   $ perl Makefile.PL&lt;br /&gt;
   $ make&lt;br /&gt;
   $ make test&lt;br /&gt;
   $ make install&lt;br /&gt;
   Attention, pour cette dernière ligne, vous devez avoir les droits
  root.&lt;br /&gt;
   &lt;br /&gt;
   Pour tester gramadoir, il suffit de faire&lt;br /&gt;
   $ gram-fr.pl monfichier.txt&lt;br /&gt;
   Pour tester uniquement la phase de tagging:&lt;br /&gt;
   $ gram-fr.pl --no-unigram monfichier.txt&lt;br /&gt;
  &lt;br /&gt;
   La désambiguïsation du tagging se fait en deux étapes. D'abord l'aplication
  des règles, puis si c'est règles après deux passages n'ont pas réussi à
  désambiguïser, on applique la fréquence la plus haute aux mots encore
  ambigüs. Gramadoir n'est pas un système probabiliste mais il se sert quand
  même de probabilités!&lt;br /&gt;
   C'est pour cela que l'on utilise l'option --no-unigram pour tester
  l'application de nos règles, mais avant que les fréquences ne soient
  appliquées (elles le sont par défaut, pour les voir, on peut faire l'option
  --xml)&lt;br /&gt;
   &lt;br /&gt;
   Lorsqu'on modifie un fichier, par exemple une règle dans le fichier
  aonchiall-fr.in (là où toutes les règles de désambiguïsation sont
  inscrites)&lt;br /&gt;
   il faut refaire l'installation à partir du "make".&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_15_gramooo_tagging</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_15_gramooo_tagging/atom?2005_03_15_gramooo_tagging"
        title="Edit Here - [gramOOo] [tagging] installation de Gramadoir" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [tagging] avancement du projet</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_07_gramooo" />
  <issued>2005-03-23T09:35:14Z</issued>
  <modified>2005-03-23T09:35:14Z</modified>
  <created>2005-03-07T10:43:50Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">Nous avons maintenant une liste de tags et lexique taggé, les ressources
  pour démarrer le travail de tagging.
   Nous les avons soumises à Kevin
  P. Scannell qui a adapté son programme pour le gaélique (qui contenait
  moins de 255 tags alors que nous en avons plus) pour que nous puissions
  faire une version française.
   J'en profite pour remercier Kevin qui est très présent et nous ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">Nous avons maintenant une liste de tags et lexique taggé, les ressources
  pour démarrer le travail de tagging.&lt;br /&gt;
   Nous les avons soumises à &lt;a href="http://borel.slu.edu/index.html"&gt;Kevin
  P. Scannell&lt;/a&gt; qui a adapté son programme pour le gaélique (qui contenait
  moins de 255 tags alors que nous en avons plus) pour que nous puissions
  faire une version française.&lt;br /&gt;
   J'en profite pour remercier Kevin qui est très présent et nous aide
  beaucoup.&lt;br /&gt;
   Il a donc vu que son programme pouvait prendre en compte le français et a
  sorti un premier résultat:&lt;br /&gt;
   &lt;br /&gt;
   &lt;span style="font-family: monospace;"&gt;&amp;lt;line&amp;gt; &amp;lt;N f
  s&amp;gt;Une&amp;lt;/N&amp;gt; &amp;lt;N f s&amp;gt;première&amp;lt;/N&amp;gt; &amp;lt;N f
  s&amp;gt;version&amp;lt;/N&amp;gt; &amp;lt;V ind pres 3 s&amp;gt;fonctionne&amp;lt;/V&amp;gt;
  &amp;lt;A&amp;gt;parfaitement&amp;lt;/A&amp;gt;. &amp;lt;/line&amp;gt;&lt;/span&gt;&lt;br /&gt;
   &lt;br /&gt;
   Nous voyons déjà dans cet exemple, qu'il y a deux mots ambigus qui ont
  plusieurs étiquettes dans le lexique:&lt;br /&gt;
   &lt;b&gt;Une&lt;/b&gt; a trois tags,&amp;nbsp; &lt;b&gt;première&lt;/b&gt; en a deux :&lt;br /&gt;
   une&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;J f s&amp;gt;&lt;br /&gt;
   une&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;D f s&amp;gt;&lt;br /&gt;
   une&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;N f s&amp;gt;&lt;br /&gt;
   première &amp;lt;N f s&amp;gt;&lt;br /&gt;
   première &amp;lt;J f s&amp;gt;&lt;br /&gt;
   Le tag D correspond à un déterminant, J à un adjectif et N à un nom.&lt;br /&gt;
   Une autre version du tagging est donc par exemple: &lt;br /&gt;
   &lt;br /&gt;
   &lt;span style="font-family: monospace;"&gt;&amp;lt;line&amp;gt; &amp;lt;D f
  s&amp;gt;Une&amp;lt;/D&amp;gt; &amp;lt;J f s&amp;gt;première&amp;lt;/J&amp;gt; &amp;lt;N f
  s&amp;gt;version&amp;lt;/N&amp;gt; &amp;lt;V ind pres 3 s&amp;gt;fonctionne&amp;lt;/V&amp;gt;
  &amp;lt;A&amp;gt;parfaitement&amp;lt;/A&amp;gt;. &amp;lt;/line&amp;gt;&lt;/span&gt;&lt;br /&gt;
   &lt;br /&gt;
   Le programme de Gramadoir pose les tags sur les noms à l'aide du lexique.
  Notre travail va maintenant être de créer des règles françaises afin de
  désambiguïser pour arriver à la suite correcte par exemple ici :
  &amp;lt;D&amp;gt;+&amp;lt;J&amp;gt;+&amp;lt;N&amp;gt;. Les attributs "f" et "s" serviront entre
  autres pour les accords lors de l'étape de construction des règles
  grammaticales.&lt;br /&gt;
   &lt;br /&gt;</content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_07_gramooo</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_07_gramooo/atom?2005_03_07_gramooo"
        title="Edit Here - [GramOOo] [tagging] avancement du projet" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] la liste des tags</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_07_gramooo_liste_tags" />
  <issued>2005-03-08T01:20:31Z</issued>
  <modified>2005-03-08T01:20:31Z</modified>
  <created>2005-03-07T10:10:26Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous avons dressé la liste de toutes les informations
  morphosyntaxiques qui nous seront nécessaires pour faire des
  règles de grammaires efficaces. Ces informations sont
  contenues dans les tags qui étiquettent chaque mot.
   Outre la catégorie grammaticale (nom, verbe, pronoms etc.) il
  nous faut distinguer genre, nombre, personne, temps, mode mais
  aussi les pronoms relatifs des ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous avons dressé la liste de toutes les informations
  morphosyntaxiques qui nous seront nécessaires pour faire des
  règles de grammaires efficaces. Ces informations sont
  contenues dans les tags qui étiquettent chaque mot.&lt;br /&gt;
   Outre la catégorie grammaticale (nom, verbe, pronoms etc.) il
  nous faut distinguer genre, nombre, personne, temps, mode mais
  aussi les pronoms relatifs des pronoms personnels, mais encore
  les pronoms personnels sujets des pronoms personnels objets
  etc.&lt;br /&gt;
   Ceci permettra de corriger les fautes d'accord comme
  &lt;i&gt;il&lt;span style="color: rgb(255, 0, 0);"&gt;s&lt;/span&gt; dans&lt;span
  style="color: rgb(255, 0, 0);"&gt;e&lt;/span&gt;&lt;/i&gt; ou des fautes
  comme &lt;i&gt;&lt;span style="color: rgb(255, 0, 0);"&gt;me&lt;/span&gt;
  lave&lt;/i&gt;, il y a un pronom personel objet mais cette phrase
  n'a pas de sujet.&lt;br /&gt;
   Nous avons aussi spécialement taggué les auxiliaires être et
  avoir de manière à pouvoir gérer les temps composés et les
  accords de participes passés. Par exemple: &lt;br /&gt;
   &lt;i&gt;Elle est aim&lt;span
  style="color: rgb(255, 0, 0);"&gt;é&lt;/span&gt;&lt;/i&gt;&lt;br /&gt;
   On a l'auxiliaire être + participe passé, donc il doit y
  avoir accord en genre et en nombre avec le pronom personnel
  sujet, donc il y a erreur.&lt;br /&gt;
   &lt;br /&gt;
   Tout cela paraît être un détail, mais ce n'est pas le cas,
  plus nous aurons d'informations sur les mots, plus nous
  pourrons construire des règles grammaticales par la suite, et
  plus elles seront précises et efficaces.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_07_gramooo_liste_tags</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_07_gramooo_liste_tags/atom?2005_03_07_gramooo_liste_tags"
        title="Edit Here - [GramOOo] la liste des tags" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] le lexique pour le tagging</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_06_gramooo_lexique_pour" />
  <issued>2005-03-08T01:20:42Z</issued>
  <modified>2005-03-08T01:20:42Z</modified>
  <created>2005-03-06T09:06:17Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous avons donc commencé l'étape de tagging du correcteur
  grammatical sur le modèle de Gramadoir.
   Pour cela, nous avons besoin d'un lexique taggé c'est-à-dire
  une liste de mots avec les étiquettes morphosyntaxiques qui
  leur correspondent. Nous avons choisi DICO le dictionnaire de
  l'ABU,
  la bibliothèque universelle. Il a fallut réadapter ce
  dictionnaire au format dont nous avions ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous avons donc commencé l'étape de tagging du correcteur
  grammatical sur le modèle de Gramadoir.&lt;br /&gt;
   Pour cela, nous avons besoin d'un lexique taggé c'est-à-dire
  une liste de mots avec les étiquettes morphosyntaxiques qui
  leur correspondent. Nous avons choisi DICO le dictionnaire de
  l'&lt;a href="http://abu.cnam.fr/DICO/mots-communs.html"&gt;ABU&lt;/a&gt;,
  la bibliothèque universelle. Il a fallut réadapter ce
  dictionnaire au format dont nous avions besoin. Nous avons
  aussi créé une liste de tags qui nous serons
  nécessaires.&lt;br /&gt;
   DICO est de la forme:&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp;
  Nom:Fem+SG&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; abaisser&amp;nbsp;&amp;nbsp;
  Ver:IPre+SG+P1:IPre+SG+P3:SPre+SG+P1:SPre+SG+P3:ImPre+SG+P2&lt;br /&gt;
   Et Laurent a fait un programme permettant de le transformer
  avec les tags:&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;N f s&amp;gt;&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;V ind pres s 1&amp;gt;&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;V ind pres s 3&amp;gt;&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;V sub pres s 1&amp;gt;&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;V sub pres s 3&amp;gt;&lt;br /&gt;
   abaisse&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;lt;V imp pres s 2&amp;gt;&lt;br /&gt;
   ...&lt;br /&gt;
   &lt;br /&gt;
   Nous pouvons noter que ces tags sont très proches d'une
  structure XML. Nous ferons dans peu de temps un autre
  programme permettant de transformer ces tags en réel format
  XML. De celle manière, notre tagger pourra étiquetter des
  textes en format XML, ce qui augmentera son utilité. &lt;br /&gt;
   &lt;br /&gt;
   Ensuite, nous avons transformé les tags en codes numériques,
  ce qui nous donne le fichier suivant, moins lourd qu'un
  fichier balisé:&lt;br /&gt;
   abaisse 37&lt;br /&gt;
   abaisse 230&lt;br /&gt;
   abaisse 236&lt;br /&gt;
   abaisse 261&lt;br /&gt;
   abaisse 265&lt;br /&gt;
   abaisse 216&lt;br /&gt;
   ...&lt;br /&gt;
   &lt;br /&gt;
   Nous avons également dû faire quelques modifications sur
  DICO. En effet, c'est un dictionnaire qui a été étiqueté
  automatiquement, il comporte donc des bugs et quelques petites
  incohérences, parfois, d'étiquetage.&lt;br /&gt;
   Nous avons donc maintenant un lexique prêt à être employé,
  qui comporte 345338 entrées et de nombreuses informations
  morphosyntaxiques qui nous seront nécessaires. Il n'est sans
  doute ni parfait ni complet, mais nous pourrons le mettre à
  disposition de quiquonque voudra bien signaler erreurs et/ou
  omissions.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_06_gramooo_lexique_pour</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_06_gramooo_lexique_pour/atom?2005_03_06_gramooo_lexique_pour"
        title="Edit Here - [GramOOo] le lexique pour le tagging" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Choix pour l'étape de tagging</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_04_gramooo_choix_pour_etape" />
  <issued>2005-03-08T01:20:41Z</issued>
  <modified>2005-03-08T01:20:41Z</modified>
  <created>2005-03-04T16:14:01Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous avons maintenant pris une décision en ce qui concerne le
  choix d'un modèle pour l'étape du tagging (étiquetage). Le
  tagging et les règles grammaticales qui détectent les fautes
  sont deux étapes différentes et qui peuvent être
  indépendantes. Nous avons donc établi deux étapes à notre
  projet.
   En effet, un tagger peut être une base pour un autre outil,
  et pas seulement la ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous avons maintenant pris une décision en ce qui concerne le
  choix d'un modèle pour l'étape du tagging (étiquetage). Le
  tagging et les règles grammaticales qui détectent les fautes
  sont deux étapes différentes et qui peuvent être
  indépendantes. Nous avons donc établi deux étapes à notre
  projet.&lt;br /&gt;
   En effet, un tagger peut être une base pour un autre outil,
  et pas seulement la détection de fautes (par exemple le résumé
  automatique ou la création d'exercices pédagogiques). C'est le
  traitement lingiustique qui est la base à toute analyse de
  texte. &lt;br /&gt;
   Il est important de s'attarder sur cette phase de tagging car
  si elle contient trop d'erreurs, elle ne permettra pas de
  détecter les fautes grammaticales. A titre d'illustration, 10%
  de tagging, sur une moyenne de 10 mots par phrase représentent
  une erreur par phrase et donc réduirait considérablement la
  détection de fautes.&lt;br /&gt;
   &lt;br /&gt;
   Donc la phase de conception d'un correcteur grammatical passe
  inévitablement par la conception d'un taggeur, et à l'heure
  actuelle, nous avons décidé d'uliliser le modèle de &lt;a
  href="http://borel.slu.edu/gramadoir/"&gt;Gramadoir&lt;/a&gt; de Kevin
  P. Scannell. C'est un modèle à base d'un lexique et de règles
  de désambiguïsation. &lt;br /&gt;
   Nous avons choisi Gramadoir plutôt qu'un modèle statistique
  car ce dernier nécessite un corpus taggé, que nous n'avons pas
  à disposition car il n'en existe pas en libres droits. De
  plus, comme le tagging statistique effectue un apprentissage
  sur corpus, l'étiquetage est dépendant de ce corpus, et donc
  s'il y a des erreurs, il n'y a aucun recours, tandis qu'avec
  des règles, on peut retrouver d'où vient l'erreur
  d'étiquetage.&lt;br /&gt;
   Voilà les raisons qui nous ont conduis à choisir Gramadoir
  pour le tagging.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_03_04_gramooo_choix_pour_etape</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_03_04_gramooo_choix_pour_etape/atom?2005_03_04_gramooo_choix_pour_etape"
        title="Edit Here - [GramOOo] Choix pour l'étape de tagging" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Les différentes méthodes de tagging</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_differentes" />
  <issued>2005-03-08T01:20:36Z</issued>
  <modified>2005-03-08T01:20:36Z</modified>
  <created>2005-02-25T10:46:12Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">Il existe plusieurs méthodes de tagging, soit à partir de
  règles, soit à partir de probabilités. La méthode basée sur
  des probabilités prend en entrée un corpus étiqueté sur lequel
  va s'effectuer un apprentissage automatique. Cela signifie que
  les résultats seront entièrement dépendants de ce corpus qui
  doit donc contenir un maximum de mots et sans erreurs
  d'étiquetage pour être ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">Il existe plusieurs méthodes de tagging, soit à partir de
  règles, soit à partir de probabilités. La méthode basée sur
  des probabilités prend en entrée un corpus étiqueté sur lequel
  va s'effectuer un apprentissage automatique. Cela signifie que
  les résultats seront entièrement dépendants de ce corpus qui
  doit donc contenir un maximum de mots et sans erreurs
  d'étiquetage pour être efficace. On peut y ajouter des règles
  qui permettront de tagger les mots inconnus. Par exemple, "si
  un mot se termine par -isme, c'est un nom masculin
  singulier".&lt;br /&gt;
   Il n'existe à l'heure actuelle aucun corpus taggé libre de
  droits, et la construction d'un tel corpus est un travail
  colossal devant être effectué à la main par plusieurs
  linguistes.&lt;br /&gt;
   &lt;br /&gt;
   La méthode basée sur des règles s'appuie sur un lexique (ou
  dictionnaire) contenant des informations morphosyntaxiques,
  c''est-à-dire la catégorie, le genre, le nombre, le temps, le
  mode... Chaque mot est étiqueté à partir de ce lexique, puis
  est désambiguïsé à l'aide de règles. Par exemple, si un mot
  est suivi par un adjectif et un nom, ce doit être un
  déterminant.&lt;br /&gt;
   Des lexiques du français libres de droits existent. On en
  trouve par exemple sur &lt;a
  href="http://www.lexique.org/"&gt;www.lexique.org&lt;/a&gt; ou &lt;a
  href="http://abu.cnam.fr/DICO/mots-communs.html"&gt;http://abu.cnam.fr/DICO/mots-communs.html&lt;/a&gt;.
  &lt;br /&gt;
   Lors d'un projet universitaire, nous avons utilisés ces deux
  dictionnaires pour les fusionner et créer un dictionnaire
  destiné aux TAL (traitement automatique des langues).
  Malheureusement, le résultat n'est pas encore définitif et il
  n'est donc pas utilisable dans l'immédiat.&lt;br /&gt;
   &lt;br /&gt;
   Conernant les méthodes de tagging, il a été réalisé une
  campagne d'évaluation&amp;nbsp; de corpus, &lt;a
  href="http://www.limsi.fr/RS99FF/CHM99FF/TLP99FF/tlp10/"&gt;GRACE&lt;/a&gt;
  (Grammaire et Ressources pour les Analyseurs de Corpus et leur
  Évaluation) de 1994 à 1998. Cette campagne a testé plusieurs
  taggers et plusieurs méthodes de tagging.&lt;br /&gt;</content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_25_gramooo_differentes</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_differentes/atom?2005_02_25_gramooo_differentes"
        title="Edit Here - [GramOOo] Les différentes méthodes de tagging" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Règles d'erreurs ou règles prescriptives ?</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_regles_d_erreurs" />
  <issued>2005-03-08T01:20:38Z</issued>
  <modified>2005-03-08T01:20:38Z</modified>
  <created>2005-02-25T14:44:21Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Même si nous n'en sommes pas encore arrivé là, une grande
  question se pose concernant la création de règles
  grammaticales visant à détecter les erreurs.
   Vaut-il mieux écrire des règles d'erreurs, c'est-à-dire
  décrire toutes les erreurs possibles, ou vaut-il mieux décrire
  ce  qui est juste, c'est-à-dire faire des règles de la
  grammaire telle qu'elle devrait être (grammaire
  ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Même si nous n'en sommes pas encore arrivé là, une grande
  question se pose concernant la création de règles
  grammaticales visant à détecter les erreurs.&lt;br /&gt;
   Vaut-il mieux écrire des règles d'erreurs, c'est-à-dire
  décrire toutes les erreurs possibles, ou vaut-il mieux décrire
  ce&amp;nbsp; qui est juste, c'est-à-dire faire des règles de la
  grammaire telle qu'elle devrait être (grammaire
  prescriptive)?&lt;br /&gt;
   Si la phrase colle avec une règle, c'est qu'il y a une faute.
  Dans le deuxième, si la phrase ne colle avec aucune des
  règles, c'est qu'il y a une faute.&lt;br /&gt;
   &lt;br /&gt;
   Cas 1: Règles d'erreurs:&lt;br /&gt;
   Exemple: Nfem sing + Adj fem plur = erreur&lt;br /&gt;
   La génération de règles d'erreurs serait infinie. Il semble
  impossible ou du moins bien limité de pouvoir décrire toutes
  les fautes imaginables dans la langue. Cette méthode à
  l'avantage&amp;nbsp; de ne créer que peu ou pas de bruit, mais
  laisse des silences, des fautes seront oubliées.&lt;br /&gt;
   Le bruit est la génération de "fausses fautes", c'est-à-dire
  que des mots justes seront détectés comme étant faux. Le
  silence correspond à des fautes qui ne sont pas détectées.
  &lt;br /&gt;
   Dans ce cas donc, on peut dire que lorsque l'on détecte une
  faute, on peut être sûr que c'est une "vraie faute", mais on
  ne peut pas toutes les détecter.&lt;br /&gt;
   &lt;br /&gt;
   Cas 2: Règles prescriptives&lt;br /&gt;
   La génération de règles dites préscriptives, qui décrivent la
  grammaire "correcte" serait peut être moins longue mais
  apporterait énormément de bruit puisque tout ce qui ne
  correspondra pas à ce qui a été décrit comme "juste", tout ce
  qui ne correspondra à aucune règle, sera faux. &lt;br /&gt;
   Cette méthode pourrait donc proposer des mots faux alors
  qu'ils sont justes. Il faut penser à l'utilisateur, cela peut
  être gênant qu'on nous dise que l'on a fait une erreur alors
  que ce n'est pas le cas. &lt;br /&gt;
   &lt;br /&gt;
   En résumé:&lt;br /&gt;
   &amp;nbsp;&amp;nbsp; - règles d'erreurs:&lt;br /&gt;
   &amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;nbsp;&amp;nbsp; &amp;nbsp; règles infinies&lt;br /&gt;
   &amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;nbsp; peu de bruit,
  mais du silence. &lt;br /&gt;
   &amp;nbsp;&amp;nbsp; - règles prescriptives:&lt;br /&gt;
   &amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;nbsp; moins de règles&lt;br /&gt;
   &amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;nbsp;&amp;nbsp;&amp;nbsp; mais beaucoup de
  bruit&lt;br /&gt;
   &lt;br /&gt;
   Je ne sais pas si j'ai été claire, mais nous reviendrons sur
  cette question...&lt;br /&gt;
   &lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_25_gramooo_regles_d_erreurs</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_regles_d_erreurs/atom?2005_02_25_gramooo_regles_d_erreurs"
        title="Edit Here - [GramOOo] Règles d'erreurs ou règles prescriptives ?" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [Gramadoir] principes</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_gramadoir" />
  <issued>2005-03-08T01:20:37Z</issued>
  <modified>2005-03-08T01:20:37Z</modified>
  <created>2005-02-25T08:22:45Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">Gramadóir ( http://borel.slu.edu/gramadoir/
  ) est un correcteur grammatical développé pour le gaélique, en Perl par Kevin P. Scannell. D'autres
  versions sont disponibles ou en cours d'élaboration pour d'autres langues
  "minoritaires" telles que le wallon, le gallois, le breton,  le
  norvégien, le tagalog, etc.
   L'entrée de Gramadóir est une liste de mots étiquetés, avec une ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">&lt;p style="margin-bottom: 0cm;"&gt;Gramadóir ( &lt;a
  href="http://borel.slu.edu/gramadoir/"&gt;http://borel.slu.edu/gramadoir/&lt;/a&gt;
  ) est un correcteur grammatical développé pour le gaélique, en Perl par &lt;a
  href="http://borel.slu.edu/index.html"&gt;Kevin P. Scannell&lt;/a&gt;. D'autres
  versions sont disponibles ou en cours d'élaboration pour d'autres langues
  "minoritaires" telles que le wallon, le gallois, le breton,&amp;nbsp; le
  norvégien, le tagalog, etc.&lt;br /&gt;
   L'entrée de Gramadóir est une liste de mots étiquetés, avec une ligne par
  forme, même pour les mots ambigüs. Par exemple:&lt;br /&gt;
   couvent: N masc sing&lt;br /&gt;
   couvent: V 3ème pers plur ind présent&lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;A partir de cette liste, après avoir découpé
  le texte à traiter en phrases et en mots, il tagge les mots. Puis il les
  désambiguïse à l'aide de règles. Puis, grâce à des règles grammaticales
  construites à partir de tags et d'expressions régulières, il détecte les
  erreurs grammaticales. Il retourne la phrase à l'utilisateur, avec la
  séquence fausse en rouge en suggérant par exemple:&lt;br /&gt;
   forme non conforme, utilisez plutôt /scata/.&lt;br /&gt;
  &lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;Le programme principal est gram-xx.pl (xx
  étant le code ISO 639-1 pour le pays).&lt;br /&gt;
  &lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;Les trois fichiers de bases de règles
  sont:&lt;/p&gt;

  &lt;ul&gt;
   &lt;li&gt;
    &lt;p style="margin-bottom: 0cm;"&gt;Comhshuite-xx.in : Chunking&lt;/p&gt;
   &lt;/li&gt;

   &lt;li&gt;
    &lt;p style="margin-bottom: 0cm;"&gt;Aonchiall-xx.in : Désambiguïsation des POS
    tags à partir de règles.&lt;/p&gt;
   &lt;/li&gt;

   &lt;li&gt;
    &lt;p style="margin-bottom: 0cm;"&gt;Rialacha-xx.in : Règles d'erreurs de
    grammaire, et exceptions.&lt;/p&gt;
   &lt;/li&gt;
  &lt;/ul&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;Toutes les fonctions Perl utilisées sont
  décrites dans le programme Gramadoir.pm.&lt;br /&gt;
  &lt;br /&gt;
  &lt;/p&gt;</content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_25_gramooo_gramadoir</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_gramadoir/atom?2005_02_25_gramooo_gramadoir"
        title="Edit Here - [GramOOo] [Gramadoir] principes" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Importance du tagging</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_importance_du" />
  <issued>2006-11-05T18:27:53Z</issued>
  <modified>2006-11-05T18:27:53Z</modified>
  <created>2005-02-25T09:23:22Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">Afin de corriger des fautes de grammaire, un pré-traitement
  efficace du texte est indispensable. En effet, pour
  reconnaitre une faute d'accord entre un nom et son adjectif
  par exemple, il faut avoir détecté sans erreur que tel mot est
  un nom et tel mot est un adjectif. Ceci est la phase de
  tagging. Il s'agit de donner une étiquette morpho-syntaxique à
  chaque mot. Et il ne suffit ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">Afin de corriger des fautes de grammaire, un pré-traitement
  efficace du texte est indispensable. En effet, pour
  reconnaitre une faute d'accord entre un nom et son adjectif
  par exemple, il faut avoir détecté sans erreur que tel mot est
  un nom et tel mot est un adjectif. Ceci est la phase de
  tagging. Il s'agit de donner une étiquette morpho-syntaxique à
  chaque mot. Et il ne suffit pas seulement d'étiqueter avec
  "nom" ou "adjectif", mais il est nécesaire d'inclure des
  traits comme genre (féminin, masculin) et nombre (singulier,
  pluriel) qui permettront de détecter que si l'adjectif est au
  masculin et que le nom est au féminin, il y a une faute
  d'accord.&lt;br /&gt;
   Cette étape de tagging est la base du traitement pour une
  analyse grammaticale. Elle est indispensable et de sa qualité
  et ses résultats dépendront la rédaction des règles de
  détection d'erreurs.&lt;br /&gt;
   De plus, en français, de nombreux mots peuvent être ambigüs,
  il est donc important de bien les traiter pour ne pas fausser
  la détection d'erreurs.&lt;br /&gt;
   &lt;br /&gt;</content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_25_gramooo_importance_du</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_25_gramooo_importance_du/atom?2005_02_25_gramooo_importance_du"
        title="Edit Here - [GramOOo] Importance du tagging" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [Grac] principes</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_21_grac_principes" />
  <issued>2005-05-16T12:08:06Z</issued>
  <modified>2005-05-16T12:08:06Z</modified>
  <created>2005-02-21T17:09:14Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Maxime Biais dévelloppe actuellement Grac, un correcteur grammatical
  indépendant d'une langue particulière et programmé en Python.

  Grac nécessite une phase d'apprentissage,
  afin de créer une base de connaissances probabiliste et une base de règles
  de grammaire. Il faut donc un corpus étiqueté et un corpus ne contenant
  aucune erreur grammaticale.

  On découpe le texte en ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  &lt;p style="margin-bottom: 0cm;"&gt;Maxime Biais dévelloppe actuellement &lt;a
  href="http://grac.sourceforge.net/"&gt;Grac&lt;/a&gt;, un correcteur grammatical
  indépendant d'une langue particulière et programmé en Python.&lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;Grac nécessite une phase d'apprentissage,
  afin de créer une base de connaissances probabiliste et une base de règles
  de grammaire. Il faut donc un corpus étiqueté et un corpus ne contenant
  aucune erreur grammaticale.&lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;On découpe le texte en phrases et en mots. On
  traite le texte avec un tagger afin d'étiqueter les mots non ambigus. Puis
  on utilise un système de probabilités basé sur des enchaînements de trois
  tags possibles pour étiqueter les mots ambigus. Les enchaînements possibles
  sont contenus dans une base.&lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;Ensuite, on passe par deux phases de
  détection d'erreurs grammaticales (GDE). La première est la phase
  d'apprentissage qui se base sur un corpus étiqueté, sans erreur de grammaire
  pour créér des règles qui sont une liste de TAG probables. La deuxième phase
  se base sur ces règles pour déterminer les erreurs. Quand on applique ces
  règles au texte à traiter, si aucune ne correspond, c'est qu'il y a une
  faute.&lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;Grac ne possède pas encore de documentation
  très détaillée car il est encore en cours de dévelloppement.&lt;/p&gt;

  &lt;p style="margin-bottom: 0cm;"&gt;Les parties GED ne sont à l'heure actuelle
  pas encore développées.&lt;/p&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_21_grac_principes</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_21_grac_principes/atom?2005_02_21_grac_principes"
        title="Edit Here - [GramOOo] [Grac] principes" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [Languagetool] programmes et règles</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_21_languagetool_programme" />
  <issued>2005-03-08T01:20:40Z</issued>
  <modified>2005-03-08T01:20:40Z</modified>
  <created>2005-02-21T12:47:49Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Le programme de Languagetool se divise en plusieurs modules
  python: SentenceSplitter, Tag, tagger, chunk, Check, rules...
  TextChecker est le programme principal.  On peut
  télécharger la dernière version du package à l'adresse : http://sourceforge.net/cvs/?group_id=110216.
   Les règles sont décrites en XML dans les fichiers
  grammar.xml, words.xml et false_friends.xml (tous trois
  ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Le programme de Languagetool se divise en plusieurs modules
  python: SentenceSplitter, Tag, tagger, chunk, Check, rules...
  TextChecker est le programme principal.&amp;nbsp; On peut
  télécharger la dernière version du package à l'adresse : &lt;a
  href="http://sourceforge.net/cvs/?group_id=110216"&gt;http://sourceforge.net/cvs/?group_id=110216&lt;/a&gt;.&lt;br /&gt;
   Les règles sont décrites en XML dans les fichiers
  grammar.xml, words.xml et false_friends.xml (tous trois
  précédés de &lt;i&gt;en,&lt;/i&gt; &lt;i&gt;hu&lt;/i&gt;, ou &lt;i&gt;de&lt;/i&gt; selon qu'il
  s'agit de l'anglais, du hongrois ou de l'allemand). Les règles
  décrites pour l'anglais corrigent surtout des fautes de
  proximité orthographique ou phonétique telle que &lt;i&gt;there&lt;/i&gt;
  au lieu de &lt;i&gt;their&lt;/i&gt;, &lt;i&gt;us/use&lt;/i&gt;, &lt;i&gt;no/now&lt;/i&gt;, etc.
  &lt;br /&gt;
   Ces règles sont précises et permettent de traiter beaucoup de
  fautes, mais nécessiteraient d'être affinées, notamment celles
  qui concernent les accords sujet/verbe qui ne sont pas
  toujours traités justement. Quoi qu'il en soit, elles pourront
  servir de modèle à l'écriture de règles propres à la grammaire
  française.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_21_languagetool_programme</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_21_languagetool_programme/atom?2005_02_21_languagetool_programme"
        title="Edit Here - [GramOOo] [Languagetool] programmes et règles" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] Eléments linguistiques nécessaires</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_18_correcteur_grammatical" />
  <issued>2005-03-08T01:20:44Z</issued>
  <modified>2005-03-08T01:20:44Z</modified>
  <created>2005-02-18T14:38:16Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Nous n'avons pas encore décidé quel correcteur sera le mieux
  adaptable au français, mais une certitude selon moi est que
  pour faire un bon outil, il nous faut une analyse syntaxique
  complète : découpage en formes, tagging (c'est-à-dire
  étiquetage morphosyntaxique), chunking (découpage en syntagmes
  verbaux, nominaux etc.).
   Des outils de tagging existent. Certains sont ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  Nous n'avons pas encore décidé quel correcteur sera le mieux
  adaptable au français, mais une certitude selon moi est que
  pour faire un bon outil, il nous faut une analyse syntaxique
  complète : découpage en formes, tagging (c'est-à-dire
  étiquetage morphosyntaxique), chunking (découpage en syntagmes
  verbaux, nominaux etc.).&lt;br /&gt;
   Des outils de tagging existent. Certains sont probalilistes,
  d'autres basés sur des règles (par exemple WinBrill) et
  d'autres, comme celui de languagetool combinent règles et
  probabilités.&lt;br /&gt;
   &lt;a
  href="http://www.revue-texto.net/Corpus/manufacture/trousse/pub/Taggers.htm"&gt;
  Winbrill&lt;/a&gt;, créé par &lt;a
  href="http://research.microsoft.com/users/brill/"&gt;Eric
  Brill&lt;/a&gt; est un bon étiquetteur dont on pourra
  s'insirer.&lt;br /&gt;
   Nous aurons également besoin d'un corpus étiqueté du français
  pour la phase d'apprentissage du tagger. De la finesse des
  tags dépendra la qualité du traitement et donc du
  correcteur.&lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_18_correcteur_grammatical</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_18_correcteur_grammatical/atom?2005_02_18_correcteur_grammatical"
        title="Edit Here - [GramOOo] Eléments linguistiques nécessaires" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">[GramOOo] [Languagetool] Principes</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_17_test" />
  <issued>2005-05-16T15:03:31Z</issued>
  <modified>2005-05-16T15:03:31Z</modified>
  <created>2005-02-17T15:22:47Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Languagetool est un
  correcteur de style et de grammaire pour l'anglais créé par Daniel Naber. Il
  est écrit en Python.
   C'est un système « rule-based », c'est-à-dire basé sur des règles
  syntaxiques écrites à la main.
   Il procède à plusieurs étapes d'analyse grammaticale.
   Il faut découper le texte en phrases, puis à chaque espace pour obtenir une
  liste de mots. Il ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  &lt;a href="http://www.danielnaber.de/languagetool/"&gt;Languagetool&lt;/a&gt; est un
  correcteur de style et de grammaire pour l'anglais créé par Daniel Naber. Il
  est écrit en Python.&lt;br /&gt;
   C'est un système « rule-based », c'est-à-dire basé sur des règles
  syntaxiques écrites à la main.&lt;br /&gt;
   Il procède à plusieurs étapes d'analyse grammaticale.&lt;br /&gt;
   Il faut découper le texte en phrases, puis à chaque espace pour obtenir une
  liste de mots. Il étiquette ces mots (phase de tagging), puis il découpe en
  syntagmes (chunks) c'est-à-dire des groupes nominaux, verbaux etc. Ensuite,
  il applique des règles écrites en XML.&lt;br /&gt;
   Le tagging est basé sur des probabilités et des règles. Il créé deux
  tableaux associatifs. Le premier expose le mot, son étiquette (c'est-à-dire
  sa catégorie grammaticale et des informations morphologiques) et la
  probabilité qui correspond au tag. Le deuxième montre une suite de deux tags
  avec la probabilité correspondant à cette séquence (par exemple sequence
  [(DET, AJ0)] = 0,1] signifie que la probabilité qu'un adjectif suive un
  déterminant est de 0,1). &lt;br /&gt;
   Plusieurs mots peuvent être ambigus, on prend alors une suite une séquence
  de trois mots et on regarde les probabilités que ces trois mots se suivent
  (par exemple qu'un déterminant soit suivit d'un nom et d'un adjectif) et on
  sélectionne la plus haute probabilité. On avance d'un mot et on continue le
  traitement.&lt;br /&gt;
   Daniel Naber ajoute une phase à son tagger probabiliste. Si le résultat du
  tagger n'est pas correct et des mots nécessites d'être désambiguïsés, des
  règles écrites manuellement sont appliquées.&lt;br /&gt;
   Ensuite vient la phase de chunking qui est basée sur des règles. Par
  exemple, un NP (noun phrase c'est-à-dire un syntagme nominal) se compose
  d'un déterminant et d'un nom.&lt;br /&gt;
   Enfin vient la phase de grammaire basée sur de règles XML. Ces règles sont
  dépendantes des étiquettes. Elles se composent de plusieurs éléments :
  &lt;br /&gt;
   - &lt;i&gt;id&lt;/i&gt; et &lt;i&gt;name&lt;/i&gt; qui sont l'identifiant et le nom de la
  règle&lt;br /&gt;
   - &lt;i&gt;pattern&lt;/i&gt; qui décrit ce qui est incorrect, &lt;br /&gt;
   - &lt;i&gt;message&lt;/i&gt; qui est l'énonciation de la règle et qui est destiné à
  l'utilisateur, et&lt;br /&gt;
   - &lt;i&gt;example&lt;/i&gt; qui est l'exemple de l'erreur. &lt;br /&gt;
   On a par exemple une règle d'accord sujet verbe.&lt;br /&gt;
   &lt;br /&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_17_test</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_17_test/atom?2005_02_17_test"
        title="Edit Here - [GramOOo] [Languagetool] Principes" />
</entry>

  
  
      <entry xmlns="http://purl.org/atom/ns#"
       xmlns:dc="http://purl.org/dc/elements/1.1/">
     
  <title mode="escaped" type="text/html">Un correcteur grammatical pour OOo</title>
  <link rel="alternate" type="text/html"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_16_correcteur_grammatical" />
  <issued>2005-03-08T01:20:43Z</issued>
  <modified>2005-03-08T01:20:43Z</modified>
  <created>2005-02-16T21:22:39Z</created>
  <draft xmlns="http://purl.org/atom-blog/ns#">false</draft>
  <author>
    <name>mlechelt</name>
  </author>
  
  
    <dc:subject>openoffice</dc:subject>
  
  
  <summary type="text/html" mode="escaped">
  Je suis nouvelle stagiaire chez Nuxeo/Indesko. J'ai
  commencé hier à travailler pour le projet qui vise à
  développer un correcteur grammatical pour la suite de
  OpenOffice.org. C'est un gros projet qui lorsqu'il sera mené à
  bien sera très utile et très utilisé je pense! Mais il n'en
  est qu'à son commencement, il ne faut pas prendre ce qui suit
  pour définitif.

  Plusieurs correcteurs ...</summary>

  <content type="text/html" mode="escaped"
           xml:space="preserve">
  &lt;p&gt;Je suis nouvelle stagiaire chez Nuxeo/Indesko. J'ai
  commencé hier à travailler pour le projet qui vise à
  développer un correcteur grammatical pour la suite de
  OpenOffice.org. C'est un gros projet qui lorsqu'il sera mené à
  bien sera très utile et très utilisé je pense! Mais il n'en
  est qu'à son commencement, il ne faut pas prendre ce qui suit
  pour définitif.&lt;/p&gt;

  &lt;p&gt;Plusieurs correcteurs existent déjà dans différentes
  langues, nous en avons retenu trois pour nous servir de
  modèles : GRAC, languagetool et Gramadóir.&lt;/p&gt;

  &lt;p&gt;Grac, «&amp;nbsp;GRAmmar Checker&amp;nbsp;», (&lt;a
  href="http://grac.sourceforge.net/"&gt;http://grac.sourceforge.net/&lt;/a&gt;)
  est développé en Python par Maxime Biais. Il est basé sur un
  algorithme d'apprentissage, et se veut indépendant d'un
  langage particulier. C'est un modèle probabiliste. Ce projet
  en est à son tout début.&lt;/p&gt;

  &lt;p&gt;Languagetool, de Daniel Naber (&lt;a
  href="http://www.danielnaber.de/languagetool/"&gt;http://www.danielnaber.de/languagetool/&lt;/a&gt;),
  également programmé en Python, est un correcteur de grammaire
  et de style pour l'anglais, basé sur un système de règles (une
  quarantaine). Le traitement s'effectue en plusieurs
  phases:&lt;/p&gt;

  &lt;ul&gt;
   &lt;li&gt;
    &lt;p&gt;découpage en phrases&lt;/p&gt;
   &lt;/li&gt;

   &lt;li&gt;
    &lt;p&gt;tagging qui est l'étiquetage des mots (ex: N, V, ADJ,
    ...)&lt;/p&gt;
   &lt;/li&gt;

   &lt;li&gt;
    &lt;p&gt;découpage en chunks, c'est-à-dire en propositions (ex:
    syntagme nominal, syntagme verbal, ...)&lt;/p&gt;
   &lt;/li&gt;

   &lt;li&gt;
    &lt;p&gt;application de règles écrites à la main.&lt;/p&gt;
   &lt;/li&gt;
  &lt;/ul&gt;

  &lt;p&gt;Gramadóir est un correcteur gaélique développé en Perl par
  Kevin P. Scannell (&lt;a
  href="http://borel.slu.edu/gramadoir/"&gt;http://borel.slu.edu/gramadoir/&lt;/a&gt;).
  Il est basé sur des règles et sur le «&amp;nbsp;pattern
  matching&amp;nbsp;». Il se compose de plusieurs
  «&amp;nbsp;filtres&amp;nbsp;» qui découpent en mots, les étiquettent,
  recherchent les erreurs grammaticales etc.&lt;/p&gt;

  &lt;p&gt;Une fois l'étude de ces trois correcteurs terminée, il nous
  faudra ensuite choisir celui qui sera le mieux adaptable au
  français pour l'étendre aux règles grammaticales françaises.
  L'objectif final reste son insertion dans OpenOffice.org (tout
  en restant disponible pour d'autres projets).&lt;/p&gt;
 </content>

  <id>tag:blogs.nuxeo.com:sections:blogs:myriam_lechelt:2005_02_16_correcteur_grammatical</id>
  <link rel="service.edit" type="application/atom+xml"
        href="http://blogs.nuxeo.com/sections/blogs/myriam_lechelt/2005_02_16_correcteur_grammatical/atom?2005_02_16_correcteur_grammatical"
        title="Edit Here - Un correcteur grammatical pour OOo" />
</entry>

  

</feed>
