Résumé du travail de Myriam Lechelt

Je vais ici faire un résumé rapide de l'important travail effectué par Myriam Lechelt sur le projet de correcteur grammatical dont je prends la suite.

Dans le cadre de son mémoire de DEA, Myriam a donc initié un travail dont l'objectif est, à terme, de créer un outil de correction grammaticale libre pouvant être intégré à OpenOffice.org. Plutôt que de chercher à réaliser entièrement un nouvel outil, elle a réalisé une analyse de plusieurs correcteurs grammaticaux libres déjà existants, afin de déterminer lequel serait le plus adaptable au français.

Parmi les correcteurs analysés (GRAC , LanguageTool et  An Gramadoir), c'est Gramadoir qui a été retenu pour être adapté au français. Son adaptation s'est traduite par la définition d'un jeu d'étiquettes pour l'étiquetage morpho-syntaxique des mots ( tagging), par l'écriture de règles de désambiguïsation pour la phase du tagging, puis par la création de quelques règles  pour la détection des fautes.

L'adaptation de Gramadoir au français n'a pas été achevée, et malgré des résultats plutôt satisfaisants lors des premiers tests, l'outil a montré des limites pour le traitement du français.

Une approche alternative a finalement été proposée, dans l'éventualité de la conception d'un nouveau correcteur. Elle consiste à introduire un niveau intermédiaire entre le mot et la phrase, le chunk (ou syntagme), lors de la segmentation des phrases et à utiliser le principe de l'unification de structures de traits au niveau de la vérification grammaticale. Nous reviendrons ultérieurement sur les notions de chunk et d'unification.



Les travaux de Myriam ayant montré que le traitement du français par Gramadoir restera limité, nous n'allons pas continuer à exploiter ce système. Nous avons décidé par ailleurs de ne pas non plus concevoir un correcteur entièrement nouveau. Nous allons plutôt réaliser une adaptation de la dernière version de LanguageTool. En effet, il y a eu beaucoup d'évolutions entre l'ancienne version rejetée à l'époque, et la nouvelle, qui semble mieux adaptable au français. Nous allons la compléter en suivant les pistes données par Myriam pour la conception d'un nouveau correcteur.

Important announcement: Join the Nuxeo team and contribute to the Nuxeo project! We have open positions in France and the UK for open source Java EE developers and sales engineers, both junior and senior.

Like this post? Share it:

Posted by Agnes Souque @ 03/21/2007 01:51 PM. - Categories: indesko, openoffice -  0 comments

Nuxeo Bloggers: Log in!
Nuxeo - Indesko - Nuxeo 5 Project
All content is copyrighted by their author.
CPSSkins is Copyright © 2003-2006 by Jean-Marc Orliaguet. | CPS is Copyright © 2002-2006 by Nuxeo SAS.