Deutschsprachiger Korpus für Paraphrase | The German corpus of paraphrase | Corpus de paraphrase en Allemand


Les humains peuvent formuler la même idée sans altération du contenu de plusieurs façons. La langue est tellement riche qui permet cette variabilité d'expression définie comme "la paraphrase" et qui représente une difficulté majeure dans les traitement automatique des langues.

En effet, pour résoudre les problèmes engendrés par la paraphrase, il est nécessaire le développement des méthodes très performants pour reconnaître ces énonces qui décrivent le même événement ou la même idée.

Les corpus composés d'ensembles d’énoncés paraphrasés semble très utile mais ce type de ressources est très rare à cause de la difficulté de la tâche et du coût élevé, dont l'importance de sa construction et de sa mise en disposition. Nous avons développé une méthode pour la construction de un corpus de paraphrases d’énoncés en allemand mais qui peut être appliquée à d'autres langues.

Auteurs: Juan Manuel TORRES-MORENO, Université d'Avignon, France ; Gerardo SIERRA MARTINEZ, GIL-Instituto de Ingeniería-UNAM, Mexique et Peter PEINL, Fulda University of Applied Sciences, Allemagne.


Page mise à jour le 20 octobre 2014