>Sommaire

>Thèses
>Pratique
  • Démarches
  • Ressources
  • Valorisation
  • Liens
>Pro/Thèse
  • Jobs
  • Contrats
  • Post Doc
>Contacts

Thèse Art

maj: 16/02/05

 

Stéphanie POUCHOT

L'analyse de corpus et la Génération Automatique de Textes : méthodes et usages

 

ecole :
Université Stendhal - Grenoble 3

discipline :
Sciences de l'Information et de la Communication

directeur :
Jacques Rouault

jury :
* Mme Laurence BALICCO, MCF, Université Stendhal - Grenoble 3, Examinatrice
* M. Jean-Pierre BALPE, Professeur, Université Paris 8, Rapporteur
* M. André BISSERET, Directeur de Recherche Emérite, INRIA Rhône Alpes, Président du jury
* M. Jacques ROUAULT, Professeur Emérite, Université Stendhal - Grenoble 3, Directeur de thèse
* M. Eric WEHRLI, Professeur, Université de Genève, Rapporteur
date : mercredi 5 février 2003

lieu :
Institut de la Communication et des Médias, Université Grenoble 3, Échirolles (38), France

mail :
stephanie.pouchot@umontreal.ca

web :
http://spouchot.free.fr

resume :
La communication entre une machine et un individu peut prendre différentes formes (icônes, sons, texte...). Le but de la génération automatique de textes est la production informatisée de messages en langue naturelle destinés à des lecteurs humains. Le résultat de ce processus doit être compréhensible, adapté et, idéalement, se rapprocher d'une production humaine.
Cette thèse présente un travail de recherche consacré à l'amélioration des performances d'un processus de génération automatique du français écrit. Basée sur l'étude d'un ensemble de textes réels (corpus de textes écrits par des sujets humains), cette recherche a consisté en l'identification et d'étude de caractéristiques propres à la langue naturelle (mise en forme, vocabulaire.) à re-produire de manière automatique. Nous présentons ces critères, la manière dont ils sont compatibles entre eux et nous proposons une nouvelle architecture pour le système de génération permettant de les intégrer au processus.

 

Blabla

Annoncez et signalez votre thèse ici

 


(english)

TITLE : Corpus analysis and natural language generation: ways and use

abstract :

Communication between a machine and a man can take different shapes (icons, sounds, texts.). The natural language generations goal is to automatically produce natural language texts for the use of human readers. The result of this process must be understandable, adapted and ideally close to human productions.
The work presented in this thesis concernes the improvement of a written French generation system. This research is based on the study of a large collection of real texts (a corpus of texts written by people). The aim was to identify and study natural language features to automatically re-produce them. We present them and the way they can be combined with each other. We also propose a new architecture for the generation system that integrates them.

 

 
©Thèse-Art 2000-2002