Le traitement des verbes à montée et à contrôle dans un réalisateur profond
Date de publication
Autrices et auteurs
Identifiant ORCID de l’auteur
Contributrices et contributeurs
Direction de recherche
Publié dans
Date de la Conférence
Lieu de la Conférence
Éditeur
Cycle d'études
Programme
Affiliation
Mots-clés
- génération automatique de texte
- réalisateur profond
- verbes
- Théorie Sens-Texte
- automatic text generation
- deep realizer
- verbs
- Meaning-Text Theory
Organisme subventionnaire
Résumé
Le verbe joue souvent un rôle central dans une phrase. Pour générer des phrases aussi naturelles que possible, un générateur symbolique requiert des dictionnaires riches, particulièrement pour les verbes. Cependant, certains verbes, tels que les verbes à montée et à contrôle utilisés dans le langage courant, ne reçoivent malheureusement pas autant d’attention et d’études qu’ils méritent dans le domaine de la génération automatique de texte (GAT). Ce mémoire a pour objectif de modéliser les verbes à montée et à contrôle dans GenDR, un réalisateur de texte profond. Pour y parvenir, nous nécessitons deux éléments essentiels : des dictionnaires pertinents et des règles spécifiques. En l’absence d’une ressource lexicale pour les verbes à montée et à contrôle, nous avons utilisé l’outil Graph Rewriting (Grew) pour automatiquement extraire les phrases comportant ces verbes à partir des corpus, entre autres, French-GSD et English-GUM. Ensuite, nous avons traité les données extraites pour identifier le patron de régime des verbes pertinents et en construire les dictionnaires adaptés à GenDR. En outre, en nous appuyant sur la syntaxe de dépendance, nous avons élaboré des règles spécifiques afin de permettre à GenDR de générer des phrases avec les verbes en question. Grâce à cette approche, nous avons ainsi réussi à modéliser les verbes à montée et à contrôle dans le cadre de GenDR.
Verbs play a central role in a sentence. To generate sentences as natural as possible, a symbolic generator requires rich dictionaries, particularly for verbs. However, certain verbs, such as raising and control verbs frequently used in everyday language, unfortunately do not receive as much attention and study as they deserve in the field of automatic text generation. This thesis aims to model raising and control verbs in GenDR, a deep realizer. To accomplish this aim, we require two essential elements: pertinent dictionaries and specific rules. Since no lexical resource exists for raising and control verbs, we used Graph Rewriting (Grew) to automatically extract sentences containing these verbs from corpora, including French-GSD and English-GUM. Then, we processed the extracted data to identify the government pattern of relevant verbs and build GenDR-compatible dictionaries. Building on dependency syntax principles, we developed specific grammatical rules that enable GenDR to properly handle these verb constructions. Through this approach, we have successfully modeled raising and control verbs within GenDR.