Le traitement des verbes à montée et à contrôle dans un réalisateur profond


Thèse ou mémoire / Thesis or Dissertation

Date de publication

Autrices et auteurs

Identifiant ORCID de l’auteur

Contributrices et contributeurs

Direction de recherche

Publié dans

Date de la Conférence

Lieu de la Conférence

Éditeur

Cycle d'études

Maîtrise / Master's

Programme

Affiliation

Mots-clés

  • génération automatique de texte
  • réalisateur profond
  • verbes
  • Théorie Sens-Texte
  • automatic text generation
  • deep realizer
  • verbs
  • Meaning-Text Theory

Organisme subventionnaire

Résumé

Le verbe joue souvent un rôle central dans une phrase. Pour générer des phrases aussi naturelles que possible, un générateur symbolique requiert des dictionnaires riches, particulièrement pour les verbes. Cependant, certains verbes, tels que les verbes à montée et à contrôle utilisés dans le langage courant, ne reçoivent malheureusement pas autant d’attention et d’études qu’ils méritent dans le domaine de la génération automatique de texte (GAT). Ce mémoire a pour objectif de modéliser les verbes à montée et à contrôle dans GenDR, un réalisateur de texte profond. Pour y parvenir, nous nécessitons deux éléments essentiels : des dictionnaires pertinents et des règles spécifiques. En l’absence d’une ressource lexicale pour les verbes à montée et à contrôle, nous avons utilisé l’outil Graph Rewriting (Grew) pour automatiquement extraire les phrases comportant ces verbes à partir des corpus, entre autres, French-GSD et English-GUM. Ensuite, nous avons traité les données extraites pour identifier le patron de régime des verbes pertinents et en construire les dictionnaires adaptés à GenDR. En outre, en nous appuyant sur la syntaxe de dépendance, nous avons élaboré des règles spécifiques afin de permettre à GenDR de générer des phrases avec les verbes en question. Grâce à cette approche, nous avons ainsi réussi à modéliser les verbes à montée et à contrôle dans le cadre de GenDR.


Verbs play a central role in a sentence. To generate sentences as natural as possible, a symbolic generator requires rich dictionaries, particularly for verbs. However, certain verbs, such as raising and control verbs frequently used in everyday language, unfortunately do not receive as much attention and study as they deserve in the field of automatic text generation. This thesis aims to model raising and control verbs in GenDR, a deep realizer. To accomplish this aim, we require two essential elements: pertinent dictionaries and specific rules. Since no lexical resource exists for raising and control verbs, we used Graph Rewriting (Grew) to automatically extract sentences containing these verbs from corpora, including French-GSD and English-GUM. Then, we processed the extracted data to identify the government pattern of relevant verbs and build GenDR-compatible dictionaries. Building on dependency syntax principles, we developed specific grammatical rules that enable GenDR to properly handle these verb constructions. Through this approach, we have successfully modeled raising and control verbs within GenDR.

Table des matières

Notes

Notes

Autre version linguistique

Ensemble de données lié

Licence

Approbation

Évaluation

Complété par

Référencé par

Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Sauf si le document est diffusé sous une licence Creative Commons, il ne peut être utilisé que dans le cadre d'une utilisation équitable et non commerciale comme le prévoit la Loi (i.e. à des fins d'étude privée ou de recherche, de critique ou de compte-rendu). Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.