Le dépôt institutionnel Papyrus sera indisponible pour quelques heures le mercredi 10 juin dès 20h, en raison d'une mise à jour logicielle. Merci de votre compréhension.
Repository logo

Robustesse des réseaux neuronaux sur graphes


Thèse ou mémoire / Thesis or Dissertation
Loading...
Thumbnail Image

Contributor(s)

Published in

Conference Date

Conference Place

Publisher

Degree Level

Maîtrise / Master's

Discipline

Affiliation

Keywords

  • apprentissage automatique
  • apprentissage sur graphes
  • over-smoothing
  • over-squashing
  • topologie des graphes
  • Machine learning
  • learning on graphs
  • graph topology

Funding organization(s)

Abstract

Le graphe est une structure essentielle pour représenter des systèmes complexes, des réseaux sociaux aux interactions biologiques. L’apprentissage automatique sur graphes s’impose comme un outil clé pour extraire des représentations pertinentes de ces structures irrégulières. Pour relever ce défi, les réseaux neuronaux sur graphes (GNN), notamment les réseaux à propagation de messages (MPNN), ont été développés afin d’exploiter efficacement l’information contenue dans ces graphes. Par exemple, les atomes et les liaisons d’un graphe moléculaire, représentés respectivement par des noeuds et des liens contiennent de l’information exploitable par un GNN. Les MPNN rencontrent deux principales limitations : l’over-smoothing, où les représentations des noeuds tendent à converger vers une valeur unique à mesure que la propagation est répétée, et l’over-squashing, où, à travers la propagation, une quantité croissante d’information est comprimée dans les représentations des noeuds, limitant ainsi la qualité des interactions à longue distance. Ces phénomènes affectent la capacité des modèles à conserver des informations de haute fréquence et à propager efficacement les messages, ce qui nuit directement aux performances. Nos contributions s’articulent autour de trois axes : la formalisation de ces limitations sous un cadre topologique unifié, la création d’une tâche synthétique pour les évaluer empiriquement et l’étude de leur impact sur différentes architectures et topologies. Enfin, nous explorons des pistes exploitant l’information topologique pour atténuer ces limites, soulignant que la structure du graphe à l’étude joue un rôle fondamental dans la propagation des messages et que les solutions existantes restent insuffisantes.


Graphs are a fundamental data structure for representing complex systems across various domains, from social networks to biological interactions. Graph-based machine learning has emerged as a key tool for extracting meaningful representations from these irregular structures, which differ significantly from tabular data, images, or textual sequences that exhibit more regular structures. To address this challenge, Graph Neural Networks (GNNs), and in particular, Message Passing Neural Networks (MPNNs), have been developed to extract and leverage the information embedded in graphs. In molecular graphs, atoms and bonds are represented as nodes and edges, respectively, allowing GNNs to exploit their structural information. MPNNs face two major limitations : over-smoothing, where node representations tend to converge to a single value as propagation is repeated, and over-squashing, where an excessive amount of information is compressed into node embeddings, restricting long-range interactions. These issues degrade the ability of models to preserve high-frequency information and propagate messages effectively, directly impacting their performance. Our contributions are structured around three main aspects : the formalization of these limitations within a unified topological framework, the creation of a synthetic task to empirically evaluate them, and the study of their impact on various architectures and graph topologies. Finally, we explore approaches leveraging topological information to mitigate these limitations. Our findings emphasize that graph structure plays a central role in message propagation and that existing solutions do not necessarily suffice to address these challenges.

Table of contents

Notes

Notes

Other language versions

Related research dataset(s)

Endorsement

Review

Supplemented By

Referenced By

This document disseminated on Papyrus is the exclusive property of the copyright holders and is protected by the Copyright Act (R.S.C. 1985, c. C-42). Unless the document is published under a Creative Commons licence, it may be used for fair dealing and non-commercial purposes, for private study or research, criticism and review as provided by law. For any other use, written authorization from the copyright holders is required.