Contributions à la fusion de segmentations et à l’interprétation sémantique d’images
Thèse ou mémoire / Thesis or Dissertation
Date de publication
Autrices et auteurs
Identifiant ORCID de l’auteur
Contributrices et contributeurs
Direction de recherche
Publié dans
Date de la Conférence
Lieu de la Conférence
Éditeur
Cycle d'études
Doctorat / Doctoral
Programme
Affiliation
Mots-clés
- Ensemble de segmentation
- Fusion
- Multi-objective optimization
- Decision making
- Semantic image segmentation
- Erreur de la cohérence globale (GCE)
- Modèle de vraisemblance pénalisée
- Optimisation multi-objectif
- Prise de décision
- Segmentation sémantique d’image
- Segmentation ensemble
- Global consistency error (GCE)
- Penalized likelihood model
Organisme subventionnaire
Résumé
Résumé
Cette thèse est consacrée à l’étude de deux problèmes complémentaires, soit la fusion
de segmentation d’images et l’interprétation sémantique d’images. En effet, dans un premier temps,
nous proposons un ensemble d’outils algorithmiques permettant d’améliorer
le résultat final de l’opération de la fusion. La segmentation d’images est une étape de
prétraitement fréquente visant à simplifier la représentation d’une image par un ensemble
de régions significatives et spatialement cohérentes (également connu sous le nom de «
segments » ou « superpixels ») possédant des attributs similaires (tels que des parties
cohérentes des objets ou de l’arrière-plan). À cette fin, nous proposons une nouvelle
méthode de fusion de segmentation au sens du critère de l’Erreur de la Cohérence Globale
(GCE), une métrique de perception intéressante qui considère la nature multi-échelle de
toute segmentation de l’image en évaluant dans quelle mesure une carte de segmentation
peut constituer un raffinement d’une autre segmentation. Dans un deuxième temps,
nous présentons deux nouvelles approches pour la fusion des segmentations au sens de
plusieurs critères en nous basant sur un concept très important de l’optimisation combinatoire,
soit l’optimisation multi-objectif. En effet, cette méthode de résolution qui
cherche à optimiser plusieurs objectifs concurremment a rencontré un vif succès dans
divers domaines. Dans un troisième temps, afin de mieux comprendre automatiquement
les différentes classes d’une image segmentée, nous proposons une approche nouvelle
et robuste basée sur un modèle à base d’énergie qui permet d’inférer les classes les plus
probables en utilisant un ensemble de segmentations proches (au sens d’un certain critère)
issues d’une base d’apprentissage (avec des classes pré-interprétées) et une série de
termes (d’énergie) de vraisemblance sémantique.
This thesis is dedicated to study two complementary problems, namely the fusion of image segmentation and the semantic interpretation of images. Indeed, at first we propose a set of algorithmic tools to improve the final result of the operation of the fusion. Image segmentation is a common preprocessing step which aims to simplify the image representation into significant and spatially coherent regions (also known as segments or super-pixels) with similar attributes (such as coherent parts of objects or the background). To this end, we propose a new fusion method of segmentation in the sense of the Global consistency error (GCE) criterion. GCE is an interesting metric of perception that takes into account the multiscale nature of any segmentations of the image while measuring the extent to which one segmentation map can be viewed as a refinement of another segmentation. Secondly, we present two new approaches for merging multiple segmentations within the framework of multiple criteria based on a very important concept of combinatorial optimization ; the multi-objective optimization. Indeed, this method of resolution which aims to optimize several objectives concurrently has met with great success in many other fields. Thirdly, to better and automatically understand the various classes of a segmented image we propose an original and reliable approach based on an energy-based model which allows us to deduce the most likely classes by using a set of identically partitioned segmentations (in the sense of a certain criterion) extracted from a learning database (with pre-interpreted classes) and a set of semantic likelihood (energy) terms
This thesis is dedicated to study two complementary problems, namely the fusion of image segmentation and the semantic interpretation of images. Indeed, at first we propose a set of algorithmic tools to improve the final result of the operation of the fusion. Image segmentation is a common preprocessing step which aims to simplify the image representation into significant and spatially coherent regions (also known as segments or super-pixels) with similar attributes (such as coherent parts of objects or the background). To this end, we propose a new fusion method of segmentation in the sense of the Global consistency error (GCE) criterion. GCE is an interesting metric of perception that takes into account the multiscale nature of any segmentations of the image while measuring the extent to which one segmentation map can be viewed as a refinement of another segmentation. Secondly, we present two new approaches for merging multiple segmentations within the framework of multiple criteria based on a very important concept of combinatorial optimization ; the multi-objective optimization. Indeed, this method of resolution which aims to optimize several objectives concurrently has met with great success in many other fields. Thirdly, to better and automatically understand the various classes of a segmented image we propose an original and reliable approach based on an energy-based model which allows us to deduce the most likely classes by using a set of identically partitioned segmentations (in the sense of a certain criterion) extracted from a learning database (with pre-interpreted classes) and a set of semantic likelihood (energy) terms
Table des matières
Notes
Notes
Autre version linguistique
Ensemble de données lié
Licence
Approbation
Évaluation
Complété par
Référencé par
Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Sauf si le document est diffusé sous une licence Creative Commons, il ne peut être utilisé que dans le cadre d'une utilisation équitable et non commerciale comme le prévoit la Loi (i.e. à des fins d'étude privée ou de recherche, de critique ou de compte-rendu). Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.