Embedding cultural diversity in prototype-based recommender systems


Thèse ou mémoire / Thesis or Dissertation

Date de publication

Autrices et auteurs

Identifiant ORCID de l’auteur

Contributrices et contributeurs

Direction de recherche

Publié dans

Date de la Conférence

Lieu de la Conférence

Éditeur

Cycle d'études

Maîtrise / Master's

Programme

Affiliation

Mots-clés

  • Fairness
  • Culture
  • Régularisation
  • Biais de popularité
  • Équité
  • Recommender Systems
  • Conversational Recommender Systems
  • Embedding Space
  • Regularization
  • Popularity Bias
  • Systèmes de recommandation
  • Systèmes de recommandation conversationnels
  • Espace d’incorporation

Organisme subventionnaire

Résumé

Les systèmes de recommandation (SysRec) sont devenus une composante essentielle des plateformes numériques modernes, influençant l'expérience utilisateur en fournissant du contenu personnalisé. Cependant, ces systèmes présentent souvent une tendance à privilégier les éléments populaires, ce qui entraîne une sous-représentation des produits issus de cultures minoritaires. Ce biais, connu sous le nom de biais de popularité, favorise de manière disproportionnée les groupes culturels dominants, réduisant ainsi la visibilité et les opportunités des cultures sous-représentées. Cette thèse commence par une analyse des différents types de biais pouvant affecter les systèmes de recommandation conversationnels (SRC). Nous concentrons ensuite notre étude sur les systèmes de recommandation — un élément central des SRC — et abordons la problématique spécifique du biais de popularité. Pour améliorer l’équité sans compromettre la précision des recommandations, nous proposons un modèle de factorisation matricielle basé sur des prototypes, appelé ProtoMF. Ce modèle intègre deux innovations principales : (1) le K-filtrage des prototypes, qui affine les représentations des éléments en sélectionnant les prototypes les plus pertinents, et (2) la régularisation de la distribution des prototypes, qui favorise une répartition équilibrée des prototypes dans l’espace d’incorporation. En utilisant le pays d’origine des articles comme proxy pour l’identité culturelle, notre approche vise à atténuer les préjudices allocationnels qui touchent les groupes culturels sous-représentés. Nous évaluons notre méthode sur plusieurs ensembles de données, démontrant qu’elle réduit significativement le rang moyen des éléments de longue traîne et sous-représentés, tout en maintenant des performances élevées en termes de taux de réussite@10. De plus, notre méthode améliore l’explicabilité des recommandations, offrant ainsi une meilleure transparence sur le processus de recommandation. Ce travail contribue au domaine des systèmes de recommandation en approfondissant la compréhension de l’équité et de la diversité, en particulier dans le contexte des recommandations de contenu culturel.


ecommender systems (RecSys) have become integral to modern digital platforms, shaping user experiences by providing personalized content. However, these systems are often biased toward recommending popular items, leading to the underrepresentation of minority cultural products. This bias, known as popularity bias, disproportionately favors dominant cultural groups, resulting in reduced visibility and opportunities for underrepresented cultures. This thesis starts by examining various types of biases that conversational recommender systems (CRS) can exhibit. We then narrow our focus to recommender systems—a key component of CRS—and address the specific issue of popularity bias. To enhance fairness without sacrificing recommendation accuracy, we propose a prototype-based matrix factorization model called ProtoMF. This model incorporates two key innovations: (1) Prototype K-Filtering, which refines item representations by selecting the nearest prototypes, and (2) Prototype-Distributing Regularization, which encourages a balanced distribution of prototypes in the embedding space. By using the items' country of origin as a proxy for cultural identity, our approach aims to mitigate allocational harms affecting underrepresented cultural groups. We evaluate our proposed method on multiple datasets, demonstrating that it significantly reduces the average rank of long-tail and underrepresented items while maintaining high performance in HitRatio@10. Furthermore, our method enhances the explainability of recommendations, offering more transparent insights into the recommendation process. This work contributes to the field of RecSys by advancing the understanding of fairness and diversity, particularly in the context of cultural content recommendations.

Table des matières

Notes

Notes

Autre version linguistique

Ensemble de données lié

Licence

Approbation

Évaluation

Complété par

Référencé par

Ce document diffusé sur Papyrus est la propriété exclusive des titulaires des droits d'auteur et est protégé par la Loi sur le droit d'auteur (L.R.C. (1985), ch. C-42). Sauf si le document est diffusé sous une licence Creative Commons, il ne peut être utilisé que dans le cadre d'une utilisation équitable et non commerciale comme le prévoit la Loi (i.e. à des fins d'étude privée ou de recherche, de critique ou de compte-rendu). Pour toute autre utilisation, une autorisation écrite des titulaires des droits d'auteur sera nécessaire.