Skip to Content
logologo
AI Incident Database
Open TwitterOpen RSS FeedOpen FacebookOpen LinkedInOpen GitHub
Open Menu
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer
Découvrir
Envoyer
  • Bienvenue sur AIID
  • Découvrir les incidents
  • Vue spatiale
  • Vue de tableau
  • Vue de liste
  • Entités
  • Taxonomies
  • Soumettre des rapports d'incident
  • Classement des reporters
  • Blog
  • Résumé de l’Actualité sur l’IA
  • Contrôle des risques
  • Incident au hasard
  • S'inscrire
Fermer

Problème 1541

Incidents associés

Incident 1682 Rapports
Collaborative Filtering Prone to Popularity Bias, Resulting in Overrepresentation of Popular Items in the Recommendation Outputs

Loading...
Biais de popularité dans les systèmes de recommandation multimédia basés sur le filtrage collaboratif
arxiv.org · 2022

Introduction

Le filtrage collaboratif (CF) est l'un des concepts les plus traditionnels mais aussi les plus puissants pour calculer des recommandations personnalisées [22] et est largement utilisé dans le domaine des systèmes de recommandation multimédia (MMRS) [11]. Cependant, un problème des approches basées sur les FC est qu'elles sont sujettes à un biais de popularité, ce qui conduit à la surreprésentation des éléments populaires dans les listes de recommandations [2,3]. Des recherches récentes ont étudié le biais de popularité dans des domaines tels que la musique [15,16] ou les films [3] en comparant les performances de recommandation pour différents groupes d'utilisateurs qui diffèrent dans leur inclination aux éléments multimédias grand public. Cependant, une étude approfondie sur les biais de popularité au niveau de l'élément et de l'utilisateur dans plusieurs domaines multimédias fait toujours défaut (voir la section 2).

Dans le présent article, nous nous appuyons donc sur ces travaux antérieurs et élargissons l'étude du biais de popularité à quatre domaines différents du MMRS : la musique (Last.fm), les films (MovieLens), les livres numériques (BookCrossing) et les animes (MyAnimeList). Dans ces domaines, nous montrons que les utilisateurs peu intéressés par les articles populaires ont tendance à avoir de grands profils d'utilisateurs et sont donc des consommateurs et des sources de données importants pour le MMRS. De plus, nous appliquons quatre algorithmes de recommandation différents basés sur CF (voir la section 3) sur nos quatre ensembles de données que nous divisons chacun en trois groupes d'utilisateurs qui diffèrent par leur inclination à la popularité (c'est-à-dire LowPop, MedPop et HighPop). Avec cela, nous abordons deux questions de recherche (RQ):

– RQ1 : Dans quelle mesure la popularité d'un article affecte-t-elle la fréquence de recommandation de cet article dans le MMRS ?

– RQ2 : Dans quelle mesure l'inclination d'un utilisateur pour les articles populaires affecte-t-elle la qualité du MMRS ?

Concernant QR1, nous constatons que la probabilité qu'un article multimédia soit recommandé est fortement corrélée à la popularité de cet article. En ce qui concerne RQ2, nous constatons que les utilisateurs moins enclins à la popularité (LowPop) reçoivent des recommandations multimédias statistiquement significativement moins bonnes que les utilisateurs ayant une inclination moyenne (MedPop) et élevée (HighPop) envers les articles populaires (voir section 4). Nos résultats démontrent que bien que les utilisateurs peu intéressés par les articles populaires aient tendance à avoir les profils d'utilisateurs les plus importants, ils reçoivent la précision de recommandation la plus faible. Par conséquent, des recherches futures sont nécessaires pour atténuer le biais de popularité dans le MMRS, à la fois au niveau de l'article et de l'utilisateur.

Travaux connexes

Cette section présente des recherches sur les biais de popularité liés à notre travail. Nous avons divisé ces résultats de recherche en deux groupes : (i) les travaux liés aux systèmes de recommandation en général, et (ii) les travaux axés sur les techniques d'atténuation des biais de popularité.

Biais de popularité dans les systèmes de recommandation. Dans le domaine des systèmes de recommandation, il existe un nombre croissant de travaux qui étudient l'effet du biais de popularité. Par exemple, comme indiqué dans [8], le biais en faveur des articles populaires peut affecter la consommation d'articles qui ne sont pas populaires. Cela les empêche à leur tour de devenir populaires à l'avenir. De cette façon, un système de recommandation a tendance à ignorer les nouveaux articles ou les articles appréciés par les utilisateurs de niche qui sont généralement cachés dans la "longue traîne" du catalogue d'articles disponibles. La prise en compte de ces items à longue traîne a été reconnue par certains travaux antérieurs, tels que [10,20]. Ce problème est étudié plus en détail par [1,2] en utilisant le jeu de données de film populaire MovieLens 1M. Les auteurs montrent que plus de 80 % de toutes les évaluations appartiennent en fait à des éléments populaires et, sur cette base, se concentrent sur l'amélioration du compromis entre la précision du classement et la couverture des éléments à longue traîne. Les recherches menées dans [13] illustrent une comparaison algorithmique complète en ce qui concerne le biais de popularité. Les auteurs analysent des ensembles de données multimédias tels que MovieLens, Netflix, Yahoo!Movies et BookCrossing, et constatent que les méthodes de recommandation ne prennent en compte qu'une petite fraction du spectre d'éléments disponibles. Par exemple, ils constatent que les techniques basées sur KNN se concentrent principalement sur les éléments les mieux notés et que les modèles de factorisation tendent à recommander des éléments populaires. Dans notre travail, nous analysons un ensemble encore plus large de domaines multimédias et étudions le biais de popularité non seulement au niveau de l'article mais également au niveau de l'utilisateur.

Techniques d'atténuation du biais de popularité. Une recherche typique sur l'atténuation du biais de popularité effectue une étape de reclassement sur un ensemble plus large d'éléments candidats recommandés. L'objectif de ces approches de post-traitement est de mieux exposer les éléments de longue traîne dans la liste de recommandations [2,4,6]. Ici, par exemple, [7] propose d'améliorer le nombre total d'items recommandés distincts en définissant une distribution cible d'exposition aux items et en minimisant l'écart entre l'exposition et la fréquence de recommandation de chaque item. Afin de trouver un juste rapport entre les items populaires et moins populaires, [24] propose de créer un groupe protégé d'items de longue traine et de s'assurer que leur exposition reste statistiquement indiscernable d'un minimum donné. En plus de se concentrer sur le post-traitement, il existe des tentatives de traitement en cours pour adapter les algorithmes de recommandation existants de manière à ce que les recommandations générées soient moins biaisées vers les éléments populaires. Par exemple, [5] propose d'utiliser une sélection de voisinage probabiliste pour les méthodes KNN, ou [23] suggère une approche de factorisation matricielle sensible aux angles morts qui débiaise les interactions entre le système de recommandation et l'utilisateur. Nous pensons que les conclusions de notre article peuvent éclairer les recherches futures sur le choix de la bonne technique d'atténuation pour un contexte donné.

...

Lire la source

Recherche

  • Définition d'un « incident d'IA »
  • Définir une « réponse aux incidents d'IA »
  • Feuille de route de la base de données
  • Travaux connexes
  • Télécharger la base de données complète

Projet et communauté

  • À propos de
  • Contacter et suivre
  • Applications et résumés
  • Guide de l'éditeur

Incidents

  • Tous les incidents sous forme de liste
  • Incidents signalés
  • File d'attente de soumission
  • Affichage des classifications
  • Taxonomies

2024 - AI Incident Database

  • Conditions d'utilisation
  • Politique de confidentialité
  • Open twitterOpen githubOpen rssOpen facebookOpen linkedin
  • e1b50cd