Comment caractériser, comprendre et évaluer les biais stéréotypés dans les modèles de langue ?

Fanny Ducel le

Lieu: Salle 1073

Résumé

Les modèles de langue génératifs (aussi dits auto-régressifs), sont de plus en plus utilisés aussi bien dans la communauté scientifique, dans les entreprises que par le grand public. Toutefois, ces systèmes contiennent et amplifient de nombreux biais stéréotypés, qui peuvent contribuer à la stigmatisation et la discrimination de certaines catégories de population. Cette présentation commencera avec quelques définitions et enjeux liés aux biais stéréotypés des modèles de langue, puis un passage en revue de l’état de l’art sur les corpus, méthodes et métriques utilisés pour identifier, atténuer et évaluer ces biais. Ensuite, je présenterai une expérience menée sur la génération de lettres de motivation par des modèles de langue en français et en italien, qui met en évidence de forts biais genrés, invisibilisant le féminin et renforçant des associations stéréotypées entre certains domaines professionnels et un genre. Finalement, je partagerai les résultats d’une expérience connexe menée sur les biais de genre dans des cas cliniques générés en français. La présentation sera en français mais les slides en anglais.

Comment caractériser, comprendre et évaluer les biais stéréotypés dans les modèles de langue ?

Fanny Ducel le var d = new Date(1741255200000); document.getElementById("date").innerHTML = d.toLocaleString();

Résumé

Fanny Ducel le