Conférence : Apprentissages machines (IA) et analyse qualitative : attraits et précautions pour les annotations sémantiques

Publié le 3 avril 2024 – Mis à jour le 14 mai 2024

le 26 avril 2024

10h30 - 12h30

Université Toulouse - Jean Jaurès, Amphi F
Contact : pierre.ratinaud@univ-tlse2.fr

Organisé dans le cadre de l'atelier d'Analyses textuelles du LabEx SMS

Après avoir situé historiquement l'apprentissage machine dans la recherche en sciences socio-humaines, sans s’attarder aux modèles de langage (BERT, ChatGPT, Gemini, etc.), mais en maintenant le plongement lexical (word embedding), Elias Rizkallah survolera les différents types d'apprentissages machines (supervisé, non-supervisé, semi-supervisé, de renforcement ou profond) qui fondent l’intelligence artificielle contemporaine.

S'agissant indéniablement de techniques largement quantitatives et multidimensionnelles, sa quête est celle de possibles ponts avec la recherche qualitative surtout sur le plan de l'analyse (contenu, thématique, discours,..) où persiste encore une relation délicate et incertaine à l'égard de l'usage de la quantification ou de la structuration non-manuelle des données. Même si Miles et Huberman (1984) en faisaient déjà largement usage, et plus récemment Ryan et Bernard (2000) en ont fait une très bonne synthèse, avant tout le mouvement des méthodes mixtes (Creswell, Onwuegbuzie, Tashakkori, etc.), il n'en reste pas moins que le statut épistémologique et ontologique de cet usage reste discutable ou évité par des postures pragmatiques (Maxcy, 2003), réalistes critiques (Modell, 2009) ou post-positivistes (Miles & Huberman, 1994).

Cette conférence portera sur l’annotation sémantique, soit l’enrichissement de sens apporté par l’analyste sur les unités textuelles, le texte « brut » ou le matériau. Comme c’est sur les unités textuelles que se base la majorité de la recherche en fouille de données textuelles, qu’on l’appelle lexicométrie, textométrie ou text mining, le débat sera amené au niveau de l’annotation sémantique, et ce suivant deux axes :

comment penser avec l’IA le statut épistémologique et ontologique de l’analyse des annotations sémantiques assistée par ordinateur ? E. Rizkallah tentera de justifier et d’étayer la quête de structuration d’un acte de production de sens par l'analyste et non seulement de l'énonciation elle-même
Comment l’apprentissage machine peut-il assister l’analyste dans son travail sur ses propres annotations de l’unité textuelle?

Ainsi, il sera montré comment différents types d'apprentissages machines peuvent assister l'analyste dans son travail comme le codage, les représentations graphiques ou tabulaires, le retour au "matériau brut" ou l’enrichissement des interprétations (e.g. "variables illustratives"). La conférence se terminera avec les précautions à prendre avec de tels usages.