Modélisation de l'attention sélective auditive à l'aide de réseaux de neurones artificiels.
Balla, Marion
Promoteur(s) :
Sougné, Jacques
Date de soutenance : 1-sep-2025/9-sep-2025 • URL permanente : http://hdl.handle.net/2268.2/24741
Détails
| Titre : | Modélisation de l'attention sélective auditive à l'aide de réseaux de neurones artificiels. |
| Auteur : | Balla, Marion
|
| Date de soutenance : | 1-sep-2025/9-sep-2025 |
| Promoteur(s) : | Sougné, Jacques
|
| Membre(s) du jury : | Read, John
French, Robert |
| Langue : | Français |
| Nombre de pages : | 61 |
| Mots-clés : | [fr] Modélisation [fr] Attention auditive [fr] Intelligence artificielle |
| Discipline(s) : | Sciences sociales & comportementales, psychologie > Psychologie cognitive & théorique Sciences sociales & comportementales, psychologie > Neurosciences & comportement |
| Institution(s) : | Université de Liège, Liège, Belgique |
| Diplôme : | Master en sciences psychologiques, à finalité spécialisée |
| Faculté : | Mémoires de la Faculté de Psychologie, Logopédie et Sciences de l’Education |
Résumé
[fr] La modélisation de l'attention sélective auditive a été peu investiguée dans la littérature en psychologie cognitive. Le cocktail party effect, c'est-à-dire le fait que notre attention soit captée involontairement par un mot prononcé dans une autre conversation que celle à laquelle on participe, constitue un défi pour les modèles actuels. La difficulté réside dans la création d'un modèle gérant les phénomènes top-down et bottom-up en contexte bruyant. Ce mémoire vise à étudier comment différentes architectures de réseaux de neurones (LSTM vs. BiLSTM) modélisent ce phénomène, notamment face à une distraction sémantique.
Nous avons implémenté deux architectures : le modèle ASAM (Xu et al., 2018) basé sur un réseau BiLSTM, et une variante LSTM standard. Cette comparaison visait à évaluer le gain en performance d'un modèle complexe (BiLSTM), théoriquement supérieur, face à un modèle plus simple (LSTM) dont le traitement causal est conceptuellement plus proche de la cognition humaine. Les modèles ont été entraînés sur un jeu de données original conçu pour manipuler la familiarité de mots spécifiques. Lors de la phase de test, les mots rendus familiers étaient intégrés dans le discours du distracteur afin de mesurer leur potentiel de distraction. Les performances ont été évaluées à l'aide de métriques de séparation de sources et analysées par une MANOVA.
Les résultats révèlent deux conclusions majeures. Premièrement, le modèle LSTM a surpassé de manière contre-intuitive le modèle BiLSTM, un résultat probablement attribuable à un sur-apprentissage du modèle plus complexe sur notre jeu de données de taille limitée. Deuxièmement, bien que les deux architectures aient apparement manifesté un effet cocktail party (une dégradation des performances en présence de distracteurs), cet effet n'était pas modulé par la fréquence d'exposition. Cette découverte suggère que l'interférence était principalement due à un masquage énergétique (basé sur les propriétés acoustiques des mots) plutôt qu'à un masquage sémantique ou informationnel (basé sur la familiarité et le sens des mots).
Ce mémoire met donc en lumière une limite critique des modèles computationnels actuels de l'attention auditive, suggérant qu'ils reposent davantage sur l'apprentissage de motifs acoustiques sophistiqués que sur un véritable traitement sémantique.
Il appelle à une investigation plus critique sur la manière d'intégrer et de tester les influences sémantiques dans les modèles de l'attention sélective auditive.
Fichier(s)
Document(s)
Citer ce mémoire
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.

Master Thesis Online


Mémoire_MarionBalla_s200035_2025.pdf