IRIT-MFU Multi-modal systems for emotion classification for Odyssey 2024 challenge - Structuration, Analyse et Modélisation de documents Vidéo et Audio

Documentation
Français (FR)

Anglais (EN)

Communication Dans Un Congrès Année : 2024

IRIT-MFU Multi-modal systems for emotion classification for Odyssey 2024 challenge

(1, 2) , (1, 2) , (3) , (2, 4) , (2, 1, 5) , (2) , (6) , (2) , , , (6) , (2, 1)

1
2
3
4
5
6

Adrien Lafore

Fonction : Auteur

Institut de recherche en informatique de Toulouse

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Clément Pagés

Fonction : Auteur

Institut de recherche en informatique de Toulouse

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Leila Moudjari

Fonction : Auteur
PersonId : 1262331

Methodes et ingénierie des Langues, des Ontologies et du Discours

Sebastião Quintas

Fonction : Auteur
PersonId : 1147669
IdHAL : sebastiao-quintas
ORCID : 0000-0002-8693-9638

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Université de Toulouse

Hervé Bredin

Fonction : Auteur
PersonId : 15856
IdHAL : hbredin
ORCID : 0000-0002-3739-925X
IdRef : 121165779

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Institut de recherche en informatique de Toulouse

Centre National de la Recherche Scientifique

Thomas Pellegrini

Fonction : Auteur
PersonId : 741962
IdHAL : thomas-pellegrini
ORCID : 0000-0001-8984-1399
IdRef : 127577955

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Farah Benamara

Fonction : Auteur
PersonId : 739760
IdHAL : farah-benamara
ORCID : 0000-0002-0685-1864
IdRef : 084066830

MEthodes et ingénierie des Langues, des Ontologies et du DIscours

Isabelle Ferrané

Fonction : Auteur
PersonId : 734607
IdHAL : isabelle-ferrane
ORCID : 0000-0002-0861-5224
IdRef : 149338031

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Jérôme Bertrand

Fonction : Auteur
PersonId : 1387276

Marie-Françoise Bertrand

Fonction : Auteur

Véronique Moriceau

Fonction : Auteur
PersonId : 735467
IdHAL : veronique-moriceau
IdRef : 115607374

MEthodes et ingénierie des Langues, des Ontologies et du DIscours

Jérôme Farinas

Fonction : Auteur
PersonId : 172411
IdHAL : jerome-farinas
ORCID : 0000-0002-7456-9019
IdRef : 20073234X

Équipe Structuration, Analyse et MOdélisation de documents Vidéo et Audio

Institut de recherche en informatique de Toulouse

Résumé

In this paper, we present our contribution to emotion classifi- cation in speech as part of our participation in Odyssey 2024 challenge. We propose a hybrid system that takes advantage of both audio signal information and semantic information ob- tained from automatic transcripts. We propose several models for each modality and three different fusion methods for the classification task. The results show that multimodality im- proves significantly the performance and allows us surpassing the challenge baseline, which is an audio only system, from a 0.311 macro F1-score to 0.337.

Domaines

Intelligence artificielle [cs.AI] Son [cs.SD] Traitement du texte et du document

Fichier principal

Vignette du fichier

Odyssey2024_vFinale.pdf (608.81 Ko)

Origine	Fichiers produits par l'(les) auteur(s)

Jérôme Farinas : Connectez-vous pour contacter le contributeur

https://hal.science/hal-04594287

Soumis le : jeudi 30 mai 2024-13:46:17

Dernière modification le : mardi 16 juillet 2024-10:01:55

Dates et versions

hal-04594287 , version 1 (30-05-2024)

Licence

Paternité

Identifiants

HAL Id : hal-04594287 , version 1
DOI : 10.21437/odyssey.2024-42

Citer

Adrien Lafore, Clément Pagés, Leila Moudjari, Sebastião Quintas, Hervé Bredin, et al.. IRIT-MFU Multi-modal systems for emotion classification for Odyssey 2024 challenge. Odyssey 2024: The Speaker and Language Recognition Workshop, Jun 2024, Québec, Canada. pp.296-302, ⟨10.21437/odyssey.2024-42⟩. ⟨hal-04594287⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS UT1-CAPITOLE GENCI IRIT IRIT-SAMOVA IRIT-MELODI IRIT-SI IRIT-IA TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

157 Consultations

15 Téléchargements

Altmetric

Partager