新闻动态 > 公司新闻

远鉴斩获ICASSP2025多模态情感与意图联合识别挑战赛亚军

2025/05/26

5月23-25日,国际声学、语音与信号处理领域的顶级会议ICASSP2025(International Conference on Acoustics,Speech and Signal Processing)苏州卫星会议成功举办。

640.png 

本次会议上,远鉴在多模态情感与意图联合识别挑战赛(Multimodal Emotion and Intent Joint Understanding,MEIJU)赛道2:不平衡的情绪和意图识别(Imbalanced Emotion and Intent Recognition)斩获第2名。远鉴研究团队提交的论文被大会录用,并在会议期间进行了论文宣讲。

 

 121212121.png

多模态情感与意图联合识别挑战赛证书


21212121.png

远鉴研究人员作技术分享


ICASSP是由IEEE(电气电子工程师学会)主办的全球规模最大、覆盖面最广的声学、语音和信号处理及其应用方面的国际会议,在全球范围内享有盛誉并具备广泛的学术影响力。每年都会汇聚来自世界各地的专家学者、企研机构、高校等,共同探讨和分享学术界和产业界最新的科研成果。

 

作为ICASSP2025举办的多模态情感与意图联合识别挑战赛,该项赛事旨在解码多模态对话中表达的语义信息,同时推断情感和意图状态,为用户提供更人性化的人机交互体验。近年来,人机交互系统逐渐成为日常生活的一部分,具备高情商和人性化特质的对话技术变得愈发重要。在传统的交互系统中,情感识别和意图识别被分开执行,情感识别可能无法精确捕捉用户的实际意图,从而导致交互系统难以有效地满足用户需求;在意图识别过程中往往忽视了用户的情绪状态,无法提供充分的情绪价值和支持。

 

远鉴参与的赛道2(普通话)提供了存在类别不平衡问题的大量标注数据,数据集包含7种情感标签(快乐、惊讶、悲伤、厌恶、愤怒、恐惧、中立)和8种意图标签(提问、同意、确认、鼓励、安慰、建议、祝愿和中立)。为了解决这个问题,远鉴团队采取在文本、视频和音频模态中使用各种数据增强技术,引入模态丢弃策略等一系列解决方案。实验结果显示,通过应用上述策略,情感和意图联合识别系统能够基于处理后的特征更精准地预测相应的情感与意图,显著增强了系统的适应性和准确性。

 454545454.png

远鉴提出的解决方案框架

远鉴在本次会议上再度展现了自身在人工智能领域的创新能力,多模态情感与意图联合识别技术的深度应用,将进一步推动智慧家居、智慧医疗、智能驾驶、生活娱乐等领域的发展。在智能驾驶方面,远鉴机动车智能语音解决方案融合多模态情感与意图联合识别技术,可通过语音感知驾驶者及乘客的情绪状态,播放适合当前氛围的音乐或提示音,有效舒缓紧张和狂躁的情绪,营造安心舒适的驾驶环境,这不仅提升了乘坐体验,也进一步保障了行车的安全性。

 

未来,远鉴将持续深化多模态情感与意图联合识别技术的研究,凭借公司领先的人工智能技术能力,不断突破技术边界,为行业带来更多、更好的应用产品和解决方案,打造更加人性化的人机交互体验。


热门新闻