10月23日,计算机领域顶级国际会议ACM Multimedia 2017在硅谷举办,信息学院多媒体计算实验室金琴团队荣获国际听视觉情感计算挑战赛(Audio-Visual Emotion Challenge AVEC 2017)冠军。
金琴团队对情感识别的两个重要模块——多模态情感特征表示和连续情感识别模型进行了创新性地改进。在情感特征构建方面,该团队提取了视觉、语音和文本等多模态情感信息,并创新地考虑对话双方对彼此情感状态的影响,从而得到更加有情感区分力的特征;在情感识别模型方面,该团队使用长短时记忆递归神经网络对连续的时序信号进行建模,通过对不同情感维度的多任务学习机制进一步提高了情感识别性能。
据介绍,国际听视觉情感计算挑战赛AVEC由伦敦帝国理工大学、诺丁汉大学、美国南加州大学和德国帕绍大学等联合组织,是情感计算领域公认的顶级国际竞赛,现已连续举办七届。该挑战赛的任务是在自然场景下根据人的行为表现连续地预测三种不同维度的情感状态。该比赛为多模态情感识别提供了一个统一的测试平台,以推进情感计算在现实场景下的应用。今年共有包括中国人民大学、中科院自动化所、北京师范大学、新南威尔士大学、卡内基梅隆大学、布鲁内尔大学等在内的共13支队伍提交最终竞赛结果。人民大学此次竞赛学生成员包括博士生陈师哲、赵金明和硕士生王帅。该团队曾在AVEC 2015获得第四名,AVEC 2016获得第二名,并在ACM Multimedia等国际会议发表论文对情感识别难点进行深入攻关。