新闻动态 > 公司新闻
远鉴两篇论文入选IEEE SLT2024并作报告分享
2024/12/06
12月2日至5日,由IEEE信号处理学会(IEEE Signal Processing Society)语音与语言处理技术委员会(Speech and Language Processing Technical Committee)主办的旗舰活动,2024年IEEE口语技术研讨会(Spoken Language Technology Workshop,SLT2024)在中国澳门召开。
SLT作为语音与语言处理研究领域的国际顶尖会议,每两年举办一次,为来自学术界和工业界的研究人员提供了一个平台,以讨论自动语音识别与理解领域的共同挑战,交流内容涵盖自动语音识别、对话/多说话人自动语音识别、说话人和语言识别、自动语音识别的新应用、视听/多模态语音处理等众多领域。
IEEE SLT2024口语技术研讨会开幕
远鉴信息是歌声深度伪造检测挑战赛(Singing Voice Deepfake Detection Challenge,SVDD)冠军、口吃事件检测和语音识别挑战赛(Stuttering Speech Challenge,SSC)冠军、源说话人溯源挑战赛(Source Speaker Tracing Challenge,SSTC)亚军,发表的两篇论文通过严格的评审,被国际会议SLT2024收录并在本届会议上宣读。
《Integrating Self-Supervised Pre-training with Adversarial Learning for Synthesized Song Detection》论文介绍了远鉴提交给SLT2024歌声深度伪造检测挑战赛的系统。现有的欺骗检测系统在高逼真度的合成歌曲数据集上应用时,往往表现不佳。为了解决这一问题,远鉴研究团队提出了一种将自监督预训练与对抗学习相结合的方法。首先,使用预训练模型来提取音频表征,然后将其输入到后端分类器中。采用基于残差块的网络来捕捉精细的音频特征。此外,还通过引入梯度反转层并应用对抗训练来增强基于原始语音网络模型,以提高模型对未知算法的泛化能力。最后,在得分层面将各种模型的输出进行组合。实验结果表明,我们的方法在受控歌唱声音深度伪造检测(Controlled Singing Voice Deepfake Detection,CtrSVDD)赛道的测试集上实现了1.57%的等错误率,与基线B02相比,相对降低了84.92%。
远鉴研究人员做SVDD技术分享
《Enhanced ASR for Stuttering Speech Combining Adversarial and Signal-Based Data Augmentation》论文介绍了远鉴提交给SLT2024口吃事件检测和语音识别挑战赛的系统。该挑战赛聚焦于通过实施多种直接且有效的多阶段数据增强技术来解决口吃的特征症状,旨在提高口吃人士的自动语音识别性能。通过模拟口吃者的节奏、语速和频谱包络的变化来提高性能。数据增强策略包括在正常音频中插入静音段、重复口吃的语音段以及调整语速和节奏。此外,还使用基于生成对抗网络的数据增强方法来获取与口吃语音相关的更精细的时频域特征。远鉴研究团队进行了详细的对比实验,评估每种方法在口吃语音识别系统中的有效性。结果表明,提出系统在口吃语音挑战赛的口吃自动语音识别赛道中达到了12.30%的字符错误率,相比官方基线实现了35.87%的相对改进。
远鉴研究人员做SSC技术分享
口吃事件检测和语音识别挑战赛冠军证书
远鉴在本届会议上展现了自身在人工智能技术领域的创新能力和国际领先水平,随着歌声深度伪造检测技术、口吃事件检测和语音识别技术及源说话人溯源技术被融入到实际应用,将为音乐产业版权、促进语音技术包容性、口吃治疗、抵御语音欺骗攻击等筑起坚实的防线。
未来,远鉴将不断开拓创新,深入研究前沿科技,引领AI和语音技术向更智能、更人性化的方向发展。
热门新闻
远鉴斩获IEEE SLT 2024三项竞赛冠亚军
喜报!远鉴信息斩获IEEE SLT 2024三个主题挑战赛竞赛荣誉:口吃事件检测和语音识别挑战赛第一名、歌声深度伪造检测挑战赛第一名,源说话人溯源挑战赛第二名。SLT 2024SLT(Spoken Language Technology)是由IEEE信号处理学会(IEEE Signal Processing Society)语音与语言处理…
远鉴斩获首届“金灵光杯”人工智能赛道一等奖
金灵光杯人工智能赛道一等奖!7月11日,首届“金灵光杯”中国互联网创新大赛颁奖典礼在京圆满收官。经过申报、初赛、决赛的激烈角逐和专家评委公正评审,远鉴信息《深度合成音视频生成与对抗鉴别应用研究》项目脱颖而出,斩获人工智能赛道一等奖。《深度合成音视频生成与…
储能安全新纪元丨全球首款储能多维生物识别安全解决方案上线!
前言据中电联数据显示,截至2023年6月底,全国电力安委会19家企业成员单位总计报送500kW/500kWh以上的各类电化学储能电站1024座、总功率27.22GW、总能量59.26GWh。储能作为促进新能源消纳的重要技术手段,是实现碳达峰、碳中和目标的关键。远鉴信息作为国内领先的人工智能…
远鉴信息2024开工动员大会召开!
一元复始,山河展新颜;蓄意待发,开启新征程。2月18日,远鉴信息2024开工动员大会在北京总部召开!远鉴信息董事长、执行总裁及部门以上负责人和全体员工齐聚一堂,共襄盛举。
新增专利授权13项!加速推动科技创新成果转化
2023年,远鉴成功共获得13项发明专利授权,涵盖语音、语言和图像处理等技术领域,涉及声纹识别、语音生成、音频鉴伪、语音评价、语音控制、自然语言处理、图像检测等智能处理技术。这彰显了公司在人工智能领域的持续创新,更凸显了公司对知识产权保护的重视。
国际竞赛 | 远鉴信息荣获ICASSP2024车载多通道语音识别挑战赛亚军
近日,ICASSP公布了车载多通道语音识别挑战赛(ICMC-ASR)排名结果。远鉴信息荣获亚军。
科研新高度!远鉴信息获准设立博士后科研工作站
近日,远鉴信息获准设为北京市博士后科研工作站园区分站。11月21日,北京市人力资源与社会保障局举办“新设站培训暨凝聚中国式现代化进程中的博士后力量推进会”,为远鉴信息等88家博士后科研工作站单位颁发牌匾。远鉴信息首席科学家郑榕博士出席并接受授牌。远鉴信息博士…
喜讯!远鉴信息荣获国家级专精特新“小巨人”企业称号
7月14日,北京市经济和信息化局发布了第五批专精特新“小巨人”企业公示名单,远鉴信息通过国家级“专精特新”小巨人企业认定,标志着公司在人工智能和信息安全领域创新技术实力和市场应用得到国家级认可。“专精特新”是指具有“专业化、精细化、特色化、新颖化”的“四…
语音生态多点布局!远鉴“谛听鉴音”系统与华为昇腾、昇思完成适配
导语:国家互联网信息办公室、工业和信息化部、公安部联合发布《互联网信息服务深度合成管理规定》,自2023年1月10日起施行。远鉴此次推出的语音深度鉴伪产品可满足伪造语音检测的安全需求。多年来,远鉴依托人工智能构建可信网络生态,在国家及社会需求的牵引下,在声纹…