新闻动态 > 公司新闻
远鉴信息参加全球信号处理顶会ICASSP 2024并作论文报告
2024/05/09
2024年4月14日至19日,国际声学、语音与信号处理领域的旗舰会议ICASSP 2024(International Conference on Acoustics,Speech and Signal Processing)在韩国首尔召开,本届会议以“信号处理技术:迈向真正智能的基石”为主题,涵盖了语音识别、语音合成、语音增强、自然语言处理、机器学习等多个前沿领域。
ICASSP 2024会议现场(图源网络)
作为IEEE信号处理学会的年度学术盛会,ICASSP不仅是全球规模最大、覆盖最全面的声学、语音和信号处理及其应用方面的国际会议,更是语音技术领域最具影响力的顶级论坛。远鉴信息受邀参加并同全球各地的高校、科研机构、企业界等,近4000位专家学者共同交流产业发展的前沿趋势,分享最新的科研成果,探索科学技术的最新动态。会上,远鉴信息被授予车载多通道自动语音识别挑战赛(ICMC-ASR)赛道亚军荣誉证书。
ICMC-ASR赛道荣誉证书
远鉴信息参赛团队现场领取荣誉证书
作为ICASSP 2024的一部分,车载多通道自动语音识别挑战赛(ICMC-ASR)针对复杂驾驶条件下的语音识别领域提出了挑战。本次挑战赛发布了超过1000小时的真实录制、多通道、多说话人、车载普通话会话语音数据。挑战赛由自动语音识别和自动语音记录与识别两个赛道组成,旨在推动车载自动语音识别研究的深入发展,并探索解决相应挑战性问题的新途径。远鉴信息就ICASSP 2024车载多通道自动语音识别挑战赛(ICMC-ASR)比赛技术方案进行了口头(Oral)报告交流。该技术方案针对多通道车载场景下的语音识别问题,从前后端两个角度进行了深入探索,相关论文被ICASSP 2024收录。
远鉴信息获奖团队现场作Oral报告
在前端算法方面,远鉴信息提出了一种基于能量投票的通道选择方法。该方法首先对四个远场通道进行降噪处理,然后利用聚类技术为每个说话人选取三个音频片段,并测试这些片段在四个远场音频通道上的能量大小。通过投票机制,选择出能量最大的通道,即距离该说话人最近的通道。此外,远鉴信息还引入了多种数据增强策略,如波束成形(Beamforming)、自动回声消除+独立矢量分析(AEC+IVA)等,以丰富训练数据,为后续的说话人分离和语音识别模块奠定了坚实的基础。
数据增强处理流程图
在后端算法方面,远鉴信息采用了多声学特征、多系统融合的策略。除了常见的Fbank声学特征外,还利用大规模无监督自监督学习提取表征特征。同时,将采用不同声学特征、不同训练数据集的模型解码结果进行融合。为了优化性能,远鉴信息还采用了多模块联合训练方法,特别关注语音增强模块与语音识别模块之间的协同。通过联合训练,降低了语音增强模块对噪声的过度抑制,从而提升了语音识别模块在复杂场景下的效果。
远鉴信息的论文被ICASSP 2024选作口头报告论文,并在车载多通道自动语音识别挑战赛道(ICMC-ASR)中取得佳绩,这不仅展示了远鉴信息在声学、语音和信号处理领域的实力达到新的水平,更为整个行业的发展注入了新的活力。未来,远鉴信息将不断提升自身在语音技术领域的优势,积极探索前沿科技,推动人工智能技术在更多场景下实现更高层次的跨越与发展。
热门新闻
远鉴斩获IEEE SLT 2024三项竞赛冠亚军
喜报!远鉴信息斩获IEEE SLT 2024三个主题挑战赛竞赛荣誉:口吃事件检测和语音识别挑战赛第一名、歌声深度伪造检测挑战赛第一名,源说话人溯源挑战赛第二名。SLT 2024SLT(Spoken Language Technology)是由IEEE信号处理学会(IEEE Signal Processing Society)语音与语言处理…
远鉴斩获首届“金灵光杯”人工智能赛道一等奖
金灵光杯人工智能赛道一等奖!7月11日,首届“金灵光杯”中国互联网创新大赛颁奖典礼在京圆满收官。经过申报、初赛、决赛的激烈角逐和专家评委公正评审,远鉴信息《深度合成音视频生成与对抗鉴别应用研究》项目脱颖而出,斩获人工智能赛道一等奖。《深度合成音视频生成与…
储能安全新纪元丨全球首款储能多维生物识别安全解决方案上线!
前言据中电联数据显示,截至2023年6月底,全国电力安委会19家企业成员单位总计报送500kW/500kWh以上的各类电化学储能电站1024座、总功率27.22GW、总能量59.26GWh。储能作为促进新能源消纳的重要技术手段,是实现碳达峰、碳中和目标的关键。远鉴信息作为国内领先的人工智能…
远鉴信息2024开工动员大会召开!
一元复始,山河展新颜;蓄意待发,开启新征程。2月18日,远鉴信息2024开工动员大会在北京总部召开!远鉴信息董事长、执行总裁及部门以上负责人和全体员工齐聚一堂,共襄盛举。
新增专利授权13项!加速推动科技创新成果转化
2023年,远鉴成功共获得13项发明专利授权,涵盖语音、语言和图像处理等技术领域,涉及声纹识别、语音生成、音频鉴伪、语音评价、语音控制、自然语言处理、图像检测等智能处理技术。这彰显了公司在人工智能领域的持续创新,更凸显了公司对知识产权保护的重视。
国际竞赛 | 远鉴信息荣获ICASSP2024车载多通道语音识别挑战赛亚军
近日,ICASSP公布了车载多通道语音识别挑战赛(ICMC-ASR)排名结果。远鉴信息荣获亚军。
科研新高度!远鉴信息获准设立博士后科研工作站
近日,远鉴信息获准设为北京市博士后科研工作站园区分站。11月21日,北京市人力资源与社会保障局举办“新设站培训暨凝聚中国式现代化进程中的博士后力量推进会”,为远鉴信息等88家博士后科研工作站单位颁发牌匾。远鉴信息首席科学家郑榕博士出席并接受授牌。远鉴信息博士…
喜讯!远鉴信息荣获国家级专精特新“小巨人”企业称号
7月14日,北京市经济和信息化局发布了第五批专精特新“小巨人”企业公示名单,远鉴信息通过国家级“专精特新”小巨人企业认定,标志着公司在人工智能和信息安全领域创新技术实力和市场应用得到国家级认可。“专精特新”是指具有“专业化、精细化、特色化、新颖化”的“四…
语音生态多点布局!远鉴“谛听鉴音”系统与华为昇腾、昇思完成适配
导语:国家互联网信息办公室、工业和信息化部、公安部联合发布《互联网信息服务深度合成管理规定》,自2023年1月10日起施行。远鉴此次推出的语音深度鉴伪产品可满足伪造语音检测的安全需求。多年来,远鉴依托人工智能构建可信网络生态,在国家及社会需求的牵引下,在声纹…