当前位置: > 行业资讯 >

行业资讯

AVS3-P10实时语音标准制定工作进入CD阶段

发布时间:2024-03-26 文章来源:新一代人工智能联盟
  2024年3月21日上午,在深圳鹏城实验室举行的第88次AVS标准工作组会议开幕式上,音频组组长窦维蓓宣布了《信息技术 智能媒体编码 第10部分:实时语音》(AVS3-P10)已经完全满足技术需求,主客观测试验证表明其性能在多个对比项中表现最优,标准制定工作由工作组草案(WD)阶段进入委员会草案(CD)阶段。这一进展标志着AVS3-P10标准制定取得了重大突破,为实时语音通信领域注入了创新的活力。
 
  作为全面和系统性引入AI技术的全球首个实时语音编码标准,AVS3-P10真正实现了高质量前提下的低码率编码。按照计划,AVS3-P10标准将于2024年正式发布。
 
  在2023年12月16日公布的N3718(AVS3-P10《信息技术 智能媒体编码 第10部分:实时语音》WD1.1)已经实现了低码率、高质量的单声道实时语音编码,在此基础上,2024年3月15日公布的N3758 (AVS3-P10《信息技术 智能媒体编码 第10部分:实时语音》CD 1.0),在技术上集成了在AVS音频历代标准中采用的基于极大相关旋转(MCR:Maximum Correlation Rotation)的参数立体声编码技术,并针对实时语音场景重新优化了码书。经过测试,码率低至7.6kbps时也可实现高质量双声道立体声编码效果,更符合AVS3P10高质量、低码率的性能要求。
 
  按照ITU-T P.800 DCR主观质量评价规范,中国电子技术标准化研究院的交叉验证,结果表明:在宽带和超宽带场景下,在低于17kbps的测试码率条件下,AVS3-P10的CD1.0实现了双声道立体声主观质量均超过对比系统。
 
  进入CD阶段是AVS3-P10标准的关键里程碑,预示着实时语音通信、在线会议等领域的技术创新和应用发展将迎来新的飞跃。
 
  AVS3-P10 实时语音编码,作为新一代的语音编解码技术标准,是对AVS系列标准的重要补充。该标准代表了主要技术贡献单位——腾讯在语音处理和人工智能技术创新和用户体验方面的最高追求,体现了业界最高水平,将为用户带来前所未有的性能和体验,引领行业进入一个全新的时代。
    〖 浏览次数: