您好,欢迎访问开云网站!

集团动态

联系开云

开云
联系人:杜经理
手机:18755199984
电话:0551-82601881
邮箱:sale.zcjd@qq.com
地址:合肥市巢湖市团结路与东塘路交口东方国际大厦8层
开云首页>>开云新闻>>集团动态>>开云-首个支持30种方言混说语音大模型发布—新闻—科学网

开云-首个支持30种方言混说语音大模型发布—新闻—科学网

发布日期:2024-07-26 作者:开云

“唔该查吓德律风费吖”“侬帮阿拉查下话费好伐?”中国电信万号智能客服天天接到几百万通德律风,此中很多是用方言拨打,特别是一些白叟习惯说方言、只会说方言,智能客服和人工客服都难以理解,沟通效力年夜打扣头。

近日,中国电信人工智能研究院(TeleAI)发布业内首个撑持30种方言自由混说的语音辨认年夜模子——星斗超多方言语音辨认年夜模子,打破单一模子只能辨认特订单一方言的窘境,可同时辨认理解粤语、上海话、四川话、温州话等30多种方言,是国内撑持最多方言的语音辨认年夜模子。

据统计,全国仍有约20%生齿未普和通俗话,他们经常被阻遏在智能信息办事以外,难以享遭到AI时期的便当。构建高质量方言数据库,是方言庇护和研究的根本。当前,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,方言数据库在丰硕性和高质量等层面均居在业内前列。

中国电信人工智能研究院(TeleAI)对峙自立研发立异,推出了星斗语音年夜模子,经由过程超年夜范围语音预练习和多方言结合建模,率先实现单一模子撑持30种方言自由混说语音辨认,是国内撑持最多方言、笼盖生齿最多的语音年夜模子。

据中国电信首席手艺官、人工智能研究院院长李学龙介绍,研发团队初创“蒸馏+膨胀”结合练习算法,解决了超年夜范围多场景数据集和年夜范围参数前提下预练习坍缩的问题,并实现1B参数80层模子不变练习。同时,星斗语音年夜模子也是业内首个开源的基在离散语音表征的语音辨认年夜模子,其经由过程“从语音到token再到文本”的建模新范式,将推理时语音传输比特率下降数十倍。

AI正在为传承说话文化注入全新生命力。方言语料收集、记实和归纳后,需包管能被后人准确理解。中国幅员广宽,“百里分歧俗,十里分歧音”各类方言语法语音特点各不不异,传统的方言研究依靠在查询拜访者主不雅感知标注,人力工程量庞大且难以系统标注。而AI可以或许更高效、系统地对方言进行清算归纳,对方言庇护和传承意义重年夜。

星斗语音年夜模子已普遍利用落地。据介绍,星斗语音年夜模子已在福开云体育app建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点利用,接入星斗年夜模子今后,万号智能客服秒懂30种方言,实现日均处置约200万通德律风;智能客服翼声平台接入星斗年夜模子的语音理解和阐发能力,实现31省全笼盖,天天处置125万通客服德律风。另外,星斗语音年夜模子还落地多地市的12345平台。

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来历和作者,且不得对内容作本色性改动;微信公家号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。


开云
专业 规范 诚信 共赢 创新 发展

18755199984/0551-82601881

( 服务咨询热线 )
地址:合肥市巢湖市团结路与东塘路交口东方国际大厦8层
Copyright © 2022 All Rights Reserved.
技术支持:无忧资源网   皖ICP备2023013513号-1