中国电信发布首个支持30种方言混说语音大模型
2024-05-30
19108
近日,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。据悉,该大模型研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练。星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。目前,星辰语音大模型已在福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点应用。
声明:本网所登载内容出于更直观传递信息之目的。该内容版权归原作者所有,并不代表本网赞同其观点和对其真实性负责。若有来源错误或者侵犯您的合法权益,请及时通过邮箱rwzbs@126.com与我们联系,我们会及时反馈并进行处理。
本页链接:http://todaychina.zgshjdw.com/a220105-show/news-27445.html