新华网合肥1月30日电(李东标)1月30日下午,科大讯飞正式发布星火语音大模型。据了解,此次发布的语音大模型除了表现出色,还能“百搭”更多应用场景,促进人机交互技术的创新与应用。
“大模型带来了语音技术发展的全新机会。”科大讯飞董事长刘庆峰表示,让机器具备学习、推理和决策的能力,就是认知大模型要干的主要工作。“简单来说,借助大模型,我们让一段语音具备更加丰富的属性,有语种、有内容、有韵律、有音色,还有情绪。”
刘庆峰介绍,星火语音大模型语音识别效果国际领先。在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。
据了解,搭载语音大模型的讯飞翻译机,即将上线多语种自动识别和增强式翻译两个重要功能。讯飞翻译机多语自动识别升级,将支持35种语言,为跨语言沟通提质增效;增强式翻译提供中英双语服务,让跨语言交流更加省心出彩。
科大讯飞董事长刘庆峰发布星火语音大模型
不只是助力跨语言沟通交流,星火语音大模型还赋能千行百业新应用场景。刘庆峰介绍,在汽车、客服、家庭、陪伴机器人等场景中,星火语音大模型还有更多用武之地,带来人机交互领域的变革。他举例说,星火语音大模型将进一步优化智能驾舱、智能座舱、智能导航等汽车交互体验,陪伴机器人、导购机器人、辅诊机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。
当天的发布会上,首个基于全国产算力训练的全民开放大模型讯飞星火V3.5,在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。首个基于全国产化算力平台”飞星一号”的开源大模型——星火开源-13B也在当天正式发布。
讯飞星火自去年5月首发以来,不断迭代升级其大模型能力。截至目前,基于讯飞听见、讯飞星火APP、讯飞输入法等应用已累计赋能亿万用户。在星火大模型的帮助下,越来越多的用户拥有专业AI助手。据统计,在讯飞开放平台上,大模型总开发者已超35万,其中企业开发者超22万。