标贝科技语音合成再获突破 全新离在线融合技术助力语音交互更高效

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

“前方路段拥堵,预计通行时间三分钟……”

“早上好,今天是3月2日,星期三,农历二月初一。天气:晴转多云,温度 3 ~ 12℃,西北风二级......”

随着人工智能语音设备的普及,语音合成技术也得到了广泛应用,生活里的这些智能语音播报服务几乎随处可见。

语音合成,是通过计算机完成文本转换语音的技术。为了让机器“说话”声音更加流畅自然,与用户沟通更有效率,语音合成的连贯度、自然度、快速定制能力就十分重要。早期语音合成大多“机械感”强烈,使用场景单一,随着语音合成效果的提升,应用场景和要求也越来越复杂。

例如,在智能车载设备或者智能家居场景下,既有一些实时查询天气、导航播报等在线功能,也有和终端设备相关的语音控制开关等功能。由于设备是移动状态,不可避免会出现没有网络或者网络信号不稳定。这种情况下,单一的在线合成或者离线合成都无法完全满足设备的应用需求。前者音色丰富、情感饱满,但是受网络条件影响,会存在网络抖动带来合成失败的情况;后者合成稳定,但是音色种类有限,并不能达到最优的音色质量要求。

离在线融合技术 给出语音合成最优解

作为国内领先的智能语音交互与AI数据服务提供商,标贝 科技 致力于智能语音技术应用边界的探索,在语音合成方面进行了大量的创新研发,已经推出高自然度、多语种、效果稳定的在线以及离线语音合成服务,充分满足企业和个人用户多样化声音生产需求。

近日,标贝科技语音合成再次取得突破性进展,自研离在线融合技术,即将离线、在线SDK融合,用户在网络不稳定情况下,可以实现离线、在线合成两种模式的灵活切换,同时兼顾了合成音色质量和响应速度的双重要求。目前此项能力已经在标贝开放平台上线,用户可以体验尝鲜。

标贝科技语音合成再获突破 全新离在线融合技术助力语音交互更高效

标贝科技离在线合成由统一的客户端SDK作为开发接口,同一个接口既可以调用云端在线的合成引擎,同时也可以调用设备端的离线引擎,用户根据自己的需求灵活接入即可。

在网络环境稳定的情况下,为了追求更多的音质效果,用户可以单独接入在线的合成引擎。如果优先考虑合成效果稳定,同时对音质要求不是很高,就选择纯离线合成引擎。如果网络环境频繁波动,则可以使用离在线融合,在一定延迟的范围情况下,自动选择云端的结果,否则,就采用离线的结果。 标贝科技离在线合成切换的逻辑已经内置在SDK中,开发者只需要考虑接入一个SDK,就能获取局部最优的效果。

标贝科技语音合成再获突破 全新离在线融合技术助力语音交互更高效

(三种合成模式路径)

同时,为了提高离线合成的音色质量, 标贝科技推出离在线融合语音合成能力的同时,还在原有离线合成基础上,升级了高音质的离线合成3.0版本, 声音效果更自然饱满,富有情感表现力,包括3个女声及2个男声共5个音色,用户可以结合使用需求,自由地选择发音人,享受媲美在线合成的优质体验。

应用场景方面,如有声阅读、车载交互、智能设备等,如果用户对合成音色质量要求比较高,同时网络情况良好,就可以优先选择在线合成服务。目前标贝科技在线合成发音人多达100余种,无论是知性、柔美、温和的女声,阳光、磁性、浑厚的男声,还是活泼、可爱、俏皮的童声,均可灵活选择。如果用户网络不稳定,又对响应速度有较强的需求,则可以选择标贝离在线融合语音合成,我们可以根据网络实时情况,实现在线、离线合成的流畅切换,确保最终的语音合成效果。

标贝科技语音合成再获突破 全新离在线融合技术助力语音交互更高效

标贝科技语音技术产品负责人表示,目前市场上能做到离在线融合语音合成能力的企业并不多,通过技术的产品化,是标贝科技在智能语音交互场景化落地的深刻思考。随着人机交互潮流的到来,用户对于语音合成的品质及效率也会有更高的要求。 标贝科技离在线融合语音合成技术打破了对人机交互对网络条件的高依赖,极大的提高了人机交互的便利。

作为深耕语音交互领域多年的品牌,标贝科技通过一次次升级和迭代,实现越来越多的场景下用户需求。未来,标贝科技将持续深耕AI语音交互技术,深化离在线语音合成能力,带给用户极致的语音交互体验。

随意打赏

提交建议
微信扫一扫,分享给好友吧。