微软推出DragonV2.1语音模型

i黑马  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

微软近日发布新一代DragonV2.1 Neural零次学习模型,该文本转语音系统仅需数秒语音样本即可生成超100种语言的逼真语音。相比前代产品,新模型在发音准确性方面取得突破性进展,单词错误率平均降低12.8%,特别改善了专有名词的发音问题。这项技术创新通过SSML音素标签和自定义词典实现精准的发音控制,可应用于智能客服语音定制、多语言视频配音等场景。微软同步推出Andrew、Ava等预设音色库,方便用户体验其卓越的自然语言表现力。

文章评价
微软推出DragonV2.1语音模型 匿名用户
发布
发布

    随意打赏

    提交建议
    微信扫一扫,分享给好友吧。