奇客微软新文本语音模型能在 3 秒内复制任何人的声音

奇客资讯 • 1年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

微软新文本语音模型 VALL-E 只要听 3 秒钟的声音样本就能复制任何人的声音。VALL-E 是一种基于转换器（transformer）的文本语音模型，比之前的模型有显著的改进，旧的模型需要长时间训练才能生成新的声音。此外，在生成的语音中声音的语调、卡里斯马（或魅力）和风格都完全一致。这是文本语音系统朝着更自然的声音迈出的重要一步。

https://valle-demo.github.io/
https://mpost.io/vall-e-microsofts-new-zero-shot-text-to-speech-model-can-duplicate-everyones-voice-in-three-seconds/

随意打赏

微软Windows最佳平替来了！国产桌面操作系统统信UOS V20发布年度更新，内置AI助理兼容多个千亿级大模型

思达派 • 34秒前

null
微软投资的Mistral AI将融资6亿美元估值60亿美元

i黑马 • 21小时前

5月9日消息，知情人士今日称，法国AI初创企业Mistral AI即将达成一笔约6亿美元的融资协议，使其估值增加近两倍，达到60亿美元。另外，Mistral AI当前的投资者，包括General Catalyst和Lightfast Venture Partners等，可能成为新一轮融资的主要投资者。文章评价匿名用户发
微软谷歌亚马逊Meta们，开始抢电了？

虎嗅网 • 1天前

最近，全球科技巨头都在积极规划和建设新的数据中心，以支撑日益增长的 AI 算力需求。2024 年 4 月份，微软与 OpenAI 计划投资1000亿美元建立一台“星际之门”超级计算机，而 Meta、谷歌、亚马逊等科技巨头也都在数据中心的部署上雄心勃勃。但是与此同时，这却给美国的电力系统带来了隐患。前阵子模型微调平台 O
微软将推自主手游商店叫板苹果、谷歌可跨平台访问

砍柴网 • 1天前

微软Xbox总裁邦德北京时间5月10日，微软公司将于今年7月份在网页端推出自主手游商店，为苹果、谷歌的应用商店和收费系统提供一个替代选择。微软Xbox总裁莎拉·邦德(Sarah Bond)周四在彭博科技峰会上表示，该商店上线时将包含
微软称75%知识工作者用生成式AI工作

i黑马 • 1天前

微软日前公布了年度工作趋势指数报告，数据显示，75% 的“知识工作者”已经在工作中使用生成式 AI，这一数据在过去的 6 个月中翻了一番。根据微软的定义，“知识工作者”是一个相当广泛的群体，通常指在办公桌前工作的人（包括办公室或居家）。文章评价匿名用户发布发布
消息称微软拒绝工作室开发《完美音浪》游戏续作

砍柴网 • 2天前

5 月 9 日消息，微软近日宣布关闭 ZeniMax Media 旗下的三个工作室：Alpha Dog Games、Arkane Austin 和 Tango Gameworks，引发了玩家、媒体、开发者的广泛关注。根据彭博社报道，微软在宣布关闭上述工作室时，Arkane Aust
颠覆Windows使用体验的功能！微软AI Explorer全新光标曝光

砍柴网 • 4天前

5月7日消息，据媒体报道，有用户在在Windows 11最新预览版中发现了名为AIX（AI Explorer）的全新DLL文件，代码显示用户在通过AI Explorer与屏幕交互时，会弹出全新的AI光标。不过AI光标并非全新概念，据Windows Latest报道，微软官方文档曾提
微软推 AI 模型 MAI-1，与 OpenAI 竞争；问界正式回应山西追尾事故；美空军部长亲自体验 AI 战斗机

极客公园 • 4天前

微软将推全新自研 AI 模型「MAI-1」，与谷歌、OpenAI 竞争北京时间 5 月 6 日消息，据 The Information 报道，微软正在公司内部训练一个新的人工智能模型，其规模足以与谷歌、Anthropic，乃至 OpenAI 的先进模型相抗衡。报道称，这个新模型内部代号为「MAI-
研究机构：今年第一季度微软 Azure 云服务市场占比 25%

砍柴网 • 5天前

5 月 6 日消息，市场研究机构 Synergy Research Group 上周发布了2024年第一季度云服务市场报告，其中显示大量企业正依靠云端服务，相较于去年同期，今年第一季度全球云服务市场增长了 21%，达到 765 亿美元（IT之家备注：当前约 5515.65 亿元人民币）。IT之家从报告中获悉，目前全球最
微软发现严重安全漏洞：受影响安卓应用安装量超40亿次！

i黑马 • 5天前

5月5日消息，据国外媒体报道，近日微软披露了一个名为 “Dirty Stream” 的严重安全漏洞，攻击者可利用此漏洞控制应用程序并窃取有价值的用户信息。微软的研究表明，这个漏洞并不是个例，许多流行的Android应用程序普遍存在这一问题，例如安装量超过10亿次的小米文件管理器和安装量约5亿次的WPS Office。目

提交建议

奇客 微软新文本语音模型能在 3 秒内复制任何人的声音

奇客微软新文本语音模型能在 3 秒内复制任何人的声音