阿里通义开源首个CoT音频模型

i黑马 • 2月前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

阿里通义语音团队最新开源的泛音频生成模型ThinkSound，主要用于视频配音，主打让每一帧画面都有专属匹配音效。据介绍，它首次将今年大热的CoT思维链推理引入了音频领域，解决了传统视频配乐技术往往只能生成单调的背景音，而难以捕捉画面中的动态细节和空间关系的难题。目前ThinkSound一共有三种型号（1.3B、724M、533M）可选，开发者可在GitHub、HuggingFace、魔搭社区下载体验。

文章评价

匿名用户

发布

随意打赏

腾讯混元开源端到端视频音效生成模型

i黑马 • 3分钟前

8月28日，腾讯混元官方宣布，开源端到端视频音效生成模型 Hunyuan-Foley。用户通过输入视频与文字描述，即可为视频匹配电影级音效，打破了 AI 生成视频 “无声” 的局限。据了解，用户仅需输入视频和文字描述，即可生成电影级高品质音效。即日起，用户可在GitHub和Hugging Face下载开源模型，或通过混
知乎开源“智能预渲染框架” 几行代码实现鸿蒙应用页面“秒开”

砍柴网 • 4小时前

近日，知乎在Gitee平台开源了其自研的鸿蒙“智能预渲染框架”，并将该框架的Har包上架到OpenHarmony三方库中心仓。该框架在鸿蒙平台首创“智能预渲染”技术，旨在破解应用复杂页面加载缓慢，交互延迟等核心痛点，通过智能预测用户浏览目标进行提前渲染，只需几行代码即可显著提升复杂页面的加载性能，实现“页面秒开”的高效
基于开源鸿蒙打造的公路机电操作系统获“茅以升科学技术特等奖”

砍柴网 • 5小时前

2025年8月26日，茅以升科教基金会道路交通委员会发布了2024年度 “茅以升科学技术奖—交通运输科学技术奖” 表彰决定。其中，由交通运输部公路科学研究院、华为、深开鸿等多家单位、企业共同基于开源鸿蒙操作系统开发完成的《公路机电国产化操作系统关键技术研发及应用》项目成果荣获特等奖。
阿里云开源多模态视频生成模型

i黑马 • 22小时前

8月26日，阿里开源全新多模态视频生成模型通义万相Wan2.2-S2V，仅需一张静态图片和一段音频，即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频，该模型单次生成的视频时长可达分钟级，大幅提升数字人直播、影视制作、AI教育等行业的视频创作效率。文章评价匿名用户发布发布
基于开源鸿蒙打造的公路机电操作系统获茅以升科学技术特等奖

砍柴网 • 1天前

2025年8月26日，茅以升科教基金会道路交通委员会发布了2024年度“茅以升科学技术奖—交通运输科学技术奖”表彰决定。其中，由交通运输部公路科学研究院在内的多家单位、企业共同基于开源鸿蒙操作系统开发完成的《公路机电国产化操作系统关键技术研发及应用》项目成果荣获特等奖。我国公路路网规模已达到 549.04 万公里，拥有
面壁智能开源8B参数的多模态模型MiniCPM

i黑马 • 1天前

8月26日，面壁智能正式开源8B参数的MiniCPM-V 4.5多模态模型，具备“高刷”视频理解能力。据介绍，该模型高刷视频理解同级SOTA且性能超过Qwen2.5-VL 72B；同等视觉token开销下，MiniCPM-V 4.5可接收6倍视频帧数量，达到96倍视觉压缩率，是同类模型的12-24倍。文章评价匿名用户发
微软开源音频模型Vibe Voice1.5B 可连续合成90分钟语音

i黑马 • 1天前

8月26日，微软研究院在美国宣布开源创新音频模型VibeVoice-1.5B，该模型一次性可连续合成90分钟超长逼真语音，显著超越此前多数模型60分钟的上限。根据公开资料整理，VibeVoice-1.5B在语音合成时长、音色稳定性及语义连贯性方面实现多项突破。传统模型在30分钟后常出现音色漂移、语义断裂等问题，而Vib
货拉拉开源两款三方库，为鸿蒙应用高效开发贡献力量

砍柴网 • 3天前

自HarmonyOS 5发布以来，鸿蒙应用开发加速推进。通过共建的方式，华为与众多生态伙伴一道，针对鸿蒙的底座技术、通用能力及各垂直行业应用场景，推出了一系列开发者场景化解决方案，为开发者提供可复用、可扩展的通用工具，持续提升鸿蒙应用的创新体验与开发效率。在这一生态共建的浪潮中，货拉拉积极贡献了其在鸿蒙应用开发过程中的
国内首个！基于开源鸿蒙的电鸿操作系统内核获最高级别安全认证

砍柴网 • 3天前

近日，由南方电网公司基于开源鸿蒙研发的电鸿物联操作系统内核获得中国网络安全审查认证和市场监管大数据中心（CCRC）颁发的EAL5+安全认证证书，电鸿成为国内首个由企业自主研发并获得最高安全级别认证的物联操作系统内核，标志着南方电网公司在工业互联网核心基础软件领域安全可控的重大突破。
马斯克开源Grok

i黑马 • 3天前

北京时间8月24日，特斯拉CEO马斯克在X社交平台上官宣，xAI去年最好的模型Grok-2.5（实际上是Grok-2）正式开源，同时，Grok-3也将在大概6个月内开源。马斯克同时发表观点表示，xAI很快就会超越除谷歌外的任何公司，然后也将超越谷歌，“但中国公司将是最强劲的竞争对手，因为他们的电力比美国多得多，而且在硬

提交建议