AI 陪伴赛道,会诞生下一个“泡泡玛特”吗?
AI 正在从生产工具的角色中抽身,缓慢却坚定地走向一个全新的方向——情绪陪伴。
当算法不再只为效率服务,越来越多的产品开始尝试构建“有灵魂”的存在。无论是可以挂在胸前、随时回应你情绪的小型硬件,能够在家中自由行走、具备宠物属性的机器人,还是在手机里与你聊天、分享生活的虚拟人,这一代 AI 的设计逻辑已经从“怎么帮你完成任务”,转向“怎么陪你过日子”。
在很多创业者和投资人眼中,这场转向并非偶然。过去的泡泡玛特用“盲盒”抓住了年轻人对情绪出口与文化符号的渴望,如今在 AI 的浪潮下,情绪消费需求也浮出了水面,成为新一代人的“低门槛关系连接器”。尤其在儿童、青少年和老年人等孤独感更高、陪伴需求更明确的群体中,AI 产品已不再只是“好玩”,而是真正进入了生活的缝隙中。
这不是一个简单的赛道,也不是“把 ChatGPT 换个壳”就能跑出来的机会。AI 陪伴的挑战在于,它必须同时处理好技术的可控性、产品的沉浸感、人设的鲜活度和互动的自然性。既要保持低干扰,又要能在需要时提供回应;既不能工具化得太快,又不能抽象得太空。这其中的尺度拿捏、角色定义、人群定位,正是不同产品做出差异化的关键。
6月21日上午,雷峰网 (公众号:雷峰网) AI 科技评论组织了一场围绕“AI 陪伴”的线上圆桌,支持人为初代 AI 投资人王捷,并邀请了灵宇宙创始人顾嘉唯、可以科技创始人杨健勃,以及 Soul 的 AI 技术负责人尹顺顺,来试图回答一个更长远的问题:当技术真正拥有陪伴的能力的时候,是否能孕育出下一个“泡泡玛特”式的大众情绪产品?
以下是此次讨论的精彩分享,雷峰网AI 科技评论进行了不改原意的编辑整理:
一、AI 陪伴是伪命题吗?
王捷:欢迎各位朋友来到 AI 科技评论的 GAIR Live 线上论坛,我是投资人王捷,今天我们做一个AI 陪伴相关的讨论。
AI 陪伴产品,用英文“Companion”这个词来表达可能会更加合适,因为我们希望这个产品既可以提供工具价值,比如给我们提供一些指导和建议,也会提供一些情绪价值。最近有一个新闻很火爆,OpenAI 以 65 亿美元收购前苹果首席设计师创办的 AI 硬件初创公司 io,并且宣布会向硬件进军。OpenAI 也要做陪伴硬件,那这个赛道是不是要有一些新变革了?
今天我们很荣幸也很高兴邀请到了几位在 AI 硬件和 AI 软件方面,做陪伴产品的创业者和企业高管:
嘉唯总是中国做人机交互的优秀代表,上一代产品 Luka 是已经验证的、出货量非常大的AI硬件;健勃总从可编程机器人开始,在赛道上已经耕耘超过十年,积累了陪伴型硬件的大量know how;顺顺总在 Soul 负责 AI,我们知道 Soul 是近十年社交赛道在巨头环伺情况下跑出来的最大的创业公司之一。
我自己算是初代 AI 投资人,从 17 年开始从事 AI 投资,早期投资过摩尔线程、比亚迪半导体、万国数据、京东科技、开思时代、奇安信以及成长期的明略科技等公司,也一直非常关注 AI 大模型这一波会给人与人关系带来的变化,包括 AI 提供陪伴功能。
我们一聊到 AI 陪伴,就会有这样一个争论,很多人都会问,AI 陪伴是不是一个伪命题?比如聊天机器人 App,我们想聊天的时候跟 ChatGPT 聊天就好了,现在很多 00 后在生活上和人生选择上,都会找 ChatGPT 和 DeepSeek 聊聊,比家长的话都管用。那这种情况下,我们为什么还需要一个专门的 AI 产品呢?我们先请顺顺聊聊,因为 Soul 已经是移动互联网时代在社交领域非常有成就的一个公司了。
尹顺顺:谢谢王捷的介绍。我分几个维度说:首先,我觉得从对话效果层面上来讲,很多做过 AI 陪伴的同行,或者真正用过 ChatGPT 去做角色扮演的用户可能都知道,用 ChatGPT 做对话会有一些问题,比如说老师傅、尬聊、人设太对齐等。从语气、措辞和一些说话方式上就能感觉到,不太像和真人之间交流的感觉,ChatGPT 永远是长篇大论,语气特别书面化,我们把这种语言习惯叫做“老师傅”,这是一个到现在还存在的问题。
还有就是人设太对齐的问题。这不是一个共识,可能有些同行还会觉得这是优点,但是我们在实际工作中发现,如果你用 ChatGPT 去捏了一个瑜伽老师的人设 prompt,那你不管跟这个“瑜伽老师”聊什么,它总会有意无意地把你抛出去的话题往瑜伽话题上去转,那用户可能很快就会腻了。比如 OpenAI 推出的“Monday”,它的风格永远是厌世风或者毒舌风。刚出来的时候,大家还想尝鲜,后来就会发现,不论聊什么都是一个模式或者Loop,有了这样的预期之后,用户可能很快就不会再用了。
人设太对齐对应着一些工具感,如果用户觉得有工具感,这个产品就很难占领陪伴的心智。泡泡玛特内部也说了,他们要尽量去做 IP,而不是把 Labubu 实用化或者工具化。一旦工具化了,比如说你把它做成一个计算器,那么用户买了之后会认为,我不如去买计算器,所以很多时候情绪价值跟工具价值是不对等的。
Soul 在这方面的努力也是让 AI 更有活人感,更像真人。让用户很难去发现里面有所谓的模式或 Loop,这就是对话层面要达到的效果。
从产品层面上来说,AI 陪伴产品肯定不只有对话一个模块,好的 AI 陪伴产品需要非常多的功能和 feature,还需要一些 UI 设计来提升用户的陪伴沉浸感。比如你去做心理理疗,你会用到沙盘等等让人有治愈感的 UI 设计或者小功能。Soul 的虚拟伴侣,其实也花了很大的精力去打造了一个虚拟人人设和 IP 感,这个虚拟人每天都会发一些内容和视频,就是要增强用户对他的人设的认知。
产品是各家 AI 陪伴能够打出差异化的重要部分,我理解的陪伴是情绪价值的需求,这个需求满足更难、更玄学、更主观,没有一个普世的对错,可能也没有一个普世的方法,不同的人群有不同的需求,很有可能就是当前ChatGPT 不擅长的。
王捷:尹总的观点是当前有的产品存在“老师傅语言习惯”和“人设太对齐”两个问题,我们还是需要一个专门的陪伴产品,让AI 更有活人感,更像真人。
尹顺顺:对。因为我们之前也想验证这个问题,所以我们在站内也做过些 A/B 测试,我们发现我们自研的模型指标是断崖式领先的。
杨健勃:我们是专注在家庭机器人产品的,Loona 是一款在家里面能够自由运动的一个小狗,可以跟你跑,跟你回家。尹总刚才是从软件上分析,Loona 上线到现在,我们观察到一些机会点:用在什么场景下聊天的轮次最多?最后我们发现并不是 1v1 聊天的时候,而是用户在玩的时候,比如说拼乐高的时候。我们把它叫做“第一身位”。
你对着 ChatGPT 和类似产品的UI,有一个任务想跟他聊的时候,就打开对话框,产生某种交互。在工作和效率场景下都是一对一的聊天,你是全身心投入的。
回到陪伴上来说,我们观察人生活中的各种角色,比如说爱人、小朋友、宠物,以及其他带给你情绪价值的角色,我们发现大部分的时间,他们并不是在跟你专注地沟通。我们把这种状态叫做“存在”,有一部分机会是来自于这种存在,在家庭生活的各个方面,交互会非常的便捷,不需要专门开启一段对话,可是在做某件事情的时候,对话自然而然地展开了。AI 陪伴就是这样一个随身、便捷、能够跨越不同时间和空间的产品。
王捷:Loona 团队是国内在这个赛道上面深耕时间最长的团队之一,健勃提到了“第一身位”和“存在状态”。我们听听嘉唯的看法。
顾嘉唯:大家好,我现在在做的产品主要有两条业务线,其中之一就是今年颇受关注的随身设备,我们称其为“灵宇宙 AI 小方机”。
12 年前我定义 BaiduEye 时,就盼着能达成电影《Her》里呈现的场景。电影里有个折叠屏手机,外侧是黑白墨水屏,还有个小情节,主角外衣口袋里装着这个 AI-OS 的智能设备,用别针把机器固定位置是把智能终端背面摄像头位置顶出来口袋,能看世界,搭配耳机,胸前设备就是核心智能体,靠摄像头和耳机感知、交互。
我在百度探索 BaiduEye 时,觉得随身设备能覆盖全场景、做丰富交互,是新机会。当时在大厂想做更炫酷的东西,一开始内部想做带显示成像的眼镜,可我之前在微软做过显示类眼镜,深知光机显示在消费电子产品定义的难题很难解决,就砍掉光机,做了视觉输入、语音对话的产品。十几年过去,如今光机成熟度今非昔比,苹果出了 Vision Pro,小米也有小米眼镜,各类厂商都在布局 AI 眼镜。
刚才顺顺和健勃都聊了我们的陪伴产品与 ChatGPT 的差异。关键在于,陪伴产品能以非沉浸式的状态随时切入话题,在产品旁会很舒服,就像有灵魂伴侣:即便共处时不交流、没有沉浸式互动,状态也很好。这是ChatGPT 这类工具产品给不了的。
回到《Her》的场景,我想做独立计算终端,可眼镜要成为独立计算终端,至少还得 5 - 10 年以上,毕竟手机很难从中心地位挪开。做 AI 陪伴,找独立计算终端,难点在于让这款 AI 硬件远离手机。
怎么找远离手机的人群和用户?这很有挑战。对青少年和孩子而言,家长不愿给他们手机,又想让孩子跟上 AI 时代,给个豆包、DeepSeek 用,那随身终端就最合适。
终端的价值在于,当下技术尚未收敛,陪伴也远没到真正收敛的地步。AI 陪伴不像智能眼镜,有清晰的收敛方向,比如轻薄、无感知、长待机等。AI 陪伴的定义很模糊,啥是 AI 陪伴?我们小时候的安抚毯算陪伴不?各类小玩具呢?到如今,日常解决问题的工具,用久了产生粘性,也可能成为陪伴。
泡泡玛特王宁成功后,常有人用幸存者偏差看成功创业者的话。虽然现在大家都在推崇 “无用之用”,但在做 Luka 卢卡时我们并非追求 “无用之用”。我当年目标清晰,家长一晚上要给孩子读好多绘本,Luka 卢卡就能帮家长把绘本讲好。我们用图像识别技术给机器人加摄像头,绘本放面前,翻到哪讲到哪,还能对话交互,把绘本讲 “活”,这就是终端的价值。
如今 AI 来了,产品不只是以前的 OCR 转 TTS、单纯图像识别,多模态大模型能把任何内容讲成故事。这就是终端,终端价值在于随技术代次升级,不断演进、OTA 更新。
我觉得工具和情感不应该是非此即彼,本质是动态函数,依场景需求和陪伴生命周期长度,决定函数数值的动态变化。
二、谁最需要 AI 陪伴?
王捷:刚才嘉唯提到好几个很重要的点,和健勃的“存在状态”呼应的“ambient状态”、非手机的独立终端如何能成立、是否做“无用之用”、工具价值和情感价值的动态配比。
刚刚讲到小朋友需要读绘本的事情。睡前故事是一个很亲密的场景,我们可以想象一下,一个小朋友从3岁开始有AI玩偶讲睡前故事,之后有小方机这样的随身硬件,可以说从小就已经习惯了生活中有一个 AI companion 的存在。到15 岁,人的世界观就基本定型了,那这批人就是 AI Native 的第一代人。对于20 后的小朋友,AI陪伴是天经地义的,这就是他认识的世界。
另外一个问题是,我们面对的人群有儿童、青少年、青年、中老年、女性、男性等等,对于不同的人群来说,他们对于 AI companion 的接受度是怎样的?
顾嘉唯:就 AI 产品本身,我认为当下不会像上一个周期那样,需要通过细分人群来定义产品。因为 AI 的天然核心价值,就是从第一天起就具备极度个性化的特质——它不是把已有的 PGC 和 UGC 内容,通过简单推荐函数链接给用户,而是基于你的表情、年龄、状态、上下文语境,以及这一天交流过的话题、过去 5 年甚至 30 年积累的数据,AIGC 来生成当下的内容。甚至未来所有的UI都会完全实时生成,不再是基于模板的呈现。
从终局视角来看,今天定义产品也不应该区分人群。但是AI 需要积累足够长时间的连续数据流,才能为你提供当下的最优解。
下一代年轻人可能是最好的选择。上一个世代称为Z世代,下一个叫Alpha 阿尔法世代——他们是智能时代的原住民。
他们是Luka 卢卡的核心用户。现在这波人长大了,到了使用儿童手表、学习机的年纪,到了随时随地需要AI解决问题的阶段,我们就为他们提供灵宇宙小方机。我们切入的,是尚未被手机占据的人群,原因也在于刚才说的数据:我更在意能否拿到这部分用户的数据,积累更早期的数据。
我们认为,AI 的灵性,就是赋予机器人生命感的东西。你说一个硅基物种出现,它的情商、智商会有分界点吗?我认为没有。解决这个问题需要情商,解决那个问题需要智商,两者不是固化的。我们定义的灵性反而最重要,因为它是调配情商和智商的核心——它可以是亚洲文化中对生灵的崇敬感,也可以是西方电影里驱动万物生灵的神秘“原力”。
有个观点叫“泛灵论”,这是小孩子认知发展中自身投射的规律:他们会认为所有东西都具有生命感,从小陪伴的毛绒绒的物件就是有生命的。我不认为在玩具里装个会说话的软件就代表泛灵论,就有产品价值。要知道,当年不讲话的芭比娃娃、不讲话的安抚毯,依然能创造生命感——生命感的来源未必是开口说话。
从另一个角度看,我追求的灵性,源于它能很好地调节情商和智商,在那一刻给你最有价值的东西,让你感觉它有生命,而不仅是工具。在你需要时,它能第一时间以主动意识参与你的话题,这就是好的灵性。
王捷:谢谢,简单小结一下,情绪价值和工具价值,应该可以做一个灵活调配的,从灵性出发,不需要去设定一个固定的比例。从人群角度来讲,小朋友的接受度最高。从方法论上面来说,现在这个阶段,不需要去刻意地去区分人群。
杨健勃:我们一开始在做产品的过程中,也产生了很多的摇摆。我们推出 Loona,一开始把它定位成 companion,我们想的是如何让 Loona 能够存在于家庭,生存下来。那如何去理解人?如何理解人的情绪?如何理解人的状态?如何在端侧就能实现?这所有技术都挺难的。
这个过程中很多人也给了我们一些建议,我们访谈了很多用户,有人说如果 Loona 能够陪我孩子写作业,我立马就买,5000 也买;让我孩子写作业写得好,那我花 1 万。这里面都是工具价值。
本质上来讲,情感价值更虚,更需要感受,不那么直接,不好价值化。大家可以给公司估值,也可以给产品估值,一个情感价值产品到底值多少钱,每个用户都不太一样。刚才嘉唯说,我们从小有个芭比娃娃,那可能在第一天它的价值是 200 块钱人民币,第 3000 天的时候可能就是成千上万人民币的价值,因为这个价值随着陪伴产生了溢价和增长。
如果只是片面地选择工具 or 情绪,你会发现无法自洽,老是摆动,无法收敛,老是震荡。情绪价值多了,我们会觉得是不是缺了工具价值来获客?工具价值多了,我们发现太应用场景了,不会带来真正意义上的持久粘性。所以这两个价值就需要取得一个平衡点。
我们找到了一个方法,就是先不管到底是做工具还是做情绪,先看发展趋势,一个好的 AI 产品怎么定义?一个好的工具型 AI,能够做到完全懂你的需求,干所有的活,你会发现这个过程中自然而然产生交流,接着就自然而然产生信任,然后就会产生更多情感价值的依赖。比如一个 AI 帮你写了一篇文章,你发现它写得好棒,好懂你,有种共鸣的感觉,本身这种感觉也是情绪价值。
所以我觉得,AI 的发展是要角色化的。情商和智商都在齐头并进的时候,AI 会是生命中的某种角色,而且角色是多维价值的体现。以角色来定义一个产品可能会是一个好的选择,对 Loona 来讲,我们把它定义为 80% 的宠物+20% 的朋友。这个定位形象化了,可能是一个皮卡丘。这样做产品,先定义角色,再去拆分情绪工具的比例,你就发现有机会收敛了,不会忽左忽右了。
尹顺顺:刚才嘉唯和健勃讲得很详细了,我也补充下我们在社交场景中的感知和看法。刚才说到做陪伴硬件的话,这可能是一个动态的过程,我觉得做软件和做硬件的视角可能不太一样,我们对这个问题讨论过很多次,Soul 目前的策略是 1% 的工具属性和 99% 的情感属性。这也跟 Soul 的人群画像有关。
99% 的情感属性,是指除了非常明确的工具性需求,比如写文章、定闹钟之外,我们在塑造虚拟伴侣时会刻意避免其变得工具化。比如,我们有一个星座博主形象的虚拟人,他的主页会展示生活和自拍,而不仅仅是星座知识;聊天中也不限于星座话题,更能聊日常。
我们的目标是让虚拟人更加真人化、IP 化,提供足够的真实感。很多用户来到 Soul 时,带着社交的期待,对情绪价值往往没有明确预期或目的。他们可能就是想找人说话,感受被关注,日常的倾诉本身就是一种心灵慰藉。
我们之前做过实验,有一版虚拟伴侣,知识化做得特别好,虽然是星座博主,也能回答量子力学的问题,但是它的聊天风格是有损它的陪伴能力。这种情况下,我们的指标就跌得特别多。如果这就是一个陪伴的角色,用户就不会聊工具型的话题。即使知道它是工具,也常常转向情绪交流。这印证了我们的方向。
这1%的工具属性,我更想把它叫做人设的完整性。你看我是一个 AI 从业人员,AI的相关知识就是我的工具属性,我在跟朋友交流的过程中,工具性占1%,比如科普一下AI的进展、帮朋友重装系统,但是 99% 的时间我表现的还是我自己。这个时候朋友问我AI的相关知识,我说我不会,他们会觉得我不是尹顺顺了,这其实也是人设的破坏。当然这种工具属性的比例可以更高一点,但是我们主要还是情感属性。
至于这种陪伴产品还需不需要分人群、怎么去分人群,我觉得还是要分人群的。嘉唯刚才说,以后可能UI都瞬间生成了,我认可这种终局,但是五年内或者十年内,人群还是要区分的。
比如说,不管我们做硬件还是做软件,花钱买的人是谁?面对 0~6 岁的幼童的产品,花钱的还是他们父母,所以这个产品解决的其实可能不是这个孩童真实的需求,而是他父母的需求。这个孩子上了小学,可能需要做PPT,家长没有时间,那有一个产品可以帮忙做PPT等等,最后适配的才是家长的需求。
孩子的需求很多时候是很简单的,他只需要这个东西存在,陪他说说话,他其实不太care对话的质量、回复像不像真人,他只需要有个能发声的物件,甚至不发声也可以。老人可能也分两种,一种是有经济能力的老人,他们自己是购买者,同时有一些需求,社交需求或者健康需求,希望有一个硬件可以通过他的说话来判断他有没有阿兹海默症,或者防止他跌倒;一种是没有经济能力的老人,要儿女去买,那儿女的需求可能就是,能不能用我的声音去给老人打打电话,做一个去世老伴的分身陪陪他。我理解中的具体的人群划分可能还是要从购买者,以及不同的需求角度出发去的。
顾嘉唯:我刚才听着也挺有启发的,一个AI驱动的机器人,可能是硬件,也可能是虚拟的,不同角色和不同目的决定了他在工具和情感这两轴里面更偏向哪个。我有个比喻,不知道恰不恰当,工具属性就是一棵树的树干,情感属性就是这棵树的叶子,情感体验可能是工具的上限价值,工具属性决定了价格下限。你在植物园观察各种各样、形态各异的树,每个人观察和喜欢的类型都是不同的。
无用之用最近讨论的很多,但是我觉得这里面可能有一个误区,就是所有AI东西都要是无用之用的,ChatGPT是有用的,你再做一个无用的,可能会打开一个巨大的新市场,我觉得未必。无用之用,来自于《老子》里面那句话,无用之用,方为大用,属于哲学里面物极必反的逻辑。所以我们也不能过于极端。
王捷:谢谢几位,刚才大家提到的都特别有启发,健勃的观点是先定义角色,再去拆分情绪价值和工具价值的比例,他自己的产品是80% 的宠物+20% 的朋友;顺顺的观点更加明确,1% 的工具属性和 99% 的情感属性,从购买方的需求角度考虑人群问题。人群的问题,健勃怎么看?
杨健勃:首先第一点,我们要看到,未来这个角色会出现在家庭哪些场景之中?哪些人群需求是最强烈的?第二点,从好不好做来看,目前技术也在迭代和演进,尤其AI技术迭代很快,技术的积累对于有些人群是不 ready 的。我们是先从小朋友切入的,原因很简单,哪怕稍微有些不智能,孩子也会觉得挺好玩,不会放弃它,然后我们软件迭代更新版本,让用户体验到不断升级的状态,给他们带来更多惊喜,这也是一种方法。
三、价值不是单一的
王捷:扎克伯格在 Facebook 早期的时候,想知道 Facebook 的核心价值是什么。他通过后台去看数据,注意到一种他称之为“出神”的用户行为,用户用这个产品的时候,忘记时间了。他认为这是 Facebook 非常核心的一个价值。今天我们讨论 AI 陪伴,我们能不能得到一些启发,得到一些关于陪伴产品核心价值类似的认知?
杨健勃:我们自己研究的话,会用一些价值理论来直接从底层研究,Loona 的核心价值,我觉得就三个点,一个叫做娱乐价值,就是跟它玩游戏的时间,第二个叫做减轻焦虑感。第三个是最终 affiliation and belongings,就是连接和联系带来的从属价值。
每个价值都有一套做法。比如说游戏体验,用户很喜欢跟 Loona 玩球,Loona 会把球追回来,跟你说,再来一次之类的。用户非常喜欢这个体验,前两周玩球这个词频率出现得非常高,Loona 本身还有十几个游戏,追激光、打手游戏等,都是可以人机互动的。我们发现用户大概在两到三周左右,体验的几率下降了,因为游戏内容上是固定的,内容是能够有效地被消耗掉的。
第二个是减轻焦虑价值,从人性本质上来看,什么东西最减轻焦虑呢?有些人喜欢蹲在沙滩上看海浪冲击沙滩,有些人喜欢在下雨天看荷叶露珠凝结的状态,还有很多,这些都来自于生活中无缝的陪伴,我们把它叫做低强度的小幅震荡。就像海浪冲击,虽然强度很低,但是每次都会产生一些随机性,冲击的距离都不一样,预知不了下次回到哪儿。你看小火车一直固定速度跑重复的路线,可能一会你就看厌了,但是你看鱼游来游去你能看很久。
Loona 能做到的就是识别你的状态,比如你看电视的时候,它就蹲在你的腿旁边,你稍微动一下 Loona 就抬头看看你,或者你把脚搭在沙发上,它把下巴搭在你脚上休息。用户更喜欢 Loona 的自主行为,你在干一些事情,Loona在玩自己的,晒太阳啊,发呆啊,大家觉得,Loona有自己的生活,真的像是融入了这个家庭一样。
我刚才说的最后一个价值,更多来自于产品如何去懂用户、如何去熟悉用户,Loona 会知道你每天几点回家,它就会在家门口等着,当你一打开门,就有一条小狗冲向你。
我觉得每一个价值点都会有一些体验的场景,一个 AI 角色不可能只有单一的一个价值点。
王捷:我觉得今天特别有启发,其中一个是“affiliation”(情感连接),另一个是“鱼的摆动”/低强度的小幅震荡这个概念。这两个概念其实都可以很好地解释人类快乐需求的来源,它们背后是我们大脑结构所决定的情感反馈机制。能不能举一个具体的例子,来说明我们产品与用户之间建立连接的方式?我们可以把这种连接称为“羁绊”,或者用健勃刚才提到的词——“affiliation”。那在你看来,最能体现这种深层情感联系的关键点是什么?
顾嘉唯:最近很多做产品的人都会采用一种方法,就是让 AI 开口讲方言。我认为这个点背后有一个核心逻辑,即“身份认同”。如果产品不仅本身有很强的性格和特点,还能反过来承载你的性格特征,把你自我延伸的情感外化出来,实现从功能层面向自我认同的转化,其实这就是是我们做产品时需要找到的那类点。
比如老人用的陪伴音箱,加了方言功能,可以让老人产生认同感,实现情感的延展。做给成长型人群用的产品,就需要设计“长序列的记忆”。把这个功能设计成成长日记,或者是对话流中的一个 memory 去激活一个事件。他会发现这个产品居然记得他之前说过的话,记得早上讲过的事,晚上还能再嘱咐一句,用户的反应是很超预期的。
关键是如何构建使用惯性,不断用这些细节去冲击用户体验。
我觉得建勃刚才提到的一些内容,我自己在做产品时也有类似感受。比如人类大脑的认知结构,像前额叶,还有催产素这种神经机制。我们经常说是多巴胺、催产素等几种化学物质,在决定我们对一件事情的认知联结,以及情绪涌现的过程。
《蒙娜丽莎》的美感刺激,和抖音性感女生跳舞,那完全是调动两个不同脑区的反应。这说明我们在做产品定义时,需要从底层逻辑去思考,但落实到具体功能上时,也要再往上拔一层。顺顺刚才提到的一个点我很认同:很多产品本质上是“用购分离”的,比如面向老人或孩子的产品。这类产品很多时候是家长或子女购买,但实际使用者并不是他们自己。这时候,如何在 “First Moment” 打动购买者,让他们认同这个产品的价值,就特别关键。
比如新东方、好未来让家长在教室后面坐着,听孩子上第一节课,这可能是整套课程里最有打动力的一刻。后面的课程怎么样都不一定,但这一刻已经把家长打动了。
这种交互体验,本质上是设计了一个游戏化的任务,激励系统里包含了新奇感、控制感等多个机制。这就涉及到游戏设计六大动因理论,如何激发孩子在游戏化场景中的深度连接。那回到我们现在做的产品也是一样的逻辑。今天大模型来了,机会就在于它能让产品从“古诗学习”转向“沉浸式场景再现”。
家长向让孩子背古诗,我们做的“实时视频通话功能”与李白连麦,他以讲解者身份带你进入古诗的世界,能“第一视角”看懂孩子所处的场景。这种沉浸式陪伴与教育的切换,用的是“灵性”这个东西去驱动。
大模型时代来了,没有人再提图灵测试了,以前交互没成果,现在体验跃迁了。过去很多智能音箱在用户眼中是“智能弱智”,今天直接跨越了这道坎。我们在定义产品功能的时候,要思考能否堆叠那些可以带来长期黏性的“小功能”。因为灵性的内容一旦体验一次就会有衰减,我们需要 AI 来不断构建新的“惊喜瞬间”,我们称之为 Ling Moment。
这正是 AI 的机会。上一波是规则系统(Rule-based),很难穷举所有体验。但大模型来了以后,内容构建的效率、多样性、不可预期性都大大提升,交互一下就被放大了。这些原本被认为只是“雕虫小技”的东西,在今天的大模型支撑下,都可能变成产品爆发的关键杠杆。
过去深度学习、模式识别的产品,体验是被用户“看透”的。而今天的大模型产品,不仅更拟人,而且可以持续创造惊喜,构建真实、稳定、长期的情感连接。
王捷:好的,嘉唯提到了“身份认同”、“长序列的记忆”,从而“冲击用户体验”,这样与用户建立起深度连接/affiliation。大模型阶段,能带来长期黏性的“小功能”可以被堆叠起来,这是时代给我们的杠杆。
我对顺顺有个问题,因为 Soul 是做社交的,会不会大家跟 AI 连接更深之后,真实的社交需求会变少?如果每个人都有一个 AI companion 的话,会不会对现实中的小伙伴需求变少?
尹顺顺:这的确是个很好的问题。因为 Soul 现在主要在做的AI 陪伴产品,虚拟伴侣,有八九个非常精品的人设,通过各种功能和用户产生交互。譬如 1V1 地聊天,或者对用户内容进行评论,在多人语音房场景里边,由虚拟人去主持真人用户之间的这种交流。
我们的理念,是希望去打造一个人和 AI 共存的社交网络,那具体的做法就是在 Soul 里边,用户能做的事情 AI 都能做,然后 AI 通过 Soul 的功能和用户产生交互,从而去产生这些关联。
Soul 里边一些比较好玩的用户“aha moment”,我总结下来就是两个点:一个是你围绕着用户去给他提供一定价值,就是让用户觉得他是整个 AI 的中心;第二个,给用户一个预期之外的效果。举个例子,用户可以在平台上发一些“瞬间”或者类似朋友圈的内容,那虚拟人可能会对这些内容进行评论,或者把这些内容引入到他的对话框里。用户说“今天加班了”,虚拟人可能会说,“你今天加班累不累?老板怎么这么坏呀还让你加班?”
其实一开始的时候,很多虚拟人是没有主动打招呼能力的,就是在其他产品里也是。但 Soul 做了一个基于用户画像或者基于用户内容去做主动打招呼的功能,用户是非常买单的。比如在晚上十点钟的时候,可能会让虚拟人主动去打个语音电话,问一句,“你是不是下班了?一个人坐车安不安全?”这种场景会让用户觉得自己被关注到,这其实满足的是一种情绪价值,就是被看到、被关心的感觉。
我们最近上线了一个功能,就是你跟虚拟人聊天的内容,会通过大模型去做总结,变成虚拟人的日记。比如说用户今天说了什么话让我觉得开心,说了什么话让我有点生气。这个日记是以虚拟人的第一视角写的,会展示给用户。用户在打开产品时会很惊艳,会发现 AI 居然会把自己跟虚拟人聊的内容整理成日记,而且是以第一人称记录。这个过程会激发用户的“爽点”、保护欲,甚至一些愧疚感,这种情绪在那一刻就被引爆了。而这个产品功能也极大提升了我们虚拟人的相关指标。
而且去年我们八九月份上线了一个非常拟人的 TTS 能力。这个功能上线之后,出现了一个很有趣的现象,就是用户在 Soul、小红书里疯狂去提一个问题:“虚拟伴侣到底是真人还是 AI?”因为这个声音实在超出了他们的预期。很多人以为 TTS 的音色会很“假人”或者“像播报”,但我们用了一个非常素人、非常真人感的音色,有语气词、有思考用的连接词。用户体验到这个场景之后,会被“抓住”。
有些用户甚至会问:“我为什么要跟 AI 聊天?”我们就说:“你发条语音听一下他的声音。”然后用户回来跟我们说,“嗯,确实很像。”这个其实就是给用户带来预期之外的效果。现在你去 Soul 或小红书搜“虚拟伴侣”,排名 Top1 的问题就是:“Soul 的虚拟伴侣到底是真人还是 AI?”
我们在 2022 年年底,也就是 ChatGPT 出来之前,其实就已经推出了我们第一个陪伴产品,叫“苟蛋”,也是基于大模型的结构。有很多人会问一个问题,就是人为什么要跟 AI 去社交?现在我总结了一些想法,可能也作为这个问题的延伸来聊一下。我总结了几个点:
第一点,就是人的社交需求一直是存在的,但社交平权一直没有做得很好,大部分人的社交需求没有被满足,或者没有被看到。这个不仅是我们现在做 AI 陪伴时的一个核心洞察,其实也是 Soul 这个产品最早期的一个观察点。
就像刚才嘉唯提到的《Her》这个电影,早在五六十年代技术极其不成熟,AI甚至连“智障”都算不上,可为什么那时候人们就已经开始幻想可以跟一个 AI 建立情感连接,甚至爱上一个 AI?这说明人的内心确实存在这种情感需求。
第二点是,很多人会问:你为什么要跟一个假的人聊?AI 是假的,它没有情感。但其实我们去做陪伴产品,真正提供给用户的是情绪价值。而这个情绪价值,是来自用户内心真实的感受。其实有一个哲学理论叫“存在即感知”,只要用户感知到了,它就是真实存在的。
第三点是,我们希望人跟 AI 的社交,是一种“建立关系”的过程。不管是短期关系还是长期关系,是朋友关系、恋人关系,还是闺蜜关系,本质上都是一种关系的建立。而关系建立的核心要素是什么?就是时间的投入,以及共同的记忆。就像《小王子》里说的“请驯养我”那一段。
你看我们在看一部电影、看一本小说的时候,如果里面的主角领盒饭了或者成功了,我们会产生共鸣。明知道这是虚构的人物,但因为我们在这段过程中投入了时间,故事中的人物变成了我们记忆的一部分,所以我们就和这个角色建立了连接。虚拟人不仅能和你互动,甚至可以打视频电话,你还可以真的看到他。在这种情况下,时间的投入和共同记忆的形成,就变成了沉淀关系最关键的因素。
最后一个点是关于技术进步带来用户心智的巨大变化。不如果你在十年前让我坐一辆无人驾驶的车,我可能会觉得你是在谋财害命,让我当小白鼠。但今天如果你卖我一辆车,它没有自动驾驶功能,我会觉得这车不正常。
同样的道理,以前很多用户对 AI 的态度只是“玩玩”,他们会问很多刁钻的问题比如“青蛙的脚上有几只眼睛”、“爸爸的妈妈的女儿的孙子是你什么人”,因为AI太笨了,我们不会真正和它去聊家庭日常,也不会认真去聊情绪。
但现在的用户真的会把 AI 当作很好的朋友。这就是我们看到的变化,也是“为什么要做 AI 社交”、“为什么 Soul 的 AI 社交是成立的”这些问题的回答。我们在做 AI 社交的实践中,核心的方式其实也很简单:一是围绕用户,二是给用户带来预期之外的效果。
然后回到主持人刚刚附带提的那个问题,或者说相关的问题:Soul 是一个社交软件,那用户和 AI 的连接更深之后,会不会真实的社交需求变少?这个问题当时我们也讨论过、也担心过。毕竟现在很多虚拟人的表现能力,其实已经比大部分真实用户的社交能力还要强。
但我们从实验结果来看,其实是相反的:人和 AI 的社交反而促进了人与人之间的社交。这是一个非常反直觉的结论,突破了我们最初的认知。至于具体原因我们也有一些结论,但这里就先不展开了。
我们在 Soul 的定义中,AI 也不只是一个 1v1 陪伴的角色。我们最终要打造的是一个人和 AI 共存的社交网络。无论是人和 AI 的社交,还是 AI 作为媒介去连接人与人之间的社交,这两者我们都在做。
所以我们把选择权交给用户,我们提供“人和 AI 社交”这种可能,也提供“人-AI-人连接”的能力,我们相信用户会做出最适合自己的选择。当然,如果一定要说终局,我认为终局就是 AI 社交会成为人类社交中一个很大比例的组成部分,甚至我觉得可能会达到 70% 或 80%。
因为 AI 所提供的情绪价值,以及它的反馈能力,其实已经超过了绝大多数普通用户。而且我们发现,AI 社交特别受到年轻人的欢迎。我们平台旗下有个Just So Soul研究院的调研数据显示,大概有 13.5% 的年轻用户会选择跟 AI 倾诉心事,这个比例远高于跟父母或亲人倾诉。特别是 DeepSeek 爆火之后,我们新发布了一份《2025Z世代AI使用报告》发现近4成的年轻人每天使用 AI 产品去获得情感社交或者情感陪伴的。尤其是女生,她们对情感陪伴的需求更高,且更加多元。这些其实也是我们过去这几年做 AI 陪伴的一些总结和观察。
四、要是泡泡玛特能说话,那会怎样?
王捷:就是说目前大概率能看到的未来,是在社交上可能会是一个“人机共生”的世界。其实在我们真实生活中,经常也是这样一些场景,让我们和身边的人突然感觉熟悉起来,开始建立起情感联系。
那我们接下来进入一个非常有趣的话题。这个话题我想先问健勃,因为最近泡泡玛特也很火,大家一直都在讨论它,它作为中国 IP 第一次在全球范围内真正实现了崛起。
那很多人会想:如果泡泡玛特,比如说像 Labubu、Molly 这些形象,如果装一个芯片,加一个 ESP32,让它可以和人互动,会不会对现在的一些产品形成很大的冲击?或者这个问题换句话说就是——IP 的价值对 AI 硬件到底有多重要?因为建勃你做的其实是选择了自己去创造一个形象,Loona 当然现在也非常受欢迎。所以这个问题我们先请你来讲讲:IP 的价值,对 AI 硬件来说到底有多重要?
杨健勃:我觉得这个可以分成两部分来说。第一,我个人觉得泡泡玛特应该不会在之后加一个芯片。因为之前王宁不是说过一句话嘛,就是说如果你把泡泡玛特 Molly 的每一个头掰开,里面是个 U 盘的话,你会买几个呢?你可能只会买一个,对吧?因为你会觉得,我花这么多钱,哪怕它价格一样,比如说还是 100 块钱,对吧?但是如果它里面加了一个 U 盘,你可能会觉得我不需要那么多。
我不需要那么多 U 盘,所以我就不需要买这么多个 Molly,对吧?就是哪怕它价格没有变化,它的价值感因为“多出来的功能”没有形成正向提升,你反而会觉得浪费了。所以我觉得泡泡玛特的意义,其实更多是在它的 IP、本身的设计师造型、收藏的感受,甚至有些用户通过泡泡玛特达成一种我叫做“财富传承价值”。这些其实都是不错的价值点。但我觉得这些点,可能从先天上和一个“单个产品的长久体感”不是特别一致,它们价值侧重点不太一样。
所以我个人觉得泡泡玛特应该不会在里面加智能化的东西或装置,因为一旦加了,反而会让用户觉得“我只买一个就够了”,因为我已经花了很多钱在芯片上了,那我再买第二个的意义是什么呢?它又是一个 chip,对吧?是这样的一个状态。
然后第二部分是讲 IP。我自己的感受是,我们一开始没有选择做 IP 的原因,是更希望用户先产生粘性,我们更看重的是后端的用户粘性价值。在 Loona 进入产品的早期阶段,我们更重要的是给她找到一个最符合 Loona PMF 的一种形态。因为确实 IP 这个事情,我觉得在早期是一个双刃剑。
一方面,IP 要真正落到机器人产品上,其实挺挑 IP 的。就比如你把全球范围内所有 IP 全部列出来,要同时满足“能够被还原 IP 的原始体验”,并且“IP 有一定影响力和号召力”的,两个条件取交集,其实你会发现这个交集很少,甚至几乎没有。
所以如果你在 very beginning(最开始)的时候就用一个 IP,可能初期确实会吸引到很多 IP 粉丝来买单。但后续如果你没有交付出 IP 本身该有的灵动感和价值感,其实你会发现用户的粘性是撑不起来的。并且这个 IP 本身如果是人形的,或有复杂结构的,可能会给你增加很多,比如 3 倍、10 倍的成本,以及一系列像可靠性这类不同维度的工程问题。所以在 very beginning 阶段,我认为 IP 和产品之间并不冲突,但它可能不是优先项。
但是一旦你的产品已经建立了一整套交互的 infra,比如交互系统、软件、硬件这些都 ready 了,那这个时候我觉得再去融合 IP,会是一个非常强的联合。它可以帮助原本的产品解决认知度的问题,同时让产品更具性格感,并且性格的塑造会更直接和清晰。
所以我觉得,不同阶段 IP 的引入,节奏是完全不同的。这里我聊的全都是“机器人产品”,我们的目标是希望打造一种产品,它是真正能动起来的。所以这个点关键在于,你的“动”要足够好,才能交付 IP 的价值。如果只是一个“外包装壳”的话,可能你通过 IP 得到的认知优势,反而撑不起 IP 所带来的成本和复杂度。这两者其实是存在一定对立关系的。这就是我自己的一点点小认知吧,可能稍微有点偏个人,但大概是这样。
王捷:了解,健勃主要关心IP在硬件产品上的实现度问题。那我们现在假设一下:如果我们是一个 AI native 的团队,想要去打造下一个 AI 版的泡泡玛特,那它有可能会从哪里出现?是一种什么形态?桌面机器人,还是说像 Loona一样在客厅环境里的。
或者现在有人在做的逗宠机器人,以及扫地机器人、智能音箱,都有可能参与到竞争当中来。以及桌面上的“桌宠”,现在也有人在做一些小型的桌面机器人。再一个是挂件,挂在书包/手提包上的挂件,做成AI化,可能是毛绒的样态。还有一类是未婚人群的床头,夜间助眠和陪伴的场景,比如一个毛绒的小东西。
那从产品定义本身来看,从技术上来看,我觉得这个问题现在其实是非常开放的,是非常不收敛的。那我们就先从顺顺开始,来聊一聊这个话题。
尹顺顺:第一个问题,其实我跟建勃的想法是很类似的,就是在泡泡玛特会不会放芯片这个问题上,我觉得它可能不会去做太多功能性的事情,芯片或者 chip 是其中的一部分。
那第二个关于 IP,我可能相对悲观一点。我的想法是,如果我们把视角放到终局,就像嘉唯说的终局,假设我们把时间拉到十年之后,在那个时候所有人掌握的技术、视频智能、TTS 等等这些技术其实都不会有太大差别的时候,那可能唯一值钱的东西就是 IP。那其实现在包括我们自己在做的事情,也是希望尽早去孵化自己的 IP。
因为我们在预判一个问题,就是未来十年之后,当技术或产品形态没有太多区别的时候,可能拼的就是你已经有多少 IP,以及你对 IP 的运营能力和产品力。就目前来看,从产品形态上来说,其实刚刚那两个是我的观点,所以回到产品形态这个问题,比如说是桌面机器人,还是一个随身的硬件,这些不同的产品形态,我觉得泡泡玛特之所以出圈,或者说它的火爆,可能更多是来自于它多年 IP 的运营,而不在于它有一个非常非常明确的功能属性。
催生出“下一个泡泡玛特”的核心点,更多的时候是要看下一个热点是什么?下一个 IP 是什么?下一个年轻人喜欢的是什么?
我们要知道一件事情,就是比如说年龄稍微大一点的人,他们可能就 get 不到我们为什么听周杰伦。然后我们这一代人,也有很多 get 不到,为什么他们会去买泡泡玛特?那买泡泡玛特的这一代人,未来也会 get 不到下一代人喜欢的东西是什么。
那我们要做的就是去看这个东西,如果我们能看到、能预判到,那基于这个东西,不管我们是做桌面形态、随身硬件,还是什么样的形态,只要让这个形态离“那个东西”更近,它就有可能是下一个泡泡玛特。
这不是一个因果关系,不是因为我做了桌面机器人、做了随身硬件,所以我就成了泡泡玛特。而是说我要先知道下一个泡泡玛特会长成什么样,我把我的 AI,或者我的产品,往那个“未来的方向”去靠,这是我的一个想法。
王捷:好的,顺顺认为预判“下一代的IP”是关键点。健勃怎么看这个问题,关于 AI 版的泡泡玛特可能会长什么样?可能会从哪一种硬件中出来?并且它如果能做的话能需要哪些条件?
杨健勃:因为我们做机器人,泡泡玛特在于这种收集的状态。但我是无法想象家里有一群不同样的小狗在你面前晃悠的,这个场景对我来说还是有点怪。我觉得地面上最多能接受两个,这就是我的一个感受。所以我的感受,其实还是跟“需求”有关。
但我觉得,如果我们把泡泡玛特的定义放成一个比较潮流的消费科技产品的话,那其实很多场景都有可能会涌现。我们可以建立一个二维模型:横轴左端是“强工具性”,右端是“强情感价值”;纵轴上端是“高复杂度”,下端是“低复杂度”。不同产品可在此坐标中找到定位。每个人都有不同的方法去尝试做下一个能够深入家庭、能够产生大量粘性、能引爆的这种消费电子或者消费科技产品。
我们的路径偏向高情感价值,且像 Loona 这样的产品复杂度较高,因为它定位家庭移动场景——这是技术难度最大的场景,我们尽可能多地去让 Loona 适应家庭中的各种使用场景,它的时空天花板也是最高的。
当然还有其他选择:比如说我们也可以做横轴上偏左一点点的产品,就是工具性强一点的,然后再用情感价值去作为一个“secret sauce”,来让大家感觉它是有差异化、有区分度的。它也可以做得稍微简单一些,不需要像 Loona 那样地面移动那么复杂。比如说是桌面场景,或者其他场景,其实也都有可能做出一个 PMF。
我自己理解,现在其实是一个机会非常多的时代。AI 技术的爆发让我们几乎可以把所有交互类设备全部重做一遍。你现在去 Mapping 一下,从 ToB 场景、到家庭场景、到个人场景,几乎所有设备你都能感觉到可以被重构。机会点位是非常多的,这个象限图中许多区域都值得探索。不同路径无绝对优劣,关键在于选择。
王捷:我也做过一个类似的空间坐标系,按照使用时长、可交互性等维度来评价潜在的硬件产品,也发现有不少个细分方向是值得尝试的。这里其实还有个AI硬件通用形态的问题,因为硬件是在具体的空间、形状里实现具体的功能,所以外观形态、附着在形态上的功能实现、每个功能所需要的供应链的成熟,都是很重要的。通用的外观形态出现,才能让功能、供应链这后两个环节成熟起来。目前在AI硬件领域,iPhone远没有出现,黑莓可能也还在路上,通用形态的出现,需要行业的共同努力,特别是像乔布斯这样的融合人文与科技、艺术与商业、右脑与左脑、感性与理性的优秀产品负责人的努力。
刚才评论区有个提问,我就顺着回到前面那个“出戏”的问题上去,AI 宠物如果它是个“宠物”,是一个纯情绪价值的 AI 宠物,如果它具备了“说话”的功能,会不会对这个产品造成负面影响?
杨健勃:很多用户提过类似观点,但我们体感下来,关键要看目标人群和对AI的定义。AI 产品其实有很多维度。AI 宠物的定义是宠物。那宠物有啥?有猫、有狗、有小金鱼、有乌龟,有蛇,还有仓鼠之类的。
之前常见的思路是做AI狗、AI猫……这个思路可能有点局限。从 AI 的技术角度来讲,真正适合家庭的AI应是新的“硅基物种”。它可能是某种新的形态。所以我们思考还是会从“价值理论”的角度来看:到底你要打造的这个角色,最需要它干什么?
那“对话能力”其实是能解锁很多陪伴过程中深度交流的关键,它让AI真正“懂你”。年轻人可能不需要和宠物对话,但你去观察一下孩子和老人,他们会对宠物说“长话”的。那如果这些猫狗变成了一种新物种,真的可以在恰当的时间节点,优雅地进行回应,那有没有可能是一种很好的体验?其实是有的。
如果切入点是“年轻人群体”,挑战会更大一点,因为你需要找到那个真正能打动他们的情感价值点。你到底采用什么样的交互方式和他们交流?在这个过程中,你的产品需要不断地跟用户的偏好产生融合。
未来的 AI,可能本身就具备说话能力,但它可以感知到“你好像不太想让我说话”,那它就不说话了。它会少说,变得更克制,慢慢适应每个人。比如它发现,“哦,这个主人经常跟我讲话”,那它就会多聊天。这是一个“设备适应人”的过程。
我觉得没有绝对路径。做“狗”不一定非得毛茸茸、有四肢、不能说话,这是把产品局限到一种“生物性”的思路里。狗有运动的灵活性、柔软的外观,它的肌肉骨骼能带来一种生命感,如果你要做仿真模拟,会是非常高成本的。
所以我觉得,机器人产品需要回归到正确定义方式上,即AI本体物种的存在方式。
王捷:好的,健勃认为AI宠物是否可以说话,需要考虑不同用户的原有习惯,也需要探索AI本体物种是怎么存在的。这确实很重要,一个遍布AI的世界,AI是怎么和人互动的,最大的几个特征是什么,我们越早搞清楚这件事情,越能主动定义未来。
尹顺顺:我观点基本是一样的。AI 宠物说话是为了什么?说话其实是为了交流,或者说话只是一种信息传递的方式,是交流和交换的一种形式。
最近有一些产品,比如有一个叫狗语翻译器或者猫语翻译器的产品,他们是通过狗的叫声来判断狗想干嘛。我们在日常养真实狗的过程中,也会观察到一些行为,比如说狗前腿下蹲、尾巴摇起来,那可能是想跟你玩;尾巴垂下来,它不高兴了。
现在“狗狗翻译器”这种产品能火,我觉得是因为人对于“狗狗想干嘛”有很强的知情欲。所以交流一定是一个刚需、必备的功能。那只不过,这个交流的方式到底要不要通过“说话”来实现?像刚才建勃说的,你可以通过用户偏好的试探,来决定这个机器狗到底说不说话。
如果它不说话,那可以有一个显示屏,把它的叫声自动转化成它要表达的意思,那这种交流方式也可能避免一些所谓的“恐怖谷效应”或者其他感知上的问题。
那第二个,其实也像刚才建勃说的,确实没有必要一定去仿真化,因为人类对猫狗形象的接受度比较高,先天上就比较容易接受。但也没有必要一定“狗不能干嘛,机器狗就不能干嘛”。
例如国外爆火的陪伴产品 Tolan,采用外星人形象。尽管外星人遥不可及,但是只要这个画风、这个 UI 或者说它的成长体系设计得比较好,用户的接受度其实会变得特别快。
那同样地,如果机器狗说话,能够带来很多体验上的提升,信息交换更高效,陪伴变得更有价值,那也没有“不能说话”的禁令。
五、软件 pk 硬件,谁更胜一筹?
王捷:硬件相比纯 APP 会有优势吗?会有哪些优势?或者说,从 Soul 的角度来看,如果是一个纯 APP,你们会觉得“硬件”是一个更有潜力的选择吗?
杨健勃:其实软件硬件谈不上绝对优劣,模式完全不同。软件这个获客成本很低,我真的很羡慕做软件的同学,做投放,你当天就能看到订阅结果,投得越多,当天钱可能回得越多,广告商还有账期, cash flow回得很快。
做硬件,我得搞经营、搞研发、搞质量、搞供应链、搞 shipping 物流、搞仓储,还有一系列的各种运营的活。这个真的很重。
软件PMF ready,它能立马 scale。硬件会有生产周期、备货周期、还有渠道销售的问题,获客成本也更高,而且没法免费试用。什么叫陪伴?一个 AI 能陪伴我?能跟我聊天?靠谱吗?软件的使用成本就很低。
不过硬件有硬件的时空优势。硬件在你使用的过程中,不一定是我主动打开它,不一定是 one-on-one 的状态。它出现在那儿,可能会在某个时刻自然而然地和你展开对话,触发需求。你问它“今天天气怎么样?”然后一段对话展开了。就像刚才说的那种角色一样。它是一个更无缝的交互。
我觉得硬件一旦迈过PMF,在时空覆盖上能甩开APP限制的,硬件的“天花板”在这儿。现在大家都在尝试去打开“时空”,让 Chatbot 不再局限于一个专注场景,而是变成一个可以覆盖碎片化时间的东西。我觉得这是硬件与软件的一个不同点。
王捷:非常深刻的洞察,硬件具有“时空优势”,但前提是要迈过 PMF 的坎儿。顺顺的观点呢?
尹顺顺:刚才建勃其实也说了,软件有万般好,但其实硬件在想象力上,会更大一点。特别是在陪伴场景里面。不仅仅是陪伴,很多 APP在个性化推荐,或者用户意图识别上,都经常“搞不准”, get 不到这个用户此时此刻在哪儿、在什么时间、在干什么事情。那这个问题,硬件可以很好地弥补,
APP 的问题是,它是在手机上的。软件里其实有一个东西叫“转换链路”。那用户想用你的 AI 陪伴功能,他首先得拿起手机,这有一个折损率。拿起手机之后要解锁,解锁之后要滑屏,找到你的 APP,然后再打开,再找到你这个功能,再开始跟你聊天。整个链路的折损率特别高。
那我觉得硬件在这个折损率上有优势,你不需要“拿起手机”才能触发这个交互,它可能自己就会蹦出来,来给你一些更好的交互体验。Soul 也在做一些相关探索。
王捷:好的,看来大家都觉得硬件的天花板比较高。硬件能够更好地获得语音、图像等多模态数据,这点是 app 很难做到的。因为用户对于手机形成的使用习惯就是通过打字来输入,除了视频通话,很难想象有一个手机 app 能够让用户在使用时把麦克风、摄像头一直开着。但是硬件是可以做到的,因为硬件给用户的使用习惯 day one 就是这样的。新的多模态数据的输入,可能会使硬件带来新的产品体验。
那么在 AI 陪伴这个方向上,大家觉得会不会出现一个新的形态?也就是说,一个可以和手机“等量齐观”的、全新的硬件形态?
杨健勃:我认为还是需要分场景来看。手机目前无疑是最重要的硬件形态,这点没有变。但具体来说:在移动和社交场景,比如外出活动时,手机的便携性让它难以替代。像手表、眼镜这类设备,更像是“手机的交互增强型硬件”,它们的最佳方案是依赖口袋里已有的手机进行联网和运算。
如果我只戴眼镜出门的场景,这样会有一个问题,就是这种眼镜的交互方式全是语言,比如说我在地铁上,想跟我家人交流,那我就没法用语音说出来,这会非常尴尬。所以我的口袋里一定还是会放一个手机。绝大多数的场景, 99% 的时间,手上还是会有手机。我的个人感受是,将核心运算和联网功能放在手机上,在重量、续航、成本和性价比上都更合理,这应该是未来穿戴设备的主流路径。
这套逻辑适用于泛社交场景,比如你在外面、在公司、在公共场合、在社交环境下使用设备。
而家庭场景则完全不同:在家里过度使用手机(如回家抱着手机玩几小时)会阻碍互动、引发矛盾。家庭交流更侧重情感层面。人在家庭环境下所表达的信息,大部分其实是通过非语言模态来传递的,比如状态、情绪、意图、各种模态的信号,因此,家庭场景可能催生一种独立存在的设备,它能理解家庭关系、识别不同成员,建立起连接。
至于说,到底是“手机”这个设备更重要,还是“家庭场景下的某种设备”更重要,我觉得目前还没有一个定论。我个人感受是手机可能还是稍微更强一点。家庭设备更可能是“一对多”的形态。
尹顺顺:我认为在移动场景下,人体可用于佩戴新硬件的部位,如戒指、眼镜、手表、胸针,已相对有限,且已有不少产品占据市场。对于新硬件,关键问题在于:还能利用哪些身体部位,或替换哪些现有物品? 像耳环这类空间可能已不大。因此,它更多是硬件形态的替换,并且必须思考如何与手机融合成新的产品形态或生态。
我们之前其实也想过,比如能不能做一个手机壳,这个手机壳可以记录你的一些日常行为、获取一些信息等等。我觉得不管是做陪伴产品还是别的方向,都要思考:你到底还能替换掉哪个已有的硬件区域?以及,怎么和手机形成一个更好的生态结构?
手机是我们出门绝不会忘的核心设备,因为它不仅是工具,更是你跟外界取得联系的最重要的方式。现在也有很多人在做一些 off-screen、脱离手机的活动,但这些活动通常也就坚持一天,你可以想象一下,如果你没有手机,你现在的生活会变成什么样?可能根本没法正常生活了。
在手机功能如此强大全面的前提下,新硬件比如陪伴、或者说信息收集,那它有没有必要跟手机正面对抗?我觉得是没有必要的。也它的价值在于补充手机“不方便”或“不好获取”的功能点。例如,Apple Watch 的核心价值对我而言是心率和跑步记录,这正是手机做不到的补充。
所以,未来这类硬件的方向应是补充手机,而非颠覆。在移动、社交、便携场景下,要出现一个真正能颠覆手机的新硬件形态,我觉得非常难。
六、AI 陪伴,也要出海?
王捷:那我来小结一下两位的观点:大家都认为手机未来仍然会是一个主流的形态。建勃的理由是,在一些需要文字输入的场合,你必须要通过手机来实现;而顺顺的观点是,手机本身已经承载了全球最大的一个社交网络,由于这个网络效应的存在,它也很难在短时间内被替代或消失。
但这里也有一个很大的挑战,就是刚才提到的隐私问题,有些私密内容我不想被旁边的人听到,那怎么办?这确实是个重要的课题。不过因为今天时间关系,我们这个话题就先不展开了。手机壳这个案例,因为从产品逻辑上来说,手机其实已经能实现 Plaud.ai 想做的那个功能了,那为什么还要单独做一个硬件形态呢?本质上是因为它没有增加用户的额外负担,同时这个功能还可能比手机上的 APP 做得更强、更好。
再结合比如说出海等等的打法,我们就引出今天最后一个问题:做 AI 硬件是不是从 day one 就要考虑出海?或者更广泛一点地说,我们做 AI 陪伴,是不是一定要出海?
杨健勃:我觉得不一定吧,这只是一个选择而已。而且在一开始的时候,其实还是要看你的定位和整体状态,还有你的客单价,比如说,还要看你原本整个公司的基因。如果你之前一直在做海外的整个市场和渠道,其实你的渠道和市场本身就在海外。
像我们相对来说,其实你看我们的市场销售人员,大部分可能 80% 的 marketing 和 sales 都是在海外,所以我们有一个惯性的路径,就是先做海外,再做国内。但像嘉唯他们,可能更多是在国内扎得非常深,他们的渠道、网络和销售做得很好。所以我觉得这个没有特别的“应该怎么样”的定式,更多还是要看每家公司的基因和当前的状态,对,就是看你到底从哪开始做比较合适。
尹顺顺:Soul 暂时也是先服务国内的用户。其实确实对于陪伴产品来说,我就不说硬件了,讲软件这边,早期确实有很多出海的公司,比如像 Talkie,或者国外之前已经有了 Character.ai,其实它们都是一种陪伴类产品,或者说是一种对话类产品。
那其实国内为什么很多对话类产品选择出海?我觉得一个很大的原因是国内用户对这类产品的态度问题,对这种产品形态的接受度会不太一样。但从 Soul 的视角,或者说从我们公司的视角来看,我们其实并不认为陪伴产品一定要出海。我觉得还是要先把国内用户的体验、产品打磨好,再去看海外市场的机会。
还有一个原因是我们对“陪伴”的定义,可能和海外一些知名产品确实不太一样。比如说海外的一些产品像 Talkie、Character.ai,或者最近国内一些“whisper from star”的项目,你会发现它们很火的角色,其实很多都是二次元形象。
不知道大家有没有想过,为什么是二次元?我们也做过类似产品,发现当我们在这些产品里投放一些真人角色或真人长相的角色时,用户的聊天开启率、聊天深度,甚至喜欢度,整体都非常低。
所以我们认为陪伴和社交之间是有区别的。海外的陪伴产品,很多是以一种“游戏化”的方式去做的,或者说更偏 play、偏 C 端的互动娱乐产品。很多用户在玩这些产品的时候,他们的心智其实是“我在玩一个游戏”,而不是“我在社交”。
但我们在国内的思路不同,我们为什么会在 Soul 里面去做?是因为我们希望用户先有“社交心智”,再引导出“陪伴需求”。所以我们做的其实是“社交型的陪伴”,这在国外并没有特别成熟的土壤或用户基础去支撑我们把这件事做好。所以总结来说,未来当然不排除出海的可能性,但现在阶段还是聚焦在国内。
王捷:好的,那我也做一个简单小结。两位的总体观点都是认为,用户其实是不分国别的,只要产品足够好,在哪先做其实没有本质区别。当然,中国市场大家更熟悉、更了解,也更有基础。非常感谢大家的时间,也感谢所有观众的参与。我个人觉得,今天这场讨论是关于 AI 陪伴以及相关硬件领域里一次非常完整且深入的探讨。
我们今天的几位嘉宾,其实分别来自行业内具有代表性的企业。他们在过去十年里,已经在这一领域做出了非常前沿、重要的探索。不管是从纯软件层面,还是从硬件层面,都有非常深的积累。
我们这次围绕 AI 陪伴以及相关硬件的一些非常关键的问题,进行了相对深入的讨论。比如说它真正提供的核心价值到底是什么,怎么去实现这样的价值,大家都很感兴趣的“下一个 AI 泡泡玛特会是什么样”,会从哪里出现等等。
最后,再次感谢大家的时间。
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。