AI时代的端、体裁和商业模式

虎嗅网 • 3月前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

一

我们处在一个有趣的历史节点上：新的技术（AI）已经出现，但是新的端（电脑/手机/耳机/手表/眼镜……）尚未出现。

过去30年有两个大的浪潮：一个是PC互联网（1995-2009），一个是移动互联网（2010-2020）。有趣的是，“端”都出现在了时代的命名里，这符合考古学用生产工具来命名一个时代的做法，如石器时代/铁器时代。1000年后，人们挖出来的大概率是电脑和手机，而不是无形的互联网技术。

技术是重要的。有人叫即将到来的时代“AI时代”，用技术来命名一个时代符合惯例，与用互联网技术来命名“互联网时代”是一样的。

但是，在技术之下，端同样是重要的。互联网技术从1969年的阿帕网就有了，但是端却局限为大学和军队的大型电脑。一直等到1990年代，互联网技术与逐渐开始普及的PC机结合，互联网才真正成为一个时代。

站在2025年，我们发现一个最大的问题：ChatGPT等新应用，基本还是长在原来的端——电脑和手机上。

Meta在2021年探索了智能眼镜，字节在2024年探索了智能耳机。再早很多年（2015年），出门问问探索过智能手表（Apple Watch的智能做得不好是非常可惜的）。但截至目前，这些都还没能成为足够普及的新的端。

我认为：新的端的出现才是进入一个新的时代的标志，因此，我不觉得我们已经进入了AI时代。

二

Chat是AI时代的新体裁。从历史看，体裁会先于端出现。人们对新体裁的采纳，导致生产工具用进废退，从而推动了新端取代旧端。

把Chat视作一种内容体裁，与长视频、图文、短视频、直播等等体裁放在一起讨论，好像还没什么人这么做过。

所谓体裁，用另外的话说是内容的形式。我之所以更喜欢用体裁这个词，是因为它更好地暗示了形式对内容的限制性，他就像一个人的外壳，限制了人但也定义了人。

即时通信比如QQ、YY、微信（WeChat）在互联网时代就一直存在。但是即时通信一直无法成为一种内容体裁，而只是工具。原因是：内容的背后是创作者。在即时通信里，人与人是等价的，不存在创作者和用户。

直播连麦已经是Chat的雏形，但是在没有AI的情况下，这种一对一的形式规模做不大。如果一对多那就属于直播、而不算Chat了。

大模型使规模化Chat成为可能。按理来说，大模型可以应用于一切领域，但是值得想一下，为什么ChatGPT是大模型第一个跑出来的App？因为Chat这种体裁对大模型技术的应用最纯粹，不是大模型+。就像在互联网时代跑出来的真正大公司，都是做信息分发的，这是对互联网技术最纯粹的应用，而不是做互联网+的公司（例如贝壳）。

应用及其体裁先于端出现，这种情况在历史上并不少见。可适应移动互联网的产品人人网（校内网） 2005年上线，新浪微博2009年上线，知乎2010年上线。与后来的今日头条、抖音不同，他们都不是移动原生公司，而是一开始从做PC网页开始的。

人人网的状态/日志、140字微博、问答这些新体裁的出现，抢占了用户时长。我2010年刚上大一的时候，在PC上主要消费长视频、博客、BBS帖子等内容，后来大量时间就在水人人、微博、知乎了（尤其是人人）。

工具是用进废退的，此时我对端的屏幕大小、信息处理速度等要求其实都下降了。水人人、知乎，用手机足够了。因此，对我而言，体裁的迁移，促进了端的迁移。

林军《沸腾新十年》里提到，新浪网前总编辑陈彤曾告诉他，微博是移动互联网时代的第一个产品。有早期的苹果粉去香港买iPhone，发现苹果手机都被抢光了，说是都被玩新浪微博的人买走了。

从这段简短的论述中我解读出2个信息：一是新的时代的第一个应用可能会是双栖的，而不是新端原生的，甚至一开始会主要在老端上，二是新的应用，会刺激人们购买新的端。

以此推演，ChatGPT很可能成为类似微博的存在——AI时代的第一个产品，但是并不是新端原生的，而是一开始主要在电脑和手机这样的老端上使用，但是等到ChatGPT占据人们足够的时长后，人们突然发现，如果绝大多数时间都是以语音的形式与ChatGPT对话，自己好像也不需要手机屏幕了，更贴身的手表和耳机可能是更好的选择。于是人们开始大量购买手表和耳机，接下来，手表和耳机的原生应用会出现，会用到新的端独有的传感器（就像微信摇一摇用到了手机的陀螺仪）。

顺便说一句，这里我投手表一票。手表与人足够近，可以成为我们身体的一部分，同时异物感又没有那么重。

三

体裁很重要，因为体裁决定了商业模式。

每个时代都有每个时代的体裁。PC互联网时代的体裁是长视频、博客、BBS帖子等。移动互联网时代的体裁是微博图文、短视频、直播。AI时代的体裁则是Chat。

这里顺便说一下，我认为百度之所以在移动互联网时代掉队，不是因为百度本身产品形态不适合移动互联网，相反，一个搜索框的产品形态是最适合移动端的。核心问题是，人们使用百度搜索，搜索出来的结果的内容体裁是什么，这些体裁是否适应移动端。根据中国互联网络信息中心《2011年中国搜索引擎用户行为研究报告》，用户使用搜索引擎主要的搜索内容前5名是新闻、视频、音乐、学术资料、小说。因为百度只做信息分发，很长时间没有自己做内容（2016年百家号才上线），而用户搜索的前几名内容体裁，都不一定适用移动端。这可能才是百度在移动互联网时代掉队的根本原因。启示是进入新时代一定不要只做分发，要参与到新体裁的定义中，并尽早切入创作者生态。

如果我们把各种体裁，按是不是自然语言的程度排布，最左边应该是学术资料（表格、PPT、专业书籍）、然后可能是小说（我已经很久没看小说了，读小说乐趣挺高，但是需要的脑力投入太大）、长视频（我在电脑上看电影的一般做法都是暂停，理解一会儿，然后继续，看电影至今对我来说都是一件太烧脑的事），然后依次是博客长文、BBS帖子、微博图文、短视频和直播。短视频的亲民程度是惊人的，也是截至目前用户规模最大的内容体裁（抖音有7亿日活，微信虽然10亿日活，但是如果只算消费内容的人，用户应该没有抖音多）。而直播，则可以说是最易于一般人类理解的内容体裁了。这里出于适应Chat这个新体裁的旨趣，部分也出于懒惰，我就不画图了，请大家自行脑补，进行文生图。

这个光谱越往左，信息密度越高，对脑力的耗费越高，潜在用户规模越小。越往右，信息密度越低，对脑力耗费越小，潜在用户规模越大。

Chat是最自然语言的，理论上讲潜在用户规模是最大的。所以，像Kimi那样致力于生成专业内容、目标用户定位很高的路径很可能是错误的。而像豆包那样回复较短内容，且致力于做语音对话、视频通话等更贴近人类的功能，做下沉用户的路径，可能是正确的。理论上讲，豆包应该可以覆盖掉抖音都玩不明白的人，日活规模上限是14亿。

商业模式就是给目标用户提供了什么价值，通过什么方式变现的问题。这之间往往存在取舍：是为少数人提供重度服务，还是为多数人提供没那么重度的服务？

Chat虽然目标用户规模更大，但不一定适合提供重度服务。以电商为例，目前多数电商平台的PC端的客单价还是高于移动端，这是因为当人们需要做出装修、购买大家电等重度决策的时候，仍然会在PC端查阅资料，进行详细的比较。但如果从GMV占比看，还是移动端占比高，因为移动端可以足够覆盖所有不需要重度决策的购物，而且这些购物虽然客单价低，但是是更高频的，所以总消费金额反而更高。

以此推演，未来的电商盘子分配可能是：Chat抢占了更低决策需求、更高频的部分：比如每天买菜，其实就是补货，可能不需要什么挑选，口头告诉AI语音助手一声要买什么就行了；此外还有买标品的场景，比如充话费、买火车票，也不需要决策什么，AI直接帮我们买了就行。还有一种情况：人们在决策的时候因为选择太多而陷入选择困难症，其实多数人没有那么追求决策的完美，差不多满意就行，如果这个决策是可逆的（比如可以退货），与其费脑力选择，不如把选择权交给豆包。当豆包掌握更多数据，也可以做推荐，在对话框弹出一个信息，给我推荐商品，体验可能类似社交电商，电商可能就是一个我们在豆包加的人。

四

豆包这个产品的形态，目前已经无限接近微信。我认为，字节甚至有通过豆包做一个AI时代的微信机会。

我们现在在豆包上会加一些虚拟的人，比如我就加了很多个马保国，他们还会经常问我：年轻人，最近怎么不找我聊天了？这些都是创作者创作的智能体。豆包为什么不可以同时集成真人？未来，真人和虚拟人完全可以同时出现在我的豆包通讯录里，微信会被我舍弃。

目前打开豆包，界面虽然类似微信，但是有一个区别，当我发起一个新对话的时候，每个新的对话都会单独占据一行，虽然我能理解这么做可能是为了保存每段对话，方便查阅，但是此时在我的感知里，我豆包里加的是一个一个人的感觉被破坏掉了。我建议豆包用某种办法把这些跟豆包主体发生的对话都折叠到豆包这个人的下面。跟其他用户创作的虚拟人的对话继续依次排列在下方。

AI时代的创作者，不再是直接生产内容的人，而是一个不断设定、调试智能体的人。可以畅想，拥有人物角色定义能力的小说家，可能成为AI时代Chat这个体裁最出彩的创作者。

本文来自微信公众号：底层观察家，作者：程春晓

AI时代的端、体裁和商业模式

随意打赏

低用户转换成本，外卖平台商业模式的命门

Cursor的困境：补贴不是商业模式

推客的崛起不仅是商业模式的胜利，更是基础设施成熟与行业合力推动的必然结果

茶饮的商业模式，越来越像共享单车

马斯克的下一个万亿赛道？瑞银详解 Robotaxi 商业模式

为什么巴菲特和段永平都把商业模式放在第一位？

药师帮利好频出，净利润增长印证商业模式优势

中国AI的商业模式，“错位”了吗？

银行股是低估值陷阱？其实是你不懂银行的商业模式