ChatGPT浪潮下，看中国大语言模型产业发展

数据观 • 1年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

ChatGPT被称为AI的“iPhone时刻”，以ChatGPT为代表的生成式AI让每个人命令计算机解决问题成为了可能。可对生产工具、对话引擎、个人助理等各类应用，起到协助人、服务人甚至超越人的角色。

　　 通用基础大语言模型的价值与自研卡点

大厂的绝对战略优先级，但也是一场重投入的持久战。

2023年3月中，OpenAI宣布ChatGPT整合GPT4，实现多模态交互、大幅提升复杂长文本理解与生成能力、可控性增强，引起全球科技界震动。

在国内科技及投资各领域的高度关注下，百度举办了“文心一言”产品发布会，虽说从产品功能、成熟度、支持用户并发等维度距ChatGPT还有不足，但也是中国在这新一轮“科技军备竞赛”中的勇于尝试与发声，目前百度也已启动API接口开放测试，瞄准B端市场。

紧随其后，360、阿里、华为、商汤、京东、科大讯飞、字节跳动等巨头企业也动作频频。

从自研通用预训练大语言模型的必要性角度分析：在全球政治经济局势下，自主可控是保障网络安全、信息安全的前提，自研基石模型具有高度战略意义；从自研的可行性角度分析：基于前文讨论的通用基础LLMs研发所需的算力、数据、算法、人才、资金储备等，中国仅有少数头部互联网企业具备研发“入场券”。

宣布入局的头部企业基于自身业务生态选择的战略路线也不尽相同。但可以大胆假设，未来若形成大模型能力领先，谁拥有通用基础大模型与生态和流量入口，谁就更有可能拥有从应用层到算力层的营收话语权。

价值：自主可控的战略意义、大模型的商业价值

卡点：高端AI算力、数据、算法、人才、资金储备

调用国外大模型将涉及数据跨境的合规风险、中国中大型企业与政府部门均存在私有化部署需求、以及受美国科技保护主义影响。种种原因，国内必将且必需产生自主可控的通用基础大模型产品与服务。

“滚雪球效应”使通用基础大模型的门槛越来越高，但其可以提供“超级大脑”一样的价值。OpenAI与微软的成功路线表明，依托ChatGPT有望打造新的个人与企业应用开发生态以及拉升云厂商业务营收。

美国芯片禁令下高端AI算力资源不足，算力资金投入上还需支撑智算集群的训练与运营成本。

互联网中文高质量数据资源小于英文，差距20-30倍，需要高质量数据清洗。

通用基础大模型开发是一个系统工程，需具备分布式训练、模型蒸馏等各类技术能力与工程化能力。

如何把know-how数据转化成Q&A的能力，需要大量提示（人与机器进行交互的指令语言）工程师。

　 中国大语言模型产业参与厂商类型与定位逻辑

垂直基础大模型厂商与应用开发厂商需在窗口期加快建立“数据飞轮”壁垒。

此轮基于ChatGPT的大模型浪潮兴起伊始，结合我国AI产业链与竞争格局现状，一种判断是：基于大模型的通用和泛化性提高，未来手握通用基础大模型的巨头企业会逐渐侵蚀垂直领域厂商业务。这种压力长期来看的确存在，但大模型与产品结合，尤其在非检索或开放域交互等场景中，需要依赖垂直领域数据和行业know-how、应用场景和用户数据反哺、一站式端到端工程化能力等。

在此窗口期，垂直领域与应用层厂商应积极将大模型能力整合入自己的技术栈，服务于产品功能优化，建立“数据飞轮”壁垒。在下游丰富的基于大语言模型、AIGC应用开发需求的影响下，还将分化出一类工具型或平台型厂商，主要提供基于各类大模型的开发平台服务，帮助客户实现便捷的AIGC应用开发与落地。

　　 大语言模型落地应用对数字产业影响

1）变革人机交互方式：既有软件将接入对话能力，交互界面发生变革，自然语言成为用户发布操作指令的新模态。这一影响将从搜索引擎等知识信息平台拓展到一切人机交互型应用。友好度和功能性的显著提升将激活软件服务的增量用户市场；

2）丰富产品种类：将诞生新一批AI-first的应用，如创意设计、AI营销、AI运营等领域；

3）塑造新兴商业模式：AI主导的“模型即服务”商业逻辑将重构应用开发流程，传统企业可享受低成本构建应用模型的便利；

4）构建新兴生态平台：超级应用的出现，本质上搭建了用户需求与各类信息服务之间的基于自然语言交互的平台生态，塑造了移动互联网后新的流量入口。

具体内容如下:

ChatGPT浪潮下，看中国大语言模型产业发展