周鸿祎:大模型像“发电厂”,把数据变成数据链,输送给百行千业
5月27日,“2023•黑马AIGC峰会”在京举办。有趣的是,360集团董事长周鸿祎在这次会议上,首次以“数字分身”形式参加,引发极大关注。今日,周鸿祎在微博中写到,数字分身“挺受欢迎,让我多少有点危机感”,虽然面临来自数字人的“挑战”,但他预测,未来数字人参会将成为主流。
大会现场,“数字周鸿祎”以《大模型时代的360方案》为主题,发表了多个重要观点。TA认为,大模型推动下的智能化才是数字化的高峰、所有行业都值得被重塑一遍。TA还表示360集团依托多年人工智能技术积累及搜索、浏览器等场景优势,布局“两翼齐飞+四路并发”大模型战略,正在积极布局大模型应用场景。
此外,创业黑马(300688)与三六零(601360.SH)签订战略合作协议,宣布双方将在人工智能大模型研发、城市产业落地、中小企业服务等领域展开全面合作。
作为国内创新创业服务领域的首家上市公司,创业黑马主要为国内中小创企业加速成长提供多元化的企业服务。其致力于从产业加速服务到创业投资的全面延伸,打造出融合企业加速服务、知识产权服务、财税服务、城市拓展服务、投融资服务、营销服务等为一体的多元化企业服务平台。未来,创业黑马将与360联手,致力于人工智能大模型的深度探索与研发,专注服务于科技创新服务领域,通过对科创服务全流程的赋能,让行业效率实现几何级数的提升。
以下为周鸿祎的数字分身现场分享内容整理:
很多朋友很关心360的大模型进展,我来讲讲360发展大模型的优势与策略,做广告的同时也给大家一个参考。
首先明确一个认知,大模型是超级人工智能到来的拐点,也是通用人工智能发展的基点。 原来的人工智能是弱智能,带来的影响有限,而大模型属于通用人工智能,在很多维度上已经超越了人类。这次GPT出现,最大的意义是人类第一次把所有知识进行了重新编码和存储,现在GPT-4已经是世界上最聪明的人,这是一个巨大的拐点。
为什么说GPT是通用人工智能?首先它用一套模型、算法、数据,解决了所有自然语言理解的问题;其次,GPT从感知进化到了认知,能够理解文字、语言、分析、规划,这对传统人工智能是一场颠覆性的革命。
未来我们在人工智能的基础上构建数字化的新场景,能够做到事半功倍。
所以我认为,GPT是生产力工具,而不仅仅是公司间竞争的利器。在大模型推动下,智能化才是数字化的高峰。过去很多人执迷于大数据,但不知道怎么用,大数据很像工业时代的石油,大模型像发电厂,把数据变成数据链,输送给百行千业,可以输送未来所有的软件、APP和网站。甚至,所有的行业在通用人工智能大语言模型的加持之下,都值得重塑一遍。
我们总结了开发大模型的技术实践,可以分为五个步骤:
第一步,构建一个大模型;
第二步,无监督学习,把知识灌进大模型;
第三步,监督微调,强化学习,做人工知识标注;
第四步,价值观纠偏;
第五步,上下文学习,在用户使用场景中不断地迭代优化大模型。
这五步中,数据、训练方法和场景,是大模型能否做成功的关键。
那么,如何描述360的人工智能策略?我可以用八个字:两翼齐飞,技术并发。
360并不是突然切入人工智能赛道的,实际上2015年我们就成立了人工智能研究院,2018年开始探索多模态的数字技术应用,2022年在知识图谱的世界杯比赛里战胜了图灵奖团队,获得了冠军。
为什么微软、谷歌、百度等搜索引擎公司都在发展GPT?因为做搜索的公司天然有发展大语言模型的技术基因,作为国内第二大搜索引擎厂商,360发展大模型可以说顺理成章。
很多人问我,大模型到底有没有门槛?事实上我认为大模型的底层架构、技术原理都差不多,今天大模型的竞争主要集中于用什么数据来进行训练,以及用什么样的训练方法来提升模型的能力。360这些年在搜索上的积淀,让我们拥有大规模、多样性、高质量的训练语料,具备很多公司不具备的数据获取和清洗能力。
目前,ChatGPT有两个最大的短板,恰好我们的搜索引擎都可以弥补。 一是数据更新不及时 ,而搜索引擎恰恰能够搜索到最新的数据和知识,帮助它及时更新,我们现在已经把360搜索和大语言模型连在了一起,完全解决了这个问题。 GPT的另一个缺点是幻觉 ,说白了就是胡说八道,这是GPT在很多专业应用场景上最致命的问题。这种情况下更需要搜索的知识校正,360有强大的搜索能力,它和大模型之间能够形成相互增强,形成正向的双向循环,用来解决大模型知识滞后、知识模糊、数据校对的问题。反过来,大模型能够提升搜索难以解决的低质量回答问题。
与众多互联网公司相比,360还具有工程化优势,就是大流量、大用户的工程化调度能力,这是已经被证明过的。同时360还拥有强大的AI内容安全队伍,可以保证数据安全输出。作为一家以安全闻名的厂商,360也有多年积累,我们打造的大模型安全风险评估体系,可以为全球大模型安全赋能。我相信,大模型能不能保证自身的安全会成为未来的核心竞争力之一。
在算力方面,360把算力分为两部分: 训练算力和推理算力。
在训练算力上,我们在6月份至少可以拥有600台8卡服务器,将近5000张显卡。这方面360的理念和其他公司不太一样,很多公司都拿AI做数据推理,这是很大的浪费。360拿消费级的显卡来做推理的机器,解决了很多问题,取得了一些成果。
目前在核心大模型上,360已经完成上千亿个参数的大模型布局,包括360GPT以及一个多模态大模型,还有与清华智谱AI合作研发的360PLM大模型,最近在多个权威第三方评测中,比如中文模型基准评测SuperCUE中,360大模型的总分也是国内领跑的。
在场景布局方面,360的策略叫做“四路并发”。其中,面向消费者,我们用搜索和浏览器打造用户的个人AI助理;面向中小微企业,打造SaaS化垂直应用工具;面向企业/政府/城市,合作打造私有化部署GPT;最后面向行业,360将携手行业伙伴,与拥有行业数据的龙头企业共同打造行业的垂直GPT。
今天,面向黑马的伙伴,我想重点讲讲企业的场景。
企业在使用公有GPT的时候会面临几个问题: 一是使用过程中数据可能会泄露;二是GPT行业知识深度不够,对企业也不了解,通用模型可能不会用。
所以,我认为,未来企业可能需要基于公有GPT,通过公有云数据训练、行业数据训练、企业数据训练、机密数据融合这四步,打造企业的专有GPT。专有GPT相当于企业的AI中台,能够提供四个方面的价值: 一是能变成员工的知识助手;二是成为员工的办公助手,提升办公的效率;三是成为领导的决策助手;四是成为企业的智能客服。
这个AI中台未来存在两种可能:一是成为“副驾驶”,大模型赋能企业的内部业务系统;二是未来还有可能成为企业内部的“主驾驶”,当大模型变成企业内部所有信息系统的前端,会成为企业内部的智能调度中枢,知识多引擎调度能力实际上就是engine模式,把企业内部的信息系统都变成企业专有GPT的插件。
大模型在中国的发展和每一个企业的发展都息息相关,特别是将成为中小企业最有力的武器,不管你在哪个行业,都有机会通过大模型实现突破和反超。反过来说,不能搭上这班车的企业也将面临淘汰。
但是,很多中小企业可能没有这方面的技术基础,怎么选择大模型、利用大模型,是很多企业家面临的困惑。为了探索解决之道,我们今天正式宣布和创业黑马开展战略合作。
未来,360会和黑马一起通过技术服务等形式,在AIGC这个领域对大模型的发展和中小企业的应用做几件事,包括:成立产学研一体化的大模型联盟,联合研发行业垂类模型核心业务,打造城市产业项目在AI领域的标杆等。
未来中国不会只有一个GPT,现在也只有几十家科技公司发布了自己的大模型,都还没有在用户场景里,让用户广泛使用、接受用户的真实反馈,所以,大模型带来的这场工业革命才刚刚拉开序幕。
我相信,未来无论是AIGC产业在中国的发展,还是360和黑马的合作,都会带来令人瞩目的价值与成果,我们将共同见证、助力中国AIGC产业的繁荣发展!