AI 有主体性吗?没有。
主体性的英文叫做 agency,另一个比较流行的 buzzword 是 AI Agent. It's cool and catchy. I understand why people like it, especially for those whose career and fortune lies on the story weaved by which.
Agent 最核心的隐含意义是某物能自主采取行动 towards a target。代理机构也叫做 agent,因为你只需要给它一个目标,say 找个律师帮忙搞定分遗产给私生子的事情,代理机构就会站在客户的角度来帮助客户达成目标。
这和 Automation 自动化的区别在于:自动化是客户已经有了解决方案,只要去执行,agent 是只有目标,需要代理结构帮助置顶方案然后再去执行。可以看出来 agent 至少一多半的主要价值锚定于 come up with the solution。
代理机构 (律师、秘书、白手套……) 为什么能干得好?1. 有更丰富的知识,2. 有执行能力,3. 通过沟通能够非常深入地了解用户。
前两点非常直白,第三点是我感兴趣的地方。妄想一个 know-it-all 的 AI 应用程序就能够完美解决你的问题吗?这是个很容易跑进脑子的妄想点子。我觉得现在的 AI 技术不能达到的原因,不在于知识和执行能力,更不在于知道客户知道的所有信息,而在于: 知道用户自己不知道的东西 。
乍一看这个结论莫名其妙。你看书的时候是否有过这种感觉:一本评价很高的书不是告诉你一大堆你不知道的东西?而是通过描述和对话“勾”起了你本身就有的一些感受、想法、情绪,然后通过作者勇敢展示自己主体性的行为 (站出来发声) 或者通过虚构的主人公的故事,把你原本有的感受、想法、情绪,澄清了、加强了、坚定了。
我不知道你是否能理解上面这一段。举个例子来讲,就是你不会共情母螳螂在交配后会吃掉公螳螂的事实,但是会共情发生在各个时代、各个国家、各个语言文化中有关勇气、爱情、亲情、牺牲......这些主题的故事。It's not because you're brainwashed by the story. They're already in you. Arts just invoke it, visualize it.
这种共鸣的产生是关键,尤其是在服务行业。
如果一个是给每个人都提供同样训练计划的健身教练,另一个是知道了你健身背后的情感和理性目的是摆脱身体疲劳,从而给你量身定制健身计划的教练,你一定会选第二个。
律师、秘书、财富管理……这些都是需要非常深入洞察客户根本需求的行业。而常见的行业中哪怕是用上一点客户沟通的技巧,也会让销售从冷冰冰的卖点介绍变成像 Apple 一样的解决方案销售、身份销售。Just like what I was told, the key of saling Microsoft enterprise solution is to sale the peace of mind.
就这,人做得到,AI 做不到。至少现在这个 perdicting machine 不可能做到。为什么?
虽然像沟通技巧、缺乏对人类场景和社会身份的理解、自己展现主体性会鼓励对方表达......这些原因我也觉得很重要,但是这些原因从模型之外的工程上花了功夫也能解决。最深刻的为什么 AI 做不到的原因,其实就是 AI 没有主体性 ,而主体性并不是一个静态的目的,而是生命系统对于外界环境的动态反馈。
举个例子:
你突然想吃地中海沙拉。
如果有任何 AI 应用程序,它会规定一个静态的目标:帮用户做一份地中海沙拉的制作教程。On top of that, 如果这是一个烹饪细分市场的 app,它会给用户推荐其他的沙拉教程、美食教程,这些额外功能的主体性是软件开发者通过编写 prompt 和设计固定的执行逻辑的时候放进去的。
但是如果我们告诉我们的另一半,今晚想吃地中海沙拉,会发生什么?
如果另一半不常吃沙拉,那么他会诧异你今天的反常,然后开始问为什么,尝试理解你背后行为的动机。这可能会花点时间,因为清楚表达需求就是个极难的事情。好不容易理解到了,原来是今天在抖音上看到了糖尿病的视频,对自己的体重和健康产生了焦虑。那么另一半有可能会先放下吃什么,先安慰;也有可能会用专业的知识告诉你其实光吃沙拉对你现在的健康也不是最好的选择,然后建议了一个又能满足食欲、还算健康的餐厅;也有可能一起焦虑,然后脑袋一热,和你一起制定了减肥计划……
这就是主体性。为什么另一半有那么多种可能性?因为这些反应会由他所处于的当时的环境反映到的身体上的情况而决定。 (比如爸妈的减肥经历保存到海马体并参与了额叶思考的召回、最近的睡眠情况反映到当时下丘脑决定的激素水平、白天一整天的伏案工作反映到脑干的植物神经中枢......事实上身体每个细节都是环境决定的。)
那如果你问 ChatGPT 同样的问题,它会怎么回答?下面是我的 ChatGPT 的回答:
“你是想让我帮你找一个地中海沙拉的食谱,还是推荐上海附近哪里能买到/点到好吃的地中海沙拉?”
ChatGPT 已经做得很不错了。它在 poke my expression,它在尝试挖掘我更加具体和明确的指令,把需求变成一个它可以执行的明确的“静态目标”。
这一层挖掘行为本身就是 OpenAI 在产品层面通过 “You‘re a helpful assistant.” 这样的 prompt 加进去的。
然而,让我们沮丧的是两个事实:
1. 用户不擅长于 (几乎等于不会) 表达需求。人类喜欢被引导、被鼓励、被共情、被勾引……
2. 如果要让类似这种挖掘行为深入,就要人为不断添加预设的静态目标。即使是这样,也无法做到动态主体性。
顺便一提,或许你觉得改变 top_p and temperature 就能模拟这种动态主体性。你可以想象一下和同一个人聊天,每次对方回复的时候,虽然他知道对话历史,但是他的人设都会完全刷新一下。
这就是我们对 AI 应用感到失望的原因:我们对 AI 期待得很高,希望它有一个动态的、持久的主体性,但是现实却是 每次都感觉像是在和知识渊博的随机盒子对话 。创业者们在自动化、知识面、模拟对话策略等方面都铆足了功夫,也只能在单一、简单场景实现“还算能用、比没有强”的感觉。但绝对谈不上惊喜。而且这种失望,用得越久、积累越多。
市场对 AI 的反馈也是真实的。“全能”不是现在的 AI 最常被提起的印象。现在能称之为好用的 AI 应用,用户的感觉应该是:在某个我要做的事情上,有一个环节我急需要 AI 插手进来,用专业能力 (文案、绘图、翻译......) 帮我一下,然后剩下的我来就行了,要交给 AI 也要调教超久,调教了还调教不好。
Agency,is not a feature. It's the emergence phenomenon of life. 对于现在的 AI 技术来讲,这太远了。要实现这个,从还原、而不是模拟的思路去设想的话,首先要构建反馈回路。这完全不是现在大模型的研发技术思路。Claude 不久前发的那篇研究为什么 AI 会有幻觉的文章其实是同样的道理。基于自回归的静态死板的损失函数,训练出来的就只能是静态死板的东西。
所以其实市场不应该对现在的 AI 抱有过多的期待,创业者也不应该有过多的妄想。 如果某个 AI 应用赢得了某个市场,那多半是创业者灌注在产品中的有限静态主体性正好共情了用户。
一个把“拟人”作为目标的 AI 产品,在当前技术前提下,必然是失败的。
本文来自微信公众号: 一个人类的思考 ,作者:杨懿宸