最近科技领域什么最火?如果你的回答还是 ChatGPT 的话,可能已经稍显滞后。
自从微软发布 GPT4,AI 领域的应用几乎每天都在更新,GPT 不再只是封闭在黑箱里的聊天机器人,而成为了新的通用工具。比尔·盖茨说,「从 ChatGPT 衍生开始的 AI 应用,是自 1980 年互联网浪潮以来*革命性的技术进步」。未来,GPT 会成为一切技术应用层的基础设施。
(资料图片仅供参考)
机会之下,忧虑不断。诸如「微软深夜放炸弹、GPT4 office 全家桶发布,10 亿打工人被革命」的标题,大量渲染惨淡就业市场和竞争加剧的内容,成了流量密码。
对产业巨头来说,的确是一次生与死的较量。宝宝树原创始人王怀南最近断言:ChatGPT 会重构互联网巨头的秩序,就连谷歌这样的巨头,都很可能在朝夕之间出局。对于中国互联网巨头来说,同样不可懈怠,百度李彦宏*个跟进,推出了文心一言,并称和 ChatGPT 的差距仅在几个月,王小川则拆穿称百度的差距应该在三年左右,并戏言李彦宏生活在平行宇宙,一时间火药味浓厚。
阿里则在近期推出了「通义千问」,恰逢阿里集团架构调整,逍遥子张勇也率先给自己在阿里云找到了「新工作」。360 创始人周鸿祎更是 ChatGPT 的拥趸,他曾在多个场合摇旗呐喊,称 ChatGPT 已经拥有或接近拥有了人类智慧,并正处于通往「通用人工智能」的临界点。昆仑万维也动作连连刺激股价,引发了深交所关注函。字节跳动的内部人士也向我透露,其内部正在赶工中,有若干组人马在齐头并进,目前成果在内部人看来颇为惊艳。
原谷歌科学家李志飞就猜想,ChatGPT 的进展超乎他的想象,他甚至也听到一种说法:如果交互方式发生革命性变化,华为荣耀小米 OPPO vivo 构筑的手机行业可能都会被颠覆掉,一个可穿戴设备即可解决用户日常需求,更不用说附着在手机之上的阿里腾讯字节百度联手掌控的移动互联网生态,这的确值得巨头们的紧张。
而对于普通人来说,讨论「人类(工作)被 AI 取代」,先得问问,什么是「取代」?汽车「取代」了马车吗?滴滴取代了「出租车」吗?似乎没有这么简单。很多出租车司机会熟练运用各种打车软件拉客,载客效率提升、收入增加了。打车软件对用车行业的正向改变,无论是司机还是乘客都有目共睹。
时下流行话语中,AI「取代」人类的各种设想,大多来源于反乌托邦科幻作品。而在现实和历史中,新的技术革命,及其带来的产业更新,并非只有「替代效应」,还会将人与技术系统重新交织在一起,组成行动网络,开辟新的领域。只有在这个打破了「技术好 vs 技术坏」的动态视角下,我们才能清楚看到更多涌现出的可能与机遇,才能全面评估技术的影响。
这篇文章将从这样的视角出发,尝试性寻找新的理解 GPT 的路径,为人与 AI 的未来提供一些相对乐观的视角,并探讨我们如何应对这些改变。
01 GPT 浪潮的根源
2016 年,谷歌 AlphaGo 大获成功,国内互联网巨头,百度、阿里、字节、腾讯、美团涌入人工智能领域,纷纷设立自己的 AI 实验室,高薪聘请专家担任负责人或首席科学家,领导科研团队。这些改变被看作是国内 AI 产业繁荣的表现,互联网大厂凭借其数据量优势,给 AI 算法提供了源源不断的养料,再让算法匹配到具体技术产品中,形成良性循环,在安防、语音识别、翻译、大数据、广告匹配推送、智能系统等领域,AI 的确有所建树。
上一波 AI 投入,专注于小模型(比如神经网络),需要大量人工标注、清洗处理数据,最后在垂直领域内验证成果。这样训练 AI,一个萝卜一个坑,单一模型难以扩展到其他领域。AlphaGO 下围棋天下*,AlphaFold 在绘制蛋白质折叠结构上强过专家,但两者无法对调使用。对相关企业来说,专精某一细分领域的 AI 相对来说投入产出比更高,利益更近。
纵观 AI 发展史,几乎都是专精突破,比如 IBM 的「深蓝」(象棋),Waston 问答系统,Libratus 扑克程序,等等。那时,AI 领域还处于「天下武林门派,各有专精,不求大同」的状态中。
这一波 AI 浪潮始于从 GPT3 到 GPT3.5 演进的过程里,大型自然语言模型(LLM)打破了人机边界,开始生成出「有意义的回答」,GPT 强大的语言通用能力,可以用推及到自然语言处理任务、机器翻译、问答系统等其他领域,且表现出色。
所谓大语言模型的「涌现」(Emergent)现象,是例如基础的社会知识、上下文学习(ICL)、推理(CoT)等能力,在训练参数和数据量超过一定数值后,就突然出现了,令 AI 一下变得特别智能。我愿称之为「灵光乍现」。
语言真是一通百通、一统武林的利器。但有意思的是,GPT 的成功并不在于掌握人类的「说话之术」,它也没有心智意识,没有思想,甚至没有推理过程,没有语境,没有理解。它与人类的「思考方式」完全不同,它在无监督学习下,采用「自回归语言模型(ALM),通过统计推断来判定意义,用「生成」替代理解,绕过了传统意义上的语言结构,也因此,它能处理各种类型的文本数据,应用在不同任务中,说白了,它就是一个高级的「接下茬儿」机器。
仅凭语言能力就把 GPT 看作是人(或神)是想象惯性和拟人化理解,这是人的偏见和媒体误导所致,GPT 远未到通用人工智能的级别。客观一点,不如将其看作「工具」,一个像镜子迷宫一样封闭复杂的反射系统,一个高度进化版的「猴子打字机」,更接近它的模型效果。
不要神话它,也不要低估它。
02 GPT 如何改变工作
在前两波技术浪潮中,操作系统和 PC 把软硬件组合起来,迭代缩小,普及大众;互联网、搜索引擎、社交平台和电商将人类协作网络重新组织;GPT 提供更便捷和自然的人机交互界面,增加了人机协作的可能性,带来的改变可能不亚于互联网。今天,我们不能想象一种没有互联网的生活,未来,对 GPT 亦如是。
GPT 会渗入不同领域的工作流程中,帮人完成以前重复性较高的案头工作,例如数据分析、商业分析、基础咨询、会议记录、文案草稿、报表生成……GPT 是一个很强大的中间层工具,它接收人类的语言指令,并转换成机器语言,操控其他的 APP 或系统,相当于一个智能中枢,这一步是革命性的跃升。
目前有关 GPT 的应用,除了二次开发的对话程序(chatbot)外,最火的是图像领域(GPT+stable difussion/Mid Journey/大鹅/Adobe……),帮助设计师快速出稿(据调查,设计师群体也是目前在专业领域运用 GPT 最多的,其次是程序员群体)。相关的视频和游戏领域也可以用 GPT+ 软件完成基础的构架和渲染,以前一个团队一个月的工作量,现在几天搞定。规模化和专业化几乎是大势所趋,未来围绕 GPT 开发的生态系统,上下游公司,只多不少。只是目前来说,还存在灰色地带——因为 GPT 生成的作品介于原创和复制之间,版权归属不明。
不过,与很多成熟的互联网产品比起来,GPT4 目前在商业和应用层面,还只是一个半成品,一块璞玉。写片汤话在行,更优质的内容还无法完成。借用之前猴子打字机的比喻,敲出大量内容不难,难的是筛选出优质内容。和 ChatGPT 聊天时我们就能感觉到,问题精确与否,语境完整与否,与最终得到的答案息息相关。比如让 ChatGPT 解释概念或直接写一大段文字时,往往错误百出(因为它对语料并不具有判断力),但是如果让它帮你根据前文续写、扩展、缩写内容,或者对文本进行总结、转写、提取关键词,找例子,都挺 OK。
由于 GPT 的黑箱属性,我们并不知道输入输出的直接对应关系,因此,和它建立沟通模式、框架,训练运用 GPT,以得到*的结果,将变得非常重要。所以李彦宏才说,未来,机器的工作中提示词(prompt)非常重要,提问的质量直接影响回答的效果。提示词工程师会有点像过去产品经理的工作,分析需求,优化输出。李彦宏大胆猜想:未来十年,人类全部工作的 50% 会与提示词有关。
由于 OpenAI 开放了 GPT4 的 API 接口,开发者可以以此为基点,在各个领域创建自己的应用,当然,这些工作同样需要对 prompt 的想象力。所有的 APP、网站、系统,只要接入 GPT 后能提升效率和创意,都会有人去尝试结合、重构,甚至颠覆。客服系统接入 GPT 后能更准确地「听懂」顾客的意思,随时响应,甚至把常见的提问整理成单独的语料库,总结出痛点,甚至新的卖点;在网页浏览器中阅读文章时,看到一个观点,不知如何反驳,可以让 GPT 找 10 个反例,甚至还可以跨站搜索包含观点的视频音频,定位到时间戳,这些功能对搜索引擎来说比较麻烦,但对具有多模态能力的 GPT 来说属于常规操作;在游戏开发领域,GPT 能快速生成地图或对话,或者测试平衡性,这些工作在过去需要花费大量人工。
GPT 影响最深远的行业当属教育。传统的、课堂上基于文本的学习方式,从普鲁士教育和工业化时代延续到现在,可能会被完全颠覆。过去,知识结构和书面表达几乎划等号,中小学写作文,大学写论文,是(文科社科)考核的重要指标。但在 GPT 广泛运用的世界里,标准答案变得不太重要,如何向 AI 提问、沟通,找到答案,可能成为新的素质教育必备技能;如何多角度思考,超出机器的生成范畴,可能会成为衡量创造力的指标。在教学方面,GPT 可以协助教师工作,解释概念、训练逻辑、头脑风暴、定制外语学习方案,让教学过程变得更丰富,个性化。
如果我们再想远一点,会发现,巨头们,无论是 BAT 还是 FAANG,都是迎着前两波技术浪潮兴起的,但这一波由微软和 OpenAI 引领的风暴,谁都没有压中——尽管巨头们在 AI 领域的投入惊人,足以砸出下一个巨头。但这些付出,在 GPT 面前,都显得有点无力,比如王小川认为百度的差距在 3 年左右,还有谷歌的 Bard,短时间对 GPT 都无法构成任何威胁。如果把 GPT 看作先行者,如同埃尼阿克之于个人电脑爆发,移动互联网全面开启前的诺基亚,互联网前浪网景浏览器(不知还会有人记得这名字吗?),那么今天的巨头们,20 年后又将在哪里?洗牌还未开始,而山雨欲来风满楼。
Open AI 创始人 Sam Altman 曾在一次采访中坦言,他之所以让 GPT 开源,让 AI 运行在一个开放的环境中,就是为了防止 AI 在进化的过程中走偏,它需要人类为其行为校准,尤其是当它还未成为 AGI(通用人工智能)时。就像一个小孩子,小时候教育成本更低,要是等他变坏,充满过激的思想和仇恨时,人类可能也无法改变它。届时,人工智能可能就是人类的最后一项发明。
03 与 GPT 协作,必要且紧要
人类与 AI 接触和交互的未来已经临近,人与人的关系、人与机器系统的关系都可能会被重塑。有一点毋庸置疑:GPT 不会取代人,也无法取代人。它始终与人不同,人类的问题,不可能被 GPT 一劳永逸地解决(历史上所有的技术革命也是如此)。
人类的问题是什么?简单来说,是价值判断的问题,包括价值的根基和价值导向的「何为良好生活」(well-being)的难题。
AI 暂时没法在这个领域给予人类更多帮助,AI 没有生活世界,没有躯体,没有朋友和经济压力,它所具有(或者说模拟出的)逻辑、观点、情感、知识,都仅仅基于庞大的模型。换句话说,它没有真正「活过」,不知道活着是什么滋味,爱情是什么状态……语义上,它可以无所不知,但在生活中,它与人类始终隔着一层。
人类的问题、境况和挑战,短时间(5-10 年)来看,取决于现存的「现代系统」(包括金融系统,国家行政,文化价值等)的运作情况。GPT 的力量尚不足以改变比它更大更复杂的东西。
从最悲观的态度来看,GPT 的确可能增加现代系统的风险,因为它只是一个技术路径,可能会把它所能触及的领域变得单一化。假设如此,我们就更应该及早去探索「逆技术路径」,不是完全抛弃或反抗系统,不是去做一个卢德分子,捣毁机器、删库跑路,让科技浪潮减缓或停滞——历史上也没有成功案例——而是去克服它的局限。就如同在互联网时代,对抗信息茧房的方法,不是断网自闭,而是更好地利用搜索引擎,找到自己需求的资料,去学习和练习逻辑严密的思考方式,站在更多的视角思考,利用互联网做公共表达,影响他人;或是创造新的商业模式,来平衡人性中的自利与善意。
我们也不能原地躺平,等待 GPT 成为一个完整的商业应用落地铺开时再去使用——这样恰好顺应了技术的逻辑,放大了负面效应。最乐观的态度,是尝试和 GPT 一起改变,去测试和寻找它的应用边界,去思考与实践,重新审视创新和创造的意义,以此改进它,同时在与 GPT 的交互中体现出人类价值。人类最难替代的能力,是在不同的道路之间穿行、选择、创造。毕竟,我们创造了它,不应该畏惧它。
从长远来看,如果 AI 让人类的生产力和创造力得到大幅提升,工作岗位人数锐减,技术性失业在所难免时,类似于 UBI(全民基本收入方案)就是时候提上议程。当人们从糊口谋生的工作岗位上解脱出来,又有一笔钱,他会做什么呢?就像文艺复兴时期的艺术家、思想家依靠资助人的赞助,自由地创作,硅谷淘金热时期无数年轻的创业公司拿到 VC 的钱后为自己的梦想奋斗一样,未来也许有更多人参与到创造、探索、实现人类的可能性之中。
关键词: