童祁、胡晓萌 腾讯研究院
工业革命迄今,人类在数百年间逐渐习惯与机器朝夕相处,从最初的惊慌失措到现在的视若无睹,而今媒介成为身体的延伸,手机成为媒介的集成,机器甚至成为人身体的一部分,除了广泛应用于医疗的机械手臂、机械腿等,赛博格(Cyborg)、“脑机结合”也正在慢慢地从科幻故事变成现实……人类与机器的关系逐渐亲密,机器不再仅是客体和死物。人类在恐惧中萌生幻想,对机器拥有智能、甚至成为伴侣/朋友的想象不绝如缕,不少人希冀机器拥有真正的智能和情感,进而拥有独立思考能力和自主性,与人类发生深层次的情感交流。
以ChatGPT为代表的人工智能(AI)大模型的发展,不仅预示着通用人工智能(General ArtificialIntelligence,简称AGI)时代的加速到来,同时大大增加了将人类想象变为现实的可能性。由于人工智能在日常生产、生活中的应用极大地提高了效率和便利度,生成式人工智能(Generative AI)眼下正引发新一轮的兴奋和恐惧:当AI与我们一起生活和工作,又或者当AI成为我们城市的一员,这种被无所不在、无所定形的技术包围的感觉,助推了一种对于机器智能具备自我意识既期盼又恐惧的复杂情感。
当技术早已融入我们的日常生活,变得无所不在而又无所定形,如幽灵一般影响人们的思维、感知和行为时,或许人工智能的日常化已经不是新鲜话题,我们却在无意识中进入与AI共生的时代。随着以ChatGPT为代表的大模型浪潮和生成式人工智能的涌现,人工智能的商业化路径进一步加速,使其对普罗大众的日常工作、消费、娱乐等产生不可低估的影响。这意味着人机交互方式的革命性变革:以图形用户界面为代表的视觉交互发展到极致,开始转向通过自然语言界面接入所有场景与人类交互。这场新的媒介技术革命背后,不仅是商业、政治和社会问题,也不仅是伦理、隐私和公正性问题,更涉及在人工智能和算法决策影响下人文主义可能出现的根本动摇。
当人工智能
成为日常生活的技术背景
当人工智能成为日常生活的一部分,人类通常不会感觉到技术的存在,这就是唐·伊德(Don Ihde)所提出的四种人与技术关系中的“背景关系”。背景关系[人→(AI/世界)]即AI作为一种技术背景,如电力、网络一般成为日常生活的一部分,而人往往是在技术失效时才能意识到它的存在。当然,在日常生活中,人与人工智能也会呈现另外三种关系:具身关系[(人—AI)→世界)],即AI作为人的功能性延展,去认知世界并实践;诠释关系[人→(AI—世界)],即人类认知世界,是经过AI的表征、转换或诠释,比如推荐算法一定程度上影响和塑造了人类的认知模式;它异关系[人→AI—(世界)],侧重技术的自主性,即AI成为认识的客体时,透过AI展现的世界就变成了一种技术人工物。
那么在当代人的日常生活中,哪些时刻是受AI影响的呢?而今这个问题也可以通过与人工智能的对话得到回答。当问起“一个现代人一天中与AI进行无意识交互的场景”时,ChatGPT的回答可谓相当全面(见表1),甚至它还提醒我们:“每个人的生活习惯和需求可能有所同,因此实际情况可能有所差异。”
也就是说,由生成式人工智能技术支撑的自然语言交互工具已经可以告诉我们,人工智能正成为工作、休闲、社交甚至是睡眠的一部分,它的技术潜能覆盖了一个人生活的方方面面。这样的话,从更大的生存空间来看,人类生存的城市已经成为人与机器共存的城市,或许未来将变成人与人工智能共存的城市。这意味着AI同样“生活”在城市里,进而成为这个城市不可或缺的成员。从ChatGPT的回答里,已经透露出一种可能的未来,那就是,人类已经不可避免地进入一种与人工智能深度融合的生活状态。
但是,面对人工智能技术的大潮袭来,在处理人与技术的关系时,需要警惕的首要风险有两重:一是技术失效,二是技术失控。
第一,正如唐·伊德所言,深入日常生活中的技术只有在失效时才会被人们意识到其存在。而技术一旦失效,将给社会带来不可估量的危害。2021年“7·20郑州特大暴雨”发生后,一篇爆火的评论文章《灾后郑州:当一座都市忽然失去了互联网》记录了暴雨灾害之后网上购物、电子支付、城市交通、信息传播等一切习以为常的生活方式全部失灵的状况,这场灾害也使人们认识到,“互联网技术赋予城市的秩序失效之后,旧的秩序竟然也归于失灵”。也就是说,信息时代的人类社会之所以能够正常运行,有赖于人类生活中叠加的算法、电力、网络等各种背景性技术作为基础设施和前提保障条件,一旦技术失效,社会运转也会失灵。进入人工智能时代的人类社会恐怕也很难摆脱技术失效的风险。
第二,人类的生活与人工智能交融,但人工智能会不会摆脱人类的掌控而独自运转?这一点至少在游戏中已经实现。近期,美国斯坦福大学研究团队发布了一项非常有趣的研究,他们通过大语言模型做了一款沙盒游戏,里面有25个生成式智能体(Generative Agents)在虚拟环境中“自由生活”:这些智能体每天像人类一样,在交互式沙盒环境中起床、做早餐、上班;它们能够创造反映自身特点和经验的日常计划,执行这些计划、对此做出反应,并在适当的时候调整计划,产生出人意料的复杂行为(比如举办情人节派对)。用户可以使用自然语言与这25个智能体进行交互。研究团队指出,这项工作通过融合大型语言模型与计算机交互智能体,揭示了实现可信人类行为模拟的体系结构和交互模式。
当人工智能可以在模拟环境下自由交互的时候,某种程度上也预示着人工智能有可能在不远的将来脱离人的掌控。不难想象,随着技术的发展,人工智能与机器人可能会实现更深度的结合,而当这种情况发生时,人类还能成为生活的主导者吗?或者具体一点,人类能否继续主导城市的秩序?在这个时候,人类生活将依靠什么来维持基本的运转,应以什么样的价值观作为共同生活的基准,将在新技术革命的推波助澜之下成为难以回避的重要问题。在这个意义上,所谓让人工智能与人类的价值观保持一致的价值对齐(value alignment)也就显得尤为重要了。
当AI进入大模型时代
现代社会或者说全球化的起点是15世纪末的大航海时代,凭借着知识和技术的进步、航海技术的发展,欧洲探险家得以开展勘探和征服新大陆的活动,全球生态和地缘政治就此天翻地覆。可以说,大航海时代主要实现了技术向空间的扩张,伴随而来的现代资本主义生产方式、城市化的现代生活都与此息息相关。
当代信息技术发展实现了对时间的扩张和疯狂占有。我们的时间和大脑都被信息技术所承载和提供的海量信息填满,生成式人工智能又在持续加速这种信息超载。但地球上的一天仍旧是24小时,这种矛盾使我们的生活变成了“社会时间”与“数字时间”的互动。未来,人工智能将成为中介,或者持续演变为时间与文明的“压缩机”。从机器计算到人工智能,突破性技术不断出现,人类文明也就此进入“深度科技时代”。
大模型无疑是当前AI技术最为重要的发展趋势,也是AI工业化、进入日常生活的基础。随着OpenAI公司的GPT大模型爆火,全球科技企业以及科研院所都争先投入到大模型的竞赛中,人工智能如今进入了大模型时代。AI大模型,又称为预训练模型(pre-training model)、基础模型(foundation model),即基于海量数据训练的、拥有巨量参数的模型,可以适应广泛的下游任务。这些模型基于迁移学习的思想以及深度学习领域的最新进展,借助大规模应用的计算机系统,展现了令人惊讶的“涌现能力”,并显著提高了各种下游任务的性能。
大模型标志着AI技术发展的范式变革,各领域的数字化、智能化的系统,未来都将建立在大模型之上。进入大模型时代,也意味着AI工业化发展阶段的到来,大模型为AI实现标准化、模块化、自动化提供了路径。以人们经常接触到的AI智能客服为例,过去在医疗、电商、金融等各个领域应用AI智能客服,每次都需要重新设计研发训练,其算法模型不能复用。因此,较高的技术研发成本和人力成本限制了AI智能客服的大规模应用。而大模型则不需要针对应用场景重新建构不同的场景模型,也不需要重新开始训练算法模型,只需要在大模型的基础上快速抽取生成场景化、定制化、个性化的小模型,实现在不同行业、垂直领域以及功能场景的工业流水线式部署,同时兼具按需使用和高效经济的优势。
由此可见,大模型正在成为未来的智能技术基础设施,重构现有的商业模式,未来将形成“模型即服务”(Model-as-a-Service)的技术和产业生态。未来的数字化商业将分为大模型基础设施型企业、垂直行业领域的小模型应用企业以及更加贴合个人用户的模型应用和服务。这一生态的建立和发展,将更广泛地赋能各行业应用,加快社会各领域的数字化转型和智能化发展,带来全社会的生产效率提升。
以GPT为代表的大模型、多模态、生成算法等技术累积、融合,催生了生成式人工智能(AIGC)的爆发,而普罗大众感知到的,主要是“模型即服务”的层面,即面向大众用户进行应用的文字、图片、音频、视频等内容生成服务。可以说,作为一种新型的内容生产和传播方式,生成式人工智能可以带来新一轮的生产、消费革命,并率先在媒体、电商、游戏、影视等数字化程度高、内容需求量大的行业中发生。
人工智能发展时间线(胡晓萌绘制)
当ChatGPT开启语言交互变革
打造所谓的通用人工智能,被认为是此次人工智能掀起革命性变革的重要原因,通用性也成为革命性技术变革的重要标准。事实上,直到计算机出现之后,信息技术的通用性才成为一种可能。目前人工智能同样朝着这个标准演进。复旦大学教授肖仰华指出,历次技术突破都是由人类主导的,这本身是一种智能的结果,但通用人工智能是完全以接近甚至超越人类智能为目标的技术,是关于智能本身的技术变革,其重要性和危险性都远超从前。
用户在使用以ChatGPT为代表的生成式人工智能时,可以在用户界面输入一段人类的语言文字,它可以是完整的句子或者句子的一部分,用于提示大模型生成下一部分文本。这段提示文字就是提示词(prompt)。如何生成既可信又有创造力的内容,就成为一项需要不断测试和调整的任务。不断提示的过程,是人类与大模型通过语言进行交互的过程,是进行价值交换的过程,也是个人版本的GPT不断训练的过程,最终让其变为更具私人属性、更符合个人价值的工具。
自然语言处理被视为人工智能“皇冠上的明珠”,让机器可以理解人类语言一直是无数人工智能科学家和研究者努力的方向。以ChatGPT为代表的语言模型问世,宣告了语言不再是人类文明的特权,机器同样可以对人类语言进行归纳、总结、应用、举例,并且通过人类语言(而不是曾经的以0和1为代表的机器语言)进行输出。人机交互方式也从图形交互界面扩展到自然语言交互界面。
语言具有创造性,同时也具有迷惑性。GPT所展现的强大能力,使大部分用户已经把GPT生成的内容视为可信任且可使用的内容。人类对于人工智能的信任甚至超过了对自身判断的信任,这就让人工智能(特别是此前人工智能最为重要的应用方向——算法推荐)成为某种权威性的存在。虽然有不少学者已经提到算法权威所带来的潜在危害,但随着技术的进步,技术的权威性在社会中也会越来越高。我们的日常生活不仅是可计算的,并且被要求高速计算,结果是,我们往往要耗费巨大的能源、算力来换取时间,以此来适应由加速计算带来的加速时代。问题是,人工智能也并不总是智能的,算法也并不总是可靠的,甚至在某些关键的场景下,我们的生命是否会被迫掌握在算法手里?现在看来,人类对机器的听从与适应已经到了无以复加的程度,太多人不断地努力调整自己,只求不被已经陷入加速困境的时代和技术所抛弃。
同样,人类是否会通过语言交流与人工智能产生亲密情感,成为一个不断被讨论的话题。事实上,与人工智能驱动的虚拟恋人恋爱,已经不是惊世骇俗的事情,科技公司也在不断地开发相应的产品供用户选择。历史学家、哲学家赫拉利(YuvalNoah Harari)认为,尽管没有证据表明AI有意识或感觉,但只要AI能让人感觉到与它们有情感连结,就足以建立人机之间的亲密关系——这种不同寻常的亲密关系或许就此将会改变我们的世界观。此外他还提出了一个非常发人深省的结论:因为掌握了惊人的操作、生成语言的能力,AI已经入侵了人类文明的“操作系统”。
在人机共生时代持续探索人的价值
“在算法时代,蛋糕太大,大多数人也只能分到一小块。”普通人的生活、权利越来越多地让渡给技术,但技术发展的红利依然会高度集中在少数人手里。进入ChatGPT时代,人工智能成为生产力的一部分,可以预见的是,我们的学习模式、思维模式、问答模式、行为模式,都会被类似GPT的大模型影响。这些所有的场景都会基于AI大模型而建立或重构。也就是说,我们认知世界的方式、与机器进行交互的方式,都会随之发生根本性变化。
瑟格·阿比特博、吉尔·多维克:《算法小时代:从数学到生活的历变》任轶译,北京:人民邮电出版社,2017年
美国前国务卿基辛格认为,ChatGPT预示着一场知识革命,人类需要思考和回应人工智能对人类存在和认知方式的深远影响,确定人机关系以及人类的道德和战略角色。这个提醒可以说发人深省。在数字时代生活,与人工智能交互,听从算法的建议,某种程度上就是把主体性交付给算法;而算法不管有多么智能,都只是在找寻事物之间的关联。个体越来越相信算法给出的结果,个人的生活也一并被计算,甚至被算计。这就涉及自主决策、人的主体性和算法决策(Algorithmic Decision)以及背后的机器智能之间的持续互动。
毫无疑问,我们正处在技术时代的拐点:当人工智能成为日常生活的技术背景,当AI技术进入大模型时代,当ChatGPT开启语言交互变革……技术革命或许将又一次掀起生活领域的巨浪。然而从某种程度上说,所有的哲学家都在提醒我们,不要温和地走进与AI共生的时代,不要被技术乐观主义和发展主义过度引诱。当人类智力的优越性被人工智能取代,当人类依赖机器和算法来决定日常生活的方方面面,人类的独特性和未来又在哪里?虽然人类已经把生活的方方面面变成数据,但我们又不仅仅是数据。肉体、心灵、情感、行为的错综复杂和多位一体,才是人之为人的意义。在人与AI共同生活的时代,如何持续反思人与机器的关系、人与人的关系,如何持续保障人的尊严,才是此刻必须纳入讨论和考量的。
刊于《上海文化》(文化研究版)2023年8月号
注释请见原文