前不久,在2024世界人工智能大会暨人工智能全球治理高级别会议上,AI智能体成为大会关注的焦点。
与会的多位国内外知名科技企业“掌门人”作出判断,“智能体是未来人工智能应用发展的主要方向”“智能体能够破解通用大模型在严谨产业应用的关键难题”,甚至认为“构建庞大AI模型的时代已经结束,AI智能体才是未来的真正挑战”。
从智能手机中的语音助手到自动驾驶汽车,AI智能体正以一种前所未有的方式悄无声息地融入我们的生活。那么,什么是AI智能体?它将为我们带来哪些改变?未来的应用前景如何?请看本期关注。
具有智能的实体
顾名思义,AI智能体就是具有智能的实体,能够自主感知环境、做出决策并执行行动,它可以是一个程序、一个系统,也可以是一个机器人。
OpenAI曾列出实现通用人工智能的五级路线图:L1是聊天机器人;L2是推理者,即像人类一样能够解决问题的AI;L3是智能体,即不仅能思考,还可采取行动的AI系统;L4是创新者;L5是组织者。在这其中,AI智能体恰好位于承前启后的关键位置。
作为人工智能领域的一个重要概念,学术界和工业界对AI智能体提出了各种定义。大致来说,一个AI智能体应具备类似人类的思考和规划能力,并具备一定的技能以便与环境和人类进行交互,完成特定的任务。
或许把AI智能体类比成计算机环境中的数字人,我们会更好理解——数字人的大脑就是大语言模型或是人工智能算法,能够处理信息、在实时交互中做出决策;感知模块就相当于眼睛、耳朵等感官,用来获得文本、声音、图像等不同环境状态的信息;记忆和检索模块则像神经元,用来存储经验、辅助决策;行动执行模块则是四肢,用来执行大脑做出的决策。
长久以来,人类一直在追求更加“类人”甚至“超人”的人工智能,而智能体被认为是实现这一追求的有效手段。近些年,随着大数据和计算能力的提升,各种深度学习大模型得到了迅猛发展。这为开发新一代AI智能体提供了巨大支撑,并在实践中取得了较为显著的进展。比如,谷歌Deepmind人工智能系统展示了用于机器人的AI智能体“RoboCat”;亚马逊云科技推出了Amazon Bedrock智能体,可以自动分解企业AI应用开发任务等等。
这些AI智能体的核心是人工智能算法,包括机器学习、深度学习、强化学习、人工神经网络等技术。通过这些算法,AI智能体可以从大量数据中学习并改进自身的性能,不断优化自己的决策和行为。AI智能体还可以根据环境变化做出灵活地调整,适应不同场景和任务。
目前,AI智能体已在不少场景中得到应用,如客服、编程、内容创作、知识获取、财务、手机助手、工业制造等。AI智能体的出现,标志着人工智能从简单的规则匹配和计算模拟向更高级别的自主智能迈进,促进了生产效率的提升和生产方式的变革,开辟了人们认识和改造世界的新境界。
重塑人与技术互动的方式
由于具有环境感知、记忆、观察、思考和行动能力以及多种特性,AI智能体可以和人类交互并完成特定的任务,推动人机交互方式的创新和变革,带来新的应用生态和产业模式——
自主性。AI智能体的核心在于“智能”,自主性是其主要特点之一。它们可以在没有人类干预的情况下,根据预设的规则和目标,独立地完成任务。想象一下,一辆无人驾驶车装备了先进的摄像头、雷达和传感器,这些高科技的“眼睛”让它能够“观察”周围的世界,捕捉到道路的实时状况、其他车辆的动向、行人的位置以及交通信号的变化等信息。这些信息被传输到无人驾驶车的大脑——一个复杂的智能决策系统,这个系统能够迅速分析这些数据,并制定出相应的驾驶策略。例如,面对错综复杂的交通环境,无人驾驶汽车能够计算出最优的行驶路线,甚至在需要时做出变道等复杂决策。一旦决策制定,执行系统便将这些智能决策转化为具体的驾驶动作,包括但不限于转向、加速和制动。
放眼全球多个国家,随着无人驾驶技术的不断进步和成熟,市场上已经兴起无人驾驶网约车服务。这些无人驾驶汽车不仅减少了对人类司机的依赖,还有望显著提升道路安全和交通效率,为我们的未来出行描绘出一幅智能化、高效化的新图景。
交互性。在基于庞大数据和复杂算法构建的大型智能体模型中,这一特性体现得较为明显。能够“听懂”并回应人类复杂多变的自然语言,正是AI智能体的神奇之处——它们不仅能够“理解”人类的语言,还能够进行流畅而富有洞察力的交互。
自ChatGPT问世之后,各个大模型如雨后春笋般涌现。人们仅仅需要通过简单的指令或者问题,即可得到自己想要的答案。它们就像一个随时待命的私人助手,可实时提供帮助。
前不久,百度公司的“文心一言”大模型也推出新功能。用户可以根据自己的需求创建个性化聊天智能体,选择AI智能体的性格、音色甚至方言。如果事先不了解,恐怕很多人会认为和自己聊天的是一个真实的人。
2023年11月,初创公司HumaneAI发布AIPin无屏幕可穿戴设备。这款设备通过语音、触摸、手势和激光投射等多模态交互的方式,为用户提供信息和服务。
适应性。AI智能体不仅能迅速适应各种任务和环境,还能通过持续学习不断优化自己的性能。自深度学习技术取得突破以来,各种智能体模型如繁星般点缀在人工智能的夜空中。它们通过不断积累数据和自我完善,变得更加精准和高效。
以AlphaGo的崛起为标志,AI智能体在围棋等策略性游戏中展现出了惊人的学习能力。游戏中,用户只需提供初始条件和目标,智能体便能够通过自我对弈和策略优化,迅速掌握游戏的精髓。此外,AI智能体对环境的适应性也十分强大,在仓库工作的自动化机器人能够实时监测并避开障碍物。当感知到某个货架位置发生变化时,它会立即更新其路径规划,有效地完成货物的拣选和搬运任务。
AI智能体的适应性还体现在它们能够根据用户的反馈进行自我调整。通过识别用户的需求和偏好,AI智能体可以不断优化自己的行为和输出,提供更加个性化的服务,比如音乐软件的音乐推荐、智能医疗的个性化治疗……
随着机器学习和深度学习技术的不断进步,AI智能体的特性和学习能力还将变得更加强大,未来将更好地适应复杂多变的现实世界,为人类社会带来更多的可能性和价值。
潜在风险不容忽视
在技术层面上,AI智能体展现出前所未有的计算能力和数据处理效率,成为现代科技发展的重要引擎之一。AI智能体通过模拟和扩展人类的认知能力,有望广泛应用于医疗、交通、金融及国防等多个领域。有学者推测,到2030年,人工智能将助推全球生产总值增长12%左右。
不过,在看到AI智能体飞速发展的同时,也要看到其面临的技术风险、伦理和隐私等问题。一群证券交易机器人通过高频买卖合约便在纳斯达克等证券交易所短暂地抹去了1万亿美元的价值,世界卫生组织使用的聊天机器人提供了过时的药品审核信息,美国一位资深律师没能判断出自己向法庭提供的历史案例文书竟然均由ChatGPT凭空捏造……这些真实发生的案例表明,AI智能体带来的隐患不容小觑。
因为AI智能体可以自主决策,又能通过与环境交互施加对物理世界的影响,其一旦失控将给人类社会带来极大威胁。哈佛大学教授齐特雷恩认为,这种不仅能与人交谈,还能在现实世界中行动的AI智能体,是“数字与模拟、比特与原子之间跨越血脑屏障的一步”,应当引起警觉。
首先,AI智能体在提供服务的过程中会收集大量数据,用户需要确保数据安全,防止隐私泄露。
其次,AI智能体的自主性越强,越有可能在复杂或未预见的情境中做出不可预测或不当的决策。AI智能体的运行逻辑可能使其在实现特定目标过程中出现有害偏差,其带来的安全隐患不容忽视。用更加通俗的话来说,就是在一些情况下,AI智能体可能只捕捉到目标的字面意思,没有理解目标的实质意思,从而做出了一些错误的行为。
再次,AI大语言模型本身具备的“黑箱”和“幻觉”问题也会增加出现操作异常的频率。还有一些“狡猾”的AI智能体能够成功规避现有的安全措施,相关专家指出,如果一个AI智能体足够先进,它就能够识别出自己正在接受测试。目前已经发现一些AI智能体能够识别安全测试并暂停不当行为,这将导致识别对人类危险算法的测试系统失效。
此外,由于目前并无有效的AI智能体退出机制,一些AI智能体被创造后可能无法被关闭。这些无法被停用的AI智能体,最终可能会在一个与最初启动它们时完全不同的环境中运行,彻底背离其最初用途。AI智能体也可能会以不可预见的方式相互作用,造成意外事故。
专家认为,人类目前需尽快从AI智能体开发生产、应用部署后的持续监管等方面全链条着手,及时制定相关法律法规,规范AI智能体行为,改进现有互联网标准,从而更好地预防AI智能体带来的风险、防止失控现象的发生。
(解放军报·中国军号出品)
摘自人人都是产品经理