AI Agent,爆款应用的伏笔?
潮水涌动,AI Agent已是海内外创投圈正在和下一步的开垦地。9月7日,以创造实用的AI代理为目标的初创公司Imbue完成2亿美元B轮融资,一跃成为估值10亿美元以上的硅谷独角兽;国内大模型创业头部企业智谱AI宣布今年已融资25亿,在最新的ChatGLM3技术迭代中,强调全新的Agent智能体能力在规划和执行方面,相比上一代提升1000%。
Agent(智能体)是什么?在Open AI应用研究主管Lilian Weng年中撰写的万字长文中,AI Agent = LLM(大型语言模型)+记忆+规划+工具,加上各种模块,目的是完成特定任务,并非常看好Agent的前景。酝酿多时,11月Open AI Devday上,All Tools整合使得GPT-4具备Agent能力,再一次引爆网络。
创业邦《2023年Q3AIGC产业观察》的案例中显示,国内AIGC行业的一些业内人士对其非常看好,期待较高,他们认为,AI Agent是整个大模型技术体系里面非常重要、关键的一环,我们离Agent模式下AI完成绝大部分工作的阶段越来越近了。
AI Agent
爆款应用的伏笔?
想象在一个虚拟城镇中,有学校、医院、家庭,25个AI智能体不仅能在这里上班、闲聊、交友,甚至还能谈恋爱,每个Agent都有自己的个性和背景故事。
这是西部世界小镇,由斯坦福和谷歌研究人员开发的AI Agent实验,目前已在Apache-2.0协议下正式开源。与游戏不同,其核心技术是利用GPT来生成AI Agent的行为和语言。在这个小小的智能体社会中,multi-agent(多智能体系统)会为不同的Agent赋予不同的角色定位,通过Agent之间的协同合作来完成复杂的任务,并演绎出整个文明的演化进程。
脱胎于游戏化的实验,AI Agent的应用价值到底有多大?在哪些场景适用呢?
AI Agent的虚拟陪伴让人们在闲暇时光中获得更多的乐趣,泛娱乐市场受到诸多投资者的关注。估值突破40亿美元的AI语言模型会话API研发商Inflection AI,今年5月推出主打情感陪伴的个人AI——Pi。区别于ChatGPT,Pi富有同情心、谦虚好奇、幽默创新、高情商,可以根据用户的独特兴趣和需求提供无限的知识与陪伴。无独有偶,国内大模型独角兽Minimax也开发出AI社交产品Glow,能为用户提供创建虚拟人物“智能体”,满足用户的角色扮演、情感陪伴、树洞倾诉等情绪价值类需求。
Agent延伸到终端硬件,推动了应用场景的多元化发展。例如,智元机器人搭载百亿级参数的大模型WorkGPT赋能人形机器人“远征A1”,未来计划在厨师、家庭清洁、护理等C端场景落地。在终端加持下,大模型与人类的交互方式也有望从互联迈向下一站——具身。
比起娱乐、生活,Agent在工作场景作为生产力引擎显然更令人兴奋。今年8月,人工智能初创公司HyperWrite推出AI Agent应用Personal Assistant,希望成为人类的“数字助手”,帮助用户整理邮箱并起草回复、帮助用户订机票、订外卖、整理领英上适合的简历等。目前该工具还处于试用阶段,主要适用于网页浏览器场景。
“原有的软件的开发方式和
生态的应用方式正在发生改变”
从Copilot副驾驶到Agent主驾驶,人人皆可定制Agent,使得原有的软件研发范式发生改变,由用户定义个人产品,对软件生态产生颠覆式影响。
“早期建立的平台,用户的功能、漏洞靠软件开发者定义和实现,当大语言模型产生之后,大家更期待在这样的模式背后,大模型真正赋予软件生态智慧,更自动、更智能地打通APP背后的数据、逻辑、流程。”一位AIGC资深创业者向创业邦解释道。
他同时也聊到公司在大模型原生应用做过这样类似的探索,“如果你想规划3天的旅游行程,需要搜攻略、订票、配合时间、安排行程,比较价格、方案,但是现在只需要大语言模型作为核心的AI助手,告诉它我有3天假期,去什么地方,同行的里面有老人、孩子,它就可以自动在网上获取信息,甚至帮你订机票、订车、订酒店。这也是大家所想象的未来的所谓的大语言模型原生应用开发的方法。”
当一部分微调和数据能够由用户需求驱动,技术应用门槛和成本也在逐步降低,普及企业业务场景。根据创业邦预估,小微企业花10万以内即可完成API调用,低成本地快速搭建大模型应用。
软件新范式下,非大模型玩家亦有机会。
根据睿兽分析AI Agent赛道数据,11月22日,来自浙江杭州的AI交互内容平台开发商波形智能完成了种子+轮融资,他们基于自研模型,从工具端切入,开发Agents开源智能体框架,创新性地提供了通过符号式的推理图(SOP),对任务进行分解,实现了对LLM Agent的细粒度控制。
数据和技术成熟度
为Agent下一步发展重点
Agent的创新机会和“护城河”,在于垂直AI数据、专家知识、交互方式里,也在于不同技术路径中。
梳理今年Q1~Q3国产大模型发展进程,创业邦发现,4~7月是大模型集中爆发的阶段;7月,应用层产业级大模型以及企业服务大模型密集发布;8月~9月大模型发布数量有所减少,但在产品功能上出现了差异化,比如,MiniMax ABAB大模型擅长数据增强和数据压缩,云雀大模型擅长多媒体内容生成和内容理解等。这说明了大模型企业的增长战略更加务实,也预示着LLM-based Agent也将拓展应用场景到技术生态的纵深度,形成“百花齐放”的局面。
一个问题是,只有基于垂类数据和专家知识的“冷启动”,Agent企业才能更好地适应环境,提供主动、优质的服务。
AI Agent企业澜码科技CEO周健认为,“许多企业如保险代理、猎头公司和零售公司,都有大量的专家,但他们无法覆盖到所有需要帮助的人,因为一天只有24小时。但可能有100个或者1000个一线的店员、店长或更多的人员需要辅助,专家无法满足这种需求。我们希望解决这个问题。”
另一个问题是,Agent如何与我们建立信任?
虽然Agent模式被市场报以很高的期待,但这个虚拟主驾驶目前还处于“L4”阶段,技术距离真正实现仍有差距。“欧洲版 OpenAI”Mistral AI的CEO Arthur Mensch在采访中曾提到,“现有的Agents在运行过程中会出现模式崩溃,它们开始重复输出相同的内容,陷入循环。因此,我们还需要开展研究,让模型更有推理能力和适应能力,能够根据任务难度调整计算量,在一定程度上解决Agents面临的问题,这是我们正在探索的研究方向。”
技术落地应用路径仍未明确。早在2021年,北京通用人工智能研究院院长朱松纯教授曾表示,“AI要在两个层次上获得人的信任——能力的边界(AI要让人清晰地知道在什么条件下AI能做到什么样的性能,可以完成哪些任务)、感情的纽带(AI要与人保持相近的价值观,把人类的价值放在重要位置)”,并提出人机之间建立有心智理论的可解释性框架。
时过境迁,模型的泛化和可解释性对于战略性新兴产业的智能化转型发挥着越来越重要的影响,科研领域尤甚,同时,我们也看到向量数据库、合成数据、模型优化等行业曙光定将给Agent技术发展和应用带来更深刻的变革。
写在最后:
AI Agent——
无处不在、不断进化的未来
Agent并非新概念,相比技术更像是先进的管理理念,但其在控制端、感知端、行为端等方面的革新将塑造更加低门槛、个性化且功能更强大的应用。尤其当生成式AI来到商业化进程加速的第二阶段,要求大模型厂商聚焦提供安全、低成本、高效、持续有价值的服务,Agent成为推动大模型商业化的解决方案之一,改变了软件研发和使用方式。
但是,想要打造无处不在的Agent应用产品,归根结底还是需要LLM大脑训练方式、系统能力的进步,因此试炼和试错是必经之路。海外已经出现很多AI Agent框架与产品,将创意付诸实践。比如在8月完成1500万美金融资的Voiceflow,现在已是最受开发者欢迎的AI Agent构建平台之一,有超过13万用户在这里高效协同构建自己的AI Agent。
大洋彼岸Agent创业生态的盛况也让一众国内AIGC创业领头羊企业闻风而动,国内某AIGC业务高管向创业邦透露了Agent更多的可能性,“Agent能去分享给别人,甚至能够共同编辑和优化,解决更多的通用问题,有可能是下一步大家奔着的解决方案。”
值得关注的是,除了Agent,行业也在探索更多的方式来提升模型的能力和效用。马斯克推出的重磅社交产品grok,其底层模型LLM Grok-1根据网络数据和人类助手的反馈进行训练;谷歌研发的聊天机器人Bard可以利用互联网上的新信息为用户“提供新鲜、高质量的回复”,也弥补了大模型发展过程中的缺陷(注:大模型擅长内容生成和推理,但不擅长提供实时本地信息)。
这也启发我们,尽管传统的互联网思维不足以覆盖AIGC的发展路径,需要更丰富的大模型的原生应用,但同样地,互联等其他技术的融合对AI发展(尤其是数据层面)的催化作用也需要引起足够重视。
总而言之,AI Agent是大模型、AIGC技术进化的重要方向和大杀器,但并非终点和唯一选项,也不可独立运作。除了Agent模式,创业邦发现,第三季度,国内大模型已在开源、多模态等多个领域发生融资事件(如下图),共同提升LLM-based Agent的综合能力。殊途同归,这些重要趋势将带领AIGC产业往应用落地更深处走去。
潮水涌动,AI Agent已是海内外创投圈正在和下一步的开垦地。9月7日,以创造实用的AI代理为目标的初创公司Imbue完成2亿美元B轮融资,一跃成为估值10亿美元以上的硅谷独角兽;国内大模型创业头部企业智谱AI宣布今年已融资25亿,在最新的ChatGLM3技术迭代中,强调全新的Agent智能体能力在规划和执行方面,相比上一代提升1000%。
Agent(智能体)是什么?在Open AI应用研究主管Lilian Weng年中撰写的万字长文中,AI Agent = LLM(大型语言模型)+记忆+规划+工具,加上各种模块,目的是完成特定任务,并非常看好Agent的前景。酝酿多时,11月Open AI Devday上,All Tools整合使得GPT-4具备Agent能力,再一次引爆网络。
创业邦《2023年Q3AIGC产业观察》的案例中显示,国内AIGC行业的一些业内人士对其非常看好,期待较高,他们认为,AI Agent是整个大模型技术体系里面非常重要、关键的一环,我们离Agent模式下AI完成绝大部分工作的阶段越来越近了。
AI Agent
爆款应用的伏笔?
想象在一个虚拟城镇中,有学校、医院、家庭,25个AI智能体不仅能在这里上班、闲聊、交友,甚至还能谈恋爱,每个Agent都有自己的个性和背景故事。
这是西部世界小镇,由斯坦福和谷歌研究人员开发的AI Agent实验,目前已在Apache-2.0协议下正式开源。与游戏不同,其核心技术是利用GPT来生成AI Agent的行为和语言。在这个小小的智能体社会中,multi-agent(多智能体系统)会为不同的Agent赋予不同的角色定位,通过Agent之间的协同合作来完成复杂的任务,并演绎出整个文明的演化进程。
脱胎于游戏化的实验,AI Agent的应用价值到底有多大?在哪些场景适用呢?
AI Agent的虚拟陪伴让人们在闲暇时光中获得更多的乐趣,泛娱乐市场受到诸多投资者的关注。估值突破40亿美元的AI语言模型会话API研发商Inflection AI,今年5月推出主打情感陪伴的个人AI——Pi。区别于ChatGPT,Pi富有同情心、谦虚好奇、幽默创新、高情商,可以根据用户的独特兴趣和需求提供无限的知识与陪伴。无独有偶,国内大模型独角兽Minimax也开发出AI社交产品Glow,能为用户提供创建虚拟人物“智能体”,满足用户的角色扮演、情感陪伴、树洞倾诉等情绪价值类需求。
Agent延伸到终端硬件,推动了应用场景的多元化发展。例如,智元机器人搭载百亿级参数的大模型WorkGPT赋能人形机器人“远征A1”,未来计划在厨师、家庭清洁、护理等C端场景落地。在终端加持下,大模型与人类的交互方式也有望从互联迈向下一站——具身。
比起娱乐、生活,Agent在工作场景作为生产力引擎显然更令人兴奋。今年8月,人工智能初创公司HyperWrite推出AI Agent应用Personal Assistant,希望成为人类的“数字助手”,帮助用户整理邮箱并起草回复、帮助用户订机票、订外卖、整理领英上适合的简历等。目前该工具还处于试用阶段,主要适用于网页浏览器场景。
“原有的软件的开发方式和
生态的应用方式正在发生改变”
从Copilot副驾驶到Agent主驾驶,人人皆可定制Agent,使得原有的软件研发范式发生改变,由用户定义个人产品,对软件生态产生颠覆式影响。
“早期建立的平台,用户的功能、漏洞靠软件开发者定义和实现,当大语言模型产生之后,大家更期待在这样的模式背后,大模型真正赋予软件生态智慧,更自动、更智能地打通APP背后的数据、逻辑、流程。”一位AIGC资深创业者向创业邦解释道。
他同时也聊到公司在大模型原生应用做过这样类似的探索,“如果你想规划3天的旅游行程,需要搜攻略、订票、配合时间、安排行程,比较价格、方案,但是现在只需要大语言模型作为核心的AI助手,告诉它我有3天假期,去什么地方,同行的里面有老人、孩子,它就可以自动在网上获取信息,甚至帮你订机票、订车、订酒店。这也是大家所想象的未来的所谓的大语言模型原生应用开发的方法。”
当一部分微调和数据能够由用户需求驱动,技术应用门槛和成本也在逐步降低,普及企业业务场景。根据创业邦预估,小微企业花10万以内即可完成API调用,低成本地快速搭建大模型应用。
软件新范式下,非大模型玩家亦有机会。
根据睿兽分析AI Agent赛道数据,11月22日,来自浙江杭州的AI交互内容平台开发商波形智能完成了种子+轮融资,他们基于自研模型,从工具端切入,开发Agents开源智能体框架,创新性地提供了通过符号式的推理图(SOP),对任务进行分解,实现了对LLM Agent的细粒度控制。
数据和技术成熟度
为Agent下一步发展重点
Agent的创新机会和“护城河”,在于垂直AI数据、专家知识、交互方式里,也在于不同技术路径中。
梳理今年Q1~Q3国产大模型发展进程,创业邦发现,4~7月是大模型集中爆发的阶段;7月,应用层产业级大模型以及企业服务大模型密集发布;8月~9月大模型发布数量有所减少,但在产品功能上出现了差异化,比如,MiniMax ABAB大模型擅长数据增强和数据压缩,云雀大模型擅长多媒体内容生成和内容理解等。这说明了大模型企业的增长战略更加务实,也预示着LLM-based Agent也将拓展应用场景到技术生态的纵深度,形成“百花齐放”的局面。
一个问题是,只有基于垂类数据和专家知识的“冷启动”,Agent企业才能更好地适应环境,提供主动、优质的服务。
AI Agent企业澜码科技CEO周健认为,“许多企业如保险代理、猎头公司和零售公司,都有大量的专家,但他们无法覆盖到所有需要帮助的人,因为一天只有24小时。但可能有100个或者1000个一线的店员、店长或更多的人员需要辅助,专家无法满足这种需求。我们希望解决这个问题。”
另一个问题是,Agent如何与我们建立信任?
虽然Agent模式被市场报以很高的期待,但这个虚拟主驾驶目前还处于“L4”阶段,技术距离真正实现仍有差距。“欧洲版 OpenAI”Mistral AI的CEO Arthur Mensch在采访中曾提到,“现有的Agents在运行过程中会出现模式崩溃,它们开始重复输出相同的内容,陷入循环。因此,我们还需要开展研究,让模型更有推理能力和适应能力,能够根据任务难度调整计算量,在一定程度上解决Agents面临的问题,这是我们正在探索的研究方向。”
技术落地应用路径仍未明确。早在2021年,北京通用人工智能研究院院长朱松纯教授曾表示,“AI要在两个层次上获得人的信任——能力的边界(AI要让人清晰地知道在什么条件下AI能做到什么样的性能,可以完成哪些任务)、感情的纽带(AI要与人保持相近的价值观,把人类的价值放在重要位置)”,并提出人机之间建立有心智理论的可解释性框架。
时过境迁,模型的泛化和可解释性对于战略性新兴产业的智能化转型发挥着越来越重要的影响,科研领域尤甚,同时,我们也看到向量数据库、合成数据、模型优化等行业曙光定将给Agent技术发展和应用带来更深刻的变革。
写在最后:
AI Agent——
无处不在、不断进化的未来
Agent并非新概念,相比技术更像是先进的管理理念,但其在控制端、感知端、行为端等方面的革新将塑造更加低门槛、个性化且功能更强大的应用。尤其当生成式AI来到商业化进程加速的第二阶段,要求大模型厂商聚焦提供安全、低成本、高效、持续有价值的服务,Agent成为推动大模型商业化的解决方案之一,改变了软件研发和使用方式。
但是,想要打造无处不在的Agent应用产品,归根结底还是需要LLM大脑训练方式、系统能力的进步,因此试炼和试错是必经之路。海外已经出现很多AI Agent框架与产品,将创意付诸实践。比如在8月完成1500万美金融资的Voiceflow,现在已是最受开发者欢迎的AI Agent构建平台之一,有超过13万用户在这里高效协同构建自己的AI Agent。
大洋彼岸Agent创业生态的盛况也让一众国内AIGC创业领头羊企业闻风而动,国内某AIGC业务高管向创业邦透露了Agent更多的可能性,“Agent能去分享给别人,甚至能够共同编辑和优化,解决更多的通用问题,有可能是下一步大家奔着的解决方案。”
值得关注的是,除了Agent,行业也在探索更多的方式来提升模型的能力和效用。马斯克推出的重磅社交产品grok,其底层模型LLM Grok-1根据网络数据和人类助手的反馈进行训练;谷歌研发的聊天机器人Bard可以利用互联网上的新信息为用户“提供新鲜、高质量的回复”,也弥补了大模型发展过程中的缺陷(注:大模型擅长内容生成和推理,但不擅长提供实时本地信息)。
这也启发我们,尽管传统的互联网思维不足以覆盖AIGC的发展路径,需要更丰富的大模型的原生应用,但同样地,互联等其他技术的融合对AI发展(尤其是数据层面)的催化作用也需要引起足够重视。
总而言之,AI Agent是大模型、AIGC技术进化的重要方向和大杀器,但并非终点和唯一选项,也不可独立运作。除了Agent模式,创业邦发现,第三季度,国内大模型已在开源、多模态等多个领域发生融资事件(如下图),共同提升LLM-based Agent的综合能力。殊途同归,这些重要趋势将带领AIGC产业往应用落地更深处走去。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。