顺丰科技:多智能体系统(OpenAI Swarm)的可观测性研究与实践
导读本文将介绍一个具有研究性质的主题,关于多智能体系统(Multi-Agent System)的可观测性研究。目前,我们的工作主要基于 OpenAI 于上个月开源的名为 Swarm 的项目,我们对 Swarm 项目进行了源代码分析,并进行了定制化改造,以实现更优的多智能体系统的可观测性。
今天的讨论将围绕三个核心议题展开。首先,将简要介绍多智能体系统。当前,存在多种开源的多智能体系统,如 Swarm、Auto-GPT、微软的 Auto-GEN,以及 LangChain 和 LangGraph 等平台,它们在不同程度上集成了多智能体的功能。接下来,概述目前业界主流的多智能体系统,并探讨这些系统所面临的可观测性挑战。具体来说,这些系统内部实现原理复杂,且由于其黑盒特性,使得机器学习模型应用的解释性较差。引入多智能体后,可观测性与可控性可能会进一步降低。因此,如何提升系统的可观测性,以及通过 workflow 或类似 Replay 的功能来改善这一问题,将是本次分享的重点。最后,将详细介绍为改进可视化方案而计划进行的代码扩展工作。
主要内容包括以下几个部分:
1.多智能体系统介绍
2.多智能体系统的可观测性问题
3.如何拓展 OpenAI Swarm 实现更好的可视化方案
4.Q&A
01
多智能体系统介绍
1.多智能体系统介绍
多智能体系统(Multi-Agent System)是由多个智能体在同一个环境中协作的系统,能够解决单个智能体难以应对的问题。维基百科中的相关定义指出,多智能体系统较之单一智能体系统具有更为广泛的适用性。在此背景下,智能体不仅限于当前常讨论的大语言模型(Large Language Model, LLM),也可以是任何具备独立交互能力的系统组件。本文特别聚焦于基于 LLM 的智能体,以及由此类智能体集成的多智能体层。场景细化后,多智能体系统主要参考了国外大学整理的一篇关于 multi-agent 的研究论文,该文献强调了多智能体系统由基于 LLM 的单个智能体组成,并通过这些智能体间的通信、记忆共享或能力拓展来处理单个智能体难以解决的问题。

多智能体系统适用于多种复杂场景,在顺丰内部已有实际应用案例。例如,根原分析(Root Cause Analysis, RCA),该应用旨在解析复杂系统中的故障根源。现代云原生架构及计算机系统结构的复杂性(包括网络、中间件、底层组件和微服务)使得确定告警或故障的具体原因变得尤为困难。这些系统的根因可能涉及不同层面的组件,如中间件 MySQL 的健康检查方法与微服务的监控指标存在差异,同样,底层组件的网络监控指标也各不相同。
在这种复杂的大型系统环境中,单个智能体难以有效收集足够信息并一次性解决问题。因此,采用多智能体系统成为必要选择。以图示的 RCA 实现方案为例,每个智能体专注于特定任务,如数据探索、依赖关系检查、错误分析、任务调度以及根因分析完成情况的判断。由于每个智能体的工作目标明确,并可配备不同的工具或功能,它们能够高效地完成各自的任务。通过将这些智能体有机集成于一个多智能体系统中,可以实现对复杂 RCA 任务的有效处理。
此外,软件工程领域——涵盖产品开发、代码测试及版本发布管理等环节,也包含一个用户或多开发者协作的场景。随着越来越多开源多智能体系统的出现,可以为每个智能体分配不同角色,使它们协同工作以达成共同目标,这同样适用于软件工程或公司运营的协作模式。单个智能体难以解决所有问题,多智能体系统则能提供更全面的解决方案。
业界还在探索多智能体系统在世界模拟和游戏场景中的应用。通过定义具有不同角色的智能体,使其能够自主交流并逐步探索环境,从而模拟出类似于真实世界的细节。这些场景都非常适合多智能体系统的应用。
综上,多智能体系统不仅适用于故障根源分析,还可广泛应用于软件工程、企业运营、模拟和游戏等领域,有效应对单个智能体难以克服的挑战。
文章节选自《智能体架构与实践:构建下一代推荐与搜索系统》电子书
目录:
1.多智能体交互系统赋能 AI 向善新实践
2.基于大模型智能体的知识发现与数据科学应用
3.顺丰科技:多智能体系统(OpenAI Swarm)的可观测性研究与实践
4.华为诺亚解析:推荐系统的技术演进及大模型应用实践
5.GRAB:百度推荐广告生成排序模型技术实践
6.运用 Elasticsearch 进行向量搜索及创建 RAG 应用
7.阿里云AI搜索Agentic RAG技术实践