顺丰科技：多智能体系统（OpenAI Swarm）的可观测性研究与实践

查股网 2025-11-13 13:01 顺丰控股(002352)个股分析

导读本文将介绍一个具有研究性质的主题，关于多智能体系统（Multi-Agent System）的可观测性研究。目前，我们的工作主要基于 OpenAI 于上个月开源的名为 Swarm 的项目，我们对 Swarm 项目进行了源代码分析，并进行了定制化改造，以实现更优的多智能体系统的可观测性。

今天的讨论将围绕三个核心议题展开。首先，将简要介绍多智能体系统。当前，存在多种开源的多智能体系统，如 Swarm、Auto-GPT、微软的 Auto-GEN，以及 LangChain 和 LangGraph 等平台，它们在不同程度上集成了多智能体的功能。接下来，概述目前业界主流的多智能体系统，并探讨这些系统所面临的可观测性挑战。具体来说，这些系统内部实现原理复杂，且由于其黑盒特性，使得机器学习模型应用的解释性较差。引入多智能体后，可观测性与可控性可能会进一步降低。因此，如何提升系统的可观测性，以及通过 workflow 或类似 Replay 的功能来改善这一问题，将是本次分享的重点。最后，将详细介绍为改进可视化方案而计划进行的代码扩展工作。

主要内容包括以下几个部分：

1.多智能体系统介绍

2.多智能体系统的可观测性问题

3.如何拓展 OpenAI Swarm 实现更好的可视化方案

4.Q&A

多智能体系统介绍

1.多智能体系统介绍

多智能体系统（Multi-Agent System）是由多个智能体在同一个环境中协作的系统，能够解决单个智能体难以应对的问题。维基百科中的相关定义指出，多智能体系统较之单一智能体系统具有更为广泛的适用性。在此背景下，智能体不仅限于当前常讨论的大语言模型（Large Language Model, LLM），也可以是任何具备独立交互能力的系统组件。本文特别聚焦于基于 LLM 的智能体，以及由此类智能体集成的多智能体层。场景细化后，多智能体系统主要参考了国外大学整理的一篇关于 multi-agent 的研究论文，该文献强调了多智能体系统由基于 LLM 的单个智能体组成，并通过这些智能体间的通信、记忆共享或能力拓展来处理单个智能体难以解决的问题。

多智能体系统适用于多种复杂场景，在顺丰内部已有实际应用案例。例如，根原分析（Root Cause Analysis, RCA），该应用旨在解析复杂系统中的故障根源。现代云原生架构及计算机系统结构的复杂性（包括网络、中间件、底层组件和微服务）使得确定告警或故障的具体原因变得尤为困难。这些系统的根因可能涉及不同层面的组件，如中间件 MySQL 的健康检查方法与微服务的监控指标存在差异，同样，底层组件的网络监控指标也各不相同。

在这种复杂的大型系统环境中，单个智能体难以有效收集足够信息并一次性解决问题。因此，采用多智能体系统成为必要选择。以图示的 RCA 实现方案为例，每个智能体专注于特定任务，如数据探索、依赖关系检查、错误分析、任务调度以及根因分析完成情况的判断。由于每个智能体的工作目标明确，并可配备不同的工具或功能，它们能够高效地完成各自的任务。通过将这些智能体有机集成于一个多智能体系统中，可以实现对复杂 RCA 任务的有效处理。

此外，软件工程领域——涵盖产品开发、代码测试及版本发布管理等环节，也包含一个用户或多开发者协作的场景。随着越来越多开源多智能体系统的出现，可以为每个智能体分配不同角色，使它们协同工作以达成共同目标，这同样适用于软件工程或公司运营的协作模式。单个智能体难以解决所有问题，多智能体系统则能提供更全面的解决方案。

业界还在探索多智能体系统在世界模拟和游戏场景中的应用。通过定义具有不同角色的智能体，使其能够自主交流并逐步探索环境，从而模拟出类似于真实世界的细节。这些场景都非常适合多智能体系统的应用。

综上，多智能体系统不仅适用于故障根源分析，还可广泛应用于软件工程、企业运营、模拟和游戏等领域，有效应对单个智能体难以克服的挑战。

文章节选自《智能体架构与实践：构建下一代推荐与搜索系统》电子书

1.多智能体交互系统赋能 AI 向善新实践

2.基于大模型智能体的知识发现与数据科学应用

3.顺丰科技：多智能体系统（OpenAI Swarm）的可观测性研究与实践

4.华为诺亚解析：推荐系统的技术演进及大模型应用实践

5.GRAB：百度推荐广告生成排序模型技术实践

6.运用 Elasticsearch 进行向量搜索及创建 RAG 应用

7.阿里云AI搜索Agentic RAG技术实践