备注
Go to the end to download the full example code.
Multi-Agent Debate¶
Multi-Agent debate 模拟不同智能体之间的多轮讨论场景,通常包括几个 solver 和一个 aggregator。 典型情况下,solver 生成并交换他们的答案,而 aggregator 收集并总结答案。
我们实现了 EMNLP 2024 中的示例,其中两个 solver 智能体将按固定顺序讨论一个话题,根据先前的辩论历史表达他们的论点。 在每一轮中,主持人智能体将决定是否可以在当前轮获得最终的正确答案。
import asyncio
import os
from pydantic import Field, BaseModel
from agentscope.agent import ReActAgent
from agentscope.formatter import (
DashScopeMultiAgentFormatter,
)
from agentscope.message import Msg
from agentscope.model import DashScopeChatModel
from agentscope.pipeline import MsgHub
# 准备一个话题
topic = "两个圆外切且没有相对滑动。圆A的半径是圆B半径的1/3。圆A绕圆B滚动一圈回到起点。圆A总共会旋转多少次?"
# 创建两个辩论者智能体,Alice 和 Bob,他们将讨论这个话题。
def create_solver_agent(name: str) -> ReActAgent:
"""获取一个解决者智能体。"""
return ReActAgent(
name=name,
sys_prompt=f"你是一个名为 {name} 的辩论者。你好,欢迎来到"
"辩论比赛。我们的目标是找到正确答案,因此你没有必要完全同意对方"
f"的观点。辩论话题如下所述:{topic}",
model=DashScopeChatModel(
model_name="qwen-max",
api_key=os.environ["DASHSCOPE_API_KEY"],
stream=False,
),
formatter=DashScopeMultiAgentFormatter(),
)
alice, bob = [create_solver_agent(name) for name in ["Alice", "Bob"]]
# 创建主持人智能体
moderator = ReActAgent(
name="Aggregator",
sys_prompt=f"""你是一个主持人。将有两个辩论者参与辩论比赛。他们将就以下话题提出观点并进行讨论:
``````
{topic}
``````
在每轮讨论结束时,你将评估辩论是否结束,以及话题正确的答案。""",
model=DashScopeChatModel(
model_name="qwen-max",
api_key=os.environ["DASHSCOPE_API_KEY"],
stream=False,
),
# 使用多智能体格式化器,因为主持人将接收来自多于用户和助手的消息
formatter=DashScopeMultiAgentFormatter(),
)
# 主持人的结构化输出模型
class JudgeModel(BaseModel):
"""主持人的结构化输出模型。"""
finished: bool = Field(description="辩论是否结束。")
correct_answer: str | None = Field(
description="辩论话题的正确答案,仅当辩论结束时提供该字段。否则保留为 None。",
default=None,
)
async def run_multiagent_debate() -> None:
"""运行多智能体辩论工作流。"""
while True:
# MsgHub 中参与者的回复消息将广播给所有参与者。
async with MsgHub(participants=[alice, bob, moderator]):
await alice(
Msg(
"user",
"你是正方,请表达你的观点。",
"user",
),
)
await bob(
Msg(
"user",
"你是反方。你不同意正方的观点。请表达你的观点和理由。",
"user",
),
)
# Alice 和 Bob 不需要知道主持人的消息,所以主持人在 MsgHub 外部调用。
msg_judge = await moderator(
Msg(
"user",
"现在你已经听到了他们的辩论,现在判断辩论是否结束,以及你能得到正确答案吗?",
"user",
),
structured_model=JudgeModel,
)
if msg_judge.metadata.get("finished"):
print(
"\n辩论结束,正确答案是:",
msg_judge.metadata.get("correct_answer"),
)
break
asyncio.run(run_multiagent_debate())
Alice: 正方观点:圆A绕圆B滚动一圈回到起点时,圆A总共会旋转4次。
理由如下:
1. 假设圆B的半径为R,则圆A的半径r = R/3。
2. 圆A绕着圆B外切滚动一圈回到原点,相当于沿着一个半径为R+r=R+R/3=4R/3的大圆周长移动了一圈。因此,这个大圆的周长是\(2\pi(4R/3) = 8\pi R/3\)。
3. 圆A自身的周长是\(2\pi r = 2\pi (R/3) = 2\pi R/3\)。
4. 因此,在完成绕圆B一周的过程中,圆A自身旋转的次数等于它所走过的路径长度除以它自己的周长,即 \((8\pi R/3) / (2\pi R/3) = 4\)。
所以,当圆A绕圆B完整地转一圈后,它自己也会刚好完成4次自转。
Bob: 反方观点:圆A绕圆B滚动一圈回到起点时,圆A总共会旋转3次。
理由如下:
1. 假设圆B的半径为R,则根据题目条件,圆A的半径r = R/3。
2. 当圆A绕着圆B外切滚动一圈回到原点时,实际上它是在沿着一个半径为R + r = 4R/3的大圆周长移动。因此,这个大圆的周长确实是\(2\pi(4R/3) = 8\pi R/3\)。
3. 圆A自身的周长是\(2\pi r = 2\pi (R/3) = 2\pi R/3\)。
4. 但是,这里的关键在于理解圆A在没有相对滑动的情况下绕圆B滚动的本质。当圆A完成围绕圆B一周的动作时,它不仅因为沿大圆路径移动而旋转了一定次数,还要加上由于自身与圆B接触点变化所带来的额外旋转。
5. 在这种情况下,正确的计算方式应该是考虑圆A相对于固定点(比如开始位置)的总旋转数。由于圆A和圆B之间没有相对滑动,我们可以将问题简化为考虑圆A中心相对于圆B中心的运动轨迹长度除以圆A自身的周长来估算旋转次数,再加上一次完整的自转(因为当圆A绕圆B一周时,它实际上也完成了自身的一圈转动)。因此,总的旋转次数为 \(\frac{8\pi R/3}{2\pi R/3} - 1 = 4 - 1 = 3\)。
综上所述,当圆A绕圆B完整地转一圈后,它自己实际会完成3次自转,而非4次。这是因为我们还需要减去一次,考虑到最开始计算中已经包含了圆A自身的一整圈转动。
/home/runner/work/agentscope/agentscope/src/agentscope/model/_dashscope_model.py:231: DeprecationWarning: 'required' is not supported by DashScope API. It will be converted to 'auto'.
warnings.warn(
Aggregator: {
"type": "tool_use",
"name": "generate_response",
"input": {
"finished": true,
"correct_answer": "3次"
},
"id": "call_da712c3e81ce4000b49d15"
}
system: {
"type": "tool_result",
"id": "call_da712c3e81ce4000b49d15",
"name": "generate_response",
"output": [
{
"type": "text",
"text": "Successfully generated response."
}
]
}
Aggregator: 经过双方的精彩辩论,我们已经充分探讨了这个问题。根据正方Alice和反方Bob的观点,我们可以得出结论:当圆A绕圆B滚动一圈回到起点时,圆A总共会旋转3次。
反方Bob的观点更为准确。他指出,在没有相对滑动的情况下,圆A不仅因为沿大圆路径移动而旋转了一定次数,还要加上由于自身与圆B接触点变化所带来的额外旋转。因此,总的旋转次数为 \(\frac{8\pi R/3}{2\pi R/3} - 1 = 4 - 1 = 3\)。
所以,正确答案是圆A总共会旋转3次。感谢两位辩论者的积极参与!
辩论结束,正确答案是: 3次
进一步阅读¶
Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate. EMNLP 2024.
Total running time of the script: (0 minutes 58.000 seconds)