联合目标和规划

时间：2023-02-11 理论教育版权反馈

【摘要】：参加一个网球双打团队的两个智能体有赢得比赛的联合目标，这带来各种子目标。多智能体规划问题的一个解是由每个智能体的行动组成的联合规划。对于智能体不幸的是，还有另一个和第一个规划同样满足目标的规划：如果A选择规划2，B选择规划1，那么没有人会把球打回去。智能体需要一个协调的机制来达到相同的联合规划；此外，某个特定的联合规划将被执行，在智能体中这应该是常识。

12.7.1 合作：联合目标和规划

参加一个网球双打团队的两个智能体有赢得比赛的联合目标，这带来各种子目标。让我们假设在游戏中的某一点，它们有联合目标，将击给它们的球打回去并确保它们中至少有一个防守网前。我们可以把这个观念表示为一个多智能体规划问题，如图12.23所示。

图12.23 网球双打问题。两个智能体正在一起打球，而且可以是下面4个位置之一：[Left,Baseline]，[Right,Baseline]， [Left, Net]，以及[Right, Net]。如果一个比赛者正好在合适的位置，就能够把球打回去

这种符号表示引入了两个新特征。第一，Agent(A, B)声明有两个智能体A和B，它们参与规划。（对于这个问题，对手不是被考虑的智能体。）第二，每个行动明确地将智能体作为一个参数，因为我们需要记录是哪个智能体完成的。

多智能体规划问题的一个解是由每个智能体的行动组成的联合规划。如果当每个智能体都执行它分配到的行动时目标能够实现，那么这个联合规划是一个解。下面的规划是网球问题的一个解：

PLAN 1:

A: [Go(A, [Right, Baseline]), Hit(A, Ball)]

B: [NoOp(B), NoOp(B)]

如果两个智能体有相同的知识库，并且如果这是唯一的解，那么每件事都很好；智能体能够各自决定解，然后联合执行它。对于智能体不幸的是（我们很快会看到为什么是不幸的），还有另一个和第一个规划同样满足目标的规划：

PLAN 2:

A: [Go(A, [Left, Net]), NoOp(A)]

B: [Go(B, [Right, Baseline]), Hit(B, Ball)]

如果A选择规划2，B选择规划1，那么没有人会把球打回去。相反，如果A选择1，B选择2，那么它们可能互相碰撞，仍然没有人把球打回去，网前也会保持无保护状态。因此，存在正确的联合规划并不意味着目标会实现。智能体需要一个协调的机制来达到相同的联合规划；此外，某个特定的联合规划将被执行，在智能体中这应该是常识（参见第十章）。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈