首页 理论教育 联合目标和规划

联合目标和规划

时间:2022-02-11 理论教育 版权反馈
【摘要】:参加一个网球双打团队的两个智能体有赢得比赛的联合目标,这带来各种子目标。多智能体规划问题的一个解是由每个智能体的行动组成的联合规划。对于智能体不幸的是,还有另一个和第一个规划同样满足目标的规划:如果A选择规划2,B选择规划1,那么没有人会把球打回去。智能体需要一个协调的机制来达到相同的联合规划;此外,某个特定的联合规划将被执行,在智能体中这应该是常识。

12.7.1 合作:联合目标和规划

参加一个网球双打团队的两个智能体有赢得比赛的联合目标,这带来各种子目标。让我们假设在游戏中的某一点,它们有联合目标,将击给它们的球打回去并确保它们中至少有一个防守网前。我们可以把这个观念表示为一个多智能体规划问题,如图12.23所示。


图12.23 网球双打问题。两个智能体正在一起打球,而且可以是下面4个位置之一:[Left,Baseline],[Right,Baseline], [Left, Net],以及[Right, Net]。如果一个比赛者正好在合适的位置,就能够把球打回去

这种符号表示引入了两个新特征。第一,Agent(A, B)声明有两个智能体A和B,它们参与规划。(对于这个问题,对手不是被考虑的智能体。)第二,每个行动明确地将智能体作为一个参数,因为我们需要记录是哪个智能体完成的。

多智能体规划问题的一个解是由每个智能体的行动组成的联合规划。如果当每个智能体都执行它分配到的行动时目标能够实现,那么这个联合规划是一个解。下面的规划是网球问题的一个解:

PLAN 1:

A: [Go(A, [Right, Baseline]), Hit(A, Ball)]

B: [NoOp(B), NoOp(B)]

如果两个智能体有相同的知识库,并且如果这是唯一的解,那么每件事都很好;智能体能够各自决定解,然后联合执行它。对于智能体不幸的是(我们很快会看到为什么是不幸的),还有另一个和第一个规划同样满足目标的规划:

PLAN 2:

A: [Go(A, [Left, Net]), NoOp(A)]

B: [Go(B, [Right, Baseline]), Hit(B, Ball)]

如果A选择规划2,B选择规划1,那么没有人会把球打回去。相反,如果A选择1,B选择2,那么它们可能互相碰撞,仍然没有人把球打回去,网前也会保持无保护状态。因此,存在正确的联合规划并不意味着目标会实现。智能体需要一个协调的机制来达到相同的联合规划;此外,某个特定的联合规划将被执行,在智能体中这应该是常识(参见第十章)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈