H

Hierarchical Gifting

分层的同伴奖励机制,它允许每个智能体基于历史交互数据动态地将部分个体奖励赠予其他智能体,并引导智能体走向更协调的行为,同时确保智能体保持自私和分散的状态。