无需登录 数据私有 本地保存

囚徒困境策略对战 - 重复博弈模拟

14
0
0
0

囚徒困境策略对战

重复博弈模拟 · 经典策略对决 · 探索合作与背叛的博弈论奥秘

以牙还牙 (Tit for Tat)
首轮合作,之后模仿对方上一轮行为。简单而强大。
VS
总是背叛 (Always Defect)
无论对方做什么,始终选择背叛。冷酷无情。
0%
收益矩阵参考(经典值)
双方合作
🤝🤝 各得 3
A合作 B背叛
🤝🗡️ A:0 B:5
A背叛 B合作
🗡️🤝 A:5 B:0
双方背叛
🗡️🗡️ 各得 1

诱惑T=5 · 奖励R=3 · 惩罚P=1 · 受骗S=0  |  T > R > P > S

🎮

选择策略,点击"开始模拟对决"查看结果

支持最多300回合的重复博弈模拟

常见问题与知识点
囚徒困境是博弈论中最经典的模型之一。两名嫌疑人被分开审讯:如果双方都保持沉默(合作),各判1年;如果双方都招供(背叛),各判3年;如果一人沉默另一人招供,沉默者判5年,招供者无罪释放。理性个体倾向于背叛,但双方合作才是整体最优解——这正是困境所在。
单次囚徒困境中,背叛是严格优势策略。但在重复博弈中,玩家会考虑未来收益,合作可能成为理性选择。罗伯特·阿克塞尔罗德在1980年代的著名锦标赛证明:在重复博弈中,基于合作的策略(如以牙还牙)往往表现最优,因为合作能带来长期互利。
阿克塞尔罗德总结以牙还牙成功的四大特性:①善良——从不首先背叛;②报复性——对背叛立即回击;③宽容——对方恢复合作后立即原谅;④清晰——策略简单可预测,让对方容易配合。这四个特性使其在各类对手面前表现稳健,最终赢得锦标赛。
在现实世界中,行动可能被误解或执行失误。加入噪声后,纯以牙还牙容易陷入"冤冤相报"的恶性循环——一次无意的背叛会引发连锁报复。慷慨以牙还牙(Generous TFT)通过偶尔原谅对方背叛来打破这种循环,在噪声环境中表现更优。巴甫洛夫策略也能较好地处理噪声。
囚徒困境广泛存在于现实世界:企业间的价格战(合作维持高价 vs 背叛降价抢市场)、军备竞赛(裁军合作 vs 扩军背叛)、环境保护(减排合作 vs 过度排放)、团队合作中的搭便车行为、甚至人际关系的维护。理解重复博弈有助于设计促进合作的机制。
选择两种策略(策略A和策略B),设置回合数(1-300),可选调整噪声率(模拟执行失误),点击"开始模拟对决"即可查看详细结果。您也可以使用预设对决快速体验经典策略组合。结果包括总得分对比、合作率、逐轮详情表格和统计摘要。