如何理解人的决策和交互,并使计算机程序能够像人一样去决策和交互,是人工智能时代的重要问题。本课程内容处于博弈论、理论计算机和人工智能的交叉领域,所探讨的就是在由人或智能体所组成的系统中,个体是如何决策的;以及这样的系统该如何设计。
本课程主要包含两大部分。第一部分是机制设计理论和算法,可以理解为“反向的”博弈,即如何设计多智能体系统的规则和近似算法,使其走向复杂的、多目标下的优化结果,同时保证计算的可行性。第二部分是“正向的”博弈分析和算法,这部分除了经典博弈论的结论,还详述了诸如无秩序代价、均衡近似与学习、均衡计算复杂度的分析等理论。算法博弈论的一正一反两部分同根同种,但又在不同方向上枝繁叶茂,本课程均给出了较为系统化的阐述。
本课程重点知识包括:1. 图上的自利路由问题及无秩序代价理论;2. Nash均衡的定义及存在性证明,多层式的均衡定义,纯策略纳什均衡,势博弈;3. Best-Case强Nash均衡;4. 最优反馈,势博弈中的最优反馈,自利路由问题中的近似纯策略纳什均衡;5. 机制设计理论基础,单物品拍卖,密封价格拍卖,最高价拍卖,二价拍卖及占优策略;6. Myerson引理证明,简单环境下的拍卖,支付规则和分配规则, Myerson引理的一般形式,支付函数的使用方法;7. 算法机制设计与显示原理;8. 最大化收益拍卖,最优的占优策略激励相容机制,谷歌广告竞价中的保留价格拍卖实例,等等。其中,难点包括无秩序代价理论、纳什均衡的计算复杂性分析、Myerson引理、最大化收益拍卖算法设计。
本课程的特点与优势是:1. 有深厚的数学理论尤其是最优化理论的知识。2. 有较强的算法设计相关内容和算法复杂度分析的内容。3. 有诸多当前最受关注的应用场景。 如搜索引擎广告算法、共享经济系统设计、无人车的规划问题、Google AlphaGo、社会资源分配问题都和算法博弈论有本质的联系。此课承接算法分析与设计、最优化原理。课程所涉及科研属于前沿困难问题,且和多个学科能够结合交织,非常有助于研究生和博士生产生独立的科研思想。课程理论有较好的深度,又能将学生引入诸多现实应用的实例。