多智能体系统及应用(卷二） pdf epub mobi txt 电子书下载 2026

Name: 多智能体系统及应用(卷二） pdf epub mobi txt 电子书 2026
SKU: 12276789
Rating: 4 (10 reviews)

简体网页||繁体网页

☆☆☆☆☆

王崇骏，史忠植，常亮，王文剑著

图书标签:

多智能体系统
智能体
分布式人工智能
博弈论
机器学习
强化学习
协调与合作
建模与仿真
应用研究
人工智能

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到静思书屋

book.tinynews.org

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

出版社：清华大学出版社

ISBN：9787302487777

版次：1

商品编码：12276789

包装：平装

开本：16开

出版时间：2018-01-01

用纸：胶版纸

页数：207

字数：333000

正文语种：中文

具体描述

编辑推荐

本书的内容遴选自2015年、2016年度中国智能体及多智能体系统研讨会的特邀报告并收集了部分学者的*新研究进展。全书共计11个专题，每个专题讨论一个技术主题或者应用，并兼顾该主题的综述和特邀报告人自身的研究成果。书中章节涉及多智能体学习、多智能体协调协商、多智能体规划、多智能体应用框架及工具以及交叉应用基础问题研究。

内容简介

智能体与多智能体系统是人工智能领域活跃的研究分支，其涉及的基本研究问题包括合作协调、推理规划、学习、工具框架、模型等。本书的内容遴选自2015年及2016年度“中国智能体及多智能体系统”研讨会的特邀报告，同时收集了部分学者的*新研究进展。全书共计11个专题，每个专题均是智能体领域的重点及热点问题，分别涉及：多智能体学习、多智能体协调协商、多智能体规划、多智能体应用框架及工具以及交叉应用基础问题研究。
本书可供高等院校、科研院所计算机、自动化及相关专业的师生、科技工作者及相关企业的工程技术人员阅读参考。

1概述
2动机理论
3动机学习
4基于动机的强化学习
5小结
参考文献

专题2多智能体强化学习中的博弈、均衡和知识迁移胡裕靖，高阳
1绪论
2背景知识
3不共享值函数的多智能体强化学习
4基于均衡迁移的多智能体强化学习
5稀疏交互的多智能体系统中的知识迁移和博弈约简
6小结
参考文献

专题3一种基于中介agent的强化学习优化协商方法陈利红，董红斌
1引言
2基于强化学习的双边多议题优化协商模型
3基于中介agent自适应学习的协调协商
4实验设计与分析
5小结
参考文献

专题4多智能体协调技术综述郝建业
1引言
2固定对手重复博弈
3合作式群体博弈
4非合作式群体博弈
5小结
参考文献

专题5基于决策理论的多智能体规划吴锋
1引言
2分布式局部可观察马尔可夫决策过程(DEC�睵OMDP)
3DEC�睵OMDP的离线规划算法
4DEC�睵OMDP的在线规划算法
5小结
参考文献

目录多智能体系统及应用（卷二）专题6部分可观察环境中的序贯决策理论及方法研究章宗长
1引言
2部分可观察马尔可夫决策过程
3离线规划方法
4在线规划方法
5基于覆盖数的规划理论
6小结
参考文献

专题7基于Landmark的启发式搜索规划张雷，吴骏，王崇骏
1引言
2STRIPS规划问题
3STRIPS问题的启发式函数设计
4多值Landmark规划
5小结
参考文献

专题8AutoRobot：基于多主体系统的自主机器人软件框架
毛新军，杨硕，杨森
1引言
2自主机器人及其软件特点
3机器人软件技术分析
4基于多主体系统的自主机器人软件体系结构
5自主机器人软件框架AutoRobot
6案例分析
7小结
参考文献专题9计算经济学与最优机制设计问题唐平中
1计算经济学简介
2最优机制设计问题：单件商品
3最优机制设计：多件商品
4小结
参考文献

专题10基于计算博弈论的出租车服务定价研究甘家瑞，安波
1研究背景与相关工作
2博弈建模
3模型求解——紧凑表达法
4ASM算法——基于元时间表的紧凑表达
5解决任意约束下的问题
6实验
7小结
参考文献

专题11云计算中定价机制的研究秦涛
1云计算简介
2云计算中的定价模型
3市场竞争、演变与定价策略优化
4小结
参考文献

精彩书摘

专题1智能体动机学习
史忠植，马刚，李建清
中国科学院计算技术研究所智能信息处理重点实验室，北京 100190摘要动机是直接驱动智能体行为以达到一定目的的内在动力和主观原因。动机为激活、引导和维护智能体行为随着时间推移的内部过程。动机触发多智能体协同工作。本文提出了一种基于环境感知的动机学习算法，也讨论了基于动机的强化学习方法。
关键词智能体；强化学习1概述
动机（motivation）是直接驱动智能体行为以达到一定目的的内在动力和主观原因。动机与激活、引导和维护的行为一样都是随着时间变化的内部过程。在文献[1]中穆克（D.G.Mook）简单地定义动机是“行动的起因”。
1943年，马斯洛（A.H.Maslow）提出动机的需求理论[2]。马斯洛假定，人的需要，即人的动机顺序发生，从最基础的生理和安全的需要，通过一系列的爱和尊重的需要，发展为自我实现的复杂需求，而需要层次有着巨大的直观吸引力[5]。多年来，人们提出许多动机理论，每种理论都在某种程度上有着不同的关注点。这些理论尽管在许多方面十分不同，但它们都出自相似的考虑，即对行为的唤起、指向和维持，这三点是任何一种动机分析的核心。
格林（R.G.Green）等人将动机理论分为生理、行为和社会的3类[3]。梅里克(K.E.Merrick)将动机理论分为4大类，即生物学理论、认知理论、社会理论和组合动机理论[4]。生物学动机理论试图依据自然体系生物学层面的工作过程解释动机。这些理论的机理经常采用能量和运动方式解释行为，使得生物体朝向一定行为。现有的人工系统研究已经使用生物学动机理论创建软件智能体和进行自然系统的模拟。
饥饿和口渴可被看作体内驱动的运动或者标志最佳的唤醒理论，意味着吃喝或者探查是生理状态监控变化被起动。不过，除发生响应生理的变化之外，类似馈送和喝水的行为也与这种体内运动有关。由此可见，认知动力理论集中于怎样确定行为，结果怎样影响行为和影响到什么程度，根据不同的行动步骤的费用和效益，解释个人行为将来很可能的结果。基于抽象的机器学习和人工智能概念，例如目标、规划、策略，动机的认知理论可以为动机计算模型提供一个初始点。
社会动机理论涉及个体与他人接触过程中的行为。动机的社会理论是生物学和认知理论的交叉。例如采用适合度和文化效应描述认知现象，而进化论可以被认为是生物学社会理论。社会动机理论可以从小组态势下的个人到更大的社会、文化和进化系统。这些理论为多智能体系统动机计算模型的设计提供重要的初始状态。
组合动机理论尝试综合生物学、认知和社会动机理论，例如，马斯洛的需求层次学说[5]、奥尔德弗的ERG理论[6]以及斯塔格纳的稳态模型[7]。对于人工系统动机综合模型也是研究的重点，这种模型在硬件、抽象推理和多智能体层面提供描述行为过程的综合算法。
专题1智能体动机学习多智能体系统及应用（卷二）人的各种行为和活动都离不开动机，动机有下列功能：
�r 唤起行动的起动功能。就个人来说，他的行动的一切动力，都一定要通过他的头脑，一定要转变为他的愿望的动机，才能使他行动起来。
�r 维持活动达到目标的志向功能。动机一旦引起行为和活动，并能使这种活动具有稳固而完整的内容，使人表现出极大的积极性，朝思暮想，茶饭不香，思维敏捷，能持久而顽强地进行这种活动。
�r 动机的强化功能。一个人在活动上的成功和失败的体验，对他的活动志向有一定的影响。或者说，行为的结果如何，影响着人的动机。由此可知，动机对人的行为起着以正负强化形式出现的调节控制作用。

前言/序言

智能体（agent）与多智能体系统（multi�瞐gent systems）是人工智能领域一个活跃的研究分支。20世纪90年代，随着计算机网络、计算机通信等技术的发展，对于智能体与多智能体系统的研究不仅成为分布式人工智能研究的一个热点，而且也成为信息技术关注的一个热点。智能体是一种处于一定环境下的系统，它能在那种环境下灵活、自主地活动。智能体提供了一种新的计算和问题求解风范。人们在研究人类智能行为中发现：人类绝大部分的活动都涉及由多个人构成的社会群体，大型复杂问题的求解需要多个专业人员或组织协作完成。最重要的和最复杂的智能是在由众多个体构成的社会中进行各种活动时体现出来的。“协作”“竞争”“谈判”“博弈”等是人类智能行为的重要表现形式。智能体与多智能体系统的研究与逻辑学、运筹学、经济学、博弈论、社会学等学科均有密切的联系，有着精彩、深厚的理论积淀。
近十多年来，智能体和多智能体技术在世界上获得了广泛应用，如AlphaGo、德州扑克、星际争霸（StarCraft）、无人机协同、反恐等。国际学术界陆续创办了专门面向智能体及多智能体系统研究的国际学术期刊Autonomous Agents and Multi�睞gent Systems和国际学术会议“The International Conference on Autonomous Agents and Multi�睞gent Systems”。除此而外，在人工智能领域的主要国际学术期刊（如Artificial Intelligence, Journal of Artificial Intelligence Research）和会议（如IJCAI和AAAI）上，关于智能体与多智能体系统的研究论文也占据了非常高的比例。
2006年，中国计算机学会人工智能与模式识别专业委员会发起组织了两年一度的“全国Agent理论与应用学术会议”，并从2006年至2012年分别在烟台大学、南京大学、国防科技大学和吉林大学一共举办了四届。2013年起，该会议并入人工智能与模式识别专业委员会在当年开始举办的两年一度的“中国计算机学会人工智能会议（CCF�睞I）”。为了更好地推动中国智能体和多智能体系统理论、技术和应用的发展，2014年3月由史忠植研究员、安波副研究员主持，在中国科学院计算技术研究所举办了首届“中国智能体及多智能体系统”研讨会，该会议采用了不征文、不收费、报告人由组织者邀请的新方式。在首届会议中，与会者一致同意在中国计算机学会人工智能与模式识别专业委员会指导下，申请成立“多智能体与智能系统学组”，决定每年由该学组组织一次“中国智能体及多智能体系统研讨会”，并对邀请的报告进一步扩充、润色后结集出版。
2015年，由高阳教授、安波副研究员、陈小平教授、毛新军教授主编的《多智能体系统与应用》就是在2014年度的部分特邀报告基础上结集出版的。
本书的内容遴选自2015年、2016年度中国智能体及多智能体系统研讨会的特邀报告并收集了部分学者的最新研究进展。全书共计11个专题，每个专题讨论一个技术主题或者应用，并兼顾该主题的综述和特邀报告人自身的研究成果。书中章节涉及多智能体学习、多智能体协调协商、多智能体规划、多智能体应用框架及工具以及交叉应用基础问题研究。
前言多智能体系统及应用（卷二）本书的出版得到了中国计算机学会人工智能与模式识别专业委员会的支持和指导，在此表示衷心的感谢。本书的编写和出版还得益于各个章节的各位作者的无私支持和帮助，在此表示特别的感谢。中国科学院计算研究所的安波副研究员、南京大学的高阳教授、燕山大学的张大鹏教授、山东科技大学的纪淑娟副教授为本书的出版提出了很多的宝贵意见，再次对他们表示感谢。还要感谢南京大学的吴骏博士、张雷博士以及宋岳、许磊、唐思雨、乔羽、陈港、李博、叶康、经纬等同学，在本书编撰及整理润色的过程中，他们给予了极大的帮助。
由于水平有限以及知识观及价值观的狭隘，书中的疏漏和不足之处在所难免，敬请各位专家和读者批评指正。

编者[]2017年5月

《多智能体系统及应用（卷二）：协同、推理与复杂行为》内容概述《多智能体系统及应用（卷二）：协同、推理与复杂行为》深入探讨了多智能体系统（MAS）领域中更高级、更具挑战性的议题，着重于智能体之间如何有效协同、进行复杂推理以及涌现出丰富多样的集体行为。本书在前一卷的基础上，进一步拓展了MAS的理论框架和技术应用，为读者提供了理解和构建具有高级智能和协作能力的分布式系统的深刻洞见。本书并非简单罗列技术术语，而是致力于揭示多智能体系统背后蕴含的深刻原理，以及如何在实际场景中加以运用。它鼓励读者跳出单一智能体的局限，从整体和动态的视角来审视问题，理解群体智慧的形成机制，以及如何通过精心设计的智能体交互来解决现实世界中的复杂难题。核心主题与内容详述第一部分：智能体间的协同机制分布式规划与协调：传统的集中式规划在面对动态、不确定环境时显得力不从心。本部分详细阐述了分布式规划技术，包括：任务分解与分配：如何将复杂任务分解为子任务，并将其高效地分配给不同的智能体。探讨了基于拍卖、投票、协商等多种分配机制的优缺点及适用场景。资源管理与调度：在有限的资源环境下，智能体如何进行有效的资源协商、共享和调度，以避免冲突并最大化整体效率。时空约束下的协同：重点关注智能体在时间和空间上的约束条件，如何实现跨时空的协同，例如在物流配送、交通流量控制等领域。分布式约束满足（DCSP）：深入研究DCSP问题，探讨如何通过智能体间的局部约束传播和回溯，解决全局的协调难题。合作与竞争的博弈论基础：智能体间的交互往往涉及合作与竞争的混合，博弈论为理解和设计这些交互提供了强大的理论工具。纳什均衡与Pareto最优：介绍基本的博弈论概念，分析在不同博弈模型下，智能体如何趋向于稳定策略，以及如何实现集体利益的最大化。动态博弈与序贯博弈：探讨智能体在多次交互中如何根据历史信息调整策略，以及如何设计能够应对不确定性的动态博弈模型。机制设计：本部分将重点介绍如何设计激励机制，引导智能体进行合作，例如在众包任务、协同感知等场景下。群体行为与涌现：许多复杂的集体行为并非由个体智能体明确编程，而是从简单的个体规则和交互中“涌现”出来。群体轨迹预测与控制：以交通流、人群疏散为例，研究如何通过分析个体的运动模式和相互影响，预测和控制群体的整体行为。模式形成与自组织：探讨智能体如何通过局部交互，自发地形成有组织的模式，例如在分布式传感器网络中的数据收集、协同感知等。仿生学启发：借鉴蚂蚁、蜜蜂、鸟群等自然界中的群体智能现象，分析其背后隐藏的分布式算法，并将其应用于MAS的设计。第二部分：智能体的复杂推理能力不确定性下的推理：现实世界充斥着不确定性，智能体需要具备在信息不完整、噪声干扰的情况下进行推理的能力。概率推理：介绍贝叶斯网络、马尔可夫模型等概率图模型，探讨智能体如何利用概率推断来更新信念、做出预测和决策。模糊逻辑与证据理论：针对人类认知中的模糊性和不确定性，介绍模糊逻辑推理和证据理论，使其能够处理非精确的知识和信息。近似推理算法：深入研究各种近似推理技术，如蒙特卡洛方法、变分推理等，以应对大规模、高维度的概率模型。多智能体知识表示与共享：智能体需要有效地表示和共享信息，以便进行协同决策。分布式知识库：研究如何构建分布式的知识表示框架，使每个智能体拥有局部知识，并通过通信进行全局共享。语义互操作性：重点关注如何确保不同智能体能够理解彼此的知识表示，实现语义层面的互操作。知识融合与冲突解决：当来自不同智能体的知识存在冲突时，如何进行有效的融合和解决，以形成一致的全局认知。学习与适应：智能体需要从经验中学习，并不断适应不断变化的环境。多智能体强化学习（MARL）：详细阐述MARL的不同范式，包括集中式训练-分布式执行（CTDE）、完全去中心化学习等，以及它们在合作、竞争和混合博弈场景下的应用。迁移学习与多任务学习：研究如何让智能体将在一个任务或环境中获得的知识迁移到新的任务或环境中，提高学习效率。联邦学习与分布式深度学习：探讨如何在保护数据隐私的前提下，实现智能体间的模型协同训练，解决大规模分布式学习的问题。第三部分：复杂系统的建模与应用分布式自治系统：探讨如何设计完全自治的智能体系统，使其能够在无人干预的情况下自主运行和演化。自适应与自愈合：研究智能体如何根据环境变化进行自适应，并在故障发生时实现自愈合，提高系统的鲁棒性。自主决策与目标驱动：关注智能体的自主目标设定、规划和执行能力，使其能够独立地追求预设目标。人机协作系统：随着技术的发展，人与智能体之间的协作日益重要。人机交互的协同设计：研究如何设计自然、高效的人机交互界面和协议，使人类和智能体能够顺畅地协同工作。信任与透明度：探讨如何在人机协作中建立信任，以及如何提高智能体决策的透明度，使人类能够理解和监督智能体的行为。实际应用案例分析：本部分通过一系列具体的应用案例，展示多智能体系统在解决现实世界挑战中的巨大潜力。智能交通管理：智能体协同控制交通信号灯、优化车辆路径、管理公共交通系统，以缓解交通拥堵，提高出行效率。智慧能源网络：智能体协同调度分布式能源、管理电力负荷、优化能源交易，构建稳定、高效、环保的能源系统。智能制造与供应链：智能体协同管理生产流程、优化库存、预测需求，实现高效、柔性的智能制造和敏捷的供应链。机器人协作：多个机器人智能体协同完成复杂任务，如空间探索、灾难救援、精准农业等。分布式传感与监测：部署大量智能传感器，通过协同感知和数据融合，实现对环境的全面、实时监测。金融建模与交易：利用多智能体模拟市场行为、进行风险评估、执行高频交易策略。社会模拟与政策制定：构建多智能体模型来模拟社会现象，评估不同政策的影响，为决策提供科学依据。本书特色《多智能体系统及应用（卷二）：协同、推理与复杂行为》力求在理论深度和实践应用之间取得平衡。本书不仅深入剖析了多智能体系统背后的数学模型和算法原理，更通过大量的实例和案例研究，展示了这些理论在解决实际问题中的强大生命力。本书语言严谨而通俗，力求让对 MAS 感兴趣的读者，无论其背景如何，都能从中获得启发和收获。本书适合高等院校的师生、科研人员、工程师以及对人工智能和分布式系统领域有浓厚兴趣的专业人士阅读。它将成为一本不可多得的关于多智能体系统高级主题的参考书，为推动该领域的进一步发展贡献力量。

用户评价

评分☆☆☆☆☆

这本书绝对是为那些对人工智能底层逻辑和高级应用感兴趣的开发者、研究人员甚至是热情的爱好者们量身打造的。它深入浅出地探讨了多智能体系统的理论基础，从其核心概念、架构设计到各种算法和模型，都进行了详尽的剖析。我尤其欣赏作者在梳理复杂理论时所展现出的清晰思路，能够将抽象的概念用生动的语言和恰当的比喻来解释，使得即使是初学者也能逐渐领悟到其中的精髓。书中不仅仅停留在理论层面，更重要的是，它提供了大量实际的应用案例，涵盖了从智能交通、机器人协作到金融风控、城市规划等多个领域。这些案例的引入，极大地增强了本书的实用性和启发性，让我能够清晰地看到多智能体系统在解决现实世界复杂问题中的巨大潜力。我常常在阅读时，会不自觉地将书中的理论与自己工作中的一些难题联系起来，思考如何将这些先进的建模和优化思想运用到实际的项目中，从而提升效率，实现更智能化的决策。这本书的价值在于，它不仅仅是知识的传递，更是一种思维方式的启迪，它鼓励读者跳出单一智能体的局限，从更宏观、更动态的系统角度去审视问题，并寻找群体协作的解决方案。

评分☆☆☆☆☆

对于任何希望深入了解智能体之间如何相互作用，并从中实现复杂功能的研究者来说，《多智能体系统及应用(卷二）》是一份不可多得的宝藏。本书的亮点在于，它不仅仅罗列了各种技术，更着重于解释“为什么”和“如何”。作者在阐述核心算法时，往往会追溯到其背后的数学原理，使得理解更加透彻，而非停留在“知其然”的层面。我对于书中关于“涌现行为”的探讨印象尤为深刻，它解释了当大量简单智能体通过局部互动，如何能够形成高度有序和智能的全局行为，这种现象在自然界和复杂系统中普遍存在，而本书则提供了一种系统化的方法来模拟和利用它。书中的许多章节，例如关于“智能体建模与仿真”、“分布式自治系统”以及“复杂网络中的智能体动态”等，都为我提供了宝贵的理论框架和技术思路。我经常在阅读时，会将其与我正在进行的研究课题联系起来，思考如何利用书中介绍的各种方法来解决我所面临的难题，例如如何设计一个能够高效协同的机器人群，或者如何构建一个具有鲁棒性的去中心化网络。

评分☆☆☆☆☆

这是一本让人读来既感到烧脑又充满启发性的书籍。它不像一些技术书籍那样枯燥乏味，而是用一种富有洞察力的方式，带领我们一步步揭开多智能体系统神秘的面纱。我特别欣赏作者在引入新的概念和技术时，所做的详尽的铺垫和背景介绍，这让我能够循序渐进地理解每一个细节。书中对各种分布式算法的深入讲解，包括它们的理论基础、算法流程以及在不同场景下的适用性，都让我受益匪浅。我尤其对书中关于“群体决策与协调”的章节产生了浓厚的兴趣，它详细介绍了多种实现智能体之间有效沟通和协作的机制，例如基于规则的协调、基于学习的协调以及基于博弈论的协调等。这些内容不仅拓展了我的技术视野，更让我对如何设计和管理复杂的群体行为有了更深刻的认识。阅读过程中，我常常会联想到一些现实生活中的场景，例如交通信号灯的智能调控、无人机编队的协同作业等，并思考书中提到的理论和方法是如何应用于这些场景的，从而提升整个系统的效率和智能化水平。

评分☆☆☆☆☆

这本《多智能体系统及应用(卷二）》给我带来了一种全新的视角来理解和构建复杂的智能系统。它不仅仅是简单的技术手册，更像是一次对“智能涌现”和“分布式决策”的深度探索。作者非常巧妙地将数学模型、算法设计与实际的工程实现无缝衔接，让读者在理论学习的同时，也能感受到技术落地的那份踏实感。我尤其喜欢书中对于不同多智能体架构的比较分析，以及它们各自的优缺点和适用场景，这对于我们在设计系统时做出明智的选择至关重要。例如，在讨论分布式强化学习的部分，书中提供的算法推导和性能评估，让我对如何在资源受限的环境下训练高效的多智能体策略有了更深刻的理解。此外，书中关于智能体通信协议、协调机制和博弈论的应用，也为理解群体行为的形成提供了理论支撑。我常常在阅读这些章节时，脑海中会闪过许多关于团队协作、资源分配等方面的挑战，并开始思考如何利用多智能体系统的原理来设计更优化的解决方案。这本书为我打开了一个全新的技术视野，让我更加自信地去探索和构建未来的智能应用。

评分☆☆☆☆☆

这本书为我提供了一个全面而深入的视角来理解和应用多智能体系统。它不仅仅是技术指南，更是一次关于“智能协作”的哲学思考。作者在梳理复杂概念时，展现出了极高的专业素养和清晰的逻辑思维，能够将深奥的理论用易于理解的方式呈现出来。我尤其喜欢书中关于“多智能体学习与演化”的部分，它探讨了智能体如何在与环境和同伴的交互中不断学习和进化，从而提升自身的智能水平和适应能力。这让我联想到许多关于“涌现智能”的经典案例，并思考如何将这些原理应用到实际的开发中。书中提供的各种模型和算法，例如协同过滤、联邦学习以及基于规则的专家系统等，都为我提供了宝贵的工具和方法。我经常在阅读时，会将书中的理论与我在软件开发过程中遇到的挑战联系起来，思考如何利用多智能体系统的思想来设计更具鲁棒性、可扩展性和智能化的系统。这本书对我而言，不仅仅是知识的积累，更是一种思维方式的升华。