首页 第八章 Agent(艾真体)

第八章 Agent(艾真体)

举报
开通vip

第八章 Agent(艾真体)null人工智能及其应用 (第三版) 研究生用书 蔡自兴第八章 Agent(艾真体)人工智能及其应用 (第三版) 研究生用书 蔡自兴第八章 Agent(艾真体)第八章 Agent(艾真体) 随着计算机技术和人工智能的发展以及互联网(internet)和万维网(WWW, World Wide Web)的出现与发展,集中式系统已不能完全适应科学技术的发展需要。并行计算和分布式处理等技术(包括分布式人工智能)应运而生,并在过去20多年中获得快速发展。近10年来Agent和多Agent系统的研究成...

第八章  Agent(艾真体)
null人工智能及其应用 (第三版) 研究生用书 蔡自兴第八章 Agent(艾真体)人工智能及其应用 (第三版) 研究生用书 蔡自兴第八章 Agent(艾真体)第八章 Agent(艾真体) 随着计算机技术和人工智能的发展以及互联网(internet)和万维网(WWW, World Wide Web)的出现与发展,集中式系统已不能完全适应科学技术的发展需要。并行计算和分布式处理等技术(包括分布式人工智能)应运而生,并在过去20多年中获得快速发展。近10年来Agent和多Agent系统的研究成为分布式人工智能研究的一个热点,引起计算机、人工智能、自动化等领域科技工作者的浓厚兴趣,为分布式系统的综合、分析、实现和应用开辟了一条新的有效途径,促进了人工智能和计算机软件工程的发展。8.1分布式人工智能8.1分布式人工智能 计算机技术的快速发展为人工智能提供了一个很好的试验应用平台。人工智能的许多新概念、新理论和新方法又指导计算机技术向新水平发展。近代计算机通信、计算机网络、计算机信息处理的发展以及经济、社会和军事领域对信息技术提出的更高要求,促进了分布式人工智能(distributed artificial intelligence, DAD的开发与应用。分布式人工智能系统能够克服单个智能系统在资源、时空分布和功能上的局限性,具备并行、分布、开放和容错等优点,因而获得很快的发展,得到越来越广泛的应用。null 分布式人工智能的研究源于20世纪70年代末期。当时主要研究分布式问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 求解(distributed problem solving, DPS),其研究目标是要建立一个由多个子系统构成的协作系统,各子系统之间协同工作对特定问题进行求解。在DPS系统中,把待解决的问题分解为一些子任务,并为每个子任务设计一个问题求解的任务执行子系统。通过交互作用策略,把系统设计集成为一个统一的整体,并采用自顶向下的设计方法,保证问题处理系统能够满足顶部给定的要求。null1.分布式人工智能的特点 分布式人工智能系统具有如下一些特点: (1)分布性。整个系统的信息,包括数据、知识和控制等,无论是在逻辑上或者是物理上都是分布的,不存在全局控制和全局数据存储。系统中各路径和节点能够并行地求解问题,从而提高了子系统的求解效率。 (2)连接性。在问题求解过程中,各个子系统和求解机构通过计算机网络相互连接,降低了求解问题的通信代价和求解代价。 (3)协作性。各子系统协调工作,能够求解单个机构难以解决或者无法解决的困难问题。例如,多领域专家系统可以协作求解单领域或者单个专家系统无法解决的问题,提高求解能力,扩大应用领域。null(4)开放性。通过网络互连和系统的分布,便于扩充系统规模,使系统具有比单个系统更大的开放性和灵活性。 (5)容错性。系统具有较多的冗余处理节点、通信路径和知识,能够使系统在出现故障时,仅仅通过降低响应速度或求解精度,就可以保持系统正常工作,提高工作可靠性。 (6)独立性。系统把求解任务归约为几个相对独立的子任务,从而降低了各个处理节点和子系统问题求解的复杂性,也降低了软件设计开发的复杂性。null2.分布式人工智能的分类 分布式人工智能一般分为分布式问题求解和多Agent系统(multi-agent system,MAS)两种类型。DPS研究如何在多个合作和共享知识的模块、节点或子系统之间划分任务,并求解问题。MAS则研究如何在一群自主的Agent之间进行智能行为的协调。两者的共同点在于研究如何对资源、知识、控制等进行划分。两者的不同点在于,DPS往往需要有全局的问题、概念模型和成功 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 ;而MAS则包含多个局部的问题、概念模型和成功标准。DPS的研究目标在于建立大粒度的协作群体,通过各群体的协作实现问题求解,并采用自顶向下的设计方法。MAS却采用自底向上的设计方法,首先定义各自分散自主的Agent,然后研究怎样完成实际任务的求解问题;各个Agent之间的关系并不一定是协作的,也可能是竞争甚至是对抗的关系。null 上述对分布式人工智能的分类并非绝对和完善。有些人认为MAS基本上就是分布式人工智能,DPS仅是MAS研究的一个子集,他们提出,当满足下列三个假设时,MAS就成为DPS系统:①Agent友好;②目标共同;③集中设计。显然,持这种看法的人大大扩展了MAS的研究和应用领域。正是由于MAS具有更大的灵活性,更能体现人类社会的智能,更适应开放和动态的世界环境,因而引起许多学科及其研究者的强烈兴趣和高度重视。 目前对Agent和MAS的研究有增无减,仍是一个研究热点。要研究的问题包括Agent的概念、理论、分类、模型、结构、语言、推理和通信等。8.2 Agent及其要素8.2 Agent及其要素 Agent在英语中是个多义词,主要含义有主动者、代理人、作用力(因素)或媒介物(体)等。在信息技术,尤其是人工智能和计算机领域,可把Agent看做是能够通过传感器感知其环境,并借助执行器作用于该环境的任何事物。对于人Agent,其传感器为眼睛、耳朵和其他感官,其执行器为手、腿、嘴和其他身体部分。对于机器人Agent,其传感器为摄像机和红外测距器等,而各种马达则为其执行器。对于软件Agent,则通过编码位的字符串进行感知和作用。图8.1表示Agent通过传感器和执行器与环境的交互作用。null1. Agent的译法 目前国内信息科学学术界对Agent尚无公认的统一译法。有的译为主体、智能主体或智能体,也有的使用原文而不译为中文。还有些人把Agent译为代理、媒体、个体或实体。那些沿用英文原文的学者,采取了比较慎重的态度,以便国内同行们继续研究它的译法,争取翻译得更加确切和完美。因此,大家可就Agent的译法畅所欲言,经过讨论或争论,求同存异,最终获得共识。 本着上述认识,特建议把Agent译为“艾真体”,其理由如下: (1)一种比较普遍的观点认为,Agent是一种通过传感器感知其环境,并通过执行器作用于该环境的实体。这个实体也可叫做“真体”。因此,可以把艾真体定义为一种从感知序列到实体动作的映射。null(2)“主体”是用得较多的一种译法。译为“主体”可能是考虑到Agent具有自主性。但是,Agent还具有交互性、协调性、社会性、适应性和分布性等特性,这些特性不可能在译名上全部反映出来,仅反映出自主特性是片面的。此外,在汉语中,“主体”有其明确的含义,它一般是指事物的主要部分。例如,中央十层大厦是这个建筑群的主体。又如,粤海铁路主体工程竣工。在哲学上,“主体”是指有认识和实践能力的人;其对立面是客体,是指主体以外的客观事物,是主体认识和实践的对象。“主体”的这些含义不能反映Agent的本意。 (3)“代理”是另一种译法,过去用得较多,现在已较少使用。译为“代理”是受到社会科学和管理科学的影响。在汉语中,“代理”也有其明确的含义,是指暂时代人担任某种负责职务,如代理总统、代理省长、代理校长或主任等。在法律上,“代理”是指受委托代表当事人进行某种活动,如诉讼、签订 合同 劳动合同范本免费下载装修合同范本免费下载租赁合同免费下载房屋买卖合同下载劳务合同范本下载 、纳税等。可见,“代理”的含义也不能表示出Agent的原意。 (4) Agent的读音为“艾金特”或“爱金体”,其相近发音为“艾真体”或“爱真体”。汉语中,“艾”的含义为“漂亮”、“美丽”,“爱”的含义为“喜爱”、“喜好”等。null(5)把Agent译为艾真体,不仅发音相近,而且含有一定的物理意义,即某种“真体”或事物。“艾真体”能够在十分广泛的领域内得到认可。例如,它可以表示具有某些智能行为的某种个体或主体;也可以表示控制系统中的对象、过程或装置;还可以表示程序和系统或子系统等。艾真体所处的环境可以是实时环境,也可以是虚拟世界。 (6)历史上,把英文或其他外文名词术语按发音或其近似发音翻译成中文的成功先例很多。例如,把motor译为摩托、马达taxi译为的士bus译为巴士,tractor译为拖拉机modern译为摩登robust译为鲁棒等。也有不按音译而搞意译又词不达意的译例。比如,世界各种语言都把斯洛伐克语“robota”音译为“罗伯特”,而只有中文译为“机器人”。这种译法未能表示robota的真切含义,导致了国人对机器人的误解。可见,如果找不到一个确切和公认的译法,那么,采用音译或准音译,仍不失为一个良策。 鉴于以上理由和其他一些因素,建议把“Agent”译为“艾真体”,并在本书的后续部分使用这一译法。因此,可把多Agent系统(MAS)译为多艾真体系统,把intelligent agent译为智能艾真体。null2.艾真体的要素 艾真体必须利用知识修改其内部状态(心理状态),以适应环境变化和协作求解的需要。艾真体的行动受其心理状态驱动。人类心理状态的要素有认知(信念、知识、学习等)、情感(愿望、兴趣、爱好等)和意向(意图、目标、规划和承诺等)三种。着重研究信念(belief)、愿望(desire)和意图(intention)的关系及其形式化描述,力图建立艾真体的BDI(信念、愿望和意图)模型,已成为艾真体理论模型研究的主要方向。 信念、愿望、意图与行为具有某种因果关系,如图8.2所示。其中,信念描述艾真体对环境的认识,表示可能发生的状态;愿望从信念直接得到,描述艾真体对可能发生情景的判断;意图来自愿望,制约艾真体,是目标的组成部分。null 布拉特曼(Bratman)的哲学思想对心理状态研究产生深刻影响。1987年,他从哲学的角度研究行为意图,认为只有保持信念、愿望和意图的理性平衡,才能有效地实现问题求解。他还认为,在某个开放的世界(环境)中,理性艾真体的行为不能由信念、愿望及两者组成的规划直接驱动,在愿望和规划之间还存在一个基于信念的意图。在这样的环境中,这个意图制约了理性艾真体的行为。理性平衡是使理性艾真体的行为与环境特性相适应。环境特性不仅包括环境客观条件,而且涉及环境的社会团体因素。对于每种可能的感知序列,在感知序列所提供证据和艾真体内部知识的基础上,一个理想的理性艾真体的期望动作应使其性能测度达到最大。 在过去的十多年中,在艾真体和MAS的建模方面进行了大量的研究工作,几乎所有研究工作都以实现布拉特曼的哲学思想为目标。不过,这些研究都未能完全实现布拉特曼的哲学模型,仍然存在一些尚待进一步研究和解决的问题,如艾真体模型与结构的映射关系、建造艾真体系统的计算复杂性以及艾真体问题求解与心理状态关系的表示等问题。null3.艾真体的特性 艾真体与分布式人工智能系统一样具有协作性、适应性等特性。此外,艾真体还具有自主性、交互性以及持续性等重要性质。 (1)行为自主性。艾真体能够控制它的自身行为,其行为是主动的、自发的、有目标和意图的,并能根据目标和环境要求对短期行为作出规划。 (2)作用交互性,也叫反应性。艾真体能够与环境交互作用,能够感知其所处环境,并借助自己的行为结果,对环境做出适当反应。 (3)环境协调性。艾真体存在于一定的环境中,感知环境的状态、事件和特征,并通过其动作和行为影响环境,与环境保持协调。环境和艾真体是对立统一体的两个方面,互相依存,互相作用。 (4)面向目标性。艾真体不是对环境中的事件做出简单的反应,它能够表现出某种目标指导下的行为,为实现其内在目标而采取主动行为。这一特性为面向艾真体的程序设计提供了重要基础。null(5)存在社会性。艾真体存在于由多个艾真体构成的社会环境中,与其他艾真体交换信息、交互作用和通信。各艾真体通过社会承诺,进行社会推理,实现社会意向和目标。艾真体的存在及其每一行为都不是孤立的,而是社会性的,甚至表现出人类社会的某些特性。 (6)工作协作性。各艾真体合作和协调工作,求解单个艾真体无法处理的问题,提高处理问题的能力。在协作过程中,可以引入各种新的机制和算法。 (7)运行持续性。艾真体的程序在起动后,能够在相当长的一段时间内维持运行状态,不随运算的停止而立即结束运行。 (8)系统适应性。艾真体不仅能够感知环境,对环境做出反应,而且能够把新建立的艾真体集成到系统中而无须对原有的多艾真体系统进行重新设计,因而具有很强的适应性和可扩展性。也可把这一特点称为开放性。 (9)结构分布性。在物理上或逻辑上分布和异构的实体(或真体),如主动数据库、知识库、控制器、决策体、感知器和执行器等,在多艾真体系统中具有分布式结构,便于技术集成、资源共享、性能优化和系统整合。 (10)功能智能性。艾真体强调理性作用,可作为描述机器智能、动物智能和人类智能的统一模型。艾真体的功能具有较高智能,而且这种智能往往是构成社会智能的一部分。8.3艾真体的结构8.3艾真体的结构8.3.1艾真体的结构特点 艾真体系统是个高度开放的智能系统,其结构如何将直接影响到系统的智能和性能。例如,一个在未知环境中自主移动的机器人需要对它面对的各种复杂地形、地貌、通道状况及环境信息做出实时感知和决策,控制执行机构完成各种运动操作,实现导航、跟踪、越野等功能,并保证移动机器人处于最佳的运动状态。这就要求构成该移动机器人系统的各个艾真体有一个合理和先进的体系结构,保证各艾真体自主地完成局部问题求解任务,显示出较高的求解能力,并通过各艾真体间的协作完成全局任务。null 人工智能的任务就是设计艾真体程序,即实现艾真体从感知到动作的映射函数。这种艾真体程序需要在某种称为结构的计算设备上运行。这种结构可以是一台普通的计算机,或者可能包含执行某种任务的特定硬件,还可能包括在计算机和艾真体程序间提供某种程度隔离的软件,以便在更高层次上进行编程。一般意义上,体系结构使得传感器的感知对程序可用,运行程序并把该程序的作用选择反馈给执行器。可见,艾真体、体系结构和程序之间具有如下关系: 艾真体=体系结构+程序 计算机系统为艾真体的开发和运行提供软件和硬件环境支持,使各个艾真体依据全局状态协调地完成各项任务。具体地说:null(1)在计算机系统中,艾真体相当于一个独立的功能模块、独立的计算机应用系统,它含有独立的外部设备、输入输出驱动装备、各种功能操作处理程序、数据结构和相应的输出。 (2)艾真体程序的核心部分叫做决策生成器或问题求解器,起到主控作用,它接收全局状态、任务和时序等信息,指挥相应的功能操作程序模块工作,并把内部工作状态和所执行的重要结果送至全局数据库。艾真体的全局数据库设有存放艾真体状态、参数和重要结果的数据库,供总体协调使用。 (3)艾真体的运行是一个或多个进程,并接受总体调度。特别是当系统的工作状态随工作环境而经常变化以及各艾真体的具体任务时常变更时,更需搞好总体协调。 (4)各个艾真体在多个计算机CPU上并行运行,其运行环境由体系结构支持。体系结构还提供共享资源(黑板系统)、艾真体间的通信工具和艾真体间的总体协调,以使各艾真体在统一目标下并行、协调地工作。8.3.2艾真体的结构分类8.3.2艾真体的结构分类 根据上述讨论,可把艾真体看做是从感知序列到实体动作的映射。根据人类思维的不同层次,可把艾真体分为下列几类: (1)反应式艾真体。反应式(reflex或reactive)艾真体只简单地对外部刺激产生响应,没有任何内部状态。每个艾真体既是客户,又是服务器,根据程序提出请求或做出回答。图8.3表示反应式艾真体的结构示意图。图中,艾真体的条件一作用规则使感知和动作连接起来。把这种连接称为条件一作用规则。null(2)慎思式艾真体。慎思式(deliberative)艾真体又称为认知式(cognitive)艾真体,是一个具有显式符号模型的基于知识的系统。其环境模型一般是预先知道的,因而对动态环境存在一定的局限性,不适用于未知环境。由于缺乏必要的知识资源,在艾真体执行时需要向模型提供有关环境的新信息,而这往往是难以实现的。 慎思式艾真体的结构如图8.4所示。艾真体接收的外部环境信息,依据内部状态进行信息融合,以产生修改当前状态的描述。然后,在知识库支持下制订规划,再在目标指引下,形成动作序列,对环境发生作用。null(3)跟踪式艾真体。简单的反应式艾真体只有在现有感知的基础上才能作出正确的决策。随时更新内部状态信息要求把两种知识编入艾真体的程序,即关于世界如何独立地发展艾真体的信息以及艾真体自身作用如何影响世界的信息。图8.5给出一种具有内部状态的反应式艾真体的结构图,表示现有的感知信息如何与原有的内部状态相结合以产生现有状态的更新描述。与解释状态的现有知识的新感知一样,也采用了有关世界如何跟踪其未知部分的信息,还必须知道艾真体对世界状态有哪些作用。具有内部状态的反应式艾真体通过找到一个条件与现有环境匹配的规则进行工作,然后执行与规则相关的作用。这种结构叫做跟踪世界艾真体或跟踪式艾真体。null(4)基于目标的艾真体。仅仅了解现有状态对决策来说往往是不够的,艾真体还需要某种描述环境情况的目标信息。艾真体的程序能够与可能的作用结果信息结合起来,以便选择达到目标的行为。这类艾真体的决策基本上与前面所述的条件一作用规则不同。反应式艾真体中有的信息没有明确使用,而设计者已预先计算好各种正确作用。对于反应式艾真体,还必须重写大量的条件一作用规则。基于目标的艾真体在实现目标方面更灵活,只要指定新的目标,就能够产生新的作用。图8.6表示基于目标艾真体的结构。null(5)基于效果的艾真体。只有目标实际上还不足以产生高质量的作用。如果一个世界状态优于另一个世界状态,那么它对艾真体就有更好的效果( utility)。因此,效果是一种把状态映射到实数的函数,该函数描述了相关的满意程度。一个完整规范的效果函数允许对两类情况作出理性的决策。第一,当艾真体只有一些目标可以实现时,效果函数指定合适的交替。第二,当艾真体存在多个瞄准目标而不知哪一个一定能够实现时,效果(函数)提供了一种根据目标的重要性来估计成功可能性的方法。因此,一个具有显式效果函数的艾真体能够作出理性的决策。不过,必须比较由不同作用获得的效果。图8.7给出一个完整的基于效果的艾真体结构。null(6)复合式艾真体。复合式艾真体即在一个艾真体内组合多种相对独立和并行执行的智能形态,其结构包括感知、动作、反应、建模、规划、通信和决策等模块,如图8.8所示。艾真体通过感知模块来反映现实世界,并对环境信息作出一个抽象,再送到不同的处理模块。若感知到简单或紧急情况,信息就被送入反射模块,作出决定,并把动作命令送到行动模块,产生相应的动作。8.4艾真体通信8.4艾真体通信 通信是一种广泛存在的现象,以致很难给出一个精确的定义。一般来说,来自传统信号的共享系统的信号产生和理解所引发的有意的信息交换,就是通信。大多数动物使用固定的信号集来表示与它们息息相关的消息,如这里有食物、附近有食肉动物、接近、撤退、让我们交配等。小猴与众不同地有多种预报不同的食肉动物的信号:大声咆哮就是食肉动物、短声咳嗽就是鹰、哩噬叫就是蛇。它们使用一种咕味声与它们自己社会群体中的统治成员交流,用另一种声音与下级成员交流,而又用一种声音与其他社会群体的成员交流。 像其他动物一样,人类也使用有限的传统信号(如微笑、握手等)来进行交流。不过,人类也已发展了复杂的、结构化的信号系统(如语言),交流各自了解的世界的大部分信息。人类是惟一能够使用数量上无限、性质上不同的消息进行可靠通信的物种。8.4.1通信的过程8.4.1通信的过程 艾真体有一个能够产生语言的行为,叫做说话行为或交谈(speech act)。“说话”用于“自由谈论”,而不是“正式谈话”,因此打字、空中文字和使用符号语言都和谈话行为一样有价值。讲话者、受话者和说话方式等将作为指定任何通信模式的一般术语,而术语“言辞“(words)将用来指代任何传统通信的信号。 为什么一个艾真体不采取它的“常规”行动而要不厌其烦地执行说话行为呢?想像一下一组艾真体正在一起探索无名普斯世界(Wumpus,一种格子棋类游戏,以该游戏中的反面角色Wumpus命名。该角色为一怪物,与其他艾真体作对。双方为争夺金子而战)。该组艾真体的优势(集体与单独)体现在以下几个方面:null(1) 通知 关于发布提成方案的通知关于xx通知关于成立公司筹建组的通知关于红头文件的使用公开通知关于计发全勤奖的通知 。相互通知该世界中已经探索过的部分,使每个艾真体可以少做一些探索。例如,这样说就行了:“在坐标34有一个蜂。” (2)询问。向其他艾真体询问世界特定部分的情况。如提问:“你已经在什么地方闻到无名普斯了?” (3)回答。回答问题。这是一种通知:“是的,我在坐标25闻到了无名普斯。” (4)请求。请求或者命令其他艾真体采取行动:“请帮我搬运这块金子。”直接提出请求显然是不礼貌的,因此经常采用一种间接的说话方式(通过陈述或者提问来请求):“我可以得到你的帮助来运走这块金子吗?”或者“你能帮我运走这块金子吗?” null(5)许诺。许诺做某事或者提供帮助:“如果你让我分享这块金子,那么我就射杀无名普斯。” (6)确认。确认请求和提议:如“可以。” (7)分享。分享感受和 经验 班主任工作经验交流宣传工作经验交流材料优秀班主任经验交流小学课改经验典型材料房地产总经理管理经验 :“你知道,老伙计,当我走近这样的目标时,我总是回到起点,然后向另一个方向前进。” 这些例子显示交谈可以相当有用并且通用。一些交谈(如通知、回答、确认和分享)有向受话者传送信息的预期效果。其他一些说话行为(如请求、命令和询问)有要受话者采取行动的预期效果。通信的双重目的就是建立信任和创建社会联系。这有助于解释交换中的通信是什么,例如,“喂,还好吗?”、“好,你好吗?”、“不错。” null1.语言的发展 对艾真体来说,难点是决定何时调用某种交谈以及决定在各种可能中哪个交谈是正确的。在某一层次上这正是熟悉的规划问题。一个艾真体有许多可能的行为可供选择,并且必须努力选择实现与其他艾真体进行信息通信的目标行为。规划中的难题也应用到了规划交谈中。在嘴巴和舌头的单独运动层次上规划英语会话似乎不可能复杂,然而至少需要规划几个分级提取(文字、短语和句子)的层次。另一个问题就是非决定性。虽然无名普斯世界中的大多数行为都是决定性的,但是交谈却并非如此。考虑交谈“向右转!”。如果另一个艾真体接收到这些言语,并且如果该艾真体把它解释为一道命令:向右转,那么这个艾真体就会这样做。或者然后该艾真体再次需要有条件的规划。不必自始至终地规划一个会话,最好构造一个通用的规划或者会话策略,生成第一个句子,停下来感受回答,然后对它做出反应。null 理解交谈的问题很像其他理解问题,例如图像理解或者医疗诊断。给定含糊的输入集,回过来看世界的什么状态已经产生了输入。交谈理解问题的一部分就是针对语言的。需要知道关于一个语言的语法和语义,以确定为什么另一个艾真体执行给定的交谈。理解问题也包括更一般的规划识别问题。如果观察一个艾真体转向并移向这块金子,就可以构建艾真体的信念模型,认为这个艾真体以得到金子为目标,从而可以理解这个行为。必须创建一类相似的精神模型,以理解那个转向金子并说“我要抓住它”的艾真体。即使附近可能有其他对象,也应相当清楚,“它”就是指这块金子。 部分理解问题可以通过逻辑推理来处理。逻辑推理是描述文字和短语组合成为更大短语的好方法。另一部分理解问题仅仅可以通过不确定推理技术来处理。常有几个世界状态都对应于相同的交谈,因此理解者不得不决定哪种情况更有可能。 null 知道了通信如何适合一般艾真体的设计,就可以把注意力转到语言本身上。当更加注意语言的常用方式而不是通信方法的一般属性时,人们就会发现自己走进了自然科学的王国,那就是探究现实世界的事物而不是关于程序或者其他人造物的科学。自然语言理解是人工智能各领域中少数有这种性质的一个领域。 2.语言基础 人们区分了形式语言(像LISP和被发明及严格定义的一阶逻辑)和自然语言(如人们用来相互说话的汉语和英语)。尽管主要对自然语言感兴趣,仍将使用形式语言工具。 一种形式语言定义为字符串集,每个字符串就是字符序列,这些字符来自叫做终端符号的有限集合。对于英语来说,终端符号包括诸如a, aback,abacus,about等大约40多万个单词。null 形式语言和自然语言的写作语法有许多不同的形式和标示方法。但是,其中大部分基于分段结构的思想都是相似的,那些字符串由来自不同类别的称为短语的子串组成。例如,短语“无名普斯”、“国王”和“在拐角处的艾真体”等都是名词短语(noun phrase,NP)类目的例子。按照这种方法辨识短语有两个原因。首先,短语是附加语义的方便工具。其次,分类短语有助于描述语言可行的字符串。任何名词短语可以和诸如“死了”的动词短语(verb phrase, VP)组合,形成句子类的短语(sentence,记为S)。没有名词短语和动词短语中间性的标注,就难于解释为什么“无名普斯死了”是一个句子而“无名普斯死的是”不是一个句子。 诸如NP, VP和S的类别称为非终端符号。重写规则由左边的一个单一的非终端符号和右边的终端或者非终端符号的序列组成。下列规则: S→NP VP 的含义就是能够对任何短语类NP,加入任何短语类VP,形成短语类S。null3.通信的组成 一个典型的通信事件由7个过程组成。在该事件中,讲话者T要使用文字W向受话者H调查建议P。在讲话者身上发生三种作用: (1)意向:T要H相信P(T典型地相信P)。 (2)生成:T选择文字W(因为它们表达意思P)。 (3)综合:T说话W(经常对H说这些话)。 在受话者身上发生4种作用: (1)感知:H感知W’(理想地W’=W,但错觉是可能的)。 (2)分析:H推断,W’可能的含义为P1,…,Pn(文字和短语有多个意思)。 (3)消歧:H推断,T要调查Pi(理想地,Pi=P,但误解是可能的)。 (4)总合:H决定相信Pi(或者,如果超出H已经信任的底线就反对)。nullnull 图8.9中表示的实例说明通信的7个过程,包括: (1)意向。讲话者以某种方式决定一些值得向受话者讲述的东西。这经常涉及对受话者的信任和目标的推理,这样说出的话才会有预期的效果。比如对于本例,讲话者想让受话者知道无名普斯不会再活在世上了。 (2)生成。讲话者使用语言知识决定要说什么。在许多方面这比理解的逆问题(如分析和消歧)更难。生成问题还没有强调得和人工智能中的理解问题一样重要,这主要是因为人们对和机器说话感到忧虑。对于现在的例子来说,只要假设受话者能够选择“无名普斯死了”这句话就行了。 (3)综合。大多数基于语言的人工智能系统综合了屏幕上或者纸上键入的输出。语音合成已经发展得相当普及了,并且有一些系统开始为人们耳闻目睹。如图8.9所示,艾真体合成了由音标字母书写的声音字符串:"[thaxwahmpahsihzdeyd].”关键在于合成的声音不同于艾真体生成的话语。要注意,这些话语是一起进行的,这就是典型的快速口语。null(4)感知。当媒介是语音时,感知的步骤就称为语音识别。当它正在打印时,就称为光学字符识别。举个例子,假设受话者察觉到声音,并相当不错地重复讲话者的话。 (5)分析。我们把分析分为两部分:句法解释和语义解释。语义解释包括对词语含义的理解和对当前状态知识的实际解释。 词语解析是指分配语音的一部分(名词、动词等)给句子中的每个单词,并组合这些单词为短语。显示句法分析结果的一种方法就是使用解析树,如图8.9所示。一棵解析树就是其内部节点表示短语、链表示语法规则的应用、终叶节点表示文字的树。如果把节点的域定义为该节点下的所有终叶节点从左到右的表列,那么可以说一棵解析树的含义是每个有X标记的节点断定该节点的域是个X类短语。 语义解释是提取话语的含义作为用某些表示语言表达的过程。在图8.9中,显示了两个可能的语义解释:无名普斯不是活的,而且它累了(口语中就是死了的意思)。讲话的几个可能的解释是模糊的。使用逻辑作为表示语言,但其他表示语言也可以使用。实际解释是考虑当前情形的语义解释的一部分。在这个例子中,所有的实际发生都使用常量S3代替常量Now, S3即代表当前情形。null(6)消歧。大多数讲话者不是有意模糊的,但大多数话语会有几种合法的解释。因为听众描绘哪种解释可能是说话者要揭示的,所以通信就工作了。模糊首先非常依赖于不确定性推理的过程。分析生成可能的解释;如果发现了多个解释,那么消歧就选择最好的那个解释。 (7)合成。一个完全无知的艾真体可能相信它所听到的每件事情,但是一个成熟的艾真体就会处理话语W和所提取的解释P、,与其他证据一起作为赞成或反对P、的附加证据。 只有当艾真体和下面的对象通信时,才感到使用语言: (a)理解一个共同语言; (b)有一个共享上下文的会话基础; (c)至少有些理性。 当艾真体完全不合理时,通信就不会工作,因为无法预测一个不合理的艾真体将对交谈做出何种反应。当艾真体不协作时,通信还可以工作。即使相信另一个无名普斯世界探索者引导你进入歧途以便它独贪金子,你仍然可以进行通信,以相互帮助而杀死无名普斯,或者执行其他有助于所有艾真体的任务。8.4.2艾真体通信的类型和方式8.4.2艾真体通信的类型和方式1.艾真体通信的类型 考虑以两种方式进行通信的艾真体。其一是分享一个共同内部表示语言的艾真体,它们无须任何外部语言就能通信。其二就是无须作出内部语言假设的艾真体,它们以共享英语子集作为通信语言。 (1)使用TELL和ASK通信 这种通信形式的艾真体分享相同的内部表示语言,并通过界面TELL和ASK直接访问相互的知识库。也就是说,艾真体A可以使用TELL(KBB,“P")通信把提议P传到艾真体B,就如A会使用TELL(KBA , "P")把P加到自己的知识库。相似地,艾真体A可以使用ASK (KBB ,"Q")查出B是否知道Qo我们称之为灵感通信(telepathic communication)。图8.10表示两个共享内部语言的艾真体使用TELL和ASK界面并借助知识库相互直接通信的略图,其中每个艾真体除了具有感知和行为端口之外,还有一个到知识库的输入输出端口。nullnull 人类缺乏灵感能力,因此不能使用这种通信。但是使用相同的内部表示语言对一群机器人编程并给它们装备无线电或者红外线,把内部表示直接转送给相互的知识库则是可行的。如果艾真体A想要告诉艾真体B在位置[2,3]有一个坑,A就不得不执行: TELL(KBB,“Pit(PA1)At(PA1,[2,3],SA9)”) 其中SA9就是当前状况,而PA1就是艾真体对坑的表示。对于这个工作,该艾真体不仅要认可其内部表示语言格式,还要认可大量符号。有些符号是静态的,具有固定的标记,易于提前认可。如例子中就是谓词At和Pit,表示艾真体的常量A和B以及位置的编号方案。null 另一些符号是动态的,在艾真体开始探索这个世界之后就可以创建这些符号。实例包括表示一个坑的常量PA1和表示当前状况的SA9。难点就在于这些动态符号的同步使用。这里给出三个难点: (a)必须有一个命名策略,使得A和B不会同时引用相同的符号来表示不同的事物。每个艾真体都把自己的名称作为引用的每个符号标示的一部分。 (b)必须有一些不同的艾真体引用相关符号的方法,以便一个艾真体能告诉PA1和PB2是否标识相同的坑。 (C)最后的难点就在于协调不同艾真体的知识库之间的差别。 描述灵感通信的另一个问题是它们易于遭到破坏。另一个艾真体可以说谎,以直接进入知识库,并让天真的灵感艾真体轻信任何事情。null(2)使用形式语言通信 由于破坏问题以及每个艾真体不可能有相同的内部语言,大多数艾真体的通信是通过语言而不是通过直接访问知识库而实现的。图8.11表示这种通信的略图。有的艾真体可以执行表示语言的行为,而其他艾真体可以感知这些语言。外部通信语言可以与内部表示语言不同,并且这些艾真体中的每一个都可以有不同的内部语言。只要每个艾真体能够可靠地从外部语言映射到自己的内部语言,它们就根本无须同意任何内部符号。 外部通信语言带来生成和分析的问题,自然语言处理(NLP)的大部分努力都进入了设计这两个过程的算法阶段。但是语言通信最难的部分仍然是前面提到的问题:协调不同艾真体的知识库之间的差别。艾真体A说什么、艾真体B如何解释A的陈述关键取决于A和B已经相信什么(包括它们相信哪些相互的信念)。这就意味着,具有相同的内部和外部语言的那些艾真体将更易于生成和分析。但是它们仍会发现,决定相互之间要说什么也是一种挑战。nullnull2.艾真体通信的方式 艾真体之间的通信和协作,是实现多艾真体系统问题求解所必需的。协作应当按照相应的策略和协议进行。通信可分为黑板系统和消息对话系统两种方式。 (1)黑板结构方式 黑板系统采用合适的结构支持分布式问题求解。在多艾真体系统中,黑板提供公共工作区,艾真体可以交换信息、数据和知识。首先,某个艾真体在黑板上写入信息项,然后,该信息项可为系统中的其他艾真体所用。各艾真体可以在任何时候访问黑板,查询是否有新的信息。可采用过滤器提取当前工作需要的信息。各艾真体在黑板系统中不进行直接通信。每个艾真体独立完成各自求解的子问题。 黑板结构可用于任务共享系统和结果共享系统。如果黑板中的艾真体很多,那么黑板中的数据就会剧增。各个艾真体在访问黑板时,需要从大量信息中搜索并提取感兴趣的信息。为进行优化处理,黑板应为各艾真体提供不同的区域。null(2)消息/对话通信 消息/对话通信是实现灵活和复杂的协调策略的基础。各艾真体使用规定的协议相互交换信息,用于建立通信和协调机制。 在面向消息的多艾真体系统中,发送艾真体把特定消息传送至另一艾真体(接收艾真体)。与黑板系统不同,两艾真体之间的消息是直接交换的,执行中没有缓冲。如果不是发送给该艾真体的话,那么它就不能读该条消息。一般地,发送艾真体要为特定消息指定惟一的地址,然后只有该地址的艾真体才能读该条消息。为了支持协作策略,通信协议必须明确规定通信过程和消息格式,并选择通信语言。交换知识是特别重要的,所有相关艾真体必须知道通信语言的语义。8.4.3交谈的规划与实现8.4.3交谈的规划与实现 当一个艾真体采取某一动作以影响另一艾真体的认知结构时,就可以说该艾真体已参与了一个通信行为。 艾真体可以通过两种方法有意地影响另一艾真体的行为或动作。其一,如果艾真体甲知道艾真体乙如何对其环境的变化做出反应,那么艾真体甲就可以通过改变环境来达到所需效果。其二,艾真体甲可以力图改变艾真体乙的目标、知识(或信念)或动作选择机制,这可以通过把这些目标、知识或动作选择机制直接“写”在艾真体乙的认知结构中来实现。艾真体甲能够用这种方法与艾真体乙通信,使后者改变其信念和目标。通信媒体将借助于艾真体的传感和感知装置,包括“写”(基于艾真体的视觉能力)、“听”(基于艾真体的听觉能力)或者“广播”(基于艾真体的电磁接收能力)等设备。null 人类之间的交谈往往涉及说话时采用的语言。语言学家把各种交流行为称为交谈。交谈具有不同的物理形式:一个动作序列(如手势语言中)、一个字符串(文本中)、一个声音扰动(尖叫和讲话)或闪光等信号。这些交谈的表现都称为言语表达。 交谈理论是艾真体通信的理论基础,它是由英国语言学家奥斯汀(Austin)于1962年提出来的,并于后来得到发展。交谈理论认为:通信语言也是一种动作,它们与物理上的动作一样。讲话者说话是要改变世界状态,通常是改变受话者的某种心智状态。通信语言并非一定能够达到预期的目的,因为每个艾真体都有自身控制权,不一定按讲话者的要求做出响应。 对话理论研究集中在如何划分对话的类型上。在艾真体通信语言研究中,对话理论主要用于考虑艾真体之间交互信息的类型。一般把对话分为表示型(representative)和指示型(directive)两类,前者如通信、宣言和致谢等,后者如询问、命令和请求等;还可以把对话进一步细分成更多的类型。null1.交谈的规划 能够像处理艾真体的其他动作一样对待交谈。艾真体能够使用一个规划产生系统制订由言语行为和其他动作构成的计划。为此,需要一个描述这些动作效果的模型。例如,考虑一个表示型交谈TELL(,),它表示该艾真体告知另一艾真体:是真的。使用STRIPS规划,可对该动作的效果建立模型: TELL(,) PC: Next_to() ~K(,) D:~K(∂,) A:K(,) 其中,前提 Next_to()确保该艾真体足够接近艾真体,以便进行可靠的通信;前提确保该艾真体在告知另一艾真体事实之前真正相信该事实;前提~K(, )保证该艾真体不会传递多余信息,只传递艾真体知道事实这一信息。假定对于情况On(A,B)On(B, C)On(C, F1),该艾真体的目标为积木世界On(B,F1)。还假设无论何时,积木B在积木C上,而且B上方为空,艾真体A1把B移到地板F1上。根据STRIPS规划和前述TELL规则,可构造艾真体的规划如下: {Move(A,B,F1),TELL(A1,Clear(B)On(B,C))}null2.交谈的实现 通过讲话实现交谈。通信动作,如TELL(,),是如何像讲话双方之间的交谈一样从讲话者传输至受话者的呢?有两种可能性:其一是从讲话者到受话者的某个逻辑公式的直接传输;其二,受话者把讲话者所讲的一些符号串翻译为它的认知结构。 如果交谈双方共享同类的基于特征的世界模型,使用相同符号的逻辑公式,那么该交谈就可以通过传输一个逻辑公式来实现。例如,交谈TELL(A1,Clear (B)On(B,C))就能通过艾真体A1发送公式Clear(B)  On(B,C)和一种有代表性的表示来实现。值得指出的是,在这样操作时要假定公式Clear(B)On(B,C)对艾真体A1与对原有的艾真体表达相同的意思。在对所有艾真体构建和编程时,相同的基于知识表示的词汇,其假设对一些所关心的状况却是令人非常难以置信的。即使两个艾真体的知识表示词汇和模型在开始时是相同的,如果遇上一些新的对象,那么这些艾真体几乎不可能给这些对象相同的内部名字。即使这些艾真体能够创造新的谓词,按照更本原的方式定义这些谓词,这些等价的谓词也可能有不同的符号。正是由于原有的艾真体要对另一艾真体采取有意姿态,其他艾真体才不能用逻辑公式对其世界模型进行编码。null 语言来进行。通过设计、使用和指导,通信艾真体知道在这种通用语言下传输的符号串是如何改变其他艾真体的认知结构的。 使用基于符号串的语言预示了两个可能的问题解决方案。其一,给定某个交谈,如何生成一个符号串;其二,如何把一个符号串译成对认知结构的作用。尽管鼓励人们在人工艾真体中使用符号串作为通信媒介,然而自然语言的机器(自动)生成和理解却是独立地进行研究的。通信使用的符号串,其生成和理解主要在自然语言领域内研究。所以,对艾真体间通过符号串的通信,也主要集中在类似自然语言(如英语、汉语等)句子的讲话上来处理。8.4.4艾真体的通信语言8.4.4艾真体的通信语言 下面简介两种国际上比较广泛使用的艾真体通信语言,即KQML语言和KIF语言。 KQML(Knowledge Query and Manipulation Language)和KIF(Knowledge Interchange Format)是美国高级研究计划局(ARPA)的“知识共享计划”中所提出的两种相关通信语言,可把它们分别译为“知识询问与操作语言”和“知识交换语言”。这两种语言是目前国际上最流行的艾真体通信语言。KIF的语法基本上类似于用LISP语法书写的一阶谓词演算。null1.知识询问与操作语言(KQML) KQML定义了一种艾真体间传递信息的标准语法以及一些动作表达式。这些行为主要是从对话理论中演绎出来的,如TELL, PERFORM, REPLY等。1997年KQML有了新的版本和规范。KQML规定的消息格式和消息传送系统为多艾真体系统的通信和协作提供了一种通用框架,特别是提供了一套识别、建立连接和交换消息的协议。 KQML分为三个层次:通信、消息和内容。通信层规定全部技术通信参数协议,消息层规定与消息有关的言语行为的类型,内容层规定消息内容。 KQML消息也称为动作表达式。一种动作表达式是以ASCII美国信息交换标准码字符串来定义的。本句法限制在ASCII码Common Lisp通用前缀表示法范围之内。该ASCII码字符串Lisp列表表示的可读性好,程序简单,易于编译,并可在许多应用程序消息平台间移植。不过,还找不到一种对所有的消息应用界面都既方便又有效的消息句法。 null 与Lisp函数调用不同的是,动作表达式参数被关键字索引,因此次序是独立的。这些关键字称为参数名,后面跟着一个冒号(:),然后必须给出相应的参数值。由于动作表达式具有大量的可选参数,所以动作表达式参数是通过关键字而不是通过它们的位置来识别的。 按照KQML规范,设计了一种艾真体通信语言SACL (Software Agent Communication Language),即软件艾真体通信语言。该语言用于MAPE环境,作为消息传递。null2.知识交换语言(KIF) 智能物理艾真体基金FIPA(Foundation for Intelligent Physical Agents)是一个非赢利协会。它的目的是为了促进基于艾真体的应用、服务和设备的成功实现。FIPA通过制定能够及时获得国际承认的规范来达到这一目标。这种规范可以最大限度地增大基于艾真体的应用、服务和设备的互操作性。 FIPA97规范定义了一种语言和支持工具,如协议,用于智能软件艾真体的相互通信。软件艾真体技术对这类艾真体采用了一种高层的观点,它的许多思想都来源于采用其他方式的社会交互作用,例如人与人之间的通信、本规范并非试图定义通常与分布式软件系统之间通信相关的低层和中间层的服务,例如网络协议、传输服务等。 null 对于软件艾真体没有单一的、通用的定义,但是艾真体行为的一些特性是广泛接受的。FIPA定义的通信语言用于支持和促进这些行为。这些特性包括目标驱动行为、自主决定动作过程、通过协商和委托进行对话、心智状态模型(BID等)以及对环境的需求和适应等。 FIPA定义了独有的消息类型,尤其是消息的格式和类型的定义。消息类型对本规范定义的语法法则是个参考,对整个消息动作和消息内容都赋予了一定的意义。ACL(艾真体通信语言)中消息的基本观点是把消息表示为一个通信动作。在对话中,处理通信动作应与处理其他动作相一致。ACL规范提出的通信语言是基于一种精确的形式语义学,这给通信动作一种清晰的含意。所有艾真体都能使用预先定义的消息类型和协议,但并不需要执行所有消息。8.5多艾真体系统8.5多艾真体系统 至今所研究的艾真体都是单个艾真体在一个与它的能力和目标相适应的环境中的反应和行为。通过适当的艾真体反应能够影响其他艾真体的作用。每个艾真体能够预测其他艾真体的作用,在其目标服务中影响其他艾真体的动作。为了实现这种预测,需要研究一个艾真体对另一个艾真体的建模方法。为了影响另一个艾真体,需要建立艾真体间的通信方法。多个艾真体组成一个松散祸合又协作共事的系统,即一个多艾真体系统。在本章开始时曾经指出,多艾真体系统研究如何在一群自主的艾真体间进行智能行为协调。在前面讨论艾真体的特性时,实际上也是指多艾真体系统所具有的特性,如交互性、社会性、协作性、适应性和分布性等。此外,多艾真体系统还具有如下特点:数据分布或分散,计算过程异步、并发或并行,每个艾真体具有不完全的信息和问题求解能力,不存在全局控制。8.5.1多艾真体系统的模型和结构8.5.1多艾真体系统的模型和结构1.多艾真体的基本模型 在多艾真体系统的研究过程中,适应不同的应用环境而从不同的角度提出了多种类型的多艾真体模型,包括理性艾真体的BDI模型、协商模型、协作规划模型和自协调模型等。 (1)BDI模型 这是一个概念和逻辑上的理论模型,它渗透在其他模型中,成为研究艾真体理性和推理机制的基础。在把BDI模型扩展至多艾真体系统的研究时,提出了联合意图、社会承诺、合理行为等描述艾真体行为的形式化定义。联合意图为艾真体建立复杂动态环境下的协作框架,对共同目标和共同承诺进行描述。当所有艾真体都同意这个目标时,就一起承诺去实现该目标。联合承诺用以描述合作推理和协商。社会承诺给出了社会承诺机制。null(2)协商模型 协商思想产生于经济活动理论,它主要用于资源竞争、任务分配和冲突消解等问题。多艾真体的协作行为一般是通过协商而产生的。虽然各个艾真体的行动目标是要使自身效用最大化,然而在完成全局目标时,就需要各艾真体在全局上建立一致的目标。对于资源缺乏的多艾真体动态环境,任务分解、任务分配、任务监督和任务评价就是一种必要的协商策略。合同网协议是协商模型的典型代表,主要解决任务分配、资源冲突和知识冲突等问题。 (3)协作规划模型 多艾真体系统的规划模型主要用于制订其协调一致的问题求解规划。每个艾真体都具有自己的求解目标,考虑其他艾真体的行动与约束,并进行独立规划(部分规划)。网络节点上的部分规划可以用通信方式来协调所有节点,达到所有艾真体都接受的全局规划。部分全局规划允许各艾真体动态合作。艾真体的相互作用以通信规划和目标的形式抽象地表达,以通信元语描述规划目标,相互告知对方有关自己的期望行为,利用规划信息调节自身的局部规划,达到共同目标。另一种协作规划模型为共享规划模型,它把不同心智状态下的期望定义为一个公理集合,指挥群体成员采取行动以完成所分配的任务。 null(4)自协调模型 该模型是为适应复杂控制系统的动态实时控制和优化而提出来的。自协调模型随环境变化自适应地调整行为,是建立在开放和动态环境下的多艾真体系统模型。该模型的动态特性表现在系统组织结构的分解重组和多艾真体系统内部的自主协调等方面。null2.多艾真体系统的体系结构 多艾真体系统的体系结构影响着单个艾真体内部的协作智能的存在,其结构选择影响着系统的异步性、一致性、自主性和自适应性的程度,并决定信息的存储方式、共享方式和通信方式。体系结构中必须有共同的通信协议或传递机制。对于特定的应用,应选择
本文档为【第八章 Agent(艾真体)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_181941
暂无简介~
格式:ppt
大小:378KB
软件:PowerPoint
页数:0
分类:互联网
上传时间:2010-10-30
浏览量:20