20世纪60~70年代,由于基于符号表示和逻辑推理的传统机器人学研究进展缓慢,许多研究人员试图从生物学的角度来研究动物智能的模式。80年代中后期R.布鲁克斯(Rodney Brooks,1954~ )提出了第一个基于行为的机器人控制体系结构—包容(Subsumption),并在随后的一系列文章中阐述了基于行为的机器人学的主要思想,并把行为学引入机器人研究领域。经过20多年的发展,基于行为的控制方法以其简单、实用、易于实现等优点迅速成为机器人研究的热点。至今,在机器人导航、机械臂控制、人机交互、多机器人协调等许多领域得到了成功应用。
与基于符号的机器人学相比,基于行为的机器人学反对抽象的定义,更适合采用场景化、具体化的解释方式。基于行为的机器人学的重要研究内容是系统结构而不是算法。基于行为的机器人在非结构化动态环境中的性能非常优越,主要表现在如下方面:①在动态复杂环境中机器人的移动速度很快。②机器人可以迅速适应变化的内外部约束。③机器人具有高鲁棒性,可以承受局部损坏。④软件代码可以是传统的几百分之一,硬件可以是传统的几十分之一,使其具有高效性。⑤操作简单。⑥系统具有可扩展性,在较少改变原有系统的基础上,可增加其性能。⑦此类机器人采用分布式自组织并行工作,可靠性强。
在基于行为的机器人学中,机器人的控制系统由一系列的行为构成。行为是用来完成特定任务的控制单元。每个行为根据所需完成的任务进行相应的感知,并输出本行为的控制命令,因此行为也可看作是从传感器输入到执行器输出的传递函数。机器人对外部环境的总体反应通过多个行为之间的交互来实现。因此对于机器人行为规划而言,交互作用是机器人学理论研究的重点。它直接影响行为的分析与综合,以及需不需要相应的内部表达和学习。
对于机器人行为规划而言,为了协调机器人能够产生合理、连贯并能体现出智能的行为,要求机器人建立高效的行为选择机制。行为选择机制按照行为之间的相互关系,可分为竞争型选择机制和合作型选择机制;按照是否具有适应变化的能力,可分为自适应选择机制和非自适应选择机制;按照是否具有专门的选择模块,可分为隐性选择机制和显性选择机制。以第一类分类来说,常用的几种基本行为选择机制中,竞争型的有基于优先级的方法、梅斯(Maes)方法、概率方法;合作型的有运动意图叠加方法、模糊融合方法、多目标优化法等方法。
当前,机器人行为选择机制的研究方向不满足于简单的环境作业。要求机器人具有自主学习的能力,并可以在动态环境和复杂环境中进行自主行为规划。此外还可以进行多机器人协作模式,更好地完成作业任务。