从图像工程角度,可将树木图像理解分为图像描述和图像认知两个层次。前者包括提取特征、度量特征之间的相似性计算等图像处理和分析内容,而后者包括学习和推理。由于后者更接近“理解”的真实含义,且通常在前者基础上进行逻辑推理判断,因此不对二者做区分,仅认为前者是后者的必要组成部分。
树木图像理解的主要内容是由机器回答图像中关于树木的“这是什么”“何种状态”“空间关系”三大类问题。
基于人类的知识体系,机器对图像(含视频)中树木的种类、大小、空间格局,以及树木的营养、水分、病虫危害程度等信息的主动获知过程。
从图像工程角度,可将树木图像理解分为图像描述和图像认知两个层次。前者包括提取特征、度量特征之间的相似性计算等图像处理和分析内容,而后者包括学习和推理。由于后者更接近“理解”的真实含义,且通常在前者基础上进行逻辑推理判断,因此不对二者做区分,仅认为前者是后者的必要组成部分。
树木图像理解的主要内容是由机器回答图像中关于树木的“这是什么”“何种状态”“空间关系”三大类问题。
这是树木图像理解最基本的问题,根据图像识别出其所代表的树木或植物种类,进一步回答这是树木的什么器官。识别用的图像可能是树木全体图像,也可能是部分器官图像,最高目标是基于最少的图像内容或最低的图像分辨率准确识别出树木。
识别出图像中树木的生长状态如何?营养状态怎样?是否受病虫害困扰?如果受病虫害危害,进一步回答病虫害种类及其危害程度。这部分内容要求机器判断树木当前“需求什么”,是最具“经营价值”的信息,也是指导和规划机器或经营者执行下一步操作的“因”。
包括树木的直径、树高、冠幅等个体大小信息,也包括树木在客观场景中的相对空间位置或竞争关系。从被动图像理解角度,这部分内容需要图像对,是基于特定的摄像机模型来完成预测;从主动图像理解角度,如果在成像过程中使用特定光源或增加额外信息,则单张图像也可实现理解。
树木图像理解属于图像理解,是图像理解在林学领域的一个分支。图像理解的历史可以追溯到人们掌握成像技术开始摄影的年代,人们在拿到图像后希望了解图像中表露或隐藏的信息,这是图像理解的原始想法。但此时受到图像获取的限制,同时计算机也没有产生,理解图像仅仅是人自身根据既有知识来判断图像的内涵,不需要借助额外工具。因此,此时的图像理解还不是现代意义上的图像理解。
随着计算机的产生,特别是进入21世纪以来,随着大规模集成电路的快速发展以及照相机的普及,人们希望有一种智能机器能自主完成对采集图像的分析判断,甚至得到更为深层的信息,以机器替代专业技师应用于实际工作中。此时,解释图像的主体由人转变为机器,真正进入图像理解时代。只有让机器能自主解释图像,才能促进机器视觉的真正发展。
图像理解是具有发展前景的一个热点研究方向,在工业自动化生产线、医学、军事、交通等领域都已得到成功的应用。但是,这一方向才刚刚起步,有众多理论、技术有待突破,尤其是树木图像受风、光、雨、霾、季节等因素的显著影响,具备自然属性,其理解算法等有很多困难需要攻克。
应用决定发展,树木图像理解的主要应用领域至少有三个:一是为林业智能机器提供视觉信息支撑;二是改变专业技师到现场的工作模式,由机器辨析林业现场传回图像所携带的重要信息并指导林业生产经营;三是实时抽取传回图像中树木指代的客观信息为大数据应用提供解决策略。这些应用构成了树木图像理解这一研究方向发展的原始驱动力。图像理解涉及的内容非常广泛,对树木图像理解而言,回答图像中树木“这是什么”“何种状态”“空间关系”三大问题是其未来的基本发展方向。