随着计算机科学和自动控制技术的发展,越来越多的不同种类的智能机器人出现在生产生活中,视觉系统作为智能机器人系统中一个重要的子系统,也越来越受到人们的重视。
视觉系统是一个非常复杂的系统,它既要做到图像的准确采集还要做到对外界变化反应的实时性,同时还需要对外界运动的目标进行实时跟踪。因此,视觉系统对硬件和软件系统都提出了较高的要求。目前比较流行的足球机器人技术,它的视觉系统属于比较典型的快速识别和反应类型。
机器视觉系统是指用计算机来实现人的视觉功能,也就是用计算机来实现对客观的三维世界的识别。人类视觉系统的感受部分是视网膜,它是一个三维采样系统。三维物体的可见部分投影到网膜上,人们按照投影到视网膜上的二维的像来对该物体进行三维理解(对被观察对象的形状、尺寸、离开观察点的距离、质地和运动特征等的理解)。
机器视觉系统的输入装置可以是摄像机、转鼓等,它们都把三维的影像作为输入源,即输入计算机的就是三维管观世界的二维投影。如果把三维客观世界到二维投影像看作是一种正变换的话,则机器视觉系统所要做的是从这种二维投影图像到三维客观世界的逆变换,也就是根据这种二维投影图像去重建三维的客观世界。
机器视觉系统主要由三部分组成:图像的获取、图像的处理和分析、输出或显示。图像的获取实际上是将被测物体的可视化图像和内在特征转换成能被计算机处理的一系列数据,它主要由三部分组成:照明,图像聚焦形成,图像确定和形成摄像机输出信号。视觉信息的处理技术主要依赖于图像处理方法,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。
机器人视觉系统主要是利用颜色、形状等信息来识别环境目标。以机器人对颜色的识别为例:当摄像头获得彩色图像以后,机器人上的嵌入计算机系统将模拟视频信号数字化,将像素根据颜色分成两部分:感兴趣的像素(搜索的目标颜色)和不感兴趣的像素(背景颜色)。然后,对这些感兴趣的像素进行RGB 颜色分量的匹配。为了减少环境光强度的影响,可把RGB颜色域空间转化到HIS颜色空间。
在足球机器人的彩色视觉系统中,程序是根据贴在机器人小车顶上的色标来识别机器人是属于哪一队,以及是几号队员的。由于在每个机器人小车顶上有两种颜色的色标,分别是队标和队员标。因此,识别工作的第一步是把图像中的每一个像素,根据颜色分类到一组离散的色彩类中。
颜色分类常用的方法有线性色彩阈值法、最近邻域法和阈值向量法等。
其中,线性色彩阈值法是用线性平面把色彩空间分割开来,其阈值的确定可采用直接取阈值和通过自动训练来获取目标颜色范围等方法,也可以采用神经网络和多参数决策树方法来进行自学习,以获得合适的阈值;而用最近邻域分类法分割图像时,则利用隶属度函数,即根据最大的隶属度来判断这个颜色属于哪个类;阈值向量法是先使用一组事先确定的阈值向量来把色彩值在色彩空间中的位置来判断其属于哪种颜色。
在色彩分类之后,必须对各个颜色类的点进行处理,最终辨识出场上的各个敌我队员和球在场上的位置和方向角。识别时,通常的做法是对分类后的像素进行一次扫描,即将相邻的同种颜色的像素连成色块。