卡雷尔CEO 尹利

双目视觉即深度视觉,以目前的技术搭配雷达可以更好的应用在服务机器人身上。

机器视觉也分种类,像工业机器手采用机器视觉可以定位抓取,工业上用的机器视觉大部分依赖外企产品。

但在双目视觉上,国内与国外企业在技术上差距不大,准确的说是各有差异。

双目视觉可以做到三维空间建模、物体的识别与扫描重建,配合机器手臂还可以做抓取物体。

北京卡雷尔机器人技术有限公司(以下简称:卡雷尔)CEO尹利说:“机器视觉是服务机器人进入家庭的一个关键之一,机器人要识别物体,以及抓取东西,必须要用到机器视觉。”

只有具备视觉能力的机器人,应用到家庭,才能真正的帮助到我们。

1号机器人网记者:你们公司目前主要的业务是哪几块?顺便介绍一下你们的双目视觉系统?

尹利:我们现在主要是为企业做定制方案,主要是围绕运动控制、导航、路径规划、感知、雷达和视觉系统,为机器人厂商提供解决方案。

关于机器视觉,我们主要是提供双目视觉,即深度视觉。可以应用在服务机器人身上。

机器人有几个阶段,现在是靠雷达自主定位和导航,到了后面机器视觉肯定是少不了,机器人只要装载手臂,就一定会需要视觉,因为要靠视觉去识别与定位抓取物体。

目前的服务机器人基本上都是采用雷达应用,如果结合机器视觉双目镜头使用,效率会更高。

卡雷尔经过三年的研发,我们采用双目的技术,解决了机器人的视觉问题。我们的双目视觉叫智能双目视觉系统,它是一个产品,也是一个独立的系统,每个感光系统都是单独一块的,但是它又可以与主控做衔接。

如果企业要使用我们的产品,我们只要提供一个接口,根据我们的通讯协议,机器人企业就可以使用了。比如:你想找一个杯子,只要给它发指令,它就会找的到。

1号机器人网记者:你们的机器视觉产品有哪些特点?你们的产品优势体现在哪里?

尹利:这个要从我们卡雷尔做双目视觉的初衷出发,双目视觉对服务机器人而言是一个刚性需求,它包括:空间建模、定位导航,未来还可以应用在机器人手臂去做定位抓取。

我们的双目视觉系统是一个独立的系统,比如:企业要用我们的系统,就要用我们的通讯协议,直接与他通讯就可以了,不需要你去把图像传过来,再去做一些处理。

我们的系统基本上集合很多技术,基础的图像处理是采用硬件加速,像物体的识别与测距,基本上都可以实现。客户只需根据场景去做,把场景研究深入了,你会发现机器人的一些技术,到一定程度就足够使用了。

其次,我们采用了硬件加速,硬件加速生产可以降低成本。

目前市面上已有不少做双目视觉的企业,但在技术上存在一些不同,比如:以色列的一些做双目视觉的企业做的挺不错,但他们是用红外,红外到了室外,阳光越强烈,就越糟糕。

我们是用摄像头去做,算是真正的视觉,我们的优势就是图像传输快,视觉更广。在阳光下我们也没有问题,哪怕是晚上,只要做一些调整也可以使用。

1号机器人网记者:你本人在视觉领域做了多久了,在卡雷尔你们是如何分工的?

尹利:我工作近20年,所以经验是很丰富的。2000年的时候我在集成一个操作系统,所以我对系统内核方面有非常深的理解。

其次在中建,一家大型国企,做集团硬件虚拟化的结合,那时候云计算在中国还不是很流行。

之后进入博彩行业,利用大数据分析,做一些风险控制的分析。

现在我们创立了卡雷尔,我本人负责整机的架构设计,我在架构设计上也做了很多年。

双目视觉方面是有我们的技术负责人专门去做,然后加速部分是我们的另外一个工程师去做的。在卡雷尔我们的分工是很明确的。

1号机器人网记者:机器人搭载机器视觉,它可以做哪些事情?

尹利:目前双目视觉可以做到三维空间建模、物体的识别与扫描重建,配合机器手臂还可以做抓取物体。

比如:三维空间,主要是配合机器人行走,在行走的过程中,它可以感知周围的物体以及与物体间的距离大小,以应用的数据结构,来描述整个空间。

比如说,我们要让机器人主动去找物体,这里分两个阶段,第一个阶段,它要移动到物体附近,还需要一个空间深度感知去感应物体在哪里,它找到后,再用机器手臂去进行抓取物体;第二个阶段,机器手与物体的距离,再识别是什么物体,这些都需要让机器人去认识,才能进行抓取。

这整个过程都要用到机器视觉。

当然以目前的机器视觉技术搭配其他技术,可以更好应用。比如机器视觉+雷达可以达到更好的效果。

1号机器人网记者:你们的双目视觉系统,目前可以识别哪些物体?

尹利:这个要看识别的距离和摄像头的分辨率了。

从理论上讲,只要有足够的计算量和足够的时间,它是可以识别任何物体的,当然以现阶段的技术,多少都会有些误差。

目前机器人搭载我们的双目识别系统,在行走的过程中,像鞋子、鼠标等都是可以识别的。

如果你想让机器人识别更多物体,前提是你要给它更多物体的特征点,前期需要通过一些训练,这样才能达到更准确的识别效果。

1号机器人网记者:你认为机器视觉是服务机器人身上一个必备的部件吗?其他技术能否代替机器视觉?

尹利:我认为视觉系统是服务机器人走进家庭的一个关键,让机器人真正服务于我们。

机器人能行走,还不能达到目的,它还需要能抓取东西,以及识别东西。

比如让机器人去倒一杯水,它需要走到水壶旁边,要能识别水壶和杯子,以及怎么倒水。要完成这些步骤,如果没有机器视觉,那是很难的。

至少我没有想到其他的好办法,除非是你的水壶精确的告诉我们位置以及形状。

1号机器人网记者:现在机器视觉技术的难点是在哪块?

尹利:现在机器视觉的技术难点可以分几块分析:

第一个是图像获取,它涉及到被测的物体,可视化的图像,以内在的转化,怎么被机器人所理解,这里面包括很多技术,包括光线程度、图像确定等,这些都影响获取的信息。在这一块上,国内也没有一些好的方案去解决。

第二个是图像的处理和分析,这个算法很多,图像的增强、编码传输等很多技术在里面,因为方案太多,所以各家的技术各异,主要还是针对不同的场景做一些优化。

另外在物体运动的过程中,物体的运动速度影响图像的抓取也是一个问题。以及算法、分辨率等都是影响视觉的因素。

总之,研究的越深入,技术难点就越多,现在只能通过一些手段去折中。

现在很多厂家都有不同方法去做,有不同的策略,其实目前没有一种方法,可以适用所有场景,只能通过特定的场景去做特定的优化。

1号机器人网记者:在你看来,国内与国外在机器视觉上的技术差距有多大?

尹利:其实真要比的话,顶端的东西国内外都有。国外视觉做的好的企业,它是几十家,这几十家都做的挺好,水平都差不多,但国内就个别几家,其他家都做的非常差。

对于国内外顶尖的企业,国内国外企业在视觉技术上差距不大,但国内企业在品牌和知识产权上要弱很多。

另外就是在硬件上,我们差距很大,毕竟核心部件基本上依赖进口。

1号机器人网记者:根据你的判断,你觉得未来的机器视觉可以做到什么程度?可否描述一下未来场景?这场景还需要多久能实现?

尹利:未来机器视觉能做到于人眼一样的效果,随着我们硬件的升级,计算能力的加强,理论上他可以达到我们理想中的效果。

就像人类的眼睛一样去观看整个世界,当然这情景还需要非常长的时间才能实现。

目前的技术发展越来越快,每2-3年就会有一个质的突破,所以在技术上翻新很快,我觉得差不多10年左右,机器视觉可以达到人眼的级别。

1号机器人网记者:国内机器视觉的市场前景如何?根据你的了解可否详细讲几点?

尹利:首先,机器视觉可以促进服务机器人产业的发展,让机器人在多种场合可以应用。

其次,机器视觉是模拟人的一个视觉,它对信息的获取、处理,作为一个智能化基础的一个手段,未来对机器视觉的应用将会越来越多。

目前市面上机器视觉产品也越来越多,随着技术的提高,国内视觉产品将会有低端走向高端,皆时应用领域会更广。

总的来说,未来针对机器视觉产品的应用会越来越广,所以市场前景是很大的。

1号机器人网记者:最后一个问题,描述一下你们未来三年的发展规划?

尹利:卡雷尔对机器人的理解是平台加应用的概念。

未来三年我们的主要精力是打造一个持续稳定的二次开发平台。比如:你是业务型的企业,或者是一个系统集成商,只要把业务搬到集成平台上来,我们会给你提供一个二次开发平台。

这个平台就是一个技术集成,包含:雷达、视觉、导航、自主移动、定位等等所有与机器人相关的技术,只要提供接口就可以供企业使用,这将是未来三年我们重点打造的平台项目