机器视觉识别技术的现状和未来
机器视觉识别的初级阶段
在这个初始阶段,用户主要是借助机器视觉识别技术来满足某些娱乐化需求。如百度研发的图片搜索可以找到相似的图片;Facebook研发根据相片进行人脸匹配的DeepFace;IQ Engine开发的Glow可以通过机器视觉识别自动生成照片的标签以帮助用户管理手机上的照片。
这个阶段还有一个非常重要的细分领域——OCR(Optical Character Recognition,光学字符识别),是指光学设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别的方法将图像形状翻译成计算机文字的过程,就是计算机对文字的阅读。
在这个阶段,机器视觉识别技术仅作为辅助工具存在,为人类视觉提供了强有力的辅助和增强,带给了我们一种全新的与外部世界进行交互的方式,如将人脸识别作为主要的身份认证方式等。这个过程就可以简化为:人眼借助机器捕捉目标信息、机器和互联网直接对信息进行分析并返回结果。
机器视觉识别的高级阶段
目前的机器视觉识别技术是作为一个工具来帮助我们与外部世界进行交互,只提供辅助作用,所有的行动还需我们自己完成。而当机器真正具有了视觉之后,机器不仅可以对外部信息进行获取和分析,还完全有可能代替我们去完成这些行动。
机器视觉之于人工智能的意义就是视觉之于人类的意义,而决定着机器视觉的就是机器视觉识别技术。在某些应用场景,机器视觉比人类的生理视觉更具优势,更加的准确、客观和稳定。人类视觉有着天然的局限,似乎能详细生动的感知整个视觉场景,但这是一个错觉,只有投射到眼球中心的视觉场景的中间部分,我们才能详细而色彩鲜明的看清楚。
机器在这方面就有着更多的优势,它们能够发现和记录视力所及范围内发生的所有事情。拿视频监控来说,传统监控需要有人在电视墙前时刻保持高度警惕,然后再通过自己对视频的判断来得出结论,但往往会因为人的疲劳、视觉局限和注意力分散等原因影响监控效果。但有了成熟的机器视觉识别技术之后,计算机就可以自行对视频进行分析和判断,发现异常情况直接报警,带来了更高的效率和准确度。
版权所有:江苏和讯自动化设备有限公司所有 备案号:苏ICP备2022010314号-1
技术支持: 易动力网络