计算机视觉的早期实验始于20世纪50年代,并在20世纪70年代首次在商业上用于区分打字文本和手写文本,但如今计算机视觉的应用已呈指数级增长。预计到2022年,计算机视觉和硬件市场预计将达到486亿美元。目前计算机视觉已经成为日常生活中的一部分,即使我们并不知道计算机技术的部署的时间和地点,但仍然会可能体验计算机视觉的应用。 那什么是计算机视觉,它如何工作又有哪些典型的应用?
什么是计算机视觉?
计算机视觉是人工智能的一种形式,计算机可以“看到”世界,分析视觉数据,然后从中作出决定,或者了解环境和情况。计算机视觉增长背后的驱动因素之一是我们今天生成的数据量,这些数据用于培训和改善计算机视觉。我们的世界里有无数的图像和视频,它们都来自我们移动设备的内置摄像头。但是,虽然图像可以包括照片和视频,也可以意味着来自热或红外传感器和其他来源的数据。随着大量的视觉数据(每天有超过30亿张图片在网上共享)的出现,分析数据所需的计算能力变得更加容易获得,也更加廉价。随着计算机视觉领域随着新的硬件和算法的出现而不断发展,目标识别的准确率也在不断提高。在不到十年的时间里,今天的系统已经达到99%的准确率,比人类对视觉输入的快速反应准确率提高了50%。
计算机视觉如何工作?
实现人工智能所有能力的关键组成部分之一是赋予机器视觉能力。为了模拟人类视觉,机器需要获取、处理、分析和理解图像。实现这一里程碑的巨大增长得益于神经网络的迭代学习过程。它从一个有助于机器学习特定主题的精选数据集开始。如果目标是像2012年谷歌那样识别猫的视频,神经网络使用的数据集需要有猫的图像和视频,以及没有猫的例子。每个图像都需要用元数据标记,以指示正确的答案。当一个神经网络在数据和信号中运行时,它会发现一个带有猫的图像;这是关于它是否正确的反馈,这有助于它的改进。神经网络正在使用模式识别来区分图像的许多不同部分。而不是由程序员来定义猫的特征属性,例如拥有尾巴和胡须,而是从上传的数以百万计的图像中进行学习。
计算机视觉应用的七个典型案例
想象一下人类视觉所允许的一切,你就可以开始实现几乎无穷无尽的计算机视觉应用。以下是当今生产生活中典型的七个应用案例:
自主车辆
自动驾驶汽车需要计算机视觉。特斯拉(Tesla)、宝马(BMW)、沃尔沃(Volvo)和奥迪(Audi)等汽车制造商使用多个摄像头、激光雷达、雷达和超声波传感器从环境中获取图像,这样他们的自动驾驶汽车就能探测目标、车道标记、标志和交通信号,从而安全驾驶。
谷歌翻译软件
你所需要做的就是把手机摄像头对准这些单词,让谷歌翻译应用程序几乎立刻告诉你它在你喜欢的语言中的意思。通过光学字符识别来查看图像和增强现实来叠加一个精确的翻译,这是一个使用计算机视觉的方便工具。
面部识别
中国在使用人脸识别技术方面无疑处于领先地位,他们将其用于警察工作、支付识别、机场安检,甚至在北京天坛公园分发厕纸、防止厕纸被盗,以及其他许多应用。
医疗保健
由于90%的医疗数据都是基于图像的,因此医学中的计算机视觉有很多用途。从启用新的医疗诊断方法到分析X射线,乳房X光检查和其他扫描,以及监测患者以更早发现问题并协助手术,期望我们的医疗机构,专业人员和患者将从今天的计算机视觉中受益,并且将来更多它在医疗保健领域推出。
实时运动跟踪
足球和冰球在电视体育节目中的跟踪已经很常见了一段时间,但计算机视觉还有助于比赛和策略分析、球员表现和评级,以及跟踪体育节目中品牌赞助的可见性。
农业
约翰迪尔(John Deere)在2019年国际消费电子展(CES 2019)上展示了一种半自动联合收割机,它利用人工智能和计算机视觉来分析收获时的粮食品质,并找出穿过作物的最佳路径。计算机视觉识别杂草的潜力也很大,这样除草剂就可以直接喷洒在杂草上,而不是作物上。这有望将所需除草剂的数量减少90%。
制造业
计算机视觉正以各种方式帮助制造商更安全、更智能、更有效地运行。预测性维护只是一个例子,在设备故障导致昂贵的停机之前,用计算机视觉对设备进行监控,以便进行干预。对包装和产品质量进行监控,并通过计算机视觉减少不合格品。
计算机视觉在现实世界中已经有了大量的应用,而且这项技术还很年轻。随着人类和机器继续合作,人类的劳动力将被解放出来,专注于更高价值的任务,机器的自动处理依赖于图像识别的过程。
http://www.lingxixueyun.com整理发布