如何将深度学习应用于无人机图像的目标检测

  • 时间:
  • 浏览:33

  本文为 AI 研习社编译的技术博客,原标题 :

  How to easily do Object Detection on Drone Imagery using Deep learning

  作者 | Gaurav Kaila

  翻译 | zackary、Disillusion、刘刘1126

  校对 | 酱番梨 整理 | 菠萝妹

  原文链接:

  https://medium.com/nanonets/how-we-flew-a-drone-to-monitor-construction-projects-in-africa-using-deep-learning-b792f5c9c471

  如何将深度学习应用于无人机图像的目标检测

  本文全面概述了基于深度学习的对无人机航拍图像进行物体检测的方法。我们还介绍了一个应用示例:利用无人机监测一个非洲住房项目的建设进度。

  第一部分:我们刚发布了Nano Drone APIs!

  您是否知道无人机及其相关功能将在2023年成为一项价值500亿美元的产业? 截至今天,无人机被用于农业,建筑,公共安全和安全等领域,同时也被其他领域迅速采用。随着基于深度学习的计算机视觉为这些无人机“提供动力”,行业专家们预测无人机将在以前难以想象的应用场景中被前所未有地广泛使用。

  我们将探索一些应用以及伴随着它们的挑战,这些应用基于深度学习完成了基于无人机的自动化监测。

  在最后,我们将展示一个使用Nanonets机器学习框架对非洲住房项目进行远程监测的案例。

  人们总是对从高处俯瞰世界着迷,从高耸的大楼上、从瞭望塔上、从堡垒,还征服了最高的山峰。为了能捕捉这样的瞬间并且和全世界分享,人们竭尽全力,借助梯子、高楼、风筝、气球、飞机和火箭,挑战地心引力。

  1906年,从风筝上拍摄的旧金山全景(来源:国会图书馆)

  如今,即使是普通大众也可以使用能够飞到2公里高处的无人机。这些无人机配有高分辨率的摄像头,能够捕捉高质量的图像,用于各种分析。

  农田的航拍图像

  随着无人机的普及,我们看到很多摄影师和业余爱好者的日常爱好和活动,他们使用无人机进行一些创造性项目,诸如捕捉南非的不平等现象,或者拍摄足以让伍迪艾伦(Woody Allen)都感到骄傲的纽约奇景。

  虽然这一切看起来很轻巧,但是价值500亿美元的无人机产业核心在于工业应用。

  在这里我们探讨一二:

  能源:太阳能发电厂的检测

  太阳能发电厂的日常检测和维护是一项艰巨的任务。传统的人工检测方式只能支持每三个月/次的检测频率。由于环境恶劣,太阳能电池板可能会有缺陷。损坏的太阳能电池板部件降低了功率输出效率。

  左图:太阳能电池板的原始热图像

  右图:因特尔自动化系统检测的缺陷定位和分类

  农业:植物早期病害的检测

  伦敦帝国理工学院(Imperial College London)的研究人员在无人机上安装多光谱相机,这些相机将使用特殊的过滤器从选定的电磁光谱区域捕捉反射光。有病害的植物通常会显示出一种有别于健康植物“光谱特征”。

  带有病原和营养不足的植物叶片的光谱图像

  公共安全:鲨鱼侦测

  对一大片土地/水域的俯视图进行分析,可以获取大量关于治安和公共安全方面的信息。其中一个例子就是在澳大利亚沿海水域发现鲨鱼。澳大利亚西太平洋集团开发了一种基于深度学习的目标探测系统来侦测水中的鲨鱼。

  除此之外,还有各种各样的航拍图像应用程序,比如土木工程(桥梁日常检查,电线监测和交通调查),石油和天然气(近海石油和天然气平台、钻井设备的检查),公共安全(机动车事故、核事故、建筑火灾、船舶碰撞、飞机和火车事故)及治安(交通监测、边境监测、海岸监测、敌对游行示威及暴动控制)。

  为了全面捕捉地形和景观,航拍图像的获取过程可以分为两个步骤。

  完成图像拼接后,生成的图像可用于上述提到各种应用分析中。

  高分辨率航空影像在全球范围内越来越常见,它包含大量可与维护、土地开发、疾病控制、缺陷定位、监测、等应用相关联的信息。不幸的是,这些数据通常是高度非结构化的,因此即便有密集的人工分析,从中大规模提取有意义的见解还是充满挑战性。

  例如,城市用地的分类通常是根据训练有素的专业人员的测量。所以这项任务是劳动密集型的、不频繁的、缓慢的和昂贵的。因此,这些数据大多只在那些拥有收集和管理这些数据所需的资源和远见的发达国家和大城市中才有。

  自动分析航空影像的另一个动机是预测有关地区变化的迫切需要。例如,在大型公众集会(如音乐会、足球比赛、抗议活动等)上,经常需要进行群众计数和群众行为。传统上,会有专人来分析从闭路电视摄像头直接传送到指挥中心的图像。正如你想象的那样,这种方法存在几个问题,例如在检测事件时人为的延迟或错误,以及标准的静态闭路电视(CCTV)缺乏足够的视图。

  以下是使用航空影像时经常遇到的一些挑战。

  航空影像自动化的挑战与限制

  当自动分析无人机图像时,有几个挑战需要克服。下面列出了其中的一些,并

  给出了有前景的解决方案:

  务实大师(Pragmatic Master),一家南非机器人即服务(robotics-as-a-service )公司与Nanonets合作对非洲一个住房建设项目进展进行远程自动化监控。

  这些项目通常因为误报而产生拖延和盗窃,这可能通过频繁的无人机飞行测绘和记录来解决

  我们的目标是通过探测以下基础设施来捕捉房屋在不同阶段的建造进度:

  Pragmatic Master之所以选择Nanonet作为深度学习的提供者是因为Nanonet易于使用的web平台和即插即用的APIs。

  使用Nanonet API的端到端流程非常简单,只需四个步骤。

  End-to-end flow of the Nanonets API

  1.上传图片:从无人机获取的图片可以直接上传到我们的上传页面。在当前的案例研究中,我们总共获得了1442张低空拍摄的建筑工地照片。上传图片的例子会在下方给出。

  2. 图像的标记:在任何监督机器学习流程中,标记图像可能是最困难和最耗时的步骤,但是在Nanonets,我们可以为你完成标记。我们有多年航空成像工作经验的内部专家。他们将精准及准确地注释你的图像,以进行更好的模型训练。对于Pragmatic Master的用例,我们标记了以下对象及其在所有图像中的总数。

  标记了热水器的图像

  3. 模型训练:在Nanonets,我们同时采用迁移学习的原则对你的图像进行训练。这包括重新训练一个已经用大量的航空成像预训练过的模型。这有助于模型更容易在你的图像上识别微图像如边缘、线条和轮廓和关注更具体的宏观模式如房屋、树木、人类和汽车等。迁移学习也缩减了训练时间因为模型不需要进行大量的迭代也能有良好性能。

  我们专有的深度学习软件能聪明地选择最佳的模型,并根据你的用例优化超参数。这涉及到使用高级搜索算法在多个模型和多维参数间进行搜索。

  最难探测的对象是最小的对象,因为它们的分辨率较低。我们的模型训练策略被优化,以检测非常小的物体,如只有几个像素面积的热水器和护墙。

  检测到完整的房子

  下面是每个类的平均精度,

  屋顶:95.1%

  热水器:88%

  墙面板:92%

  护墙:81%

  注365体育意:添加更多的图像可以提高平均精度。我们的API还支持在同一图像中检测多个对象,例如在一个图像中检测屋顶和护墙。

  4. 测试与集成:在模型训练好后,你可以将Nanonet的API直接集成到您的系统中或者我们还提供一个镜像,其中包含你训练过的模型和推理代码。镜像可以方便地进行缩放,并提供容错推理系统。

  最后一步,图像被拼接起来并使用与每幅图像相关联的GIS数据创建整个景观视图。

  预测的图像拼接在一起创造了整个景观视图

  客户信任是我们的首要。我们致力于在任何时候为你提供所有权和你内容的控制。我们提供了两个使用我们服务的套餐,

  在这两个套餐中,我们与我们的云合作伙伴Amazon Web 365官网 Services合作,使用高度复杂的数据隐私和安全协议。你的数据集是匿名的,并且在预处理和训练过程中经过最少的人工干预。我们所有人都签署了保密协议(NDA),以保护你的数据不落入坏人之手。因为我们相信“你的数据就是你的!”,你可以要求我们在任何阶段从我们的服务器上删除你的数据。

  Nanonet是一种web服务,它使得使用深度学习变得容易。你可以用你自己的数据构建一个模型,以实现更高的准确性,并使用我们的APIs将其集成到你的应用程序中。

  更多细节请访问:https://nanonets.com/drone

  务实大师(Pragmatic Master)是一家南非机器人即服务公司,提供装配相机的无人机,以获取建筑、农业和采矿工地的图像。通过对这些图像的分析,让我们能跟踪进度、识别挑战、消除低效并提供场地的整体鸟瞰图。

  想要继续查看该篇文章相关链接和参考文献?

  长按链接点击打开或点击【如何将深度学习应用于无人机图像的目标检测】:

  https://ai.yanxishe.com/page/TextTranslation/1295

  AI研习社每日更新精彩内容,观看更多精彩内容:

  等你来译:雷锋网(公众号:雷锋网)雷锋网雷锋网

  雷锋网原创文章,未经授权禁止转载。详情见转载须知。


365官网 365体育