当前位置 首页> 科易专栏> > 正文

一文详解泊车感知的摄像头需求

泊车 摄像头
CV研习社    2021-06-11    690

  文章导读

  本文我们从泊车场景的感知需求出发探讨一些算法之外的东西,内容有些琐碎,聊点泊车感知的图像形式,感知层面的行泊一体化,相机选型中要注意哪些参数等。

  1

  前情回顾

  上一篇我们聊了自动泊车功能中车位线识别的一些数据及算法,但是从数据的角度来说很多时候算法工程师需要用相机模组采集真实场景的图像而不是直接购买第三方或者下载开源数据集做训练。那么从数据源头出发我们需要根据算法的输入形式和感知的需求提出技术指标,筛选Sensor和镜头模组甚至进行定制化业务。

  2

  泊车感知的输入形式?

  在目前L2~L4的方案中,摄像头作为核心传感器通常部署在车辆周围一周,甚至能有10多个摄像头配合感知周围环境。不同位置的摄像头用处也不同,前视+周视相机往往用于行车感知;鱼眼相机往往用于360环视和泊车感知;车内相机往往用于驾驶员监控。

  扯得有点远了,回到主题我们说的是做泊车选用的摄像头问题。较为常规的做法是使用四颗鱼眼相机环视拼接然后在鸟瞰图上做停车位检测,障碍物检测等多任务:如下图所示:

  图片

  鸟瞰图的输入形式保留了地面线条的几何特征,有利于车位线的检测。但是从上图中可以看出基于鸟瞰图的检测存在两个问题:

  感知的范围局限在车身周围15米以内;

  有高度的物体投影到鸟瞰图后形状扭曲;

  另一种做法是使用每颗鱼眼相机输出的原始视图独立做感知,当然我们可以拿未做畸变校正的数据作为输入,也可以使用畸变校正后的数据作为输入。如下图所示:

  图片

  通过原始视图可以看出车辆,树木等障碍物仍然保持物体较真实的特征,并且从图像中能够看到较远处的物体;但是地面的车位线,车道线等标志在鱼眼相机中无法维持直线等几何形态,给检测增加了一定难度。

  从上面两种图像的输入形式对比出发,基于拼接的鸟瞰图适合做车位线检测,基于原始视图适合做障碍物检测,所以大多数做泊车感知时偏向于拆分成两个网络分别处理不同的任务。这种类似于松耦合的方案,两个不同的任务放在不同的网络中独立运算,然后将输出的感知结果进行过滤合并。

  3

  如何减少传感器的数量

  由于传感器类型的不同,行车的感知和泊车的感知一般是分开来做的。但是从传感器简化的角度,行泊一体化将是未来趋势,那么势必就要考虑鱼眼和周视相机是否能统一的问题。

  假如把周视广角相机和环视鱼眼相机合二为一了,接下来就是这些问题了:

  需要几颗摄像头,安装在什么位置?

  需要多大的视场角覆盖车身周围的环境?

  需要多大的分辨率用于检测远中近的物体?

  高分辨率的数据ISP能否处理,算法压力如何?

  ……。

  从硬件的角度可以定制传感器既具有鱼眼的超大FOV,又具有周视相机相对较高的PPD,能够兼顾80米甚至更远的障碍物。好奇的小伙伴肯定会问,焦距和视场角不是相互制约的吗?如下图所示:焦距越小,视场角越大。

  图片

  但是挡不住模组厂商定制化业务的强大,只要有需求就有市场,有不少厂商把前视的多目摄像头整合在一个模组中用于感知。

  从算法的角度需要考虑把周视相机做的的物体检测等功能和环视拼接后做的车位线检测等功能合并,这就回到上一小节提到的感知算法的图像输入形式了。功能上来说肯定是怎么做精度高就怎么来,分开多个网络各司其职完成任务,但是如果能统一输入形式,用一个模型多任务的处理所有任务,既简化了图像链路流程,又复用了一部分特征提取环节,小编觉得将是一个趋势,推荐都在原始视图上做感知功能,因为如果将一个障碍物检测的任务放在鸟瞰图上进行,那么越远处的立体物体扭曲就会越大。如图所示,在方圆5米内的车辆已然变形,何况60米处的障碍物。

  

  4

  影响摄像头性能的参数有哪些?

  算法工程师需要根据功能需求提供技术要求给供应商选择合适的Sensor及镜头模组。那么有几个最常见的参数我们必须的了解:

  分辨率:谈到摄像头,我们说的最多的就是分辨率是多少!通俗点说分辨率就是图像的大小,一般会用图像水平方向的像素点数 × 图像垂直方向的像素点数计算。比如业界说的标清的分辨率就是1280×720,也叫720P;高清的分辨率就是1920×1080,也叫1080P。

  所以图像的分辨率越高,包含的像素越多,画面看起来就越清晰。描述分辨率的单位有以下几种:

  dpi(点每英寸)

  lpi(线每英寸)

  ppi(像素每英寸)

  ppd(像素每度)

  其中ppd是算法工程师接触较多的一个指标,指视场角中的平均每 1° 夹角内填充的像素点的数量。如下图所示(图片来自于网络):

  
图片.png
  人眼观察周围环境时水平FOV是210°,垂直FOV是100°,当我们看手机时一般距离30~40cm,假设1°里面占据60个像素时,人眼是无法分辨像素颗粒度的。所以在VR等消费电子行业比较流行的说法是将60ppd的图像称为视网膜分辨率。

  那么像素颗粒度是什么感觉?看看下图体会一下:

  
图片.png
  帧率:这是另一个常用的参数指标,一般指摄像头在某种色彩空间中最大分辨率下能够支持的最高视频捕获能力。

  对于人眼来说,一般运动场景下能到达15fps的帧率已经是连续运动的效果了;但是对于感知算法在高速场景下还是需要摄像机满足30fps及以上的帧率。

  相机的各个参数之间都有其关联性,比如上面说的ppd就和分辨率及视场角密切相关。那么帧率与分辨率和视场角有没有什么关系呢?

  为了提高帧率,首先我们会考虑是否可以缩小视场角,如若不行,是否可以减少分辨率。在很多镜头的datasheet中会出现pixel binning mode。分辨率的下采样模式其实有两种:

  Binning Mode

  Skipping Mode

  Binning Mode是将相邻的相同颜色单位电荷相加后输出一个信号。采用这种电荷合并的方式可以提供暗处对光感应的灵敏度。如下图所示(将四个相同颜色的B合并成Bs,其他雷同):

  
图片.png
  Skipping Mode是删除相邻的行列,起到隔行列抽样的效果。如下图所示:

  
图片.png  动态范围:指图像最亮和最暗部分的相对比值。当在强光源照射下的高亮度区域及阴影、逆光等相对亮度较低的区域在图像中同时存在时,摄像机输出的图像会出现明亮区域因曝光过度成为白色,而黑暗区域因曝光不足成为黑色,严重影响图像质量。如果Sensor内的HDR达到一定的DB后,即可缓解此类情况。如下图所示:
图片.png  
  还有好多比较重要的参数就不一一列举了,比如MTF:即调制传递函数,用于描述镜头的性能。

  Distortion:物体通过光学系统后实际像高与理想像高的差值,离光轴越远的点畸变越大。

  RI:即相对照度,用于描述光学系统成像面均衡性。

  SNR:即信噪比,用于描述成像的抗干扰能力。

  感光部件:CCD或者CMOS两种;

  滤光片类型:RGGB、RCCB、RCCC等

  这两个参数在之前的一篇文章里小编简单介绍过。

  
  镜头的定制原则

  首先考虑一下人是如何观察周围事物的,人的视力分为中心视力和周边视力:

  中心视力较为敏锐,在中央处非常小的区域内,集中了绝大多数的视锥细胞,负责颜色和细节的感知,只有在这一小块区域,人们才能真正看清楚东西的细节和色彩,但需要较亮的光线下才起作用;

  周边视力相对不敏锐,主要是视杆细胞,负责探知微弱光线,暗视下起主要作用。

  在AI领域,摄像头一直被作为眼睛观察周围事物,所以从仿生学角度,也应该对镜头做相应定制化设计。当然有的同学会说,既然是物理元器件就可以人工堆性能,保持视场角不变的情况下,不断增加图像分辨率是否就可以了?

  那么就存在分辨率过高,会导致图像文件太大、传输慢、耗流量、网速低的时候显示不出来等等问题,高分辨率可能会大大降低传输和运算速度,而这将是一个比“提高几乎看不出来的区别的细节”更严重的问题。

  镜头的定制原则可以参考ADAS行业前视多目相机的目的,通常配一个HFOV~30°的长焦远视摄像头,一个中距离HFOV~52°主摄像头,一个近距离HFOV~120°的短焦广角摄像头。如果定制一款摄像头将不同角度内分布不同的数量的像素点是否可以将上述三目摄像机统一呢!根据需求测试测试PPD吧!

我要收藏
本文为专栏作者授权科易网发表,版权归原作者所有。文章系作者个人观点,不代表科易网立场,转载请联系原作者。如有任何疑问,请联系ky@1633.com。

这款类脑智能芯片,高效能、高容错、高实时,支持时间序列处理,近乎无损量化部署并已成功应用。你还在等什么?

相关推荐
激光质子刀关键技术突破及激光器产业化
质子疗法是肿瘤放射治疗的一种,该疗法将氢原子核中的质子通过粒子加速器释放高能量射线进行治疗。 由于质子束在组织中独特的吸收曲线(称为布拉格峰),它可以提供更好的剂量分布,允许在肿瘤部位沉积最大的破坏性能量,同时最大限度地减少沿路径对健康组织的损害。 全球首创激光驱动的离子加速:相比于目前质子疗法使用的传统加速器,激光驱动的离子束加速梯度高,能在很短的距离加速到很高的能量,具有源尺寸小、脉冲短、亮度高和能谱宽等特点,在等离子体电磁场诊断、核聚变质子快点火、质子照相、癌症治疗和温稠密物质产生等方面有着广阔的应用前景。 全国产化,全球顶尖的下一代小型化激光质子刀,既完成了对传统放疗的替代,又实现了对大型加速设备的源头创新,引发成本革命,是解决商业化痛点的终局方案。
领域:新型治疗、急救与康复技术
智慧林长制全面解决方案
林长制是以保护发展森林等生态资源为目标, 以压实地方党委政府领导干部责任为核心, 以制度体系建设为保障, 以监督考核为手段, 构建由地方党委政府主要领导担任总林长, 省、市、县、乡、村分级设立林(草)长, 聚焦森林草原资源保护发展重点难点工作, 实现党委领导、党政同责、属地负责、部门协同、全域覆盖、源头治理的长效责任体系。 公司的核心技术团队均有十余年从事“智慧城市”领域的经验,具备新型智慧林业顶层设计、全面解决方案、项目研发及实施的全过程管理能力;主导和参与的项目累计金额达数亿元。 公司具备测绘高级工程师、信息化中高级工程师、系统集成等中高级工程师数十人;具有地方标准和行业标准制定能力和丰富的经验;核心成员曾主导及参与出版发行行业信息化专著。 公司主营业务是智慧/数字林业,围绕林业系统的相关业务,是林业行业领域,提供智慧林长制全面解决方案的服务商。
领域:物联网应用软件
基于高性能音频芯片的新能源电机监测设备
新能源汽车、航空航天、电机系统相关领域,人力检测、侵入式检测等传统检测模式存在三大关键痛点:诊断难、局限高、误差大,这些问题存在将导致检测失真、时延。项目要实现的目标:降低停机时间、提高生产效率、预防潜在故障、节约维护成本,实现全面的生产优化。项目基于波束形成技术的声像学传感器阵列、高能效AI音频芯片、新能源汽车/电力系统行业声纹库及相关硬件进行研发,仅需一套设备 + 一台电脑就可以精准定位检测故障成因,优势体现在支持精准、毫秒级响应,不停机、降低检修浪费,便携不伤机。
领域:高性能、智能化仪器仪表
物理灭蚊系统开发
秉承中国本土发展方针,以节能环保为主题思想,与自然生态环境相结合,开发和研究为改善人类生活质量的可持续发展产品。公司目前主营产品为太阳能户外灭蚊灯,工程户外灭蚊系统,户外灭蚊灯,家用灭蚊灯,甲醛处理器,车载净化器和中央空气循环净化系统等。产品主要配套服务于市政园林工程,房地产物业小区,公园,酒店,渡假村,学校和医院等。 致力于利用仿生学原理实施形成诱蚊、灭蚊辐射圈,覆盖式整体灭蚊、控蚊技术满足了用户对于户外大范围灭蚊的需求。公司主要团队研究高端生物蚊虫管理系统已超过10年。在帮助市政、学校、物业小区、别墅花园和各地蚊虫控制中心提供蚊虫监视器来控制蚊虫引发的疾病,先后研发出高效灭蚊产品,结合利用光波、气味、体温模拟来吸引蚊虫的消费型捕蚊器,用科学创新概念针对蚊虫害研发新一代的技术和产品并获得国家认可多项专利,产品具有安全、高效、环保、智能诸多优点。
领域:生态环境建设与保护技术
空海跨介质航行器产业化先行者
公司致力成为空海跨介质航行器系统开拓者,设计的航行器可以在水和空气两种不同流体介质间适应性地实现运动过渡,充分利用飞行器高机动性以及水下高隐蔽优势,解决空、海领域的跨域范围的侦察、海洋巡检、快速搜救等实际需求问题。项目着力于突破重点技术,主要研究内容包括:(1)跨介质航行器不同流体介质间的结构以及动力技术;(2)针对跨介质及海洋风浪的复杂环境下航行器多工作模式快速切换技术;(3)面向水下复杂环境的感知以及识别技术。产品以科技创新为主,打造了纵列式双旋翼可重构跨介质航行器。该航行器可搭载单波束声呐、侧扫声呐、水质检测仪、核辐射剂量仪等设备载荷,实现近海大范围远距离无人化高效率巡检和作业,为海上风电、海洋牧场、海上平台等提供更快、更全面的一体化作业设备。公司在“扎根技术,纵深产品”的战略驱动下,将全面推进“空—水”一体化智能场景的应用升级,为海洋可持续发展赋能。
领域:海洋工程装备设计制造技术
轻量化“数字孪生”3D引擎推动企业数字化转型发展
公司在 “数字孪生”核心支撑技术—3D轻量化领域已耕耘多年,形成了极具门槛的核心技术积累。截止目前,已为国内超过400家客户,涵盖制造业、工程建筑行业、高等院校,提供了3D轻量化产品及技术服务,应用于近500多个重大项目或系统平台建设。 主要产品与服务有: (1) 3D/BIM/GIS轻量化融合引擎(WebGL/服务器端渲染); (2) BIM/GIS施工管理平台; (3) CAD图纸轻量化引擎(WebGL); (4) 图模管理协同平台; (5) 汇报演示系统; (6) 图模查看工具; (7) 3D可视化沙盘搭建系统; (8) 搭建智慧工厂、化工、矿山、电力领域的3D设备模型交易平台。
领域:Web服务与集成软件
自动投切专利申请
自动投切专利申请
自动投切是通过自动装置来实现的。这种装置能够根据电网的运行状态,通过感应器对电容器的运行进行自动调控,并在需要时自动进行投切。自动投切装置在电力系统中有着广泛的应用,包括重要机房、计算机房等关键设备的电力保障,电力系统中重要设备、通信设备的备用电源,以及火灾、地震等紧急情况下的电力供应保障。
关键词:自动投切,实现方式,并联电容器
口令码变换算法的用途
口令码变换算法的用途
口令码变换算法通常涉及一系列的操作,用于将原始口令转换为另一种形式,以增强安全性或满足特定的应用需求。
关键词:保密,加解密,大型企业,财会
半刚性基层底拉应力研发方向
半刚性基层底拉应力研发方向
半刚性基层底拉应力是指半刚性路面基层底面在行车荷载作用下产生的拉应力。在路面结构中,半刚性基层起到提高整体承载能力并降低土基承受的荷载强度的作用。然而,半刚性基层本身的拉应力相对集中,若超过极限则可能导致路面结构损坏。
关键词:正交试验,底基层,半刚性基层,设计参数,拉应力,半刚性基层底拉应力
空压机组技术哪里有?
空压机组技术哪里有?
空压机组是一种将机械能转换成气体压力能的能源转换装备,主要由泵头组件、气罐组件和管阀组件等部分组成。泵头组件是空压机的核心部件,主要负责压缩空气,完成能量的转换;气罐组件是空压机的存储部件,负责储存压缩后的气体;管阀组件是空压机的输控部件,负责连接泵头和气罐输送气体,并控制气体流通。
关键词:城际动车组,实际应用,空压机组
直接横摆力矩控制技术哪里有?
直接横摆力矩控制技术哪里有?
直接横摆力矩控制(DYC)是一种车辆运动稳定的有效方法,它通过对车轮上纵向力的调节,直接构成对车辆质心的横摆力矩,以克服车辆的前轴或后轴侧滑,提高车辆的操纵稳定性。在车辆处于低附着系数路面、大侧向加速度等极限工况下行驶时,车轮上的侧偏力已处于饱和状态,此时无法单纯依靠转向控制来提高车辆的稳定性。然而,车轮上的纵向力往往还有很大的裕度可以被利用,DYC正是基于这一原理来提高车辆的操纵稳定性。
关键词:电机驱动,分布式驱动,横摆力矩,直接横摆力矩控制
碳酸盐含量的用途
碳酸盐含量的用途
碳酸盐含量主要指的是血液中的二氧化碳含量,这是人体新陈代谢产生的废气。通过测量呼气中的二氧化碳含量,可以确定碳酸盐含量,并用于计算氧合指数。在建筑材料、食品工业、医药和环保领域,碳酸盐都有着广泛的应用。
关键词:储层,岩心,体积分数,测井资料,塔拉,碳酸盐含量
畜牧产业发展现状
畜牧产业发展现状
畜牧产业是一个广泛且复杂的行业,涉及到多个方面。首先,从产业链的角度来看,畜牧产业包括上游的禽畜苗种、饲料、疫苗等,中游的养殖,以及下游的屠宰、产品加工等环节。其生产过程中,畜牧业主要利用畜等已经被人类驯化的动物,通过人工饲养、繁殖,使其将牧草和饲料等植物能转变为动物能,以取得肉、蛋、奶、羊毛、蚕丝和药材等畜产品。其次,畜牧业在中国的发展历史悠久,其发展历程可以追溯到远古时期。随着农业的发展,畜牧业逐渐成为了农业的重要组成部分。近年来,随着生物技术的发展和人们收入水平的提高,畜牧业在生态、经济和社会等方面的重要性得到了日益提高。
关键词:农牧民,农村经济,快速发展,增产增收,畜牧产业
手术仿真产业研究动态
手术仿真产业研究动态
手术仿真是一种结合计算机和虚拟现实技术的医学模拟方法,主要用于模拟一系列临床外科手术操作,以演示和指导与手术相关的各个过程。它在医学教育中发挥着重要作用,为医生提供了一个安全、灵活且标准化的平台,用于手术训练、手术规划以及术后虚拟康复训练等。
关键词:虚拟现实技术,外科手术,医学上,仿真虚拟,手术仿真
服务精选
服务案例
官方社群
标签