当前位置 首页> 科易专栏> > 正文

计算机视觉技术专利分析

计算机 视觉 专利 行业 现状 智能 医疗
科技资讯    2019-11-08    1200

  基于行业发展需求,从计算机视觉技术专利整体现状,智能安防、自动驾驶和医疗影像三大应用领域专利布局,对计算机视觉技术进行了深度剖析。


  专利整体现状


  受益于深度学习算法的优化、计算能力的突破以及数据的积累,计算机视觉技术从2012年开始快速迭代,不断推陈出新。2012年,ImageNet大规模视觉识别挑战赛中,冠军团队使用深度学习算法将识别错误率降低了10%,成为影响人工智能进程的里程碑事件,从此计算机视觉技术商业化落地能力不断提高,迎来了突破性发展。

  伴随着技术的创新与突破,全球计算机视觉技术专利申请量开始激增,呈现指数增长,从2010年的200多件激增至2016年4000多件。中国近年来专利申请量连续取得世界第一,再加上中国对人工智能技术的重视,又是世界上最大的目标市场,因此中国以67.7%的占比,排在目标国申请量的首位,美国以近22%位居第二。


  01  助力智能安防


  随着安防产品应用领域的不断扩张,传统安防技术的计算能力不足以应对日益增长的视频和图像数据,识别效率和识别准确率也阻碍安防产业进一步发展。计算机视觉技术中人脸识别技术具备超越人眼的实时识别准确率,与安防使用场景契合度较高,已成为智能安防的关键技术之一。


  智能安防中的人脸识别算法经历了早期算法、人工特征+分类器、深度学习三个阶段。早期算法有基于几何特征的算法,基于模板匹配的算法,子空间算法等多种类型,这些算法严重依赖训练集和测试集场景,且对光照、人脸的表情、姿态敏感,泛化能力不足,不具有太多的实用价值;第二阶段的人脸识别算法普遍采用了人工特征+分类器的思路,部分解决了光照敏感问题,但还是存在姿态和表情的问题;目前利用深度学习的人脸识别算法已成主流,极大地提高了智能安防实时监控精度,推动这一技术真正走向实用。


  2013年,脸书(Facebook)的Yaniv Taigman等人提出了DeepFace算法,该算法基于检测点实现人脸检测,通过对检测后的图片进行二维裁剪,将人脸部分裁剪出来,然后转换为3D模型,利用CNN模型对3D模型进行特征提取、归一和分类完成人脸识别。DeepFace算法是人脸识别的奠基之作,直接影响了后续的DeepID和FaceNet等算法。


  同年,香港中文大学的汤晓鸥教授及其团队提出了DeepID算法,并凭借该算法参加2014年ImageNet大规模物体检测任务比赛获得第二名优异成绩。随后团队对DeepID算法进行改进提出DeepID2算法。DeepID2采用深度学习的方法来提取人脸高级特征,其采用的CNN网络结构共为10层,包括输入层、4个卷积层、3个池化层、1个DeepID层和1个Softmax层;在提取特征后,使用了Joint Bayesian和Neural Network两种方法进行区人脸比对,最终得出识别结果。


  同年,谷歌的Christian Szegedy等人提出了Inception网络结构,该结构构造了一种“基础神经元”结构,来搭建一个稀疏性、高计算性能的网络结构,将CNN中常用的卷积(1x1,3x3,5x5)、池化操作(3x3)堆叠在一起(卷积、池化后的尺寸相同,将通道相加),一方面增加了网络的宽度,另一方面也增加了网络对尺度的适应性。谷歌基于Inception搭建了GoogleNet。GoogleNet凭借其优秀的表现,得到了很多研究人员的学习和使用。随后,谷歌的Philbin James William等人又提出了FaceNet,与其他的深度学习方法在人脸上的应用不同,FaceNet并没有用传统的softmax的方式去进行分类学习,然后抽取其中某一层作为特征,而是直接进行端对端学习一种从图像到欧式空间的编码方法,然后基于这个编码再做人脸识别、人脸验证和人脸聚类等;将图像输入卷积神经网络去掉sofmax后的结构,经过L2的归一化,然后得到特征表示,基于这个特征表示计算三元组损失,其可使用两种卷积神经网络结构,第一种是Zeiler&Fergus架构,22层,第二种是GoogleNet式的Inception模型。在LFW上,使用了两种模式:直接取LFW图片的中间部分进行训练,效果98.87左右;使用额外的人脸对齐工具,效果99.63左右,超过DeepID。


  2014年至2016年期间,GoogleNet团队对GoogleNet进行了进一步的发掘改进,研发出了Inception v2,Inception v3和Inception v4。最终基于Inception v4提出了inception-ResNet-v2。专利(申请号:US15395530)披露了将nxn的卷积通过1xn卷积后接nx1卷积来替代以加速计算,又可以将1个卷积拆成2个卷积,使得网络深度进一步增加,增加了网络的非线性;或者使用了两个并行化的模块(卷积、池化并行执行,再进行合并)来降低计算量,以及将ResNet与Inception 结合。


  同在2016年,谷歌的Barret ZOPH等提出了NasNet,并以此提交了专利申请(申请号:US62414300)。这个模型并非是人为设计出来的,而是通过谷歌很早之前推出的AutoML自动训练出来的。该项目目的是实现“自动化的机器学习”,即训练机器学习的软件来打造机器学习的软件,自行开发新系统的代码层,它也是一种神经架构搜索技术(Neural Architecture Search technology)。其模型就是基于AutoML首先在CIFAR-10这种数据集上进行神经网络架构搜索,以便AutoML找到最佳层并灵活进行多次堆叠来创建最终网络,并将学到的最好架构转移到 ImageNet 图像分类和COCO对象检测中,其在图像分类任务中表现极为优秀。


  为了更好地适应移动端平台,2017年,谷歌的Howard Andrew Gerald等推出了MobileNet。该技术使用了一种称之为deep-wise的卷积方式来替代原有的传统3D卷积,减少了卷积核的冗余表达,在计算量和参数数量明显下降之后,卷积网络可以应用在更多的移动端平台。其他创新主体也围绕移动端应用进行大量技术创新,如通过神经网络模型的压缩、大型网络的特性迁移至小型网络等。


  02  赋能医疗影像


  传统的医学影像依赖于医师根据影像提供的信息进行诊断,而计算机视觉技术为医疗影像带来了新机会。自2006年,全球涉及医疗影像的计算机视觉相关专利近2000件。


  医疗影像的计算机视觉技术可以分为前期的图像获取,中期的图像处理,以及后期的图像诊断。图像获取进一步细分为图像构建、图像生成、目标跟踪,图像处理包括图像增强、图像修复、图像分割,图像诊断分为图像匹配、图像构建、图像分类。无论从专利布局数量还是布局质量,西门子、通用电气和飞利浦是该领域最重要的专利申请主体。三家企业在医疗图像构建、医疗图像生成、医疗图像增强和医疗图像修复等细分技术均进行了大量的专利布局,上述专利技术主要关注如何通过计算机视觉技术更高效地分析处理医疗数据,提升图像检测设备的性能,使其能获取更加准确、更加丰富的信息。


  03  革新自动驾驶


  除了智能安防、医疗影像,视觉技术在自动驾驶方面的应用越来越受到众多科技型企业、传感器企业、汽车企业的重视。自动驾驶的图像视觉处理领域,Mobileye公司具有绝对的技术优势和市场优势,Mobileye也一次又一次地利用技术的革新推动着产业的发展。


  2006年,深度学习算法刚提出不久,Mobileye就尝试利用深度学习算法对车灯进行了识别,并利用车灯信息对车辆进行识别导航。与此同时,福特提出利用人工智能技术修复低分辨率的图像,使得汽车在夜间也能获得更加清晰的图像。早稻田大学尝试将视觉系统和激光点云相融合,并融入人工智能技术。松下提出了专门处理环视视觉的处理器架构,其布局可谓十分超前。因为直到不久前,Mobileye推出新的视觉辅助驾驶系统才开始采用多摄像头的环视技术。Mobileye也在硬件系统上进行了尝试,如对片上系统的中断技术进行了研究。在这一阶段,由于技术的不成熟,车辆控制技术所出现的关键技术较少。


  2013年以后,人工智能在计算机视觉方面的技术发展得越来越成熟,大量的关键性技术涌现出来。比如Mobileye采用了人工智能识别算法,识别道路轮廓。百度也利用人工智能算法识别车道线。这些都对车辆行驶路径的规划提供了技术保障。福特、苹果等也在算法领域进行了各种探索。


  在硬件设备领域,同样出现了一批代表性技术。随着传感技术和算法的发展,智能网联汽车获得的数据越来越多,而车辆的操控具备及时性,这就要求处理器能在短时间内处理大量的数据。


  Mobileye在硬件系统方面做出了大量的尝试,研发了多核多线程处理设备。从产品上来看,Mobileye也一直自主设计芯片,其拥有多代EyeQ芯片,芯片和算法的融合设计使得其计算能力得到了进一步提升。其他的创新主体,比如法雷奥、东芝也在硬件设备的改造上进行了尝试。


我要收藏
本文为专栏作者授权科易网发表,版权归原作者所有。文章系作者个人观点,不代表科易网立场,转载请联系原作者。如有任何疑问,请联系ky@1633.com。

你是否还在为抽油机系统的高成本、短寿命、稳定性差等问题而烦恼?点击查看技术

相关推荐
高智能化双臂机器人
公司致力于研发高智能集群机器人系统,机器人具有 “ 手 、 足 、 眼 、 脑 ” ,基于高速动态移动视觉定位关键技术;机械臂可自主更换电池,视觉精准识别电池的位置,全流程实现无人化智能作业:1.装载外卖;2.更换电池;3.取出外卖。
领域:机器人
建筑及机电声学认知检测及智能声学产品系统研发及产业化
项目利用振动及声学传播的特性,依据专业声学测试分析方法,结合建筑机电、通风设备的特有声音频率,快速准确实现各种设备噪声的检测与分类,实现精准的产品研发配套,有效解决机电设备环境噪声的干扰,实现人居环境尤其是商业酒店、综合体及公共场所的声品质提升,给城市、商业建筑、酒店及公共场所的通风、制冷系统装上一套“无声的装备”。 项目优势: 1、市场前景广:振动声学市场巨大,重点文旅产业的基础设施-声学产品(防火隔声门、通风隔声消声百叶窗、浮筑地台等)及技术配套; 2、技术水平领先:引进国外IAC先进技术并消化吸收,国际品牌、外资企业资深技术团队及管理团队,技术及产品体系、资源体系完善; 3、行业布局深入:已经建立起与上游客户稳定的业务关系,与科研院所进行产研学一体化合作,与行业内北京、上海、深圳资深外资机电及声学顾问、设计院已经建立起稳定的业务对接,合作共赢; 4、团队项目业绩突出:参与一些国家重大项目建设,团队经验非常丰富。
领域:网络应用技术
领先的数据安全分析专家
公司是由密码技术专家,国内信息安全领域专家和管理人员组成核心团队的高新技术企业。公司专注密码安全(分析)技术研究和产品开发,深入研究行业应用,探索创新产品研发,解决行业安全难题,提升数据安全能力,拥有多项发明专利。商用密码检测产品填补国内空白,国内密码应用安全检测产品市场占有率90%以上。公司是国内最早利用密码分析技术进行加密数据流量分析技术的企业,产品已经在政府、运营商等网络出口部署,凭借独特的分析技术,为用户数据安全提供了有力支撑。
领域:计算机产品及其网络应用技术
环境、海洋测试服务——综合的全面解决方案提供者
公司提供包括环保竣工验收、企业日常环境监测、土壤场地调查、海洋监测与测绘、海域和陆域生态调查、环评检测、工作场所检测、公共卫生检测、加油站和洁净室检测等检测服务。 监测类:环境检测(包含废水、废气、污泥、土壤、噪声、辐射、生活饮用水、海洋环境检测、室内空气检测); 编制类:环保管家服务项目(包含企业自行检测、企业亲亲平台服务、应急预案编制、环评报告编制、竣工环保验收报告编制、VOC专项报告编制、企业日常环保工作服务等); 编制类:土壤场地调查项目(包含方案编制、现场检测等工作)。
领域:环境监测预警技术
内毒素检测整体解决方案
内毒素领域整体解决方案: 1、低内毒素回收Low Endotoxin Recovery (LER)解决方案; 2、注射药、药包材及医疗器械内毒素检测解决方案; 3、透析相关领域内毒素检测解决方案; 4、细胞治疗领域内毒素和真菌葡聚糖检测解决方案; 5、深部真菌感染和革兰氏阴性菌感染的诊断解决方案。 企业40多年来一直专注于鲎试剂的生产研发和推广,专注于细菌内毒素检测。鲎试剂能够准确、快速地定性或定量检测样品中是否含有细菌内毒素和(1,3)-β-D-葡聚糖。鲎试验法简单﹑快速﹑灵敏﹑准确, 是目前国际上药典认可的检测细菌内毒素和真菌葡聚糖最好的方法,正广泛应用于药检、临床、科研、环保、食品卫生等领域,是当今医药行业产品安全的重要保障。
领域:快速生物检测技术
AI+病理辅助诊断
我们以数字病理为切入,以临床需求为导向,以人工智能为方法、以科研成果为基石,凝练医疗产品、解决方案,打造数字化、智能化、全流程病理检验平台。 AI+病理辅助诊断目标:打造标准化、数字化、智能化的病理科,通过“AI + 病理”解决方案体系,基于“AI+病理”全流程检验平台,进行持续的研究、数据收集、改进完善,对产品持续优化,提高诊疗效率,推动医疗健康人工智能应用。
领域:医学影像诊断技术
下闸的用途
下闸的用途
下闸通常是指在水利工程中,通过操作闸门来控制水位和水流量的过程。这一过程在水利工程的正常运行中具有重要意义,可以保障水利设施的安全和有效利用。同时,在城市化进程中,下闸也被广泛应用于城市排水系统、城市河道、农田灌溉系统等多个领域,用于控制雨水的流向和流量,防止城市内涝,调节水位和水流量,保障城市的水资源利用和环境保护。
关键词:吊装设备,隧洞,城门洞,导流,导流洞,下闸
抗震设计基本思路技术的高校资源
抗震设计基本思路技术的高校资源
抗震设计的基本思路主要包括以下几个方面:场地选择:避免地震时可能发生地基失效的松软场地,选择坚硬场地。这是抗震设计的基础,因为场地的地质条件直接影响建筑物的抗震性能。体型均匀规整:在平面上和立面上,结构的布置应力求使几何尺寸、质量、刚度、延性等均匀、对称、规整,避免突然变化。这有助于保证结构在地震作用下的稳定性和整体性。提高结构和构件的强度和延性:结构物的震动破坏主要来自地震动引起的结构振动,因此抗震设计应尽可能减小从地基传入结构物的振动能量,并使结构物具有适当的强度、刚度和延性,以防止不能容忍的破坏。多道抗震设防:使结构物具有多道支撑和抗水平力的体系,在持续时间较长的强地震动过程中,一道防线破坏后,有第二道防线可以支撑结构,避免倒塌。这种设计思路提高了结构的抗震冗余度,增强了其抗震能力。
关键词:抗震性能,钢筋混凝土框架结构,抗震设计方法,抗震设计,得到广泛应用,抗震设计基本思路
建筑供暖的用途
建筑供暖的用途
建筑供暖是通过一定技术和设备向建筑物内部提供热量,以维持室内适宜温度的过程。供暖方式多种多样,包括但不限于以下几种:锅炉供暖系统:通过燃烧天然气、石油或煤炭等燃料,将水加热至一定温度,然后通过管道将热水或蒸汽输送到建筑物的供暖设备中。这种供暖方式具有热效率高、温度可调节等优点,适用于各种建筑类型。热风供暖系统:通过燃烧燃气或燃油产生热风,并通过风扇将热风输送到建筑物中。这种供暖方式升温速度快,适用于空间较大的建筑物,但在保温效果和能源利用上可能存在不足。集中供暖系统:热源和散热设备分别设置,用热媒管道相连接,由热源向多个热用户供给热量的供暖系统。这种方式提高了供暖效率,减少了能源浪费。太阳能供暖系统:利用太阳能集热器将太阳辐射能转化为热能,再通过管道将热水输送到建筑物内实现供暖。这种供暖方式环保、可持续,但受天气条件影响较大。
关键词:结冰,绝缘,公路路面,变热,建筑供暖
谷子栽培研发方向
谷子栽培研发方向
谷子的栽培涉及到多个环节,以下是一些关键步骤和注意事项:选地与整地:谷子耐旱、耐瘠薄,适应性广,但为了达到高产、优质的目的,最好选择土层深厚、结构良好、有机质含量丰富的砂质壤土或粘质壤土进行种植。在播种前,应进行深耕整地,将地块整平,并借墒及时进行秋覆膜或早春覆膜。选用良种:选择适应当地气候和土壤条件的优良品种是栽培成功的关键。常见的谷子品种包括冀谷20、冀谷21、衡谷9号、谷丰1号、鲁谷10号、豫谷9号和晋谷21等。播种量一般为每亩0.5kg左右,播种深度为3~5cm。施肥:合理施肥对谷子的生长和产量至关重要。基肥以农家肥为主,播种前结合深耕整地一次施入。在氮肥的使用上,一般可作为种肥,但用量不宜过多,以防止倒伏。根据土壤肥力状况,可适量补充磷肥和钾肥。具体的施肥比例和量应根据当地的土壤肥力和气候条件进行调整。田间管理:谷子生长期间需要进行适当的田间管理,包括中耕除草、灌溉和病虫害防治等。中耕除草可以疏松土壤,提高土壤透气性,促进谷子生长。灌溉要根据天气和土壤墒情进行,确保谷子生长所需的水分。同时,要注意防治谷子常见的病虫害,如锈病、白发病等。收获与储存:谷子成熟后要及时收获,防止落粒和霉变。收获后要进行干燥和储存,确保谷子的品质和产量。
关键词:栽培措施,谷子,粮食作物,谷子栽培
一体式研发方向
一体式研发方向
一体式通常指的是将多种系统或功能集合成一体的规格或样式。这种集成化的设计在多个领域都得到了广泛应用,例如机床、机器人、自动化设备和纺织机械等。一体式交流伺服电机控制系统在数控机床领域应用广泛,它们能够提供高速、高精度的位置控制和运动控制,从而实现复杂的切削和加工过程。在机器人领域,一体式交流伺服电机控制系统扮演着重要角色,用于驱动机器人关节,实现精确的位置和速度控制。此外,这种控制系统还广泛应用于各种自动化设备,如包装机、印刷机、食品加工机械等,以提高设备的生产效率和产品质量。
关键词:一体式,优化方案,CAE,静刚度,保静刚度
定点DSP技术专家推荐
定点DSP技术专家推荐
定点DSP主要完成的是整数运算或小数运算,其数值格式中不包含阶码,通常的数据宽度为16位或24位。与浮点DSP相比,一个24位的定点DSP提供的精度与浮点DSP的24位数据尾数提供的精度相同,但定点DSP无法提供大的动态范围,因此在运算时需要考虑“溢出”问题。
关键词:DSP,电子耳蜗,植入,语音处理,CIS,定点DSP
总有机酸技术专家推荐
总有机酸技术专家推荐
总有机酸是指一类具有酸性的有机化合物,其酸性主要源于羧基、磺酸、亚磺酸、硫羧酸等官能团。这些有机酸广泛存在于自然界中,可以从植物或农副产品中提取分离出来,也可以通过特定的生产工艺合成。总有机酸具有多种理化性质,例如,低级和不饱和脂肪酸多为液体,而高级脂肪酸和芳香酸则多为固体;小分子脂肪酸和含极性基团较多的脂肪酸易溶于水,难溶于亲脂性有机溶剂,而大分子脂肪酸和芳香酸则大多为亲脂性化合物,易溶于亲脂性有机溶剂而难溶于水。有机酸均能溶于碱水,因分子中含羧基而呈较强的酸性,能与碳酸氢钠反应生成有机酸盐。
关键词:总有机酸,提取工艺,莴苣
蒸发水汽科研进展
蒸发水汽科研进展
蒸发是液态或固态物质转变为汽态的过程,在气象学上,它主要指液态水转变成为水汽的过程。这一过程发生在液体表面,涉及到液体分子从液面离去,当这些分子的动能大于飞出时克服液体内分子间的引力所需的功时,它们就能脱离液面而向外飞出,变成这种液体的汽体。
关键词:高原,贡献率,纳木错,蒸发水汽
服务精选
服务案例
官方社群
标签