欢迎您访问大河网,请分享给你的朋友!

当前位置 : 首页 > 范文大全 > 报告范文

计算机视觉研究范例(12篇)

来源:网友 时间:2024-01-07 手机浏览

计算机视觉研究范文

【关键词】计算机视觉技术马铃薯外部品质检测

随着计算机技术的不断发展,计算机视觉技术应运而生并在工业自动化以及农产品检验检测等领域成功应用。其中,将计算机视觉技术用于以自动化采集和品级分级为代表的果蔬商品化处理具有非常广阔的发展空间。我国政府将“农产品深加工技术与设备研究开发”列为我国“十五”重大科技攻关项目的第一项,这标志着计算机视觉技术在果蔬外部品质检测中会发挥越来越重要的作用。

马铃薯是世界上仅仅排在小麦、水稻和玉米之后的第四种主要农作物,种植区域非常广泛。马铃薯品质检测是马铃薯深加工的一个关键步骤,目前,该检验过程多数采用人工检测,不仅成本高、效率低,而且与检验员的专业素质有密切的关系,受到人为因素影响的程度较大,严重制约的马铃薯加工企业的发展。计算机视觉技术能对农产品的某些特性变化和缺陷进行识别,具有客观、无损害等特点。本文对基于计算机视觉的马铃薯外部品质检测的应用进行了研究。

1应用计算机视觉技术对马铃薯进行外部品质检测的必要性

随着“麦当劳”、“肯德基”的餐饮服务业的快速发展,炸薯条、炸薯片已经成为一种休闲食品深受消费者的喜爱,推动了我国马铃薯产业的发展。然而,情况并不十分乐观,与国外的马铃薯企业相比,我国马铃薯加工企业生产规模小、生产产品单一、技术设备落后、产品质量不高的现象导致我国的马铃薯产品销售困难,经济效益逐渐下滑。

基于以上现状,对马铃薯的加工研究还有很长的一段路程。企业要扩大生产规模,针对中国的消费趋势与消费水平开发出新的马铃薯产品,从而提高我国马铃薯产品的竞争力。这就要求马铃薯加工企业要对马铃薯的加工技术进行创新,保证产品质量。其中,马铃薯外部品质检测对马铃薯产品的最终品质起着决定性作用。当前的人工检测方式已经不再适应社会发展的要求,利用计算机视觉检验代替人工检验成为社会发展的必然趋势,这是因为计算机视觉技术具有以下优点:

(1)精度高,能够进行定量测量。

(2)自动化程度高,一次就可完成包括大小、形状、颜色以及缺陷在内的检测和分析,并能进行综合识别。

(3)无损检测,计算机视觉检测过程不需要接触产品,是通过传感器扫面获取图像的,不会造成产品的损伤。

(4)信息量大,可对大量信息进行采集,对光谱的敏感范围也很广。

2基于计算机视觉的马铃薯外部品质检测的应用研究

2.1马铃薯大小的检测方法

马铃薯的大小检测不仅影响马铃薯深加工的商业价值,在在遗传和育种方面也有很高的应用价值。

利用计算机视觉技术对马铃薯大小的检测步骤如下:先从摄像机中获取马铃薯的图像信息,在图像信息的基础上对马铃薯三维空间的几何信息进行计算,并由此重建和识别马铃薯。而马铃薯物体表面某点的三维几何位置与其在图像中对应点之间的相互关系是由摄像机成像的几何模型决定的,这些几何参数成为摄像机参数。要想准确的获取这些摄像机参数,就必须将实验与计算相结合,此过程成为系统定标。

系统定标的基本步骤:根据设定好的摄像机模型和特定的实验条件包括形状、尺寸等已知的定标参照物,经过对马铃薯图像的处理,并利用一系列的数学转换和计算方法将摄像机模型的内部和外部参数计算出来,从而建立照片与实物的联系推算出马铃薯的真实尺寸。

2.2马铃薯形状的检测方法

根据《中国马铃薯栽培学》中的知识,我们可以把马铃薯的块茎形状分为三类,分别是圆形、长筒形和椭圆形,除了这三种形状,其余都是这三种形状的变形。此次研究将马铃薯分为圆形、椭圆形和长筒形,并且采用椭圆的短长轴比来模拟马铃薯的纵横直径之间的关系。

2.2.1马铃薯形状特征参数的提取

将马铃薯椭圆的短长轴比R作为形状特征参数,并按照R的大小将马铃薯进行分类。当R小于0.67时,称之为长筒马铃薯;当R大于0.85时,称之为圆形马铃薯;当R介于0.67到0.85之间时,称之为椭圆形马铃薯。

2.2.2结果与分析

随机抽取114块马铃薯,对抽取的马铃薯进行正反两面拍照,挑选清晰度最高的228张图片。人工分类后进行计算机视觉分类,操作步骤具体如下:

(1)用DIPS预处理:B通道灰度化,中值滤波和Otsu分割;

(2)通过计算机视觉技术提取马铃薯图片的短长轴比R;

(3)将人工分类与计算机视觉分类进行对比,并得出正确率。

根据图表,我们可以看出在228张仅有两张图片被分类错误,正确率高达99.1%,而这两个分类错误的马铃薯的短长轴比处于0.67周围,分别为0.667604,0.67193和0.671887,0.661063,又因为对马铃薯形状的分类不需要类似工业生产那样精密,所以,当正反两面短长轴比接近时都可看作是椭圆形。

2.3马铃薯的缺陷检测

计算机视觉技术具有实时、客观、无损的检测特点,能对马铃薯的表面缺陷和某些特征要素进行快速检测。基于此,国内外很多研究学者进行了大量的实验研究,在1998年开发了利用PC机辅助的实时马铃薯检测系统,能够对马铃薯的重量、颜色以及形状进行快速检测;2000年,相关研究者在此基础上建立了计算机视觉检测系统,不仅能实现大小、形状的检测,还能对马铃薯表面的生长裂缝、机械裂缝、绿皮等表面缺陷进行检测。当前对马铃薯表面缺陷进行检测的主要计算机视觉技术包括缺陷分割法和缺陷识别法两种方法。

3结论

本文应用计算机视觉技术对马铃薯的大小、形状和表面缺陷等外部品质进行了检测,但是还未能实现利用计算机视觉技术对马铃薯的表面缺陷进行分类这一技术。因此,相关部门要加大研究力度,争取早日完善计算机视觉技术,从而推动我国马铃薯加工企业快速高效的发展。

参考文献

[1]鲁永萍.基于机器视觉的马铃薯外部品质检测与分级.机械设计及理论[D].内蒙古农业大学.2013(学位年度).

[2]史崇升.基于高光谱成像技术的马铃薯外部品质无损检测建模及优化研究.电子与通信工程[D].宁夏大学.2014(学位年度).

作者单位

计算机视觉研究范文篇2

关键词:机器视觉;边缘检测;图象识别;滤波算法

中图分类号:TP242文献标识码:A文章编号:1674-7712(2013)02-0082-01

一、机器人系统的发展及机器人视觉

机器人的发展大致经历了三个成长阶段,也即三个时代。第一代为简单个体机器人;第二代为群体劳动机器人;第三代为类似人类的智能机器人。它的未来发展方向是有知觉、有思维、能与人对话。机器人向着智能化、拟人化方向发展的道路,是没有止境的。机器人视觉是计算机学科的一个重要分支,它综合了光学、机械、电子、计算机软硬件等方面的技术,涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。我国机器人视觉应用主要有以下目的:用以代替人类从事危险、有害和恶劣环境、超净环境下的工作;提高劳动生产率,改变产品质量,快速相应市场需求,加强在国际市场的竞争能力。

二、机器人视觉的原理

机器视觉是机器人感知周围环境的主要途径之一。它可以通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为符号,让机器人能够辨识物体,并确定其位置。目前成熟的光电成像技术都只能捕获二维明暗信息,而不能获得距离信息,所以直接通过这种途径获得的机器视觉也只能是二维的。随着科学技术的发展,三维立体视觉的解决方案也如雨后春笋般涌出,其中就包括双目立体视觉,狭缝光投影法,时间差法等。

(一)实现方法

1.图像的获取与预处理:用于进行三维特征提取的图像是一幅常规的二维灰度图,所以使用一个常规的CCD或CMOS图像传感器即可满足要求。图像需要进行量化处理,即把图像信息分成许多像素点,这些亮点经过A/D转换后即可输入计算机进行处理。2.边缘信息提取:边缘提取算法就是把一副灰度图像转化为二值图像,灰度图像中的轮廓在二值图像中用1表示,而非轮廓位置用0表示。边缘提取算法的种类非常地多,如Robert算子卷积法等。3.边缘检测与轮廓连结:边缘检测主要采用各种算子来发现、强化图像中那些可能存在边缘的像素点。边缘检测算子除了有Roberts算子外,还有索贝尔算子(Sobeloperator)和Prewitt算子、高斯偏导滤波器以及Canny边缘检测器等。4.利用线条分类识别三维物体:提取出二维图像的轮廓信息,还不足以分析出其中的三维特征,我们必须对轮廓信息进行进一步的模式化处理,从轮廓中提取特征。5.从二维图像中提取三维特征的局限性:虽然从二维图像中提取图像的三维特征的算法对设备的要求低,处理的数据量相对较小,输出地结果也比较规整。但是这种算法也有其局限性。

(二)摄像机模型及透视技术

透视技术实际是一个非线性映射,这在实际求解时可能需要大的计算量,而且如果透视效果不明显,直接使用该模型可能会使求解变为病态。透视逆变换把三维物体转变为二维图形表示的过程称为投影变换。

三、基于视觉的机器人路径规

针对移动机器人规避障碍和寻找最优路径问题,提出了在复杂环境下移动机器人的一种路径规划方法。采用了栅格法建立了机器人工作平面的坐标系,整个系统由全局路径规划和局部避碰规划两部分组成[8]。在全局路径规划中,用改进蚁群算法规划出初步全局优化路径;局部避碰规划是在跟踪全局优化路径的过程中,通过基于滚动窗口的环境探测和碰撞预测,对动态障碍物实施有效的局部避碰策略,从而使机器人能够安全顺利的到达目标点。这种方法能在较短时间内找到最佳路径并规避障碍。

四、机器人视觉处理程序

机器人视觉处理程序的主要功能包括:(1)从USB摄像头实时读取视频数据,进行简单的预处理;(2)随后进行图像处理,主要完成空域的图像增强。通过对图像进行二值化,将目标小球从背景中提取出来;(3)计算目标的位置,进而计算出机器人头部的旋转角度,通过舵机驱动程序,控制机器人头部转动到目标所在角度,实现对目标物体的跟踪。

经过实验,机器人头部可较好地跟踪目标,实现了视觉原型系统。

(一)机器人视觉的目标与任务

目标:使机器人具有感知周围视觉世界的能力。让机器人具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。

任务:图象的获取、预处理、图象分割与表示与描述、识别与分类、三维信息理解、景物描述、图象解释。红色部分就构成了图像分析的研究内容。

(二)视觉信息的处理

移动机器人视觉信息的处理通常由图象获取、图象分析、关系描述三部分组成。

五、结束语

移动机器人是目前机器人领域的研究重点之一,吸引着众多学者的注意。机器人的研究涉及到人工智能、控制理论、传感器技术和计算机科学等多门学科。通过阅读大量的期刊、学术论文用于进行三维特征提取的图像是一幅常规的二维灰度图,所以使用一个常规的CCD或CMOS图像传感器即可满足要求。图像需要进行量化处理。为了给形态学处理的图像提供统一的条件,计算机在把获得图像进行形态学处理前,必须先对其进行预处理。由于各方面客观条件以及个人研究能力的限制,在机器人技术中嵌入式系统的应用及视觉处理程序方面的研究还不够深入,还需要在今后的研究中不断深入探讨。21世纪是信息化的时代,随着信息技术的发展和普及,机器人视觉系统无论是在理论研究上上,还是在应用方面都将很大进展。

参考文献:

[1]段峰,王耀南.机器视觉技术及其应用综述[J].自动化博览,2002(3):43-47.

[2]李文锦,吴海彬,何祖恩.基于机器视觉的机械测量及识别技术研究[J].机床与液压,2010(1):32-51.

计算机视觉研究范文篇3

该文围绕基于内容的图像检索技术展开研究,对国内外基于内容的图像检索算法技术进行对比,概括了基于内容的图像检索算法技术的特点,在基于内容的图像检索算法技术中采用的相关核心技术进行了简要分析。

关键词:图像检索;图像特征提取;RGB

中图分类号:TP393文献标识码:A文章编号:1009-3044(2016)01-0206-02

1概述

视频信息处理的基础是图像信息处理技术,我们生活在一个科学的信息时代,平时我们从外界接触到的信息主要都来至图像、文本、视频等,自然世界本来面貌的反应来至图像和视频,图像和视频是最贴近大自然的,图像信息在我们的信息处理领域中占有很重要的地位。

人们在计算机技术和互联网技术的发展中接触到大量的信息,人们之所以可以获得大量的多媒体信息主要依靠互联网,互联网具有动态发展和快速增长的特点。信息量的暴增,信息量的不断增加导致信息大爆炸,我们怎么样对信息快速而准确的查找,怎么更好地对大量的信息进行管理是一个关键性问题。视觉信息是人们获取信息的主要方式,视觉信息可以对人们周边的事物还原本来的面貌,给人自然贴切的感觉,人们对内容丰富、表达直接的多媒体图像信息很关注,我们每天的天气预报需要卫星云图,网上购物时候商品主要都是以图片的形式展现给消费者。面对人们对图片信息的需求,快速准确的检索出来我们需要的图片信息是急需解决的问题,图像信息比文本信息表达给我们的要更详细,更容易接受。

基于内容的图像检索技术是一个功能强大的技术,数字图书馆改变的传统图书馆的模式,数字图书馆用数字形式把多媒体和图像都表现出来,把信息收集和整理到一起,我们可以在网络的平台上运用基于内容的图像检索算法技术对图书信息进行检索,基于内容的图像检索算法技术成为数字图书馆应用的重要技术。在医疗上,各大医院在医疗诊断上也应用基于内容的图像检索算法技术,磁共振图像、CT图等图像,医生可以应用基于内容的图像检索算法技术对这些图像进行分析研究,帮助医生更好的工作。在互联网的电子商务时代,网上购物很大的替代了实体店,网上商品的展示主要是图片信息,用户要想找到符合自己需求的商品,也是要有基于内容的图像检索算法技术的支持。知识经济的发展知识产权被重视,对注册的商标的图片信息,要在图片信息库中进行检索,对比是否有重复的图片,确定商标是否可以被注册,这也是要有图像检索技术的支持。警察在对案件进行侦破的时候要有指纹的采集,这也是图像检索技术。服装设计、新闻广告需要的图片比较多,这就需要图像检索技术搜索出符合自己需求的图片信息。图像检索技术应用在社会的很多领域,军事、工业、教育等。

2国内外研究现状分析

国外基于内容的图像检索算法研究技术主要是基于图像视频媒体,对查询接口和检索内容的管理,IBM早期应用基于内容的图像检索算法研究技术系统,支持WEB检索和图像数据库检索,根据颜色纹理特征对照片图像进行检索,系统查询和特征查询的界面直接面向用户,便于用户使用,随着计算机网络发展IBM现在基于内容的图像检索算法研究技术应用到了商业医学等图像检索领域,比较有名的是基于互联网的远程博物馆漫游计划。哥伦比亚大学的比较常用的基于网页界面的图像搜索引擎,采用图像色块的不同的特点进行对比匹配的多种查询方法,在互联网上建立一个用户查询,采用可视化对象的方式,并对图像的特征进行提取,为用户提供检索的接口。加利福尼亚大学早期采用对图像进行分割然后查找出相似的图像,特征表述法可以快速帮助用户对图像进行查询匹配。加州大学基于内容的图像检索算法研究技术系统是先把数据库样例图像进行分割,然后根据用户图像的需要对分割的图像的颜色形状等特点进行检索查询。

国内一些科研研究机构也开始对基于内容的图像检索算法研究技术方面内容进行研究,国内研究还是处于对图像颜色的查询,对于比较成熟的图像形状纹理技术的查询还需要研究,国防科技大学对图像数据库的体系结构,面向用户接口界面等技术有一定的研究基础,对理论比较重视。清华大学图像检索技术应用在对文物壁画的较多,对文物的年代的判断是基于壁画的主色进行判断,也开发了一个比较完整的基于内容的图像系统,这个系统对图像研究采用的检索技术是颜色纹理分布关键词来进行表述的。浙江大学对图像检索技术的研究是在1995年,对图像检索系统的研究主要是特点颜色形状的图像,图像检索系统查询主要是对关键字、颜色纹理布局、全局颜色纹理,拥有自己开发的图像检索系统,并应用于科研工作。

3图像处理技术研究的特点

早期的图像处理技术是人工标注的图像检索,这种技术主要是对图像进行人工分析,对图像特征进行文字标注,建立文本文献索引数据库。在对图像数据库进行检索时候主要是得到图像编号,转变成文字检索。随着计算机和互联网技术发展,人们采用人工标注的图像检索技术已经不能满足对图像检索的需求,基于内容的图像检索算法技术是计算机图像处理技术和数据库技术结合的产物,分析和识别物理图像,用计算机来模拟人对图像的观察,把观察到的物理图像的特征进行标识然后组织管理,人们对图像的检索依据特征的标识在数据库图片信息中找到匹配的信息,从而在大量的数据库中检索出需要的图片信息。

1)基于内容的图像检索算法研究内容特点:基于内容的图像检索算法研究最初椒图像胡匹配,对图像内容和相同处采用全局方式去描述,简单、单一的图像采用这种方式;采用用户自己用计算机检索图像的方法,这种方法我们叫做图像检索反馈技术,用户在用计算机对自己需要的图像进行检索时,把图像按自己的需求分成需要的和不需要的,然后反馈给系统,这样系统会对用户检索的图像进行标识,这样通过反馈的标识进而返回用户满意的检索图像,对查询图像的特征进行查询直到用户满意为止,这种方式采用循环查找匹配;对图像检索采用区域的方法,对图像物体的提取之前先把图像用技术进行分割,把每个图像的自己的特征整合到一起编程图像的整体的特征,对图像的检索采用图像相识度进行对比。

2)基于内容的图像检索算法研究技术特点,基于内容的图像检索算法研究技术与传统的通过关键字进行检索技术不同,基于内容的图像检索算法研究技术是通过在数据库中的图像信息的特征进行检索,满足用户查询的要求,采用相识度的检索技术从大量的数据库中查找出和用户检索内容相似特征的图像,然后把检索出来相识特征的图像进行整理排列,用户在自己筛选最后检索出自己需求的图像信息,在数据库多媒体庞大的信息量时代,对图像特征进行匹配是一个很大的计算,需要快速的检索速度,基于内容的图像检索算法研究技术采用查询图像的界面面向用户。

4基于内容图像检索技术

本文涉及的图像检索技术包括颜色模型技术,图像特征提取、图像纹理特征提取、图像形状特征提取、图像的相似度技术。

颜色模型技术,颜色模型是颜色空间的表现方式,基于视觉的视觉模型和基于物体的颜色模型是颜色空间的两个结构方式,我们对颜色认知上的RGB就是基于物体的颜色模型,视觉模型主要是研究图像相识度的。RGB颜色模型有R、G、B、三个坐标轴,颜色的分布和变化是根据坐标点在三个坐标轴的具置定的,图像的色彩可以用RGB三色的坐标轴来建立,RGB是颜色空间的显示。

图像特征提取,基于内容的图像检索技术的基础就是图像的特征提取,文本特征和可视化特征是图像提取的两种方式,图像特征提取包括图像的共同特征提取比如颜色纹理,和具体的应用在假设的基础上对图像内容比如人体特征提取两种,图像特征提取包括好多的专业性知识。颜色特征是图像检索中的关键因素,图像的物体和场景特征主要在颜色上体现出来,颜色图像特征是人们的视觉特征,蓝色体现大海的颜色特征,绿色体现草原的颜色特征,主要技术包括颜色矩、颜色直方图、颜色相关图等。

图像纹理特征提取,体现图像相同质地表面共有的内在的视觉特征,物体表面的组织信息和物理与周围环境的关系都通过视觉特征表现出来,人们可以采用局域内容的图像检索技术采用纹理特征把相同纹理特征的物理图像从数据库中检索出来,基于内容的图像检索技术主要采用的纹理特征技术包括小波变换技术和灰度矩阵技术等。

图像形状特征提取,图像形状特征和图像颜色、纹理特征不同,图像形状特征是基于图像物理本身划分的各个区域,是计算机视觉模式研究的基础,被应用到特殊的研究中,在物体形状的翻转拉伸等变化不影响图像形状特征,在计算形状的相识度上提出了高的要求。轮廓特征体现在物理的边界表面,区域特征体现在图像物理的整个形状,轮廓特征和区域特征可以很好地把图像特征表示出来,图像形状特征提取技术采用几何变换和傅里叶变换两种计算方法。

图像的相似度技术,传统的文本检索是基于文本的匹配,计算机对图像查询和数据库中图像的相似度是基于内容的图像检索技术完成对图像进行检索的主要方法,基于内容的图像检索技术关键是图像的匹配,图像的相似度计算包括特征向量的归一化、距离函数的相似性技术等。

5总结

基于内容的图像检索算法技术在多媒体数据库中对图像进行检索,采用对图像内容进行分析归纳特征,根据分析出的特征在数据库大量的图像库中对特征进行匹配,找到相似的特征的图像并检索出来供用户选择,基于内容的图像检索技术的关键性是图像特征的提取,本文主要对图像特征的提取技术展开研究,本文技术创新在于基于平面颜色理论的RGB图像检索算法,使用RGB颜色空间,提出颜色的空间分布特征。基于内容的图像检索算法技术最终要实现的是把用户需要的检索结果返回给用户,是计算机图像检索技术的一个新的技术,在图像检索应用上有很大的应用空间。

参考文献:

[1]廖倩倩.基于内容的图像检索系统的实现[J].电视技术,2007(2).

计算机视觉研究范文篇4

本文采用山羊绒手排长度测试仪、传统山羊绒手排长度法、Almeter仪三种测量方法检测山羊绒长度,比较三种方法的差异性,从而证明山羊绒手排长度测试仪的可靠性、稳定性。

关键词:山羊绒;长度;试验方法;比对

目前测试山羊绒长度的方法有三种。传统山羊绒手排长度法是在排图后直接在绒板上进行长度测量,这种方法有很多缺点:一是测量后需要手工计算,二是会使图形发生变化,影响测量准确度,三是实验员手法差异会产生误差。Almeter仪较适合羊毛条检测,用于山羊绒长度检测,存在不符合纤维特性、科学性差、误差大的问题。而采用基于计算机视觉技术的山羊绒手排长度测试仪可直接精确地测量计算出手排长度的所有相关参数。现采用三种试验方法比较其工作效率、准确程度、稳定性、重复性等指标,以完善和改进仪器,为推广使用提供科学依据。

1试验内容

依据标准GB18267―2013《山羊绒》和GB/T21293―2007《纤维长度及其分布参数的测定方法阿尔米特法》分别采用传统山羊绒手排长度试验方法测量山羊绒手排长度;采用山羊绒手排长度测试仪测量山羊绒手排长度;采用Almeter测量山羊绒巴布长度。

1.1参加的实验室及检测项目

(1)国家毛绒质量监督检验中心(内蒙古自治区纤维检验局):传统山羊绒手排长度、Almeter长度、山羊绒手排长度测试仪测量长度。

(2)鄂尔多斯羊绒集团:传统山羊绒手排长度;Almeter长度。

(3)鹿王羊绒集团:传统山羊绒手排长度、山羊绒手排长度测试仪测量长度。

(4)河北省纤维检验局:传统山羊绒手排长度。

(5)青海省纤维检验局:传统山羊绒手排长度。

(6)浙江省纤维检验局:传统山羊绒手排长度。

1.2试验时间

2013年11月(自接到样品,15日内完成)。

2试验结果

2.1手排长度方法与手排长度测试仪方法比对

由内蒙古纤检局与鹿王羊绒集团联合检测,共重复试验60次,其平均差异为0.121mm。

采用平均数差异的显著性测定,其结果如下:

1)传统手排长度方法:平均长度x1=32.856mm,其标准差S=1.8506,n=60。

2)手排长度测试仪:平均长度x2=32.735mm,其标准差S=1.3211,n=60。

3)其差异的标准差:

平均数标准差

平均数标准差

查t值表t0.05=1.980,t0.01=2.617。因为t'

2.2山羊绒手排长度测试仪台间差比对分析

本项目研制了2台山羊绒手排长度测试仪样机,按照比对方案,采用2台测试仪对同一山羊绒样品进行了重复试验30次,其平均差异为0.02mm。采用平均数差异的显著性测定,结果如下:

1)1|测试仪:平均长度x1=32.47mm,其标准差S=1.127,n=30。

2)2|测试仪:平均长度x2=32.45mm,其标准差S=1.056,n=30。

3)其差异的标准差:

平均数标准差

平均数标准差

查t值表t0.05=2.000,t0.01=2.660。因为t'

2.3山羊绒手排长度测试仪与Almeter仪测量的山羊绒巴布长度的比对

采用Almeter仪测量山羊绒巴布长度,与图板电子检测仪比较。平均数差异的显著性测定其结果如下:

1)图板电子检测仪:平均长度x1=32.735mm,其标准差S=1.3211,n1=60。

2)Almeter仪:巴布长度平均值x2=32.60mm,其标准差S=0.70,n2=30。

3)其差异的标准差:

平均数标准差

平均数标准差

查t值表t0.05=2.000,t0.01=2.660。因为t'

2.4山羊绒手排长度测试仪与6家实验室手排长度平均值的比对

采用山羊绒手排长度测试仪对同一山羊绒样品进行了重复试验60次的总体平均值与参加比对试验的6家实验室手排长度平均值的总体平均值进行显著性测定。平均数差异的显著性测定其结果如下:

1)测试仪:平均长度x1=32.735mm,其标准差S=1.3211,n1=60

2)6家实验室传统手排法:平均值总体平均值x2=32.39mm,其标准差S=2.449,n2=6

3)其差异的标准差:

平均数标准差

平均数标准差

查t值表t0.05=2.000,t0.01=2.660。因为t'

3结论

(1)山羊绒手排长度测试仪检测与传统手排长度方法结果没有显著性差异,因此,采用山羊绒手排长度测试仪可替代传统手排长度法,既可提高检测效率,减少人为误差,又能提高检测的准确程度。

(2)已研制的两台测试仪样机检测结果没有显著性差异,说明仪器的稳定性好。

(3)山羊绒手排长度测试仪与Almeter仪测量山羊绒巴布长度的比对没有显著性差异。

计算机视觉研究范文篇5

关键词:计算机视觉;智能交通;监控系统

中图分类号:TP277

近些年来,随着我国人民生活水平提高,使私家车辆的数目急剧增长,并且车辆的增长速度远远超出市政建设的力度。这样的事实导致城市交通拥堵、违规通车、车祸增加,所以迫切的要求加快市政建设,实施高效率的交通监控措施,基于计算机视觉的智能交通监控系统也由此得到了相应的广泛的发展和应用。那么,计算机视觉技术下的智能交通监管系统究竟应该如何设计与实现呢?

1计算机视觉下的智能交通监控系统

1.1计算机视觉技术

计算机视觉技术即利用各种图像摄录设备将通过对视觉目标进行识别、跟踪、测量并将由此获取的视觉信息传输至计算机并进而利用图像技术进行视觉信息处理以达到进一步进行智能化处理的视觉处理技术。

1.2智能交通系统(ITS)

智能交通系统(ITS)是指通过现代化的网络信息技术、自动控制技术等有效综合手段在一定范围内建立的全方位发挥作用的交通运输综合管理和控制系统。作为交通运输管理体系的一场新的革命,近年来,由此技术进一步开发形成的监控系统已经在各个道路的关键路口、路段和其他交通繁忙地域普遍建立,为交通运输管理提供了自动化、智能化的信息收集和处理等多方面的服务。但是,随着城市建设的迅猛发展和人流、车流量的猛增,更加智能化的交通管理系统的开发和利用显然也成为了当务之急。

2计算机视觉下的智能交通监管系统的建立

正是基于新的发展需要,我们有必要把计算机视觉和智能交通监控系统进一步结合起来,首先通过计算机视觉分别对各个道路的关键路口、路段和其他交通繁忙地域等相应位置实时进行交通信息采集,然后,通过信息传输系统、或者进行处理后存入服务器并将处理过的实时交通信息及时传输到监控指挥系统,以实现对于各个道路的关键路口、路段和其他交通繁忙地域的实时监控和管理。由此,显然就需要设计以下各个子系统并共同构建为一个完整的体系。

计算机视觉下的智能交通监管系统

实时交通信息收集系统

监控指挥系统

高质量信息存储传输系统

图1计算机视觉下的智能交通监管系统工作程序示意图

3智能交通监控系统的实现

计算机视觉下的智能交通监管系统实现的第一步是通过实时交通信息收集系统实时进行交通信息采集,即通过对于运动物体的分割,在图像找出有意义的部分,抽出运动目标的特征,进而通过连续画面间的变化判断目标的运动状况。在这一系统运行中,首先可以“摄像头读入”的初始视频,使用相应的算法提取“背景”,然后通过原图与背景运算形成相应的“前景”,由此即可进一步通过矩形框的使用来达到“运动目标检测”与信息采录的目的。

图2视觉监控系统原理图

3.1系统功能实现

对运动物体的检测主要有光流法以及差分法两种方法,由于光流法比较复杂和耗时,实时检测很难实现,因而,现有实时交通信息收集系统一般通过差分法的应用来进行开发和实现。

3.1.1帧间差分法

帧间差分法对运动目标进行分割处理过程中使用较多也最为简单实用的一种方法,其基本原理就是通过在连续的图像序列中两个或三个相邻帧间采用基于像素的帧间差分并且阈值化来提取图像的运动区域,进而通过逐象素比较获取前后两帧图像之间的差别来判断运动物体的移动状况。在实际操作中,一般可以假设用于获取序列图像的视频设备为静止物体,设视频中连续两帧的图像为It(x,y)和It+1(x,y),然后通过对连续两帧的图像相应的像素进行比较,利用Dt(x,y)=It+1(x,y)-It(x,y)这一方程求出相应的阈值来检测出运动物体的移动状况:

Mt(x,y)=

当然,必须注意的是,由于帧间差分法所得到的差分图像在现实中并非由理想封闭的轮廓区域组成的,因而,运动目标的轮廓自然也就往往是局部的、不连续的,且其误差往往随着运动物体速度的增大而增大,因而,这一方法并不适于对于高速运动目标的有效检测。

3.1.2背景差分法

与帧间差分法不同,背景差分法则是利用当前图像与背景图像的差分来检测物体运动状况一种方法。其基本原理是在可控制环境下,通过对于运动背景的固定假设,设待检测运动物体的图像为I(x,y),背景图像为B(x,y),通过输入图像与背景模型进行比较,利用D(x,y)=I(x,y)-B(x,y)这一方程求得到图像中的各像素的变化信息,进而检测运动物体的移动状况:

Mt(x,y)=

当然,在实际运用中,背景差分法的关键,是要建立一个背景模型,并更新模型。

3.2程序功能的实现

本程序功能实现所主要使用的是OpenCV函数。OpenCV能够实现对图像数据的操作,包括分配、释放、复制、设置和转换数据,以及对摄像头的定标、对运动的分析等。在函数实现上,用到了Cv图像处理的连接部件函数,运动分析与对象跟踪中的背景统计量的累积相关函数等相关的函数。本系统就是运用图3介绍使用到的函数名及其功能和使用格式等来实现对视频流的运动车辆的轮廓检测的。

图3寻找轮廓程序主要算法流程

实验证明,本系统能够较好地实现对视频流的运动目标的轮廓检测和对象跟踪,并能实时更新背景,车辆跟踪正确率在95%以上,虽然存在着轮廓检测正确率稍差的缺点,但其主要原因是由于摄像头所处的角度和运动目标靠近程度的影响,从根本上并不影响对于运动目标的实际检测。

4结束语

加快城镇化进程是我国发展的大趋势,在这一趋势下,城市病的治理当然可以离不开现代化的科学技术。但是,必须注意的是,无论多么先进的管理系统,最终都只有通过人的行为才能够发挥有效的作用,在这个意义上,设计与使用先进的交通监控系统固然是解决交通问题的技术条件,但是,交通问题的解决,最终还必须依赖于人的素质的全面提高。

参考文献:

[1]戴俊乔.城市道路交通视频监控系统架构和性能的研究[J].科技与创新,2014(06).

[2]张伟龙,李刚,王雨翔.基于计算机视觉的智能交通监控系统[J].小型微型计算机系统,2014(07).

[3]庞其富.浅谈城市轨道交通视频监控系统设计方案[J].通讯世界,2014(01).

计算机视觉研究范文篇6

【关键词】视觉;症状和体征;计算机;环境暴露;学生

【中图分类号】R179R163【文献标识码】A【文章编号】1000-9817(2008)07-0585-03

视频显示终端综合征又称VDT(visualdisplayterminal)综合征,是指从事光学显示器终端作业所引起的一系列症候群。随着计算机等视频终端的普及,人群视疲劳的发生率呈逐渐上升趋势。视疲劳不但不同程度地影响患者的视觉功能和生活质量,而且也影响患者的身心健康。VDT操作人员由于长时间注视荧屏和在固定姿势下操作,易出现视觉疲劳与全身症状,其主要表现为眼干、眼酸、眼痛、视力减退以及头昏、头胀、颈和腰背酸痛、四肢酸痛、食欲减退、便秘、失眠等[1-3]。世界卫生组织(worldhealthorganization,WHO)调查表明,计算机工作人员视疲劳发生率为10%~40%,有的可达40%~92%;经常连续击键的计算机操作人员,骨骼肌慢性损伤发生率可达10%以上。同时,它还会造成神经行为异常,影响正常的免疫系统功能等。目前,随着我国经济的发展和现代化办公设备的普及以及教育理念的不断更新,高校学生的计算机使用率和拥有率不断上升,计算机教学、计算机作业、网络信息交流等已经迅速深入到大学生的学习和生活中,各种荧屏暴露的影响也更为深刻。为了解和分析目前在校大学生和研究生计算机荧屏暴露的时间,探讨暴露时间对眼视觉功能及全身状况的影响,笔者对北京市海淀区4所重点大学的在学生进行了调查,为探讨和建立长期计算机荧屏暴露人群的防治措施和膳食与健康指南提供依据。

1对象与方法

1.1对象以北京大学医学部、北京航空航天大学、北京科技大学、清华大学在校本科生、研究生为对象,采用多阶段抽样方法,按年级、学校、性别分层,共调查在校大学生和研究生2222名,其中本科生1437名(64.7%),研究生785名(35.3%);男生1136名(51.1%),女生1086名(48.9%)。年龄为17~30岁。

1.2方法采用问卷调查方法。问卷由北京大学医学部营养与食品卫生学系专业人员设计完成,并选取20名不同性别的大学生与研究生进行预调查,根据预调查反馈的信息对问卷进行了修订,再进行正式调查。问卷由北京大学医学部预防医学专业的研究生和大五年级的学生发放。调查主要采取入户方式,由调查员指导被调查者填写,由督导员进行监督,问卷当场收回,在完成问卷填写后发放礼品。共调查问卷2246份,其中有效问卷2222份,废卷24份。

1.3调查内容内容包括一般个人资料、工作史、计算机荧屏暴露史、荧屏前工作时间、眼痛、眼干等眼部症状及头痛、头昏、颈和腰背酸痛、四肢酸痛等全身症状。症状分为10级:0分为无症状;1~4分为轻,即用眼后出现眼部酸、胀等眼部症状,休息后很快恢复,对学习和工作无明显影响;5~8分为中,即有明显的眼部症状,且症状经常出现,影响生活质量及工作,必须用药缓解;9~10分为重,即除有明显的眼部症状和视作业不能持久外,尚有记忆减退、失眠等全身不适,用药后不缓解。

1.4质量控制调查问卷设计中有质量控制题,以判定问卷填写的真实程度;问卷无记名,在问卷抬头处注明调查目的和保密方法,并在调查问卷回收时赠送礼品以提高被调查者的依从性;数据录入完成后,项目负责人随机抽取10%的问卷进行检查、复核,错误率

1.5资料整理与分析首先进行方差齐性检验,数据呈正态分布,采用方差分析和χ2检验。数据统计分析采用SPSS10.0数据包进行,以P

2结果

2.1计算机荧屏暴露时间将被调查对象按年级分组,计算各年级学生计算机荧屏暴露时间,见表1。

表1结果显示,北京市4所重点大学学生每日计算机荧屏暴露平均时间为(5.20±3.06)h。方差分析结果表明,随着年级的增长,计算机荧屏暴露时间显著延长(P<0.05);LSD法两两比较结果表明,各年级研究生计算机荧屏暴露时间显著长于本科生(P<0.05),高年级学生显著长于下一年级学生(P<0.05)。

2.2计算机荧屏暴露时间对眼与视觉功能的影响将每日计算机荧屏暴露时间以2h和6h为界,分为低、中、高3个时间段,统计各时间段眼症状发生状况,表2结果显示,计算机荧屏暴露时间长短与各项眼症状均有明显相关性,即计算机荧屏暴露时间越长,症状越明显(P<0.01)。χ2检验结果显示,计算机荧屏暴露高时间段组眼及视觉症状出现的频率高于暴露低时间段组和中时间段组,且差异有统计学意义;同样,计算机荧屏暴露中时间段组出现眼及视觉症状的频率高于暴露低时间段组。其中总发生率最高的是视力下降(42.71%)、视物模糊(39.3%)和眼干(38.3%)。

2.3计算机荧屏暴露时间对全身症状的影响将每日计算机荧屏暴露时间以2h和6h小时为界,分为低、中、高3个时间段,统计各时间段全身症状发生状况,表3显示,计算机荧屏暴露时间长短与全身症状均有明显相关性,即计算机荧屏暴露时间越长,症状越明显(P<0.01)。χ2检验结果显示,计算机荧屏暴露高时间段组全身症状出现的频率高于暴露低时间段组和中时间段组,且差异有统计学意义;同样,计算机荧屏暴露中时间段组出现全身症状的频率高于暴露低时间段组。其中总发生率最高的是困倦(48.4%)和颈痛(38.1%)。

2.4医学院校与理工类院校学生眼与视觉及全身症状发生率比较进一步比较发现,每日计算机荧屏暴露平均时间医学院校学生为(4.56±2.66)h(800名),理工类院校学生为(5.56±3.21)h(1422名),理工类院校学生计算机暴露时间显著高于医学院校(P<0.01)。两类院校学生眼与视觉及全身症状的发生状况见表4,5。

表4,5显示,医学院校学生各种自觉症状发生率均低于理工科院校,其中重影、异物感、视力下降、眩晕、食欲减退、恶心、烦躁、记忆力减退、失眠等差异均有统计学意义(P值均<0.01)。

3讨论

长时间计算机荧屏暴露对人体的影响主要表现在视觉功能与骨骼、肌肉,能引起视力下降、视物模糊、眼干等。产生视疲劳的原因主要有眼调节功能的过分使用和衰弱[4],生活与工作环境的异常刺激,导致环境性视疲劳,以及精神因素、某些全身性疾病、长期过度紧张的脑力劳动也可致视疲劳[5]。

计算机操作为坐姿,长期、持续不变的姿势和强迫使作业者的腰、背、肩及手臂等部位的骨骼肌长时间处于紧张状态,产生疲劳。持续计算机作业者常会在作业中、作业后出现手指、手腕、肩、背等部位肌肉僵硬、麻木、疼痛等[6-8]。这些疲劳感的发生率、局部骨骼肌的疲劳程度与作业时间成正比。

调查发现,北京市几所重点大学在校学生计算机使用时间随年级递增而显著延长,各年级之间差异均有统计学意义。分析其原因,可能是随着年级的升高,课程逐步深入,越来越多地需要计算机参与教学与作业,多项社会工作、资料和信息查询也需要借助网络。研究生的查阅文献、撰写综述与论文等均需要计算机完成,且随着经济的发展,相当数量的学生持有个人计算机,这些都增加了计算机使用的时间。

理工类院校学生计算机荧屏暴露时间显著高于医学院校学生,多数自觉症状发生率也高于医学院校。一方面,医科学校学生的生活和学习对计算机的依赖程度低于理工科学校;另一方面,医学生对于长时间接触计算机的危害也更清楚,能自觉地采取各种预防和保健措施,防止身体受到过多负面影响。

近年来,多项国内外研究显示,过多暴露荧屏光可致视力下降以及一系列视觉及全身不适。韦莹[9]对某校计算机系大学生进行计算机终端视疲劳问卷调查显示,相当数量的学生有视力减退、视物模糊、眼干涩、烧灼感等视疲劳症状和肩背酸痛、腰痛、精力不集中、疲倦等全身症状。症状轻者休息后能缓解,对工作及生活影响较小;重者症状加剧,休息后不能有效缓解。本次对北京市4所不同性质的重点大学进行大样本量的调查,使结果可以进行对比研究,加以此次调查人群的广泛性和时效性,更能够反映目前高校学生的计算机荧屏暴露状况,为校园内视疲劳的流行病学研究提供资料,也更有利于探讨大学教育中应该注意的问题。

4参考文献

[1]傅智伏,张铭志,洪荣照,等.观看视频终端与青少年近视的关系:598例病例对照研究.伤残医学杂志,1999,7(3):26-30.

[2]张云霞,卢彦明,赵广臣,等.视屏显示终端作业工人情感状态特征及神经行为功能测试.中国公共卫生,1997,13(11):684-685.

[3]NAKAISHIH,YAMADAY.Abnormalteardynamicsandsymptomsofeyestraininoperatorsofvisualdisplayterminals.OccupEnvironMed,1999,56(1):6-9.

[4]徐广第.眼屈光学:修订版.北京:军事医学科学出版社,2001:226-273.

[5]MOCCIF,SERRAA,CORRIASGA.Psychologicalfactorsandvisualfatigueinworkingwithvideodisplayterminals.OccupEnvironMed,2001,58(4):267-271.

[6]YUNMH,LEEYG.Resultsofasurveyontheawarenessandseverityassessmentofupper-limbwork-relatedmusculoskeletaldisordersamongfemalebanktellersinkorea.IntJIndErgonom,2001,27(2):347-357.

[7]CHUNGMK,CHOIKG.ErgonomicanalysisofmusculoskeletaldiscomfortsamongconversationalVDToperators.ComputIndEng,1997,33(3-4):521-524.

[8]余善法,王志炜.VDT作业对肌肉骨骼系统的健康影响研究.工业卫生与职业病,1994,20(5):277-279.

计算机视觉研究范文篇7

关键词:智能视频监控;目标跟踪;运动分割;图像标定

中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)35-8499-03

1概述

在人类的活动所涉及的各种信息中,以视觉信息所占是比重最大。人类主要依靠视觉系统来形成记忆。计算机视觉系统便是模拟人类视觉系统的某些功能,用摄像机和电脑代替人眼对目标进行识别、跟踪、测量,实现计算机对三维景物世界的理解。计算机视觉是计算机科学和人工智能的一个分支,目前既是工程领域也是科学领域里一个极富有挑战性的研究项目,它的实现,将给相关重要应用领域,如制造业、医疗诊断、检验以及军事领域中的智能、自主系统等,带来质的改变。近三十年来,计算机视觉技术已经取得了突飞猛进的进展,它的巨大应用前景将使得这种发展势头继续保持相当长的时期。

计算机视觉是通过运用各种成像系统代替人的视觉器官实现成像输入的,再由计算机来代替大脑完成对视频图像的分析和处理。目前有两种技术途径可以实现计算机的智能视觉效果,一个是仿生学方法,另一个是工程方法。仿生学是从分析人类视觉入手,通过对人类视觉成因原理的了解,参考人类视觉建立一个计算模型,用计算机系统将所有的过程和结果一一重现。由于这种技术方法目前还有许多难题需要破解,进展十分缓慢,因此更多的考虑采用工程方法。工程方法脱离了人类视觉系统的种种条框,从另一个角度寻找各种可行的技术方法实现计算机的视觉功能。

对于人类来讲,视觉系统虽然是获取信息的途径中占比最大的,但是,其他获取信息的通道也是必不可少的。在人类的智能系统中,感知行为是通过各个通道分别获取信息,然后汇集起来,使人类获得一个全面的感知。每个通道所获取的信息对于事物的理解或许是不全面的,但是,将所有的信息通道所获取的信息进行总和后却是可以得到一个相对完整的认识的。以前所研究的比较初级的人工智能系统就犯了以偏概全的毛病,希望通过独立运行一个完美的功能子系统就能获取所有的信息。为了达到这样一个目的,不得不去人为施加种种约束条件,或者造一些脱离实际的理想数据,结果可想而知。我们在研究计算机视觉系统的可行性方法的时候,也要认识到计算机视觉只是人工智能的一部分,它的功能是不能够孤立实现的,必须结合不同的应用背景,与不同的感知通道相互配合,综合达到智能视觉监控系统的目的。例如,计算机视觉系统运用在通信中,应与语言通道想配合;在发现和跟踪目标的应用中就要注意和激光和超声波等非视觉技术配合等。目前,关于计算机视觉的理论还不是太完善,但是相关的应用已经先行一步,该文对计算机视觉系统方面的实际运用方面进行了研究。

2计算机智能视频健康概述

2.1计算机智能视频监控研究现状

计算机视频监控是通过计算机视觉和图像处理来完成对目标的一系列监控目的,比如运动检测、运动目标跟踪、目标分类以及目标行为的描述与理解等。将这些监控目的进一步划分,其中运动目标的类与跟踪、运动检测是近年来视频监控领域里研究较多的项目,也是属于视觉处理中低级和中级的部分;而高级部分是行为的描述和理解,这也是业内近年来较多受到关注的研究热点,它代表了监控行业未来的发展方向,也是信息产业的未来发展趋势。由于它巨大的应用前景,产业界、学术界和各级管理部门都对它给予了高度重视,其中蕴藏着的巨大商机和所带来的经济效益更为人们津津乐道。

人们可以运用计算机智能视频监控系统对拍录到的图像序列进行自动分析,它特有的计算机视觉和视频分析技术可以自动完成这个过程,不需要人为进行过多干预。这样,就可以在很大程度上解决“他们正在做什么”、“他们将会做什么”的问题,而后,人们通过进一步的决策推理过程对“我们可以采取什么问题”的疑问给出答案。目前,社会上发起的平安城市等大型项目已经给智能视觉系统的应用提供了可供借鉴的方向,同时,还可以扩展到人流量统计、监控偷油行为、入侵行为等,这些需要用到智能识别系统的项目都使得人们逐渐对计算机智能视频监控系统重视起来。

2.2计算机智能视频监控系统与运动目标检测技术

目标的运动检测是一项相当困难的工作,这是因为背景图像中往往还存在一些动态变化的影响,如影子、光照、遮挡、混乱干扰以及天气等。这些因素的干扰使得人们很难将运动变化的区域从背景图像中提取出来。直接影响了对目标的分类、跟踪和行为理解等后期处理。目前,常用了运动目标检测技术有背景减除、时间差分、Rosenblum等。

2.3计算机智能视频监控与运动目标跟踪技术

2.3.1运动分割

动态环境中捕捉到的运动目标图像大多受到各种不确定因素的影响,如影子、物体之间或者与环境之间的遮挡、摄像机的运动、光照条件的变化等,这些都给准确有效的运动分割带来困难。但是,快速准确的运动分割是一个相当重要的环节。就拿影子的干扰来说,若是影子与与检测目标分离,容易引起误会,将影子误认为是场景中的目标;若是影子与目标相连,则会扭曲了目标的形状,使得基于形状的目标识别方法不再可靠。目前主要采用的是背景减除法,这种方法的适用范围有限。人们目前还没有找到对于任何复杂环境中的动态变化均有适应性的处理模型。研究者们试着运用时空统计的方法构建自适应的背景模型,也许对于那些不受限于环境的运动分割而言是个好方法。

2.3.2目标跟踪的分类

2.3.2.1根据目标跟踪与目标检测的时间关系可分为三类

一是先检测后跟踪,而是先跟踪后检测,三是边检测边跟踪。

2.3.2.2根据目标跟踪的所采取的策略来分,有3D和2D两种

3D的方法是在一个由基于坐标系构筑的三维立体世界内进目标进行跟踪,2D则是在一个二维平面内对目标进行锁定跟踪。2D的方法所需处理的数据较少,跟踪操作速度较快,但是,对于遮挡问题无能为力。

2.3.3跟踪方法细分

2.3.3.1基于特征的跟踪方法

不管是刚体运动还是非刚体运动,在一序列图像中,相邻的两帧图像中,由于采样时间间隔十分短,在视觉上差别微小,可以认为是这些个体特征在形式上具有平滑性。

2.3.3.2基于主动轮廓的跟踪方法

用参数表示轮廓线,运用目标的边缘特征提供运动方式、物体形状之外的其他目标信息。

2.3.3.3基于运动估计的跟踪方法

运用运动估计技术对目标进行分割和跟踪是一种常用的做法。

2.4图像标定

由目标在图像坐标系下的坐标来求得在世界坐标系下的坐标,称之为图像标定。通常是根据摄像机的内外参数来实现的,简称为摄像机标定。这种方法中,需要注意的是摄像机所得到的图像投影容易受到几何形变的影响,这样在建模的时候,导致精度不够。像平面与所拍摄的物平面上的两条平行线,在图像上就可能是两条相交的直线。一个匀速运动人,想要在图像坐标系下计算出其速度。但是,在近距离拍摄时,测得的速度快,远距离拍摄的时候,测出的速度慢。在进行目标跟踪之前,对目标进行良好的图像标定,可以使目标的动态特性建模效果更加精确。

2.5计算机智能视频监控技术难点

数字化、智能化是视频监控系统的未来发展趋势。目前,视频监控系统系统智能化还需面对许多问题,这些问题大多源于计算机视觉技术方面。

2.5.1从实际情况来看

视频监控系统需要面对一个十分复杂且不断变化的应用环境,这给计算机视觉技术的应用带来了更高的要求,要求能够自动、连续地工作,才能将目标从复杂环境下的分离、结构出来,从而进一步完成其他分析工作。

2.5.2其次,运动目标本身具有多样性的特征

如何使这些目标摆脱客观环境的限制,将目标的变化区域从背景图像中提取出来,从而目标进行运动分析、分类,尤其是对非刚性目标运动进行跟踪、行为理解还是相当困难的,这也是智能视频监控系统领域里近年来研究的重点。

2.5.3若是监控的范围扩大,就需要大量的摄像机进行协同工作

但是,实现多台摄像机对运动目标连续、一致的视觉分析还非容易之事。

2.5.4目前该领域内还产生了建立视频数据库的想法

系统通过这样的方法实现海量视频信息的存储、检索和查询,这方面也是近年来研究的热点,目前还处于起步阶段。距离视频监控系统的智能化目标还有相当长的路要走。

2.6计算机智能视频监控应用前景展望

2.6.1人数统计

在许多人流量大的地方都有人流量统计的需求,如火车站、广场等。这时候目标以人头为基本计算单位,对人头的检测和跟踪是主要技术要求。实际上这种检测轮廓非常重要。

2.6.2车流量统计

在许多路口,交通部门对车流量也需要有个大概统计,许多地方的车流量可以通过其他检测手段检测,视频图像是最快和较为准确的一种方式。

2.6.3遗留物检测

自911事件发生以来,全球对于公共安全的意识日益重视,各国纷纷采取多种措施防范恐怖主义袭击,例如加强出入口管制、随身行李检查、增加警备人员数目、追踪可疑人士的行径等。其中,监控系统扮演了非常重要的角色,特别是在车站、机场、大型商场等人口密集的地区,一旦发生炸弹引爆等恶意袭击事件,后果不堪设想。为了及早防范,监控系统需要采用具备遗留物侦测的智能分析系统,对可疑滞留物品实行及时通报和处理。另外,遗留物侦测也可以用来解决自动提款机(ATM)的安全问题。部份不法份子会在ATM加设卡片阅读机或贴上误导性信息,达到骗取钱财的目的,设置遗留物侦测系统可以及时发现这些非法架设的物品。遗留物侦测还可以用于侦测遗规泊车的情形,结合车牌辨识系统更可达到全自动的智能化执法。一旦发现禁止停车区域有车辆停留,便会触发遗留物警报讯号,并启动车牌辨识器记录违规停泊车辆的车牌号码,大大降低交通执法人员的工作量和运作成本。

2.6.4遗失物检测

在博物馆或公共展览厅贵重物品失窃的情形时有发生,单纯依靠录像做事后处理的消极性做法往往不能解决问题,如果在物品遭窃的瞬间就能马上发现对于防范事件有相当重要的作用。遗失物侦测的作用是可以侦测到画面上物品被移走或是偷走的情形,及时发出警报,同时也能自动分辨出对象属于遗留物还是遗失物。但这类检测对同色物体的分辨分析运算能力有很高的要求,同时对硬件的配套布置也有很严格的要求。

当摄影机被移动或是画面被遮蔽时会造成场景变化,侦测器便可以根据这种情况判断摄影机异常并发出警报。这种应用更加广泛。通产的移动检测都属于此范畴。

在实际应用场景中,日光对监控的影响较大,一般要避免逆光。

3结束语

综上所述,目标跟踪有非常广泛的应用市场需求,我国还处于起步阶段,研发出具有自主知识产权的、稳定可靠、技术先进、节约成本等特点的智能监控系统,可以有效填补国内空白。随着技术的成熟,硬件的推陈出新,应用产品的大幅降价,使得应用范围不断扩大,将来这方面会有更好的前景,使之成为一个能带动相关产业集体发展的一个新型产业。

3.1对经济发展的作用

良好的市场前景会促进企业在该产业的科技力量投入,有力促进了智能监控技术革新,使得企业进入了经济发展的快车道,同时带动了电子产业及相关企业的技术革新及经济发展。形成技术革新与资金的一个良性循环。

3.2对社会发展的作用

增加了对地方经济和就业需求的拉动。产业链的形成,强化实施企业之间的横向经济联合和技术协作,通过企业间技术平台上的横向协作,在特色产业基地内形成合力,打造一条新型的产业链。

3.3对人才培养推动作用

企业的相关类技术人员之间不断的合作交流,大大提高了企业相关类技术人才一个质的飞跃。达到技术推介和人才培养的目的,为国内,特别是经济发达地区今后在电子科研技术领域的进一步发展奠定人才技术的基础。

参考文献:

计算机视觉研究范文篇8

关键词:数字图像技术;应用;发展趋势

中图分类号:TP391.41

计算机的特点在于能够处理各种数据,数字图像能够经过增强、复原、分割等处理,随着计算机技术的不断发展和进步,现在的数字图像技术具有图像处理多样性、精度高、图像的再现性好、处理量大的优点,本文主要研究数字图像处理技术的发展现状和发展趋势。

1数字图像处理技术研究现状

所谓图像处理是指利用计算机来处理图像的过程,主要是实现改善图像的视觉效果,研究的内容主要包括图像数字化、图像增强、图像还原以及图像分割等。数字图像处理最早来源于20世纪20年代的报纸业,到20世纪50年代,随着计算机的发展,数字图像处理技术得到人们的普遍关注,数字图像处理技术随着太空计划得到很大的发展,最具有典型的例子,是对月球照片的处理。

进入到20世纪70年代后,数字图像处理技术随着计算机断层扫面(CT)的出现得到发展,在以后的时间里,数字图像处理技术不断有新的研究成果,1975年EWI公司研究的CT装置获得诺贝尔奖,目前数字图像技术已广泛应用在各行各业中。

2数字图像处理技术的应用

数字图像处理技术目前在各行各业中都得到了很大的进展。在遥感航空航天方面,不少国家都派出了侦查飞机对目标地区进行空中摄影,进而通过图像处理技术来分析照片,节省了人力、物理,也能够从图片中得到其他的有用信息。在20世纪60年代以来,美国以及其他的一些国家发射了资源遥感卫星,由于成像条件非常差,因此图像本身的质量也不高,需要采取数字图像处理技术处理,如采用多波段扫描器进行扫描成像,图像分辨率为30m,这些图像转变为数字信号传送下来,再经过处理。数字图像处理技术在各国的应用中已非常广泛,如用在森林调查、灾害监测、资源勘查以及城市规划中。

数字图像处理技术最早来源于医药方面,因此在生物医学工程方面,数字图像处理技术也发挥出了巨大作用,除了上文所讲述的CT之外,还有一些显微图像处理技术,主要是识别红细胞、白细胞以及染色体分析等,在医学诊治方面X光肺图像增强、心电图分析以及超声波图像处理技术等发挥出了重要作用。

在通信工程方面,目前通信主要的发展趋势为综合性的多媒体通信,也就是将电视、计算机以及电话联合在一起在数字通信网上传输,在传输的过程中最为复杂和困难的地方集中在图像的处理中,比如说,彩色电视信号速率为100Mbit/s以上,想要传输出去就需要压缩信息的比特量,因此技术成败的关键就在于编码压缩。目前国家正在大力研发的新的编码方法,如小波变换图像压缩编码以及自适应图像网络编码等。

在工业和工程方面,主要的应用集中在自动装置配线中检测零件的质量、弹性力学照片的应力分析以及邮政信件的自动分检等,另外在智能机器人中也有应用。在军事、公安方面,数字图像处理技术的应用主要集中在导弹的精确制导、侦查照片以及图像的传输和显示方面,在公安方面,主要应用在鉴别人脸、识别指纹以及图片复原方面。数字图像处理技术除了以上所讲述的应用领域之外,在电视图像的编辑、服装设计、发型设计以及文物资料复原等方面也有广泛的使用。

3数字图像处理技术的发展趋势

目前数字图像技术随着科技的进步得到了很大的发展,随着低成本硬件相关技术的发展可以想象数字图像技术将会得到更加广泛的应用,目前国内的研究成果主要集中在一些诊断、图像压缩编码以及目标识别等方面,但是还没有广泛应用在实际生活中。数字图像处理技术将会向着高分辨率、立体化、超高速以及智能化等方面发展,下面具体讲述数字图像处理技术的发展趋势。

随着计算机、人工智能以及思维科学研究的不断发展,数字图像处理技术在计算机视觉方面将会进一步的发展,智能机器人的重要感觉器官是视觉,目前研究的开放话题集中在理解和识别三维应力,将会应用在军事勘察、危险环境作业以及家庭服务等方面,目前人们对于自身的视觉了解的还非常少,因此在计算机视觉方面还需要进一步的探索。

数字图像处理技术还会向着虚拟现实发展,所谓虚拟现实就是使用计算机构成一个虚拟的三维空间,这项技术的发展是在计算机硬件技术的提高方面提出的,人们应用机器人身上的摄像机能够真实的感受到所在的环境,进而操纵机器人的行为,另外网上虚拟现实也是未来的一个发展方向。人们在完成社会生产中往往习惯使用自身的认识和工具,将这些掌握在自身手中,因此目前时代的发展趋势就是将原来二维的东西向着三维发展,如三维重建技术在地图方面的使用,在军事方面能够使用电子沙盘实现任意角度的转化和计算,也能够真实的直观的反应两点之间的障碍物等,还能够实现模拟飞行路线,为作战指挥带来极大的便利。在计算机中进行三维重建目前的热点和难点问题主要是计算机视觉研究领域。在图像压缩、识别以及分割方面,目前已取得很大的研究进展,目前图像处理面临的新的问题主要是图像专业压缩算法、图像识别算法等。

4结束语

综上所述,本文先分析了数字图像处理技术研究现状和主要的应用领域,进而研究数字图像技术的发展趋势。目前数字图像处理技术已广泛的应用在生活中,如在网络、手机等中的应用,数字图像处理技术的发展与人们的生活息息相关,随着技术的不断发展,数字图像处理技术还会不断得到进步,这些还需要更多的人努力去研究。

参考文献:

[1]孔大力,崔洋.数字图像处理技术的研究现状与发展方向[J].山东水利职业学院院刊,2012(04):11-14.

[2]陈炳权,刘宏立,孟凡斌.数字图像处理技术的现状及其发展方向[J].吉首大学学报(自然科学版),2009(01):63-70.

[3]吕戈静.浅谈数字图像处理技术的现状及发展[J].电脑知识与技术,2012(33):8035-8036.

[4]丁可.数字图像处理技术研究与发展方向[J].经济研究导刊,2013(18):246+270.

计算机视觉研究范文1篇9

>>Logisim在计算机专业硬件基础课程综合性实验中的应用探索巧用大学计算机实验教学中的综合性实验计算机类综合性与设计性实验的设计与思考综合性大学非计算机专业《计算机基础》课程改革基于问卷调查法的计算机仿真技术课程综合性实验效果分析评价计算机网络综合性创新实验项目探析综合性大学计算机基础课程改革与设计面向计算机专业的递进式综合实验教学方案计算机互联网应用的综合性分析论综合性大学计算机科学与技术师范专业的建设地方综合性大学计算机中心管理的研究与实践计算机硬件课程与实验平台建设浅议高校计算机视觉课程教学的创新谈计算机视觉课程的教学创新面向就业的中职计算机课程研究面向对象的计算机导论课程教学计算机基础类课程网络实验平台构建的研究计算机组成原理实验课程网络在线试验平台建设模式的思考基于VMware的计算机网络课程虚拟实验平台搭建面向卓越工程师的计算机网络实验课程教学改革常见问题解答当前所在位置:l.

[3]Computervision[EB/OL].[2016-12-26].https://courses.cs.washington.edu/courses/cse576/16sp/.

[4]Zhangputervision[EB/OL].[2016-12-26].http:///linzhang/CV/CV.htm.

计算机视觉研究范文

【关键词】农产品计算机视觉技术品质检测

农产品品质检测工作中除了采取人工检测法以外,还可以采取半自动或自动检测法,如在水果分级检测工作中的质量分级检测法、光电分选法以及大小分级法等。然而农产品品质会受到自然生长环境或人为因素等方面的影响,农产品的色泽、大小及形状等并不相同,无法采取单一指标进行检测。因此充分应用计算机视觉技术,对农产品的品质进行检测,极为重要。

1计算机视觉技术

计算机视觉技术又被称为机器视觉技术,指的是通过人类设计,在计算机环境下,达到再现或模拟人类视觉相关的职能行为的一种技术,包括了印刷和手写文字的识别技术,图像模式识别技术,物体三维表面形状识别技术、距离识别以及速度感知等技术。该技术是诸多学科的结合与交叉,涉及到数学、生理学、信息处理、物理学、光学以及计算机等多种学科。探究计算机视觉技术的目的在于实验人类视觉的再现及延伸,即再现高等动物的视觉系统,并对物体形状以及类别进行识别。

此外,计算机视觉技术处理的原始资料多是图像,所以该技术和图像处理以及模拟识别等有着紧密的联系。现阶段,计算机视觉技术在诸多领域有着较为广泛的运用,包括了医学辅助诊断、资源调查、卫星图像解释、军事指导、灾害监测、气象以及工业产品的外观筛选及检测等。同时研究该技术在农业工程领域中的应用,也成为了热门话题。

2在农产品品质检测中,计算机视觉技术的具体应用

笔者在查阅相关文献资料的基础上,探究在农产品品质检测工作中,计算机视觉技术在产品表面缺陷以及损伤识别工作中的具体应用;果形识别工作中的具体应用;农产品尺寸以及面积检测工作中的具体应用。

2.1在产品表面缺陷以及损伤识别工作中的具体应用

在对农产品进行分级的过程中,依然存在着一大问题,即农产品表面缺损以及损伤识别。而早在1984年就已经出现了采取线扫描和模拟摄像机针对苹果表面损伤进行检测的实验报道,实验结果显示,采取数据技术能够检测出苹果表面损伤,其检测结果完全能够达到人工分级的精度。与此同时,还出现了一种机器视觉系统,该系统将不规则的图像信息与正常的图像信息区分开来,在去除蔬菜内的杂物以及检测农产品的污点等方面能够取得较好的应用效果。此外,在1989年,国外出现了一种全新的计算方法,即运用红外线扫描摄像机,处理苹果表面的灰度图像,既能够确定苹果表面的损伤面积,还能够区分不同损伤区。然而还技术是以机械装置的设定为基础,需要消耗2s的时间,对一个苹果进行检测,苹果表面缺陷分级精度以及损伤分级进度并不高。

我国在1997年,出现了运用计算机图像处理技术对苹果损坏自动化检测的试验研究,该试验结果显示,该技术的损坏检出率较高,能够规避果梗区以及花萼区对于坏损区域识别的具体影响,且该检测技术的鲁棒性较强。

2.2在果形识别工作中的具体应用

果形识别是影响水果质量的重要因素之一,对于水果品质检测有着重大意义。当水果成熟后,水果的外形将会发生巨大的改变,且无法采取数学方法进行鉴别,采取其他方式进行果形识别极为重要。

在1981年,有研究人员就针对形状识别中的图像特征进行了探讨,提倡采取结构分析法以及外形轮廓曲线检测法,针对水果外形进行识别。并在1985年,以数字图像分析技术以及模式识别技术为依据,针对番茄定向、番茄形状、表面缺陷以及尺寸进行分类的特殊算法,运用灰度梯度曲线,明确番茄表面缺陷以及花萼位置等。而我国则在2000年,按照果实形状分析,通过连续性指标、半径指标、连续指标对称性、半径指标对称性等特征参数,表示果形,并首次采取参数形状分析法。

2.3在农产品尺寸以及面积检测工作中的具体应用

农产品分级中,以农产品外形尺寸为依据。在1987年,国外就已经开始研究机械视觉技术在牡蛎肉分级以及尺寸检测工作中的具体应用。并在1992年,针对人工检测以及机器视觉检测进行进行了对比分析,试验结果显示,和人工检测技术相比,采取视觉检测技术,能够提高检测的精确度,减少检测消耗时间;同时在评价以及推广种质资源中,准确的测量以及详细的记录种质形态的指标,有着极为重要的意义。为了能够精确、快速地计算出玉米种质尺度,在1995年,有研究人员就提出了自动化选择技术,该技术在处理玉米种质图像中,其辨别精度极高。

而我国在2002年,有研究人员就针对水果品质进行动态、实时监测的智能化分级生产线进行了研究,该生产线,首先通过水果输送翻转系统,利用滚筒式输送翻转装置,将水果往前输送,在输送过程中,以水平轴为中心,保证水果表面能够被系统检测到,以此获得图像信息。然后利用计算机视觉识别系统,对水果等级进行判断,明确图像信息。该系统具备了视觉识别功能。最终通过分级系统,完成水果分级工作。

3结语

在二十世纪七十年代以后,计算机视觉技术就已经得到了较为迅速的发展,在我国,该技术在农产品品质检测中的具体应用也得到了人们的高度关注,同时也取得了一定的成效。计算机视觉技术作为人眼的延伸技术之一,其具备了人脑功能,运用该技术代替以往的人工操作技术,已经成为了农产品品质检测工作的必然发展趋势。

参考文献

[1]朱从容.计算机视觉技术在水产养殖中的应用[J].浙江海洋学院学报(自然科学版),2008,10(04):191-192.

[2]王勃,徐静.计算机视觉技术在苹果叶片营养诊断上的应用[J].农机化研究,2008,(03):887-888.

[3]李朝东,崔国贤,盛畅,等.计算机视觉技术在农业领域的应用[J].农机化研究,2009,10(12):667-668.

作者简介

陈超(1995-),男,福建省福州市人。现为北京交通大学在校学生。研究方向为电子科学与技术。

计算机视觉研究范文1篇11

互联网技术飞速发展,在方便人们生活工作的同时,也带来了许多新问题,其中版权问题较为突出。图像数字水印是一种保护数字多媒体产品版权的重要技术,被嵌入信息起到一种密码效果,不可查或不可见,但通过专业的载体,算法可以进行分辨,该技术为知识产权保护提供了重要途径。Matlab是一款美产商业数字软件,应用十分广泛,本次研究基于Matlab软件概述图像数字水印算法。

1Matlab中的图像处理函数

Matlab作为一款商用数字软件,功能强大,计算机语言强大,含有FFT、DCT、DWT等多种数字处理基本变换函数,处理速度快、算法简便。可处理包括.bmp/、.hdf、.jpeg等目前广泛使用的图像格式。数字水印算法一直是水印算法领域研究热点。Matlab下数字水印与其它数字水印并无明显差异,通过特定的水印嵌入算法,实现对原数字图像加载水印,或对各种图像进行处理,运用数字水印检测算法对水印的可靠性等综合性能进行评估,一般通过外界攻击进行测试。

2Matlab下图像数字水印算法的实现

以下就Matlab软件构造一种基于人类视觉模型理论的自适应水印算法,并以Matlab软件测试其性能。

2.1水印信息的构造

2.3仿真实验

运用Matlab图像数字处理软件,进行水印算法仿真检测。取图像200个样本,严格按照以上介绍的水印嵌入步骤,选择中阶区域为水印序列,而后设置相关参数,载体大小为512×512,调节因子a、β分别为12.0、0.32,以Matlab图像数字相关功能进行水印嵌入,利用其自带测试软件检测不可见性,效果良好,肉眼不可见。以JPEG格式存储,分别进行剪切、滤波、缩放等常规处理,并进行水印序列检测,结果显示:50%压缩,NC=0.93;10%椒盐噪声处理,NC=0.90;3×3滤波,NC=0.95;50%缩放,NC=0.85;30%剪切,NC=0.63。而常用的Corpulent变换算法,经相同攻击后NC分别为0.89、0.88、0.89、0.73、0.23,劣于本文算法。

3小结

数字水印算法一直是水印算法领域研究热点,随着印刷技术、计算机技术的不断发展,相关研究不断深入,涉及领域愈加宽广,开始涉及仿生学、生物、视觉模拟等领域,即给数字水印算法研究提供了新思路,也带来了新的调整。本次研究中,所用的离散小波变换函数在数字水印领域应用较广,但仍存在易破解、鲁棒性欠佳等缺陷。本文基于Matlab软件,结合人类视觉模拟理念,引入开关函数,以筛选更符合人类视觉需要的嵌入强度,结果显示新的算法嵌入水印不可见性非常优越,对缩放、压缩、中值滤波等常规攻击抵御能力较好,对剪切也具有一定的抵御能力,这与引入的离散小波变换函数有关,应注意的限于人类视觉模型固有缺陷,该算法抵御旋转等视角变换类攻击能力不足,相关研究有待进一步深入。

参考文献

[1]潘禄生.基于小波包分解的数字水印算法[J].计算机安全,2011(4):21-24.

[2]杏宾.数字水印技术及应用研究[D].电子科技大学,2009:34-36.

[3]王佳欣,文政颍.不可见性与鲁棒性的彩色素质水印算法[J].计算机仿真,2014,31(3):266-267.

[4]赵刚,张晶,方旺盛.基于小波包变换和人类视觉系统的数字水印算法研究[J].井冈山大学学报,2014,35(2):45-47.

[5]雷芸,孙泽锐,王晓云.一种抗剪切信心隐藏算法[J].微电子学与计算机,2014,31(2):132-135.

计算机视觉研究范文篇12

基金项目:陕西省自然科学研究计划项目(2010JK740;2010JM8019);西安理工大学学科联合研究项目(102-210914)。

作者简介:吕林涛(1955-),男,陕西西安人,教授,主要研究方向:网络与信息安全、数据挖掘;赵呈轩(1982-),男,河南新乡人,硕士研究生,主要研究方向:网络与信息安全;尚进(1984-),男,河南郑州人,硕士研究生,主要研究方向:网络与信息安全;杨宇祥(1974-),男,湖南湘潭人,副教授,博士,主要研究方向:生物医学信号检测与处理。

文章编号:1001-9081(2011)07-1847-03doi:10.3724/SP.J.1087.2011.01847

(1.西安理工大学计算机科学与工程学院,西安710048;2.西安理工大学机械与精密仪器工程学院,西安710048)

()

摘要:针对目前色情图像过滤算法对比基尼图像和类肤色图像误检率过高,且不能有效过滤带有动作的多人色情图像的缺点,提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型首先通过改进的SURF算法提取色情场景局部特征点,然后融合视觉单词的上下文和空间相关高层语义特征,从而构建色情图像的高层语义词典。实验结果表明,该模型检测带有动作的多人色情图像准确率可达87.6%,明显高于现有的视觉词袋色情图像过滤算法。

关键词:色情图像;过滤;图像高层语义;语义树;视觉词袋;鲁棒特征加速

中图分类号:TP393.08;TN911.73文献标志码:A

Pornographicimagesfilteringmodelbasedon

high-levelsemanticbag-of-visual-words

LaLin-tao1,ZHAOCheng-xuan1,SHANGJin1,YANGYu-xiang2

(1.SchoolofComputerScienceandEngineering,Xi'anUniversityofTechnology,Xi'anShaanxi710048,China;

2.SchoolofMechanicalandPrecisionInstrumentEngineering,Xi'anUniversityofTechnology,Xi'anShaanxi710048,China)

Abstract:Currentpornographicimagesfilteringalgorithmshavesomeshortcomings,suchashighfalsepositiveratetowardthebikinisimagesandinsufficiencywhenfilteringpornographicimageswithpornographicactions.ThepaperproposedanewpornographicimagefilteringmodelbasedonHigh-levelSemanticBag-of-Visual-Words(BoVW).Firstly,localfeaturepointsinsexsceneweredetectedusingtheSpeeded-UpRobustFeatures(SURF)algorithmandthenhigh-levelsemanticdictionarywasconstructedbyfusingthecontextofthevisualvocabulariesandspatial-relatedhigh-levelsemanticfeaturesofpornographicimages.Theexperimentalresultsshowthatthemodelhasanaccuracyupto87.6%whentestingthemulti-personpornographicimages,whichissignificantlyhigherthantheexistingpornographicimagesfilteringalgorithmbasedonBoVW.

Keywords:Pornographicimage;filtering;imagehigh-levelsemantics;semantictree;Bag-of-Visual-Words(BoVW);Speeded-UpRobustFeatures(SURF)

0引言

快速有效地监测和过滤网络色情信息已经成为网络信息安全中的一项重要研究课题。现存的色情图像过滤技术虽然对网络上明显的图像可以实现较好的过滤效果,但不能有效过滤带有动作的多人色情图像,并且对含有比基尼的正常图像误检率较高。

随着视觉词袋(Bag-of-Visual-Words,BoVW)算法在图像检索和场景分类领域的成功应用[1-2],2008年ThomsDeselaers等人[3]首次提出采用视觉词袋算法提取图像高层特征过滤色情图像,该算法大大提高了色情图像的识别效率,但忽略了肤色特征。2009年AnaP.B.Lopes等人[4-5]在此基础上加入色调信息提出了HUE-SIFT特征描述算子,采用固定词汇大小分配,最后使用基于支持向量机(SupportVectorMachine,SVM)分类算法进行色情图像的分类。但该算法对词袋算法本身缺乏优化,算法需要付出昂贵的计算时间。2009年YIZHILIU等人[6]提出了构建SURF(Speeded-UpRobustFeatures)视觉词汇的方法来提取肤色区域的局部特征算子以减少SIFT算法的计算时间[7],虽然SURF的计算效率较SIFT算法有较大提高,但是视觉词汇聚类过程中采用简单的K-Mean聚类算法,造成语义缺失。2009年王宇石等人[8-9]采用视觉单词和语义映射算法检测色情图像,该算法虽然采用了语义映射模式,但是未能对高层语义视觉词组进行提取,因此算法仍存在一定的局限性。

针对目前色情图像过滤算法误检率过高等问题,本文提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型在传统低层视觉特征基础上,利用语义分析和理解相关技术,提取图像中包含的高层语义特征,从语义层面来识别不良图像,不仅符合机器视觉认知过程,而且可有效弥补现有算法比基尼图像误检率过高、不能有效过滤带有动作的不良图像过滤技术的不足。实验证明,算法可以有效过滤带有动作的多人不良图像,较同类算法识别率高,误检率低。

1高层语义视觉词袋的色情图像过滤模型

本文提出的基于高层语义视觉词袋的色情图像过滤模型如图1所示。该模型主要包括特征提取、高层语义词典构建和分类器构建三部分。

1)特征提取采用文献[6]中的SURF(4×4)算法提取局部特征;

2)高层语义词典构建通过随机森林算法[1]将提取的视觉基元的进行分类产生底层视觉词汇,并将中级词汇再次分类、融合上下文关系和空间相关特征[10-12],最终构建具有高区分度的高层语义视觉词典;

3)分类器采用文献[1]中的χ2-kernelSVM分类算法。

图1高层语义视觉词袋的色情图像过滤模型

2高层语义词典构建算法

高层语义词典构建算法主要通过视觉基元分类和视觉单词分类两阶段完成。视觉基元分类算法主要由随机森林算法和消除干扰词算法完成;视觉单词分类主要由上下文相关视觉词汇分配算法和空间相关视觉词汇分配算法完成。最终完成高层语义视觉词典的构建。高层语义词典构建算法流程如图2所示。

图2高层语义词典构建算法流程

2.1空间相关视觉词汇的权重分配算法

色情图像最明显的特点是有大面积的肤色区域和敏感器官的暴露,视觉词汇在分配的过程中如果对色情图像空间相关的视觉词汇加权分配,可以有效识别敏感区域和和提高视觉词汇的区分度。本文采用对色情图像空间相关的视觉词汇加权分配[10]。算法描述如下:

1)从兴趣点集合提取出的视觉词汇集合wl(1

2)计算视觉词汇wl在高斯βi条件下加权频率Tfwlβi,Tfwlβi∑nim1P(βi/Zm);

3)计算视觉词汇wl的平均权重Tfwl,Tfwl∑nwli1(Tfwlβi)/nwl;

4)计算wl的权重Ifwl,Ifwlln;

5)计算视觉词汇wl最终空间权重Swwl,SwwlTfwl×Ifwl。

2.2人体器官特征的空间拓扑结构算法

传统的视觉词袋算法通过编码局部突出片段的视觉基元获取视觉单词,但是却忽略了图像对象间的空间拓扑结构,本文将利用人体器官特征的空间拓扑结构表达的三角关系提取色情图像高区分度特征。经研究发现,人体器官特征本身具有一定的空间拓扑结构,利用人体器官特征的这一特点可以准确判定图像是否含有人体躯干部位。对于图像中包含单人的色情图像身体倾斜度不大于90°,人体暴露的胸部特征和人脸特征基本成三角形状,如图3所示。

图3色情图像人体器官特征空间拓扑结构

本文采用简化2D字符串[11]构建高层语义视觉词汇间的空间拓扑结构,假设V是人体器官特征对象集合,集合内每一个对象对应一个高层视觉词组,本文用“

2.3多人色情图像高层语义树构建算法

对于包含多人的色情图像,除具有大面积的肤色区域信息,更重要的是包含一些特定的动作,主要有亲吻、拥抱以及躯体部位的粘合。亲吻主要涉及嘴部和其他敏感器官,拥抱主要涉及肢体,躯体粘合主要涉及人体躯干和敏感器官。上述三种行为语义基本构成多人色情图像中的行为语义特征,色情图像高层语义树构建过程如图4所示。

图4色情图像高层语义树构建过程

在图4中,语义模型包括:人体器官对象模型和人体相关行为模型。由于色情图像相关的语义词汇中有些词汇出现的概率较高,因此,本文在文献[12]提出的加权分配语义词汇算法基础上,去除场景语义模型,只对人体器官对象视觉词组和人体行为相关视觉词组加权分配。对于数据集合V中任意一张图像Ci,如果人体器官对象视觉词组概率为PO,人体行为相关视觉词组概率为PA,可以通过公式PCiαPO+βPA,α+β1,计算Ci的敏感系数。当敏感系数大于阈值t时判定此图为色情图像。

3实验结果分析比对

为了验证高层语义视觉特征在色情图像过滤中的效果,本文通过采用网络收集的色情图像和PascalVOC2010图像库正常图像作为训练和测试数据集合,并与本领域著名文献[4,6,9]中方法完成实验结果对比。

3.1实验采样数据集

实验图像来自网络和PascalVOC2010图像库,其中在网络上收集的色情图像5800张,可以分为A类:包含明显的图像;B类包含比基尼图像;C类:包含带有动作的多人色情图像;正常图像5000张均取自PascalVOC2010图像库。

训练数据集和测试数据集分别为3000和5560张图像,从三类色情图像中各随机取出1500张进行训练,另外手工标注了2000张色情图像的人体躯干和敏感区域(性器官),用来产生各类低层视觉语义单词。

3.2实验结果比对

本文采用随机森林算法从1932900个关键点中分类产生了7883个SURF视觉单词,并根据词汇的上下文关系和空间相关特征进行再次分类,产生5120个中级视觉词组,同时将中级词组分为2150个人体器官相关和2980个人体动作相关的高层语义词汇。最后对高层语义词汇编码形成色情图像高层语义词典。

由于色情图像中包含大面积的肤色区域和人体敏感器官,此类局部特征点具有明显的上下文相关和空间相关特性。表1结果表明:加入上下文相关和空间相关特性的视觉词汇分配算法的特征区分度要明显高于传统视觉词汇分配算法;三类图像的过滤正确率本文算法均高于其他算法。视觉词袋算法的时间复杂度主要取决于特征提取和视觉词汇分配算法的时间复杂度,本文采用文献[1]中的随机森林算法对视觉词汇进行分配,缩短了视觉词汇分配的计算时间。实验结果表明,在特征提取和词汇分配两个阶段的总计算时间,本文算法的平均计算时间均低于其他三类算法。四类算法特征提取和词汇分配平均计算时间比对如图5所示。

表1四类色情图像过滤算法正确率对比

%

4结语

基于视觉词袋的色情图像检测是一种很有前景的方法,因为通过理解图像表达的高层语义对色情图像进行过滤不仅可以过滤明显的图像和多人色情图像,而且也符合机器视觉和认知理论。本文用具有高区分度的高层语义特征进行分类检测速度和准确度都较现有算法有较大提高,但在过滤90°侧身的色情图像检测方面有待进一步研究。

图5四类过滤算法特征提取和词汇分配平均计算时间对比

参考文献:

[1]UIJLINGSJRR,SMEULDERSAWH,SCHARJH.Real-timevisualconceptclassification[J].IEEETransactionsonMultimedia,2010,12(7):665-681.

[2]WULEI,HOISCH,YUNENGHAI.Semantics-preservingbag-of-wordsmodelsandapplications[J].IEEETransactionsonImageProcessing,2010,19(7):1908-1920.

[3]DESELAERST,PIMENIDISL,NRYH.Bag-of-visual-wordsmodelsforimageclassificationandfiltering[C]//ICPR2008:19thInternationalConferenceonPatternRecognition.Washington,DC:IEEEComputerSociety,2008:1-4.

[4]LOPESAPB,deAVILASEF,PEIXOTOANA,etal.Abag-of-featuresapproachbasedonHUE-SIFTdescriptorfornudedetection[C]//EUSIPCO2009:Proceedingsofthe17thEuropeanSignalProcessingConference.Glasgow,Scotland:Mendeley,2009:1552-1556.

[5]LOPESAPB,deAVILASEF,PEIXOTOANA,etal.Nudedetectioninvideousingbag-of-visual-features[C]//SIBGRAPI'09:Proceedingsofthe2009XXIIBrazilianSymposiumonComputerGraphicsandImageProcessing.Washington,DC:IEEEComputerSociety,2009:224-231.

[6]LIUYIZHI,XIEHONGTAO.ConstructingSURFvisual-wordsforpornographicimagesdetection[C]//ICCIT'09:12thInternationalConferenceonComputersandInformationTechnology.Washington,DC:IEEE,2009:404-407.

[7]LUOJUAN,GWONO.AcomparisonofSIFT,PCA-SIFTandSURF[J].InternationalJournalofImageProcessing,2009,3(4):143-152.

[8]王宇石,李远宁,高文.基于局部视觉单词分布的像检测[J].北京理工大学学报,2008,28(5):410-413.

[9]王宇石,高文.基于视觉单词和语义映射的色情图像检测算法[J].高技术通讯,2009,19(10):1041-1047.

[10]LITENG,MEITAO,KWEONI,etal.Contextualbag-of-wordsforvisualcategorization[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,21(4):381-392.