欢迎您访问大河网,请分享给你的朋友!

当前位置 : 首页 > 范文大全 > 报告范文

计算机视觉前沿方向范例(12篇)

来源:其他 时间:2024-02-04 手机浏览

计算机视觉前沿方向范文篇1

关键词:实验教学;创新能力;无标记手势分割;3D定位;过程控制

一、引言

当今时代,科技进步日新月异,国际竞争变得日趋激烈。而各国之间的竞争,是民族创新能力的竞争。我国作为发展中国家,要想在激烈的国际竞争中占据有利位置,就必须走科教兴国的道路。高等教育是培养人才的摇篮,是经济发展的强大后盾,中华民族能否在二十一世纪取得更大的发展,关键在于我国的高等学校能否培育和造就出适应时展的大批创新人才。因此,高等学校必须加快教学改革,大力开展创新教育,着重培养大学生的创新性思维和创新能力,将教学目标由培养“知识型”人才转向培养“创新型”人才。

二、改革实验教学内容

传统的实验教学大多是验证型实验,只是让学生验证已有的正确性和科学性,这种被动的方式不利于他们创造力的培养。为了改变这种情况,我们按照控制类实验教学大纲的要求,在现有的教学计划中,加大实验教学、实践教学、综合性课程设计、生产实习和社会实践方面比重,同时设计比较灵活的教学计划,使学生对实验有深入研究的时间和能力,为培养学生的实验能力、创新意识和创新能力提供一个宽松的环境。并将对技术基础课和专业课的课程教学体系及内容进行改革,鼓励教师把相关领域最新最前沿的科研成果转化为实验教学内容,形成具有学科特点的科学、完整、系统的实验教学课程体系。同时,支持学生参加控制专业各类竞赛,竞赛内容充实到创新实验中。实验内容分为基础型、综合型、设计型,突破传统模式,不断更新教育教学理念,研究具有设计性、系统性、综合性实验教学模块,探索新的实验教学方式方法。在相关课程的基本实验中,规定学生必做的实验,或综合相关课程的内容,进行设计型实验,由“验证型”实验向“综合型”、“设计型”实验逐步推进,提高学生独立思考、分析、判断和处理实际技术的能力。启发学生的创新意识,为学生独立开展综合性、创新性、设计性实验打下良好基础。在综合性、设计性实验阶段,学生自由组成实验小组,选择老师指定的实验题目或自行设立感兴趣的题目。在老师的指导下,论证可行性,设计实验方案和步骤,观测实验和记录实验现象,分析实验结果,得出科学的结论,并撰写相关科技论文。这个过程可以让学生亲身感受、理解知识产生和发展的过程,培养学生的实践能力,进一步提高学生的科学素质。

三、科研竞赛融入实验教学内容

为了培养创新能力改革实验教学内容,将科研竞赛融入实验教学内容,我们把控制类专业相关领域最新最前沿的科研项目《基于Kinect深度信息的无标记手势分割和3D定位》内容和成果融入实验教学内容,形成创新实验,提升学生创新能力。支持学生参加控制专业各类竞赛,同时将竞赛内容融入创新实验,提升学生创新能力。

1、科研融入实验教学内容

《基于Kinect深度信息的无标记手势分割和3D定位》科研项目,主要内容:基于Kinect深度信息提出一种精确稳定的无标记手势分割和3D定位方法,基于深度阈值方法在实验空间中检测出手部二值图像,根据一般手势行为特性提出基于目标手势端点检测和动态阈值算法无标记地分割出精确手势,为避免不精确的分割结果对分割手势基本形态阈值限定.选取精确目标手势的重心坐标和纵向平均深度灰度值对手势3D定位,实验表明该手势分割方法比已有无标记方法更精确稳定3D定位KinectSDK的骨骼点手势定位稳定可靠无奇异点。

机器视觉的手势交互是智能人机交互(humancomputerinteraction)HCI的关键技术之一,旨在提供更方便快捷的人机视觉接口。在手势识别中,须解决手势分割和定位、手势特征提取和分析三个问题,基于肤色模型的分割方法使用普遍。然而,肤色的差异性、对光照环境变化的敏感以及当背景中存在与肤色颜色相近颜色时给这类方法带来很大困难。近年来,随着低成本深度摄像头Kinect的出现,可以方便地通过深度阈值分割初步获取手部区域。受到Kinect深度数据分辨率的限制和手腕部分对手势的干扰。本科研项目基于深度信息和动态阈值方法无标记地分割和定位出精确手势,鲁棒性好计算复杂度低,并结合手势重心点与纵向平均灰度值稳定的定位出手势3D位置。

通过基于Kinect深度信息的无标记手势分割融入创新实验,学生能够熟练应用低成本深度摄像头Kinect和相关软件完成图像处理,在完成基于深度阈值的手势检测和基于动态阈值手势精确分割创新实验后,学生创新能力和知识有很大提高,能够应用中值滤波算法去噪处理和概率统计样本分析方法处理实际问题,增强创新能力。

手势3D定位是对手势某一固定点坐标的实时反应,对动态手势跟踪和识别极其重要。引入手势3D定位创新实验对于培养学生空间想象能力,权重定位算法很重要,能够提升学生创新能力。

2、竞赛融入实验教学内容

“西门子”中国智能制造挑战赛包含化工过程控制、电梯控制。

化工过程控制:化工反应过程极为复杂多变,特别是临界点压力、温度、液位变化很快,难于准确控制,学生在完成“西门子”中国智能制造挑战赛化工过程控制中,面对如此复杂多变的控制对象,必须要思考创新的控制算法,才能完成竞赛,创新能力得到提升。

电梯控制:学生除了完成单台和多台电机的电气控制:顺序控制、自锁控制、联锁控制、延时控制外,关键是多台电梯群控算法的研究,这将开发学生的聪明才智,提升创新能力。

通过创新性研究项目的实践锻炼和参加控制专业的大量竞赛,学生能够把握科技前沿、社会需求,建立先进的科学思想,探索、思考新的科学问题,同时其研究成果也为科研发展或者社会科技服务做出了贡献。

综上所述,通过科研竞赛融入实验教学内容,能够提升学生创新能力。

参考文献:

[1]李强,田国栋.基于DS18B20d的室内智能温度控制系统设计[J].电子设计工程,2012,20(3):34-36.

[2]《过程控制系统》,编(译)著:黄德先、王京春、金以慧。,出版社:清华大学出版社。

[3]自动控制原理,作者:吴麒,出版社:清华大学出版社。

[4]计算机控制技术――高等学校教材,作者:姜学军,出版社:清华大学出版社。

[5]深入浅出《西门子S7-300PLC》西门子(中国)有限公司

计算机视觉前沿方向范文篇2

关键词:自动指纹识别系统;指纹增强;中值滤波;方向场

中图分类号:TP391.4文献标识码:A

文章编号:1004-373X(2009)10-107-03

FingerprintImageEnhancementAlgorithmBasedonMedianFilter

SUIXueli1,MEIYuan2

(1.JinchengCollege,NanhangUniversity,Nanjing,211156,China;

2.SchoolofComputerScience&Technology,NanjingUniversityofScienceandTechnology,Nanjing,210094,China)

Abstract:Fingerprintenhancementisimportantforimprovingtheaccuracyofminutiaextraction,evenforthetotalAutomatedFingerprintIdentificationSystem(AFIS).Inthispaper,medianfiltermethodisappliedtofingerprintimageenhancementforthefirsttime,andamoresimplefingerprintimageenhancementmethodisproposed.Themainprocessingis:foreachcurrentpointinfingerprintimage,astatisticalwindowofonedimensionwith(2R+1)insizeisgained,hereRistheradiusofthewindow,thenthemedianfilterisoperatedonthiswindow,thecurrentpointwiththeresultofthemedianfilterisreset.TheexperimentalresultbasedonFVC2002showstheproposedmethodisasimple,effectivefingerprintimageenhancementalgorithm.

Keywords:AFIS;fingerprintenhancement;medianfilter;orientationfield

0引言

生物特征识别[1,2]技术是根据每个人独有的可以采样,测量的生物学特征和行为学特征进行身份识别的技术。由于生物特征不像各种证件类持有物那样容易窃取,也不像密码、口令那么容易遗忘或破解,所以在身份识别上体现了独特的优势,近年来在国际上被广泛研究。自动指纹识别系统[3-5](AFIS)由于其体积小,成本低,易操作,可靠性高等优点越来越受到人们的青睐,成为最重要的生物识别技术之一。

一般的自动指纹识别系统包括:图像采集、图像分割、方向场估计、指纹增强、二值化及细化、特征点提取、特征匹配等部分。可靠提取指纹特征点是指纹准确识别的基础,但由于受噪声和采集环境等因素的影响,采集到的部分指纹图像质量比较差,特征点提取的准确性就会急剧下降。指纹增强作为指纹识别系统中非常重要的一部分,其目的就是通过对低质量指纹图像采取一定的算法处理,使其纹线结构清晰化,以尽可能地提高特征提取的可靠性。

迄今为止,已提出大量的指纹增强算法[6-8]。其中,运用最为广泛的主要有O′Gorman等于1989年提出的方向滤波方法,L.Hong等[9]于1998年提出的基于Gabor滤波器的指纹增强算法。这两者都利用了指纹图像的方向性及脊、谷交替的特性。前者在设计滤波器时,针对量化后的方向,设计不同的方向滤波模版,其设计原则为:

(1)滤波器的模板尺寸要合适,要求是一个或者一个半的纹线周期;

(2)模板的尺寸要为奇数,以保证模板通过中心点关于坐标轴对称;

(3)为了提高脊线和谷线之间的对比度,模板设计在垂直于纹线方向上,中央部分系数为正,两边系数为负;

(4)滤波结果应和原图的平均灰度无关,因此滤波器模板中所有系数的代数和应为零。该方法速度较快,但是存在难于选择合适模版尺寸的问题。

众所周知,Gabor滤波器是带通滤波器,它以其在空域良好的方向选择性和在频域良好的频率选择性而在计算机视觉领域,尤其是在纹理分析方面得到了广泛的应用。利用Gabor函数进行指纹图像的增强,本质上是沿着纹路方向采用低通滤波器,而沿着垂直于纹路方向采用带通滤波器。这种组合滤波器一方面可以消除纹路方向上的瑕疵,另一方面可以增强脊线和谷线之间的对比度,所以能取得令人满意的结果。然而,该方法的计算量很大,程序设计相当复杂,且在估计局部频率时也存在一定的困难。

相对于已有工作,这里首次将中值滤波算法运用于指纹图像增强问题,提出了一种更为简单的指纹图像增强算法。该算法的主要过程是:对图像中的每个像素点,沿该点方向上取一个(2R+1)的一维统计窗口,其中R为该统计窗口的半径。对该窗口进行中值滤波,并将中值结果赋予该像素点。基于FVC2002指纹库的实验结果验证了该方法的有效性。

1方向场计算

在梅园等[10]提出的方向场估计算法基础上,通过引入图1所示的新的窗口模版,形成了本文所采用的方向场计算方法,其大致过程如下:

(1)对于指纹图像I,根据式(1)分别计算每个像素点沿x,y方向的梯度向量。

[Gx(x,y),Gy(x,y)]T=[I(x,y)/x,I(x,y)/y]T(1)

图1新的窗口模版

(2)将整幅图像分割成一系列互不重叠、大小为Win×Win的内层块;为每个内层块分配一个具有共同中心点、大小为Wout×Wout的外层窗口。根据式(2),式(3)分别计算每个内层块的梯度向量及块的一致性,同时统计每个内层窗口所对应外层窗口中所含有效点梯度向量(即非0向量)的个数。

[GINBx,GINBy]T=[∑Woutx=1∑Wouty=1Gsx(x,y),

∑Woutx=1∑Wouty=1Gsy(x,y)]T(2)

CohinB=|∑Woutx=1∑Wouty=1\|∑Woutx=1∑Wouty=1|\|(3)

其中:

Gsx(x,y)

Gsy(x,y)=G2x(x,y)-G2y(x,y)

2Gx(x,y)Gy(x,y)

(3)确定块一致性阀值φ及有效点个数阀值φ,对每个内层块,若其块一致性或者有效点个数小于相应得规定阀值,则将该块的块梯度向量置为0向量。

(4)对每个块梯度向量为0向量的内层块,采用基于迭代的方法,重新估计其块梯度向量。

(5)依据式(4)将每个内层块的梯度向量转化为块方向。

θ=(1/2)π+1/2

tan-1(GINBy/GINBx),GINBx≥0

tan-1(GINBy/GBx)+π,GINBx

tan-1(GINBy/GINBx)-π,GINBx

图2(a)为原始指纹图像,图2(b)给出了用该方法计算出的方向场结果图(其中Win=3,Wout=21,φ=0.3,φ=(Wout×Wout)/6。可以看出,该方法计算出的结果更加平滑,方向的连续性较好,为后面的指纹增强奠定了良好的基础。

图2算法的过程结果

2基于中值滤波的指纹增强算法

中值滤波是对当前像素点的一个M•N统计窗口内所有像素点按照灰度级排序,用处于中间位置的灰度级来代替当前点灰度值的一种排序滤波方法。在具有两类目标的窗口中,其物理意义为:将当前像素点归类于处于多数的类别之中。该方法具有很好的抗噪性能,且不使边缘模糊,因此在很多的图像增强问题中很受欢迎。本文的主要工作就是首次将中值滤波算法运用于指纹图像增强问题,提出了一种基于中值滤波的更为简单的指纹图像增强算法。

在指纹图像的有效区域(即含有脊线、谷线的图像区域),也包含了两个类别――脊线(对应于图像中的灰度级较低的纹线)、谷线(对应于灰度级较高的纹线)。因此,从宏观上讲,中值滤波算法是完全可以运用于指纹图像增强问题的。因而问题的关键就在于如何选择合适、有意义的统计窗口。

对于该统计窗口,这里认为以当前点为中心,沿当前点方向的一维统计窗口是合适、有意义的统计窗口。其解释为:指纹图像是具有明显方向信息的纹理图像,沿当前点方向的一维统计窗口,如图2(c)所示,具有鲜明的物理意义,即若该统计窗口内主要包含脊线上的点,则把当前点划分到脊线中是合理的。同理,若该统计窗口内主要包含谷线上的点,则把当前点划分到谷线中亦是合理的。若统计窗口沿其他方向,极限情况是沿该点方向的垂直方向,则不会有任何意义,滤波后的结果自然无法理解通过实验,也得到了证明,如图3(a),(b)给出对每一点都采用水平方向或垂直方向的一维中值滤波结果。

从结果中可以看出,不沿着当前点方向进行中值滤波,结果明显不正确。采用一维窗口而非二维窗口,其一是因为一维数据量少,运算速度快;其二是当采用二维窗口时,若第二维的数值较大时,其中值滤波的结果亦没有意义,同样,这里亦通过实验得到了证明,如图3(c)给出了沿着当前点方向采用(2R+1)(2R+1)的二维统计窗口进行中值滤波的结果,结果也明显不正确。

图3一些反例

基于上述分析可以知道,本文算法的主要过程,即对图像中的每个像素点,都沿该点方向上取一个(2R+1)的一维统计窗口,其中R为该统计窗口的半径,对该窗口进行中值滤波,并将中值结果赋予该像素点。为了更为详细地阐述算法的实现细节,以下给出该算法基于Matlab编程语言的实现过程,并给出非常详尽的注释:

functionfilter_img=median_filter(image,org_img,R)

%image:原始指纹图像;org_img:指纹方向场;R:一维滤波

窗口半径;filter_img:中值滤波后的图像

[row,col]=size(image);

%row:指纹图像的高度;col:指纹图像的宽度

template_X=zeros(1,2*R+1);

%template_X用于保存一维统计窗口中所有像素点的横坐标值

template_Y=zeros(1,2*R+1);

%template_Y用于保存一维统计窗口中所有像素点的纵坐标值

template_img=zeros(1,2*R+1);%template_img用于保存一维统计窗口中所有像素点的灰度值

%以下开始对图像中的每一个像素点进行中值滤波

forrows=2*R:row-2*R

forcols=2*R:col-2*R

cos0=cos(org_img(rows,cols));%计算当前像素点方向的cos值

sin0=sin(org_img(rows,cols));%计算当前像素点方向的sin值

forr=-R:R%计算一维统计窗口中所有像素点的横坐标、纵坐标值

template_X(1,r+R+1)=round(r*cos0+cols);%round为取整函数

template_Y(1,r+R+1)=round(rows-r*sin0);

end

fori=1:2*R+1%得到一维统计窗口中的所有像素点的灰度值

template_img(1,i)=image(template_Y(i),template_X(i));

end

filter_img(rows,cols)=median(template_img);%对一维统计窗口中的所有像素点的灰度值进行中

值滤波,并将结果赋给当前像素点

end

end

图4本文算法在FVC2002指纹库上的部分实验结果

3实验结果

为了充分验证本文算法的有效性,这里在FVC2002指纹库上做了大量的验证实验,其中窗口半径R=9。鉴于篇幅的限制,图4分别给出该指纹库中DB1,DB2,DB3,DB4中一组实验结果。实验结果表明,本文算法能取得较为满意的增强效果,是一种简单、有效的指纹图像增强算法。

4结语

首次将中值滤波算法运用于指纹图像增强方面,提出了一种更为简单的指纹图像增强算法,该算法的主要过程是:对图像中的每个像素点,沿该点方向上取一个(2R+1)的一维统计窗口,其中R为该统计窗口的半径,对该窗口进行中值滤波,并将中值结果赋予该像素点。通过针对FVC2002指纹库进行实验表明,该方法是一种简单、有效的指纹图像增强算法。

参考文献

[1]王波涛,蔡安妮,孙景鳌.生物图像识别技术及其应用[J].计算机工程与设计,2001(4):34-37.

[2]张成海,张铎.现代自动识别技术与应用[M].北京:清华大学出版社,2004.

[3]JainAK,HPankantiLS.AnIdentity-authenticationSystemUsingFingerprints[J].Proc.IEEE,1997,85(9):1365-1388.

[4]JainA,HongLin,BolleR.On-lineFingerprintVerification[J].IEEETrans.onPatternAnalysisandMachineIntelligence,1997,19(4):302-313.

[5]LeeChih-Jen.FingerprintFeatureExtractionUsingGaborFilter[J].ElectronicLetters,1999,35(4):288-290.

[6]章毓晋.图像工程(上册)图像处理和分析[M].北京:清华大学出版社,1999.

[7]JainK,PrabhakarS,ChenbiningMultipleMatchersforaHighSecurityFingerprintVerificationSystem[J].PatternRecognition.1999,20(11):1371-1379.

[8]RafaelC.Gonzalez,RichardEWoods.数字图像处理[M].2版.北京:电子工业出版社,2007.

计算机视觉前沿方向范文篇3

MEA结构示意图如图1所示。催化剂层(CatalystLayer,CL)是发生化学反应的场所,阳极发生氧化反应,阴极发生还原反应;质子交换膜(ProtonExchangeMembrane,PEM)具有良好的阻气能力和传导质子的能力,同时具有一定的机械强度和良好的结构稳定性[8];气体扩散层(GasDiffusionLayer,GDL)在电极中起着支撑催化剂层、稳定电极结构的作用,同时使反应气体能够均匀地到达催化剂层[9],气体扩散层主要是提供质子传递的通道(从阳极到阴极),同时应防止两边的氢气和氧气互串及阴、阳极发生短路;密封层作为电池组封装时的支撑,同时防止氢气和氧气绕过气体扩散层的边缘发生互串。密封层和质子交换膜为透明薄膜,密封层中间矩形空腔涂覆有催化剂,GDL尺寸要比CL稍大,并且一面涂覆有碳粉,通过热压使GDL有碳粉的一面与CL层结合在一起。GDL与催化剂层要求精确层合,否则会导致氢气和氧气外泄,反应离子减少,使电池的电能转换效率下降。

2MEA贴片方案

由于盛放GDL的料盒尺寸要比GDL略大,机械手每次开启真空拾取GDL时,GDL在料盒中的倾斜角度和位置是不确定的,而催化剂每次进给的位置也有偏差,此外由于该方案中存在拾取头反转机构,拾取头反转轴线与GDL中心线不共线也会引入贴片误差,因此,机械手不可能将GDL拾取后直接贴在催化剂层上。所以,笔者根据工艺要求,提出了具有真空吸附功能的多自由度机械手贴片方案。该方案采用机器视觉技术获得催化剂层和GDL的位置信息,并通过相应的贴片算法,消除了上述误差,从而引导机械手精确贴片。2.1机械结构方案根据层合工艺需求,设计如图2所示的层合机械结构,该结构包括执行部分和检测部分。执行部分包括:具有真空吸附功能的拾取头,用于从料盒中拾取GDL;可使拾取头反转180°的摆动气缸;用于调整拾取头XY平面角度的直线执行器,当直线执行器的末端伸出时,沿Z轴负方向观察,拾取头逆时针旋转,当直线执行器缩回时,拾取头靠弹簧复位实现顺时针旋转;用于拾取头上下运动的Z向电动机模组;用于拾取头沿Y方向移动的Y向电动机模组及沿X方向移动的X向电动机模组;上热压头和下热压头内部有恒温发热芯,并且具有真空吸附功能,其中上热压头可以沿Z方向上下移动,下热压头可以沿X方向移动。检测部分包括:用于采集黑色催化剂层图像的催化剂检测相机,用于采集GDL图像的GDL检测相机。两部相机与装有图像处理软件的计算机连接。2.2贴片流程贴片流程为:首先对两台相机进行空间坐标和图像变形的标定,去除两台相机中的图像畸变,并将采集的图像像素坐标转换成实际坐标;涂覆有黑色催化剂层的薄膜材料沿Y轴正方向由夹持机构输送到位,催化剂检测相机采集图像;料盒将碳粉层朝上的GDL片材提升到位,拾取头从料盒中吸取一片GDL,然后移动到GDL检测相机的上方,GDL检测相机采集图像;下热压头向X负方向移动固定距离(根据实际安装尺寸确定),并开启真空吸附;计算机通过本文第2.3节的下片GDL贴片算法,将位置偏差转换成直线执行器和各模组移动的距离,从而将GDL准确地贴在下热压头上,下热压头移回原位;GDL再拾取一片GDL移到GDL检测相机采集图像的位置,GDL检测相机采集图像,计算机通过本文第2.4节的上片GDL贴片算法,控制直线执行器和各模组移动,摆动气缸反转180°,上热压头开启真空吸附,将GDL准确地贴在上热压头上,机械手返回取料位置,上热压头向下运动,两片GDL有碳粉的一面与薄膜材料热压一定时间后层合在一起,关闭两热压头真空吸附,重复以上过程,直至加工完料盒中的GDL。2.3下片GDL贴片算法贴下片GDL时没有拾取头的反转,贴片算法相对简单,该算法同时也是上片GDL贴片算法的基础。首先催化剂检测相机和GDL检测相机对催化剂层和GDL进行图像采集,测量出催化剂层和GDL相对各自相机坐标系的角度。然后利用直线执行器对GDL角度进行纠正,从而使GDL中心线与催化剂层中心线平行。最后测量催化剂层和GDL两边缘上的关键点坐标,从而计算出X、Y方向的移动距离。2.3.1GDL角度纠正GDL和催化剂位置示意图如图3所示,图3中,XDODYD为GDL检测相机图像坐标系,XCOCYC为催化剂检测相机图像坐标系。以OD为圆心、rOD为半径的圆代表GDL检测相机的视野范围,与该圆相交的实线矩形代表拾取头从料盒拾取GDL后到达采图位置时GDL的图像,此时拾取头的中心线与XD轴重合,虚线代表GDL角度纠正完后的GDL图像;以OC为圆心、rOC为半径的圆代表催化剂检测相机的视野范围,与该圆相交的实线矩形代表催化剂检测相机下的催化剂的图像,以C'为顶点的实线矩形代表下热压头上方的催化剂边框的图像,以D'为顶点的虚线矩形代表贴片后的GDL图像,机械安装时要求XD轴与XC轴平行。通过数字图像处理中的边缘检测算法,检测出角度纠正前GDL长边相对于GDL相机视野XD轴的夹角为α,催化剂长边相对于催化剂相机视野XC轴的夹角为β,α、β沿XD轴逆时针方向为正。控制直线执行器运动,拾取头逆时针旋转ω=β-α,单位为(°),从而使GDL与XD轴的夹角为β,此时GDL与催化剂平行。2.3.2X向和Y向电动机模组移动量通过边缘检测算法,测得角度纠正后GDL长边上任意一点D1的坐标为(xD1,yD1),短边上任意一点D2的坐标为(xD2,yD2)。同理测得催化剂长边上任意一点C1的坐标为(xC1,yC1),短边上任意一点C2的坐标为(xC2,yC2)。假设下热压头不伸出,拾取头直接将GDL贴在下热压头上的催化剂层上,即GDL从点D平移到D',则X向电动机模组移动的距离Δx为:式中:lD为GDL长边的长度;wD为GDL短边的长度;lC为催化剂层长边的长度;wC为催化剂短边的长度;ΔxDC为GDL检测相机视野中心与催化剂检测相机视野中心在X方向上的距离,由机械安装位置决定。在实际应用中,下热压头沿X轴负方向移动距离有一误差s,则X向电动机模组移动的实际距离Δx实为:式中:ΔyDC为GDL检测相机视野中心与催化剂检测相机视野中心在Y方向上的距离,由机械安装位置决定;h为两片催化剂层对应顶点在Y方向上的距离,由MEA生产厂家决定;k为催化剂检测相机下方与下热压头上方之间的催化剂层个数,由薄膜生产厂家和机械安装位置决定,可以直接数出。2.4上片GDL贴片算法拾取头吸取GDL时,GDL轴线不可能与拾取头轴线完全重合,而是以一定的夹角相交,因此当拾取头反转180°后,仅用式(3)、式(4)不能保证上热压头贴片位置精确,需要对GDL再次进行纠偏。上片GDL位置示意图如图4所示,拾取头从料盒中拾取一片GDL到GDL检测相机的采图位置,经过本文第2.3.1节所述的GDL角度纠正后,GDL的位置变为以D为顶点、l3为轴线的实线矩形,通过式(1)和式(2)计算出点D的坐标(xD,yD);拾取头绕自身轴线l2翻转180°,GDL的位置变为以D3为顶点、l1为轴线的虚线矩形;控制直线执行器使拾取头绕铰接旋转中心OR逆时针旋转γ角度,此时拾取头的轴线为l5,GDL到达以l4为轴线的虚线矩形框的位置,使l4与l3平行。l1、l2和l3相交于点I1,l4和l5相交于点I2,l2与XD轴的夹角为ω,l2与l5的夹角为γ,由几何知识得出点I1的坐标(xI1,yI1)为:式中:xOR、yOR为铰接旋转中心相对于GDL检测相机的坐标,由机械安装位置决定。

3应用实例分析

为验证本文贴片方案在MEA贴片工艺中的有效性,在如图5所示的MEA贴片设备上进行实验。该设备的贴片方案机械结构与本文的设计方案完全一致,图像处理软件采用Matrox公司的MIL图像处理库,相机采用MicroVision公司的MVC3000SAC-GE12工业相机,其像素尺寸为2048个×1536个,像元尺寸为3.2μm×3.2μm,镜头选用PENTAX12mm焦距镜头,GDL检测相机采用高亮度LED条形光照明,催化剂检测相机采用高亮度背光照明。X、Y、Z向运动选用重复定位精度为±0.003mm的3套伺服电动机驱动精密滚珠丝杠模组完成,直线执行器采用Zaber公司的μm级小型直线执行器,运动控制系统采用DeltaTau公司的8轴PMAC运动控制卡。按照本文第2.2节所示的贴片流程进行贴片后的MEA成品示意图如图6所示,通过测量GDL两个顶点D3、D4到催化剂层两个顶点C3、C4的距离a、b、c、d,反映GDL与催化剂的层合情况,按厂家要求a、b、c、d的精度为1±0.2mm,实测结果如表1所示,所有测量距离均在0.8~1.2mm之间,满足了贴片要求,平均值在1mm左右,说明该燃料电池MEA贴片方案具有良好的稳定性。

4结语

计算机视觉前沿方向范文篇4

【关键词】机器视觉;桑葚菌核病;轮廓提取;Canny算子

桑葚菌核病俗称白果病,是危害桑椹的主要真菌性病害。桑葚菌核病的侵染循环是病原菌以菌核的形式在土壤中越冬,然后菌核抽生出子囊盘,子囊孢子借风力传播,侵入桑树雌花花器而引起初次感染。病原菌侵入雌花花器后,菌丝大量增殖,最后形成菌核后,菌核随病椹落地,病椹腐烂而菌核留在地表成为下一年的感染源。

目前我国大多都是采用农业、化学、生物和物理等手段来防治桑葚菌核病。化学防治虽然方便快捷,见效快,对果农要求也不高,但容易使病菌产生抗药性,从保护环境和保障桑椹产品的食用安全考虑不适合长期使用,而另外两种防治措施都要消耗大量人力、物力、财力。本文根据桑葚菌核病的发病特点,利用机器视觉识别技术对桑葚菌核病的子囊盘进行识别后对子囊盘进行远红外加热方法,使土壤温度在60s内迅速达到125℃,迅速杀死病原菌,从而使病原菌不再传播,就能达到防治桑椹菌核病发生的目的。相较于传统的农药防治方式,该技术更加环保、效率更高、且简便易行,对防治桑椹菌核病、提高桑椹的品质和价值等方面起着至关重要的作用。

一、机器视觉识别桑葚菌核病子囊盘的算法及分析

机器视觉(MachineVision)也称计算机视觉(ComputerVision),用机器来代替人的眼睛,从而检测和测量,来达到对图片信息的控制。

(一)桑葚菌核子囊盘边缘轮廓检测算法分析。图像的边缘是指图像灰度构成的曲面上的陡峭区域,是图像中目标的最基本的特征之一。边缘存在于物体和背景之间,以及物体和物体之间、基元和基元之间。因此,第一步就是对图像的边缘进行提取和分析。Roberts算子、Sobel算子和Laplace算子是微分法里的主要算法。卷积算法是这三种算法的核心,唯一区别就是卷积列阵。其中最简单的算子是Roberts算子,它利用局部差分算子寻找边缘,它检测边缘是靠采用对角线方向相邻两像素之差近似梯度幅值检测边缘。检测垂直边缘的效果好于斜向边缘,定位精度高,对噪声敏感。Sobel算子的形式是滤波算子,目的是提取边缘。图像中每个点都用两种模板做卷积,第一种注重检测水平边缘,对水平边缘影响最大,另一个是对垂直边缘的检测,这种方法对垂直边缘影响最大。Laplace算子本质上是一个二阶微分算子,对边缘敏感。而Canny算子是在信噪比准则、定位精度准则和单边缘响应前提下推导出的最优边缘检测算子。

(二)基于各算子的边缘图像轮廓提取图分析。经过实验数据对比分析发现Robert算子对噪声较敏感,且会丢失部分边缘信息使得边缘不连续,边缘检测效果很差,几乎看不清子囊盘的边缘轮廓;而Sobel算子对噪声有一定的抑制作用,边缘检测效果也要好于Robert算子,但仍丢失了部分边缘信息,子囊盘的边缘轮廓也不清晰。Laplace算子边缘检测效果较好,尤其能清晰的反应子囊盘的边缘特征。但是在识别未加热的子囊盘时边缘轮廓缺失严重,它的纹理太复杂,不能进行有效地处理。Canny算子实现简单,边缘信息不丢失,噪声小,处理速度快,检测效果较好,所以本文拟采用此算子进行图形的分析和处理。通过对实验图形数据的进一步分析可以看出,Canny算子主要受到和控制。尺度参数控制着滤波窗口对图像的平滑程度。越小,定位精确度越高,但信噪比越低,容易将噪声当做边缘提取;相反,越大,平滑程度越高,对噪声的敏感度随之降低,但易丢失边缘细节。阈值在很大程度上控制着边缘检测结果的好坏。阈值越小,保留的边缘信息越多,边缘越连续,但伪边缘也会增多,噪声点也会越多;增大,会抑制伪边缘,但同时也易丢失细节,边缘将会出现断裂。在本文实验中,利用Canny算子提取加热前的子囊盘边缘时取0.6,取0.1时比较合适。处理加热后的子囊盘时取1.3,取0.5比较合适。选取合适的参数后对加热前后的桑葚菌核子囊盘原始和边沿轮廓图进行分析比较,很明显的看出加热前后桑葚菌核的边缘出现了较大的差异。经过边沿轮廓的提取可以明显地发现,加热前边沿仅有一个颜色过度,而加热后出现了两个过度,并且加热后子囊盘皱缩,形状也发生了明显的变化,面积缩小为原来的1/2左右。

二、实验结果及分析

通过对桑葚子囊盘的边缘轮廓进行提取,经过一定的算法分析,识别出了桑葚菌核病的子囊盘后利用远红外线装置在实验室的环境下对子囊盘进行加热。选取实验远红外光管功率为1000W,在远红外光管与桑葚菌核之间的加热高度为55mm时。加热时间30s,当上升温度为63℃,不能有效的杀死桑葚病菌子囊孢子;加热时间45s,当上升温度为89℃,能杀死部分桑葚病菌子囊孢子,但仍可传病,当加热时间60s,上升温度为125℃,能够最大程度杀灭桑葚病菌子囊孢子,起到良好的防治效果。

三、结语

本文针对目前桑葚菌核病防治上存在的问题,提出了一种新的防治方法。利用该方法实现了对桑葚子囊盘边沿轮廓特征的提取,识别出了桑葚菌核并能有效的控制加热装置进行加热处理;在实验环境下,研究出了桑葚菌核死亡的极限温度数据,绘制出了加热过程的温度数据曲线图,能够通过远红外加热的方法对其进行有效杀灭,达到了初衷目的,对生产实践有一定的指导作用。

参考文献

[1]梁杨,徐立,马晓敏等.对桑椹肥大性菌核病菌具有抑制活性的中草药筛选[J].蚕业科学,2011,37(2):0187-0192.

[2]KatsutaroK.MulberrydiseaseofJapan[M].Tokyo:Kenpakusha,1979:109-130.

[3]陈利锋,徐敬友.农业植物病理学[M].中国农业出版社,2001:54-57.

[4]操海群,岳永德,花日茂等.植物源农药研究进展[J].安徽农业大学学报,2000,27(1):40-44.

[5]吕蕊花,赵爱春等.利用除草剂草甘膦防治桑椹菌核病的初步试验[J].蚕业科学,2011,37(5):0907-0913.

计算机视觉前沿方向范文1篇5

黑龙江电视台8号演播室是一个开放式4讯道高清新闻演播室,面积560平方米,主要用于新闻、民生、实事类节目录制,2013年1月1日正式启用,现在每天承担2个半小时新闻直播,半小时新闻录播任务。黑龙江电视台《新闻夜航》栏目,是全国十佳新闻栏目,收视率在省内排行遥遥领先,该栏目每天在8号演播室完成直播。8号演播室引进了多项先进的技术,制作手段丰富新颖,并首次引入轨道机器人+虚拟植入系统、DLP大屏拼接、4K在线包装系统等,可谓是高配置、高投入。

虚拟植入系统的特点

也许你对虚拟植入系统还不太了解,我们在这里先做个简单介绍。虚拟植入系统分两部分,图形处理和摄像机运动跟踪,图形处理部分包括:图形制作设备、图形播控设备、图形工作站,各采用一台计算机完成各自工作;摄像机跟踪部分包括摄像机传感器、跟踪信号处理相关软硬件。虚拟植入系统的工作流程包括虚拟场景制作、镜头校正、标定三维模型的相对空间位置信息,操作播控工作站控制三维场景的播出。

在演播室设计当初,黑龙江电视台考察了多家兄弟电视台,目前虚拟植入系统在国内有一些成功应用案例,如CCTV蛇年春晚、CCTV5豪门盛宴、江苏卫视跨年晚会、凤凰卫视气象站等。通过考察,台里认为摄像机轨道拍摄控制系统和虚拟系统结合是当今电视台演播室技术发展的一个方向,虚拟植入起到了丰富节目内容,提升画面呈现效果的作用,于是台里决定尝试这种先进的制作理念。

那么引入虚拟植入系统到底有哪些优势呢?黑龙江电视台技术部白晓云主任作了概括,虚拟植入技术可在画面中填加三维场景,这些三维场景可以是人物、建筑、舞台装饰、大屏幕等与节目相关的内容,可以是静态的,也可以是动态的。这些三维场景在演播室空间中具有相对确定的位置信息,并且可以通过传感器获取到摄像机的变焦、聚焦、平摇、俯仰等信息,根据这些信息实时进行调整,在摄像机景别变化时,画面中虚拟场景能跟实景一样产生相应的景别变化。“虚拟植入的应用为我台提供了更加丰富新颖的节目制作手段,实现了增强画面表现力,提升节目视觉感受,技术发展推动节目创新的项目预期。比传统节目制作的优势体现在包装手段更加生动、新颖、互动性强,虚实结合的效果增强了节目的表现力,提升了画面视觉冲击力。”

黑龙江台虚拟植入系统为两讯道虚拟系统,一个固定机位,一个移动机位、图形制作设备、图形播控设备、图形渲染引擎及图形处理合成设备组成。此外,本项目整套设备设计成箱载模式,既可在台内流动使用,又可在外景使用;既有虚拟植入功能,又有虚拟演播室功能,可满足更多的节目制作需求。

Furio机器人让虚拟植入系统生辉

在整个虚拟植入系统中,RossVideo的轨道机器人遥控跟踪系统Furio起到了重要的作用。白主任强调,Furio机器人与传统的摄像机承托设备相比优势显著:Furio机器人可沿轨道高速运动,最高速度达到2m/s,使镜头一气呵成,流畅生动。Furio机器人提供了全新的拍摄角度和更大的拍摄灵活性,提供了新颖的动态拍摄效果,具有更多的运动自由度,运动更加迅速平稳;操作简单,使用方便,可远距离遥控操作。RossVideo机器人支持拍摄状态存储功能,可以将摄像机的动态拍摄过程记录在服务器中,只需点击对应缩略图标,即可重现摄像机拍摄过程中的所有动作和状态。“一次设计,多次使用。”只需摄像师根据节目需求进行一次操作,并将拍摄状态保存下来,在以后的节目录制过程中,普通工作人员即可通过调用存储状态的方式控制机器人进行拍摄。

节目录制部科长张甲寅体会很深,相比之前的多个固定拍摄机位,只需一个轨道机位就直接将主持人送到大屏前,全方位展示主持人的风采。机器人不仅可以水平移动,还可以灵活地上下移动,移动镜头的视觉冲击力强,给主持人提供了更大的空间。机器人可向渲染引擎传送升降、俯仰、横摇、变焦、聚焦及移位等摄像机运动信息。360度旋转不仅可以拍到主持人,也可以拍到台下的嘉宾和观众,增强了台上台下的互动效果。自今年年初使用以来,Furio轨道机器人性能稳定,未出现大的故障,现已成为该演播室主要机位。

RossVideo为虚拟植入系统提供有力的技术支持

谈到RossVideo对整个项目的提供的支持,白主任称赞道,“RossVideo是一家在国际上技术领先的视频设备厂商,将最先进的技术理念和技术方案第一时间介绍到中国,让国内的制作水平与国际同步接轨。”RossVideo公司为该设备在黑龙江电视台的使用提供了良好的使用设计和技术支持,严格按照黑龙江台演播室景区的整体设计来安装该系统,并进行精确调试,多次对台方员工进行技术培训,而且也借鉴了很多国外成熟制作模式。通过使用Furio机器人系统,使得台方新闻节目在表现形式上更具创新性。

在设备安装和使用过程中也面临一些挑战,机器人也不例外。机器人提供的是沿圆弧轨道的位移,而图形设备需要的是直角坐标系中的位移。另外,机器人沿轨道运动时,与虚拟物体之间除了相对距离的变化还有拍摄角度的变化,这就需要定制相应的算法来解决以上问题。白主任说,在项目实施过程中,RossVideo的工程师和台里的技术人员通力合作,经过多次的现场测量和反复的计算调试,最终成功解决了这个难题,实现的弯轨运动的正确跟踪。

张科长也谈到了在施工阶段遇到过的一些困难,由于轨道弧度较大,机器人快速运动时会产生较大的离心力,再加上原演播室水泥地面不太平整,导致机器人高速运动时出现抖动现象。“RossVideo公司及时从比利时派来工程师到我台,对机器人重心进行精确调整,反复对轨道进行调平,使其在现有地面条件下实现最大的平整度,通过水平调整,加装减震片等措施,误差由原来的3度,减小到1度,抖动现象很好地得到改善,从画面上看不出任何抖动。另外,Ross工程师还在轨道两端加装了刹车反光片和缓冲器,防止机器人快速运动时脱离轨道。”张科长强调,在前期设计方案时,要充分考虑自流平、承载度等问题,这样在后期施工中,就能避免由于路基不平出现的抖动现象。“总之,在此项目上,RossVideo与我们合作非常默契,大家相处非常愉快。RossVideo提供的技术服务和支持很及时,很到位,我们也很感谢!”

黑龙江电视台是国内首个使用RossVideoFurio机器人控制跟踪系统用于新闻节目录制的电视台,在黑龙江电视台报道“神十飞天”、“辽宁号航母”、“事件”等重大新闻节目中,通过轨道机器人和虚拟植入系统的完美结合,“航母”、“神舟”、“”不仅全景展现,而且细节清晰,整个画面非常协调,仿佛就在观众眼前。模拟演示非常逼真,动画效果栩栩如生,对内容的阐述更加直观和深入,这在以往的制作手段中是很难达到的效果。通过使用虚拟植入系统,大大提升了新闻节目的收视率,在当今激烈的节目竞争中脱颖而出。

计算机视觉前沿方向范文篇6

关键词:公路建设;环境影响;评价指标

前言公路建设项口环境影响评价关系到国计民生,因此构建社会、经济环境评价体系,对建设项目进行量化的经济损益分析研究,是公路建设项目可行性研究的重要内容。对公路建设项目环境影响评价体系的研究,克服了单个项目评价缺乏整个环境影响分析及整体环境对策规划的缺陷,能有效地控制各类污染源及污染物的排放总量和交通建设对环境造成的影响,使环境影响评价成为有效辅助决策、规划、计划的手段之一。

1.公路建设环境影响评价概况

现代社会,公路交通运输是人类赖以生存和发展的基础条件之一。我国公路交通建设的高速发展,有效地解决了自然资源、劳动力、生产设施等生产要素相分离的矛盾,为实现共同富裕和可持续发展已经做出了巨大的贡献,而且将发挥更重要的作用。公路交通建设一方面积极促进国民经济的飞速发展;另一方面,公路基础设施在建设前、建设中和建设完成以后都会以不同形式对社会经济环境、自然景观、生态环境、环境大气、环境噪声等产生各种影响。

公路建社对环境的影响客观地要求对公路建设项目做深入透彻的评价研究和分析,并通过评价研究分析找寻合理可行的方案,保障公路建设沿着可持续发展道路顺利前进。公路建设环境影响评价研究是监督和减缓工程环境的不利影响,达到经济发展和环境保护相协调,保证可持续发展的重要手段之一。

2.公路建设环境评价体系中存在的问题

在公路建设环境影响评价中,部分评价体系还未构建或未完善,评价体系因子的量化关联问题的处理还没解决。并且由于公路建设项目的线性性质,各个地区的生态环境评价体系也不尽相同。因此,在评价项目建设对生态环境的影响时应建立适合项目沿线地区的评价体系。总结起来,其主要问题表现在以下几方面[1]:

(1)模型和模型参数存在的问题:关于评价方法中的一些数值模拟参数有待于改进。《公路建设项目环境影响评价规范(试行)》的应用仍然具有一定的局限性。具体表现在模型应用具有一定的局限性,参数的取定具有不确定的概括性。如对噪声的预测模型只适用于双向四车道,且设计行车速度有一定的限制。

(2)缺乏可持续发展理论的应用:公路交通建设建立了开发资源、协调资源、合理利用资源、加快经济发展的纽带,同时也是消耗资源、影响环境的举措。因此,在评价中运用可持续发展的观点、理论和方法尤为重要。而现有的评价体系和实践应用中,这一理论没有得到充分的体现。

(3)实际应用中缺乏科学的评价手段:由于科学技术的飞速发展和计算机技术在环境研究领域的广泛运用,对于环境监控己经基本实现计算机控制和数据处理。在国内,专门用于环境评价研究的软件层次很低,而这些软件对于“公路建设项目环境影响评价”却无能为力。

以上提到的问题在应用中确实存在,问题的出现将损害对公路建设环境评价的合理性、准确性、有效性和可依据性。

3.环境影响评价的要素分析

公路工程项目对环境影响的重点是线性的带状影响。其特点是路线长、范围广、施工期长、影响大。因此环境影响评价要素应包括如下内容[2]:

(1)工程分析:工程分析是针对性很强的评价工作,分析内容包括各工程方案对环境的影响;路基设计对环境的影响;取、弃土石方工程对环境的影响;排水系统对环境的影响;绿化与美化;沿线管道埋设;

(2)环境影响因子:公路建设项目对环境影响因子的识别应根据项目建设在不同时期对环境的作用。通常包含三大类:工程位置对环境的影响;施工对环境的影响;营运对环境的影响;

(3)环境影响评价的现状调查、监测;

(4)环境敏感地区、敏感点的确定;

(5)环境影响识别;

(6)评价指标体系结构的建立;

(7)预测模型与参数:评价的关键是预测,预测模型要符合实际情况。模型选定后,参数选用正确与否直接影响计算结果的精度及评价结论的可信程度;

(8)环境保护对策研究。

4.道路环境影响指标体系的建立

道路环境影响指标体系按照计算方法可分两类:一类是可以由具体数值直接计算得到,另一种是无法直接计算得到,比如目前一般认为景观协调方面是不容易量化的。对于可以量化的指标可以用相应的计算模型就可以得到,而对于这类不易量化的指标就要采取其他方法,比如采取打分或排序的方法得到相应的指标值,同样也可以进行有效的评价。

4.1道路声环境评价指标

目前国内外道路噪声评价中一般用等效噪声级L作为评价指标,L的数值和人们的主观吵闹感觉程度有较好的相关性,可以分三步计算[3]:

(1)各道路单元点在计算点产生的基础噪声

首先将实际道路划分成一系列的道路单元,按交通量预测噪声的大小及不同的速度和同重车百分比对噪声进行的修正,同时考虑坡度对噪声产生的影响,求取一个道路单元噪声

(2)计算扩散传播对交通噪声的修正值

通过交通量预测和有关道路因素的修正,可以得到汽车在道路上行使时产生的噪声强弱,但是要进行道路声环境评价不但要计算汽车行使线上的噪声的大小,而且要计算离汽车行使线不同距离和不同高度处的噪声值,噪声扩散、传播时的衰减和加强通过测试数据进行修正。

(3)计算交通噪声评价值

将由交通量计算得到的基础噪声值加上由扩散和传播产生修正值,最终可以得到第i个道路单元点在计算点处产生的噪声评价值。然后将计算点范围内的第N个道路单元在计算点处产生的噪声值合并起来,就得到交通噪声评价值。

4.2道路大气环境评价指标

在道路建设项目大气环境影响评价中以尾气污染指数最为实用,为计算尾气污染物在计算点产生的浓度,可将道路划分成一系列的道路单元,分别计算各道路单元污染物排放在该点产生的浓度,然后再求和计算整条道路尾气污染物排放在该点产生的浓度。以道路单元中心为坐标原点,下风向为x轴正方向对整个道路单元建立平面坐标系,则可求出整个有限线源对计算点上污染浓度的贡献。

4.3道路景观的评价指标

公路景观设计应力争使自然景观与公路工程结构物达到有限的协调,建立起新的完整的公路景观系统。所以道路景观应从使用者的视觉、心理出发,达到公路功能、美观及经济的一致性。目前研究道路景观是采用综合指标的方法,先确定道路景观的评价指标,然后在此基础上对各分级指标进行评价,在对道路景观进行评价时,可以从以下方向考虑[4]:

(1)通视:要求路线各组成部分的空间位置配合协调,使司乘人员感到线形流畅、清晰、行驶舒适安全。

(2)导向:建立一个区域性的视觉系统,使司机在视觉所及的范围内,能预见到公路方向和路况的变化,并能及时采取安全的行驶措施。

(3)协调:使公路线形及沿线设施与沿途空间景观环境相协调。

(4)绿化:利用绿化来补充和改善沿线景观。

公路景观可以从以上四个或更多方面计算出道路景观综合评价指数,这样可以较全面和真实的反映道路景观的综合性和复杂性。

随着科学技术的进步以及人们对环境问题认识的逐步提高,环境评价已不再是一项单纯环境科学知识的简单应用,而是已发展成为一项需要综合应用多学科知识及技术。总之,建议加大环境影响评价技术及方法的研究,用先进的科学的技术及方法及可持续发展的思想武装环境评价,使其在促进公路交通建设与环境可持续发展方面发挥应有的功效。

参考文献

[1]袁卫宁,任征,高等级公路环境影响综合评价[J],西安公路交通大学学报,1999

[2]陆雍森,环境评价[M],同济大学出版社,2002

[3]赵强,简述高等级公路环境影响评估[J],2001

计算机视觉前沿方向范文篇7

关键词新闻;网页设计;视觉识别;媒体

中图分类号TP39文献标识码A文章编号1674-6708(2012)65-0194-02

视觉识别系统是运用系统的、统一的视觉符号系统,对外传达企业的经营理念与形象信息的平面设计系统。它是企业识别系统中最具传播力和感染力的要素,它接触的层面广泛,可快速而明确地达成认知与识别的目的。随着品牌经营理念的不断深化,识别视觉设计已经成为市场经济竞争中的有力武器。“用眼睛看世界”是人类认知和解读世界的原初能力和习性,当设计者将企业名称、企业标志、企业标准字、标准色彩、象征图案和企业标语等组合形式符号化、具体化的表达出来,该品牌的企业理念便直观的传达给了消费者。视觉识别系统设计在消费者的认知、接受和理解中使企业文化得到了彻底贯彻。

当今世界的网络事业正处在一个迅猛发展和普及的阶段,网民数量的急剧增加、网络涉及民众日常生活的愈发广泛、网站建设的不断蓬勃、网页内容的高速更新,使网络已经成为了很多人的一种生活方式。在互联网新闻传播方面,网络平台可以为人们提供最快最全的新闻信息,形式多样,丰富多彩。因此,在电视、广播、报纸等传统媒体之外,越来越多的人们已经习惯于通过网络浏览新闻。尤其当重大事件发生时,网络搜索新闻的随时和便捷性更为受众所青睐。但在信息爆炸的时代,新闻网页的设计者要想争取更多的点击率,在保证新闻内容优质的前提下,还必须要打造自己独特的品牌风格。调查显示,有高达67%以上的网民倾向于在固定的网站浏览新闻,而这其中59%以上的受调查者选择固定网站的原因是“页面让人觉得舒服”。由此可见,高质量新闻网页视觉识别系统的建立非常必要。由于品牌视觉识别系统是一个完整的系统工程,涉及的范围很广,这里着力从新闻网页设计的标志系统设计、色彩设计、字体设计三个方面进行分析。

1新闻网页设计的标志系统设计

新闻网站的标志无疑是整个视觉系统设计中最关键的一部分,它作为设计中的核心,若能给浏览者留下深刻的印象,服务于品牌传播的同时,将直接关系到网站的经济效益。不同种类的网站新闻页面,有着各自不同的视觉识别系统设计方式,主要分为两种类型。一是传统报纸媒体、传统电视媒体和传统广播媒体的网络版形式,另一类就是商业综合网站的新闻频道。由于传统媒体在社会中已经有了固定的受众,也具备着相对广泛的影响力,多平台中的统一标志也有利于品牌传播,所以传统媒体的网络版新闻页面标志设计也多会沿用已使用的标志。如人民网沿用的是《人民日报》的字体和颜色,以“人民网”三个字的书法为网站标志,凤凰网直接沿用凤凰卫视抽象的凤凰旋转交融的形象台标。除了几乎完全直接沿用的媒体,也有对网络标识进行全新设计的,比如新华网的网络标志变成了中英文相结合的设计。与此差别较大的是,一些综合商业网站的标志设计充分体现了互联网传播时代的多样性,生动、灵活、时尚,极具个性化。其中百度的标志设计最为活跃,不仅有一般情况下使用的最具识别力的标志,在节日、纪念日等有意义的日期到来之际,会在与本来标志相统一的基础上设计与节日氛围相适应的新鲜标志样式。再比如腾讯网红黄绿三色环绕着一只小企鹅的标志设计,同样很有意义。环绕QQ企鹅的三种颜色代表腾讯网为公众提供的三个创新层面:绿色,表示通过学习型创新,提供日新月异生命力蓬勃的产品;黄色,表示通过整合创新,提供温暖可亲的多元化互联网服务;红色,表示通过战略创新,倡导年轻活力,创意无限的生活方式。标志设计独具创造性的同时,腾讯公司的企业文化也尽在其中。

在与商业网站的对比中我们看到,我国的新闻网页的标志设计对于互联网优势的体现还是很欠缺的,新闻网页设计者应该在把握市场动态,对网民的喜好倾向进行分析的基础上,把互联网相对于传统媒介在图形与色彩上的变化优势充分体现出来。

2新闻网页设计中的色彩设计

不同颜色会给予人不同的心理感受,当网页映入浏览者的眼帘,它的颜色便会直接影响他们对该网站的第一印象。因此,色彩设计在网页视觉识别系统设计中是举足轻重的关键环节。蓝、深红、灰、黑是目前各大网站中最常见的颜色。蓝色这种代表理性的冷色调可以一定程度上的体现新闻的真实性,新闻网首页的新闻小标题中用得较多。红色辨识度最高,传播速度最快,在新闻网页设计中多用在栏目板块或标题上,使所表现的内容很容易被捕获。但是腾讯网、人民网、新华网等诸多网站中,其标题字设计为均蓝色或者黑色,并没有滥用红色,这是因为红色易引起视觉疲劳,不利于长时间阅读。

3新闻网页中的字体设计

与图片的功用比起来,文字表意明确,是新闻网页构成要素中的主体,虽然图片常常更加,但是网民获得新闻信息的最主要形式仍是通过文字。黑体和宋体作为传统媒体中最常用的两种字体,同样被使用在新闻网页中,略有不同的是,计算机中黑体和宋体选择更加灵活多样。黑体字是一种装饰字体,笔划整齐划一,醒目有力,识别性高,常被选作要点新闻、或者新闻大小标题使用的字体。模仿宋体字结构和笔意的仿宋体,笔画粗细一致、秀丽狭长,适合阅读,也同样适合印刷,在新闻网页的段落中被广泛使用。在字体大小方面,浏览腾讯网、人民网、新浪网等大型网站可以发现,9磅和12磅左右的字体使用较多,通常分别作为新闻网页的标题和正文,或者分别作为需要强调的地方和辅助内容。

在信息高速发展的今天,新闻网站要想获得更多的认可,必须加强视觉识别系统的设计改革,打造全新的网站,为用户提供更好的体验。

参考文献

[1]刘俊荣.基于行为识别的网页文本分类算法研究与实现[D].北京邮电大学,2010.

[2]宋鳌.网页去噪在交互电视中的应用与研究[D].上海交通大学,2011.

计算机视觉前沿方向范文

关键词:高等教育计算机专业课程教学改革

随着“国务院关于大力发展职业教育决定”的出台,我国职业教育的发展又进入了春天。各种专业在高职院校中迅速发展壮大,曾经的老大计算机专业不仅没有发展,人数还不断下滑。“让无业者有业,让有业者乐业”。高职院校的教育就是就业教育。学生不选择计算机专业,肯定是就业出现了问题,也就是专业建设出现了问题。根据本人从教多年的经验,谈一下高职院校计算机发展建设的一些想法。

一、高职院校计算机专业学生就业难的原因

当今高职学校学生在就业过程中有这样突出的矛盾:一方面毕业生找不到对口的工作;另一方面用人单位在大量的应聘者中又找不到适用的人才。这种严重的供求矛盾表明:计算机专业人才培养产需之间严重脱节。而造成这样的现象,归纳有如下几个原因:

(一)课程设置不合理

现在高职院校计算机专业开设的课程一般有:计算机基础(Office办公软件)、VB程序设计,C语言、Flas制作、网页设计等;但是目前存在的问题是:学生们能把办公软件学好,可是计算机专业班学生是全男班,去公司做文员不大可能。因此现在感觉计算机专业的学生在就业市场上,能从事本专业工作的很少、很多人不得不改行干别的工作。

(二)教学方法落后

目前大多数高职学校仍然承袭传统的教育理念,沿用陈旧的教学方法,学生学习效果不佳,理论听不懂,操作不熟练。在这样的教育模式下,导致学生动手能力差、未具备高职学生职业技能强的特点,难于适应IT发展对人才的要求。

(三)教师实际操作能力不足

高职学校教师长期从事教育教学工作,无法进入企业体验生活,对IT行业缺乏经验,无法及时把握IT行业的脉搏。教师缺少职业培训,技术更新滞后、缺乏教育创新机制,严重影响教学质量。

二、高职院校计算机专业发展必须“四化”

(一)专业设置必须行业化

传统的计算机专业就只有计算机应用方向,开的课程多而且杂,没有针对性。学生不知道本专业究竟学什么,学习后究竟能干什么。而如今,随着计算机的普及,计算机已经进入社会的各个行业,不同的行业,计算机的作用不同。这就要求高职学校的计算机专业方向的设置必须细化,市场化,行业化。根据市场需要,高职计算机专业就应该分为自动办公方向、平面设计方向、计算机维护方向、动漫制作方向、网络搭建和维护方向等。不同的方向应该有不同的课程设置,如自动化办公方向,除了计算机基本操作维护、办公软件外,还应该加强秘书方面的培训。平面制作方向则应该加强美术方面的培养。

(二)教学手段、方法必须多样化

从信息论角度看,人的信道特性触觉信道带宽为1,听觉为100,视觉为10000,所以要交换信息,就要充分利用视觉信息。因此,计算机辅助教学以它直观、形象、生动的演示功能,给学生带来多感官、多种类型的刺激,而且能充分调动学生学习的自主性,具有与传统的教学手段无法比拟的优势,是一种适应21世纪素质教育要求的信息化教育教学模式。在计算机专业课程教学中应该多使用多媒体教学,多用课件,通过图文并茂、视频动画以直观教学的形式,提高学生的学习兴趣,使其处于一种积极主动的精神状态;利用人机交互,可以即时获得信息反馈,灵活控制教学内容,使其更加直观形象,更易于理解,提高讲课的效率和教学效果。

另外,在计算机专业课中还应该多使用“任务驱动法”:“任务驱动”是一种建立在建构主义学习理论基础上的教学法,学生的学习活动必须与任务或问题相结合,让学生带着真实的任务去学习,为每一位学生的思考、探索、发现和创新提供了开放的空间。教师把课堂教学目标分解为一个个“任务”,而且这些“任务”具有可操作性。

(三)学生技能强化必须重复化

高职院校学生的优势是操作熟练。但现在的学生学的东西多,但却熟练的少。办公自动化的打字速度只有50字每分钟,平面设计方向的photoshop操作只能用鼠标等,这样高职学生有何优势可言?同时计算机课程是操作性较强的课程,所以学校应尽最大可能补充和更新计算机设备,严格管理,提高使用效率,最大限度地增加学生使用计算机的时间,在课程安排上,相关方向的核心课程必须重复强化,课程宁愿少,也必须让学生掌握熟练。

(四)教师知识必须前沿化

作为职业学校的教师,继续教育是教育工作中不可缺少的一部分。计算机的发展日新月异,要使计算机教师跟上行业发展的趋势,必须要求其不断地自学或下企业锻炼或到高等院校深造充实自己,从而及时了解行业的情况及时掌握应有的技能能力。计算机教师要培养出符合时代需要的应用性高素质人才,自己就必先有新的教学理念并且不断更新自己的知识与技能,扩大自己的专业视野。只有这样才能在教学中具有针对性,而让学生真正掌握最新专业知识和技能,增强他们的职业适应能力,从而提高他们就业的针对性和稳定性,真正为社会培养有一技之长的应用型人才。

参考文献:

计算机视觉前沿方向范文

(中国人民解放军空军航空大学军事仿真技术研究所,吉林长春130022)

【摘要】现实世界是一个三维立体世界,可以轻易地分辨出物体的形状大小、远近高低及其之间的相对位置。而在显示器和绘图机上仅能用二维空间来表示三维空间,因此需要应用投影变换使其维数降低,达到合理逼真的显示。投影变换是一种重要而基本的三维几何图形变换,在实际中应用广泛。针对投影变换,主要介绍了其分类方法、基本原理,并浅析了投影变换的一些应用,给出了具体的推导步骤和方法,最后说明了投影变换在飞行模拟器视景仿真中的应用及其重要性。

关键词投影变换;透视投影;平行投影;斜投影;视景仿真

ThePrincipleandApplicationElementaryAnalysisofProjectionTransformation

HANLu-jiaLISong-wei

(AviationUniversityofAirForceMilitarySimulationTechniqueInstitution,ChangchunJilin130022,China)

【Abstract】Therealworldisa3Dworld.Wecaneasilyrecognizetheshape,thesize,theheight,thedistanceandtherelativepositionoftheobjects.Inthedisplayandthedrawingmachine,thethree-dimensionspacecanonlyberepresentedintwo-dimensionspace.Therefore,weneedtoreducethedimensiontoaquireareasonableandrealisticdisplay.Theprojectiontransformisanimportantandbasic3Dgeometrytransform,whichiswidelyusedinpractice.Aimingattheprojectiontransformation,mainlyintroducestheclassificationmethod,thebasicprinciple,analyzessomeapplicationofprojectiontransformationandgivesthespecificproceduresandmethods.Finally,explainstheprojectiontransformisviewedtheimportanceandapplicationofscenesimulationinaflightsimulator.

【Keywords】Projectiontransform;Perspectiveprojection;Parallelprojection;Obliqueprojection;Visualsimulation

通讯作者:韩鲁佳(1990—),男,硕士研究生。

作者简介:李松维,男,高级工程师,研究生。

在计算机显示、地图、工程图、机械图中,经常要用到投影变换。在三维立体空间中,我们可以轻易辨别出物体的大小、形状及其空间位置关系。然而,当需要将真实物体显示或记录时,往往要将其变换为二维空间图形。投影变换可以降低三维物体的空间维度,使其能够在显示器和绘图机等二维图形显示器中表达三维空间物体的一些必要信息。投影变换在计算机图形学中有着广泛的应用。

1投影变换的分类

投影变换是将三维物体变为二维图形表示的过程[1],投影变换的目的是显示图形[2],变换过程中用到的矩阵称为投影矩阵[3]。根据投影中心和投影平面之间的距离不同,基本的投影变换有两种,分别是平行投影和透视投影[4],如图1所示。平行投影的投影中心位于无穷远,投影线互相平行。这样产生的投影结果和物体与投影平面的相对位置无关,对实际物体信息的反映较差。例如在三视图中只能够表达物体两个方向的信息[5],如果改变物体的位置或是投影方向,则可以让平面投影图表达物体在三个方向上的信息,使图形的真实感大大增强。而透视投影能够根据观察点与物体的远近位置不同,采用中心投影法,正确地描述出物体在三维空间中的远近位置和相互层次之间的关系,使人获得有立体感,有深度的空间视觉效果。

在平行投影中,根据投影方向是否与投影平面垂直,可以分为正交投影和斜投影[6]。投影方向与投影平面垂直叫做正交投影,不垂直则称作斜投影。在正交投影中,根据视向与坐标轴的关系分为多视角正投影和正轴测投影。正轴测投影又依据有多少个主轴被同等地缩短,分为正等测、正二测、正三测投影。同理,斜平行投影分为斜等测和斜二测投影。

在透视投影中,依据视向与世界坐标系的相对关系,可以分为一点、两点和三点透视。它们的视向区别和灭点个数如图2所示。

2投影变换的原理

在坐标系oxyz中,假设投影平面就是z=0,推导透视投影的计算公式。设视点为V(xvyvzv),空间中任一点M(xyz)在平面z=0上的投影为N(x1y10),则:

在实际应用当中,如果我们能够采用自己规定的坐标系,可以将投影平面设置在面z=0处,则用上面推出的公式计算即可。但是这样做有一定弊端,一旦投影平面固定在面z=0,对于某些物体只能得到物体的一点透视且与视点位置无关,而往往二点透视、三点透视具有更好地空间感、立体感,更加生动逼真。因此,通常情况下我们不能要求投影平面的位置,需要允许投影平面的改变。下面我们讨论在坐标系oxyz中,投影平面是任意平面的情况。

3几种典型的投影变换

3.1三视图

我们通常所说的三视图属于正平行投影。正投影由空间三个坐标轴中的任意两个表达[8],由于其仍保有其深度信息,在有多个物体显示时具有可以反映前后关系的特点。而采用变换矩阵将第三个坐标值变为0,则无法达到此效果。生成三视图就是将三维物体投影分别投影到面xoy、面xoz和面yoz上,而通常我们还要将其画在同一平面上,如图3所示。

3.2轴测图

把一个物体投影到一个投影面上,使它在投影面上的投影能反映它在长、宽、高3个方向的形状,并能沿轴向测量,这样的投影叫做轴测投影图[9]。

3.3斜投影

把物体沿方向V向z=0平面作平行投影,且保持x,y方向长度不变,称为斜轴测投影。设V与xoy面的交角为α,V在xoy面的投影矢量与x轴的交角为φ。利用特殊投影点坐标得斜轴测变换矩阵为:

3.4透视投影

物体透视图具有较强的立体感,直观,逼真,符合人的视觉习惯,在建筑、设计、广告、艺术绘画应用广泛[10]。

计算物体透视投影时,应当将物体放入视点坐标系里,原点重合,绕视点坐标系y轴旋转α,绕x轴旋转φ,最后平移一段距离L、M、N,则:

4透视投影变换在飞行模拟器视景显示中的应用

在飞行模拟器中,需要将实际地景显示在屏幕上,为飞行员提供逼真的视景显示画面,使飞行员能够在模拟飞行训练中感觉更真实,更贴近实际飞行。在将三维空间景物转换到二维投影屏幕上显示的过程中,由于需要变现出空间景物的远近,纵深,而不改变物体的真实形状和拓扑结构[11],这就要用到透视投影变换。我们在PC平台下使用视景仿真显示相关软件驱动,并得到了经过透视投影变换后的图像,如图8所示。运行环境为:InterCoreCPU3.10GHz,内存4GB,显卡GeForceGTX9804GB。

5结束语

投影变换在计算机图形学中应用广泛,具有重要的作用和地位[12]。介绍了投影变换的分类方法,及其基本原理,详细给出了透视投影和平行投影推导的具体步骤,并计算了一些投影变换的具体应用,最后将透视投影应用在飞行模拟器的显示系统中,并在PC环境中证明了投影变换能够达到良好的显示效果,获得逼真的视觉反馈。

参考文献

[1]范贤德,李松维.计算机成像技术与应用[M].吉林:吉林人民出版社,2008:70-71.

[2]BjornBollensdorff,UweHahnet,MarcAlexa.TheEffectofPerspectiveProjectioninMulti-Touch3DInteraction[J].GraphicsInterfaceConference2012.

[3]陈杰.空间曲面的平行正投影原理[J].水利科技,2002(3):61-62.

[4]王长波,高岩.3D计算机图形学[M].北京:机械工业出版社,2010:49-50.

[5]钟韬,袁威,左炜亮.系统标定中的透视投影模型[J].兵工自动化,2011-03:30-35.

[6]DonaldHearn,M,PaulineBaker.计算机图形学[M].北京:电子工业出版社,2013:294-295.

[7]唐荣锡.计算机图形学教程[M].北京:科学出版社,2008:59-60.

[8]何援军.计算机图形学[M].北京:机械工业出版社,2006:99-100.

[9]范幸义.计算机图形学[M].3版.重庆:重庆大学出版社,2008:110-111.

[10]YangZhang.FisheyeDistortedImageCalibrationusingParabolicPerspectiveProjectionConstraint[C]//20125thInternationalCongressonImageandSignalProcessing.

[11]陈自强.投影透视研究[J].华东理工大学学报,2000,26(2):201-205.

计算机视觉前沿方向范文篇10

引言

优美、和谐的公路景观对于保障车辆的行驶安全,提高司乘人员的舒适性,实现人与自然的和谐发展具有重要意义。近年来,我国公路建设突飞猛进,2004年,全国公路通车里程达187.07万公里,居世界第四位,其中高速公路3.43万公里,列世界第二位,有力的支撑了国民经济的健康发展,但与此同时,公路建设带来的生态破坏、景观割裂以及由此引发的交通事故等负面影响日益凸现,对我国经济社会的可持续发展构成了严重威胁。因此,对公路沿线进行环境保护和景观设计,成为我国公路建设中的迫切任务。

1.国内外公路景观设计现状及存在的问题

西方发达国家的公路景观设计总体上可以分为三个阶段:第一阶段,仅注重提高道路的通行能力,确保行车安全通畅,主要着眼于道路线形设计、结构设计、力学计算等公路本身的建设,尚未提出系统的公路景观设计理论;第二阶段,开始重视道路以外的附属设施、环境保护、管理等配套设施建设,使道路的功能得以更充分地发挥,但公路景观设计大多作为环境保护的一部分提出,初步的公路景观设计理论开始出现;第三阶段,着眼于道路的多功能利用,不仅使用路面,还利用立体空间(诸如立体交叉及地下空间),公路景观设计理论出现与其他学科相互融合的态势。现代公路景观设计正在成为一门涵盖土木工程学、生态学、计算机、植物学、美学、心理学等诸多学科的边缘性科学,公路景观成为信息化时代的多信息载体。当前国内外公路景观设计中存在的问题主要有以下方面:

(1)公路景观设计滞后于路基路面及其他附属设施的设计,有的甚至忽视了景观设计,条块分割,人工雕凿痕迹明显。许多已经出版的书籍和已经成文的规定都把公路的景观设计等同于“美化设计”或“绿化设计”。

(2)设计中过分注重形式美,对司乘人员实际的景观体验重视不足。设计者常采取传统的园林景观设计手法来设计公路景观,许多公路被“装饰”成富丽堂皇的绿化带;缺乏全局意识,过分注重形式美,忽视了人们在车辆高速运动中的景观体验,造成过往旅客和驾驶人员眼花缭乱,易产生视觉疲劳和不良情绪。

2.基于动态特性的公路景观设计的基本思想

公路沿线的周边环境不仅要满足交通功能,而且还应该赋予人们优美、宜人的景观视觉。公路的景观设计,一方面要强调公路与沿线的自然环境、交通设施、车辆等的协调统一,使公路成为环境的一部分,实现与自然环境的和谐;另一方面也要强调根据车辆高速行驶的动态特点,实时调整景观的表现形式,既满足静态视觉的要求,同时也满足车辆行驶中人的动态视觉的要求,为司机和乘客提供实时变化的审美效果。

动态中人的景观尺度感、动态中人对环境的参与特点和人的心理感受是公路景观设计中至关重要的因素,公路景观设计应充分考虑人的视觉及行为特点,满足动态变化的要求。基于动态特性的公路景观设计方法是指根据司乘人员的动态视觉特性,充分考虑行车速度对景观尺度、人的美感特性、景观组合方式等方面的影响,从人的动态体验出发,对公路沿线各种景观要素进行组合和优化设计。

公路景观设计面对的关键问题是如何处理速度(v)、时间(t)与景观效果的关系问题。这里的v和t不是传统物理学意义上的车速和时间,不能简单的理解为两地之间的位移跟速度和时间的线性关系。动态景观设计理论对v、t的理解,需从景观设计角度进行如下阐释:以车辆为参照物,v可以理解为公路景观以及与公路相关的自然景观(包括大地景观、气象景观、植物季相变化景观等)、人文景观(城市、河堤、名胜古迹等)的不断运动;t应该理解为上述一系列运动景观的动态组合。也可以这样表述:公路景观设计应该营造出一系列闪现在人视野中犹如电影胶片般的动态、连续的画面。由于公路上的车辆一般都会经历起步、提速、持速运行、减速、再提速、再持速运行……这样一系列不断反复的运动,相应的,这一系列动态画面景观也经历着同样的运动和变化,设计人员进行公路景观设计时应充分考虑这种变化,区分具体情况下人的不同视觉感受,而不能采取一刀切式的设计。

3.基于动态特性的公路景观设计基本要素

3.1.动态中的景观敏感度

景观敏感度是指景观引起人们注意力难易程度的量度,相对于静态景观而言,车辆行驶过程中,公路景观的动态敏感度在很大程度上将会被弱化,因此,欲使道路景观对行驶中的司乘人员起到与静态相同的视觉效果,就必须通过专门设计,弥补车速对动态景观敏感度的弱化影响。

动态中景观敏感度(s)的大小和车速(v)、司乘人员前方视野中能清晰辨认景物的最大距离(dmax)、清晰辨认景物的最小尺度(hmin)、路侧能清晰辨认景物的最小距离(dmin)四大因素密切相关,其关系可用下式表示:

s=f(v,dmax,hmin,dmin)

根据相关研究成果,为了达到最佳动态景观敏感度(smax),不同车速(v)与dmax,hmin,dmin之间有一定的对应关系,见表1。

表1车速(v)与dmax,hmin,dmin关系表

(table.2relationamongspeed-v,dmax,hminanddmin)

v(km/h)2060100140

dmax前方视野最大晰辩距离(m)150370660840

hmin前方视野晰辩最小物质尺度(m)0.351.102.003.00

dmin路侧晰辩最小距离(m)1.715.098.5011.9

以限速60km/h为例(当处于特定路段比如起步区、隧道内、急弯区时,需慢速行驶),司机前方的景观或景观单元的最远距离不应大于370m;不应小于5.09m;它们的高度应大于1.10m。当景观或景观单元的三维尺度超出这些阈值时,司机的景观敏感度为零,即对这个速度下行驶的司机来说是“视而不见”的。

导致动态中景观敏感度变化的因素很多,除了本文列出的v、dmax、hmin、dmin等四大因素外,敏感度的变化还受景物表面相对于视线的坡度、景物在视域内出现的机率、景物的色彩、质感、明度和人的视力、情绪以及天气的变化等很多不确定因素的影响,由于篇幅所限,本文不再详细叙述。

3.2.动态中人的景观尺度感

静态中人的景观尺度感是在人的生活起居中形成的,包括人的对周围环境形成的空间感、场所感,一般是宜人的小尺度;而在车辆行驶情况下,车辆的运行使人们对公路沿线景观的尺度感发生了变化,进而带来道路与周围环境产生新的比例关系,路边景物一晃而过,只有尺度较大的物体才能看清,这种大体量的景观尺度是人们视觉的需要,符合动态中人的心理感知和生理特点。高速行驶下的汽车只有穿行于大尺度的景观空间,司乘人员才能产生融入自然的感觉而不是被排斥感,所以,动态中人的景观尺度感常是宜车的大尺度。因此,公路景观设计中景观尺度的确定,应充分考虑动态中人的视觉、心理和生理的变化,根据路段的性质、车速等因素来综合确定。

3.3.动态中人的视觉特性

计算机视觉前沿方向范文1篇11

1仿人机器人NAO平台简介

NA0是由AldebaranRobotics公司开发设计的仿人机器人。结合前沿技术以及专为NA0开发的编程环境,使用者可以根据自己的设计对NA0进行编程,赋予它听、说、看、感知等能力,实现机器人与人、机器人与机器人之间的交流。NA0能力出众、动作流畅、是仿人机器人中的佼佼者。NA0机器人身高58cm,重4.8kg;有25个自由度,配有惯性导航仪和闭环控制系统,具有撅握能力的双手;配有多种传感器,包括超声波传感器等;CMOS摄像头,同步动态随机存取存储器;CRJ为AMDGeode86500MHZ;无线网际网络和以太网端口,灵活的操作系统选择,可以在Linux、Windows等操作系统下编辑;可以进行声音合成、语音识别、视觉识别和探测障碍物等;开放式编程框架,用户可以根据自身专业水平选择适合自己的高级编程语言,如C++,MATLAB等。NAO有广泛的应用,可将其应用于多领域的研究平台、技术教育平台、科技竞赛平台、家庭服务、展览展示等。本文主要在展览展示背景下,以NAO为应用平台,使用NAO的摄像机,进行复杂背景下视频的实时采集,将视觉跟踪技术应用于NAO机器人,以自然的方式完成人机交互展示。

2基于目标跟踪的交互信息识别方法

为建立完整的复杂背景下的机器人交互平台,在视觉跟踪算法的基础上,本文提出了一种控制NAO运动的跟踪理解算法,这种算法简单而高效地将跟踪算法获得的对象运动轨迹匹配为不同的语义,采用两种交互形式,一种是自动检测视频中的运动物体进行跟踪,另一种是手动选择感兴趣的物体进行跟踪。这样做既丰富了交互形式,也使得NAO面向具体动态交互任务具有较好的处理能力。在具体的实现中,当确定跟踪目标之后,该算法首先确定目标往哪个方向走,由于跟踪目标过程中采用最小矩形的形式,所以先获得最小矩形的中心作为目标移动的中心点,根据中心点的坐标,确定目标移动的方向。设移动前中心点的坐标为(心九),移动后目标中心点的坐标为(4,凡),根据坐标关系,当目标上下运动时,横坐标的变化是0,当目标左右运动时,纵坐标的变化为0,但是由于目标在移动过程中,不一定严格按照直线运动,会存在一定的误差,所以根据多次实验结果。但是这样定义也存在问题,因为不一定按照直线运动,除了横纵坐标分别变化以外,还可能出现横纵坐标同时变化的情况,目标是沿着倾斜的方向运动的,那么这样定义就无法对目标的运动进行正确的理解,所以还要调整理解算法,使其更加精确。在上面讨论的基础上,本文引人文献[9]中的目标矢量。首先将整个摄像画面分为9个区域,如图1所示。其中5区域作为目标中心点区域,其余的分别代表不同的运动方向。当跟踪的目标从5区域转移到其他对应的区域时,则表示相应的动作,由于区域的范围较大,所以可以有效防止相机或目标抖动引起错误的理解。NA0机器人完成一个动作需要特定的时间,所以当其接到向某一方向的运动命令之后,完成每个动作都应留有足够的时间。在做动作期间,目标的运动是不起作用的,当前运动结束后,才会继续检测运动目标的中心,这样做不会出现混乱的情况。使用这种机制,利用目标的跟踪就可以发出动作控制的命令。具体的人机交互系统的控制语义定义如图2所示。仿人机器人NAO有很多动作,控制也较为灵活,本文只是进行了简单的实验,用于验证基于跟踪交互的准确性和实时性,实现自然的人机交互,实际应用过程中可以根据实际的需要更改NAO的动作,实现动态任务完成交互。

3系统设计与实现

本系统以仿人机器人NAO为实验平台,实验计算机为CPUE5500@2.80GHz,2GB内存,将C++、OpenCV和Matlab程序在MatlabR2009a环境下运行,进行交叉编译完成程序运行。使用仿人机器人NAOv4.0版本的摄像头获取视频图像,作为实验资源,摄像头的型号为MT9M114,本文中使用的图像是RGB格式,分辨率为320x240,帧率为30帧/s。控制对象为仿人机器人NA0,无线网络实现NA0机器人与PC机相连,通过PC机发出相关指令,实现对NAO机器人的动作控制。人机交互系统的硬件设备框图如图3所示。交互者根据任务,选择交互方式,如果是自然交互,那么背景中只有一个运动目标,系统自动跟踪进行交互;如果手动选择感兴趣目标,就在PC机界面上选择自己感兴趣的目标,后续的跟踪和动作控制可以由系统自动实现。因此,根据目标运动轨迹的不同,通过跟踪理解算法,转化为不同的控制命令,通过无线网络传输到NAO机器人中,实现了复杂背景下的视觉跟踪交互。系统的软件实现框图如图4所示。

4实果与分析

为了验证本文机器人交互系统的有效性,本节对该系统进行了一系列的实验,实验结果如图5所示。从图5、图6中可以看出,该交互系统可以对于目标的上下左右运动、目标窗口尺寸大小变化的情况实现较好的跟踪,没有时间延迟,跟踪精确,这样的跟踪能力说明目标分割精确,跟踪算法实时性好,精度高。左右运动跟踪过程比较复杂,目标在运动的过程中窗口尺寸也在发生变化,所以,对区域划分,设定一定运动范围的跟踪理解算法对于交互正确进行非常有效,从而实现了复杂背景下基于视觉跟踪的自然人机交互系统。

5结论

计算机视觉前沿方向范文篇12

9月底,沈劲在杭州参加了一个主题为“前沿科技”的创业者竞赛。他以高通创投中国区董事总经理的身份担任此次大赛的评委。在当天比赛结束后,沈劲特别点评了四家参加比赛的创业公司,并称很有可能投资它们。

比赛结束回到高通后,针对入围公司的投资案迅速被列入沈劲的工作日程。从去年开始,高通的风险投资开始针对新的科技趋势转向新的投资重点,即“前沿科技”。

沈劲告诉记者,这些前沿科技是由新型计算平台定义的,包括人工智能、虚拟现实(VR)、扩增实境(AR)、无人机、机器人和太空科技等。

高通目前已在全球投资了22家前沿技术公司,在前沿科技领域融资额前10的公司,高通投资了其中4家。比如,在人工智能领域投资了Clarifai;无人机领域,高通领导了3DRobotics(3DR)的最新一轮融资,这家公司采用全堆栈方法生产消费级无人机;汽车自动驾驶领域,Qualcomm作为第三大投资者支持了自动驾驶车辆公司Cruise,今年3月,Cruise被通用汽车以10亿美元的价格收购。

“这些前沿技术将与今后全球经济发展密切相关。”沈劲说。

沈劲的任务是在中国寻找优秀的前沿技术创业公司。过去一年多时间里,他看了数百家这个领域的创业公司,最终向七家伸出了橄榄枝,其中包括语音智能公司云知声、国内无人机公司零度智控,以及注重商业模式的AR科技公司小熊尼奥等。

但对于庞大的高通来说,这些远远不够,高通需要寻找更多优秀的前沿科技公司结成联盟,除了正常的资本回报,投资创业公司不仅为高通了解移动新领域的增长点提供了灵敏的嗅觉,也为高通的新战略布局提供了子弹。12年三次迭代

高通创投已成立16年,投资组合包括140多家公司。2004年开始在中国市场投资,13年间投资的公司超过30个。

单纯从数字上看,高通在中国的投资项目并不多。尤其在2004年到2007年最初三年间,高通只完成5个投资案例。当时,中国的3G业务要到2008年底才开始正式运营,普通用户根本不知道流量和数据的概念。

高通当时投资的这5个项目恰恰聚焦数据和流量。这些业务在当时的环境中没有大红大火,却因技术独特,生命力顽强。如高通当时投资的高级无线对讲平台QChat,直到十年后的今天,中国电信依然在行业用户中大范围应用。

2007年,沈劲担任高通创投中国区董事总经理。沈劲的到来为高通在中国的投资业务打开了局面。次年即是中国3G业务发轫之年,沈劲将重点锁定在移动互联网,从2008年到2015年,陆续投资了智能手机公司小米、智能手机操作系统设计公司中科创达,在最接近消费者的移动互联网应用端,投资了应用商店机锋网、移动娱乐平台提供商触控科技,以及易到用车等。

期间,高通已经是全球最大的智能手机芯片公司,这些被司组合起来,是高通沿着“芯片―智能手机―操作系统―应用端”整个产业生态不断分点布局的投资逻辑。

从2015年初,高通开始转向智能手机之外的更多移动互联网终端芯片,高通风投也开始转向前沿科技。这是高通第三阶段的投资重点。

不过,单纯地把高通的风险投资部门独立于母体来观察,无法全盘把脉高通的整体战略思路。贯穿高通第二阶段和第三阶段投资周期的智能终端操作系统技术平台公司中科创达和其之间的关系最具代表性。

中科创达CEO耿增强告诉记者,中科创达和高通的渊源从2008年创立之初就开始了,当时,中科创达和高通创造了智能时代的数个“第一次”,如合作了全世界第一台SmartBook、第一个平板电脑操作系统、第一个智能手机的存储设计等。

有了这些合作基础,等到2010年中科创达希望通过融资扩大规模时,高通的加入显得顺理成章。

沈劲评价中科创达,第一感觉是“不性感”:“他们的创始人口才一般,也没有雷军头上的光环,商业模式拿出来看更没什么意思。”

实际上,导致这家公司不性感的根本原因在于当时做智能手机操作系统设计投入巨大,且安卓阵营在当时来看前景不明,这才是VC当时不敢轻易投资的真相。高通在当时入股中科创达,既是出于对这家公司创始人团队本身的认可,更是出于战略考量。

后来的故事大家都知道。IDC数据显示,到2015年,安卓智能手机在全球占比高达81.2%,总发货量高达11.7亿台。高通成为全球最大的安卓智能手机芯片供应商,中科创达则为包括华为、OPPO、联想、中兴等几乎全部主流智能手机厂商提供操作系统平台技术。双方赌赢了第一把。

2015年,中科创达在深交所上市。上市后,高通持股3.07%,位列第五大股东。但据耿增强测算,高通对中科创达的投资回报率超过20倍。

高通和中科创达的故事到此并未结束。

2014年,在全球智能手机出货量出现饱和拐点前夕,耿增强决定为公司寻找新的增长点。即在智能手机之外的更多移动终端平台设计领域,如车载、无人机等智能硬件领域。这一次,中科创达的转型思路和高通的战略转向又一次形成默契。高通在2014年底开始酝酿IOE(InternetofEverything)转型战略。希望为所有连接到移动互联网的终端设备商提供芯片解决方案。

但高通这种大公司架构,虽然服务大型客户十分高效,面对成百上千个小智能终端公司,在组织层面上很难短时间立刻支持IOE战略中国市场的落地。

这恰好是中科创达的强项。2015年中,中科创达向高通提议,由两家公司共同出资成立一个合资公司:由中科创达来具体服务这些分散的智能硬件客户,高通从芯片技术层面支持中科创达,共同拓展智能硬件市场。

耿增强回忆,高通对这个合作模式十分感兴趣,但出于对中国法律风险的考评,高通决策层更倾向于用投资而非合资来做这件事情。而中科创达又觉得,此事需要双方长期高度协同,单纯的投资关系无法维系,分歧令谈判过程十分艰难。

最后,高通全球总裁德里克・阿博利亲自拍板决定合资。今年2月,双方共同出资设立重庆创通联达智能技术有限公司。

合资公司成立后确实解决了高通在物联网战略落地最头疼的问题。耿增强透露,目前,合资公司已经发展包括无人机、VR、机器人、IPCamera、车载系统等在内的近百家客户,预计第一年就有很不错的盈利数字。

在一次会议上,沈劲半开玩笑地对耿增强说,希望合资公司的客户能够至少达到2000个。耿告诉记者,首战告捷之后,这个数字看起来并不困难。

所以说,中科创达和高通之间的关系,超越了普通投资关系,双方更是生意对象,又是战略合作者。内在的逻辑是,生意建立了信任,引发了投资,投资加深了战略合作基础,在共同目标和多层互动之下,一起做大做实了市场。前沿科技机会

2015年初,高通正式完成了组织架构上的重组,成立了一个完整的针对IOE战略的移动芯片团队。高通创投随之调整重心,在全球一口气投资了超过22家前沿技术公司,中国公司占了7家。这些公司聚焦在AR/VR、人工智能、机器人和无人机、太空科技等领域。

环境变了,风来了。经过测算,高通决策层认为,无人机很有可能是智能硬件市场的一个突破口。2014年底,高通内部提出了将智能手机芯片加载在无人机里,将无人机从“功能机”升级成“智能机”的想法。希望在全球找到数个无人机公司战略投资,并将智能无人机产品化。

国内无人机公司零度智控在2014年底就进入高通视野。零度智控副总经理史圣卿回忆,虽然零度智控从2007年就开始做无人机产品,有九年技术积累,但在智能迭代方面一直无法找到合适的突破口,钱也烧完了,当时已经面临生死存亡关头。

整个2014年,零度智控团队试探性与展讯、华为海思、大唐联芯等芯片公司接触。但“最终有能力,下决心去做这件事情的,只有高通”。

2014年底,双方一拍即合。零度智控开始尝试用高通的智能手机芯片研发一款集成度更高、更智能、更小巧的智能无人机。

双方都是第一次,整个过程波折不断,来回修改测试,焦灼气息笼罩在整个零度智控和高通无人机团队。

到了2015年9月至10月间,在高通内部几乎要放弃这个项目的节点,零度智控的全球第一台基于高通芯片的智能无人机“SMART智能无人机”终起来了。

与一般的无人机相比,它的意义在于把无人机从“功能机”升级到了“智能机”。实现了4K超清画质、高清图传、计算机视觉、人影追踪、避障等多种无人机性能。

随后,双方在今年初开始洽谈投资事宜。几乎在同期,2016年1月,高通正式了SnapdragonFlight平台,打算做大无人机市场。

6月,零度智控和高通分别升级技术,推出了重量仅199克的Dobby口袋无人机。仅两个月,销量超过5万台。9月,零度智控正式对外宣布获得来自高通创投、民航投资和信达国萃1.5亿元人民币的B轮融资,该融资将用于产品研发。

史圣卿告诉记者,在命悬一线的关键节点,高通不仅帮助零度智控理清了供应链关系、渠道,甚至帮助他们找了更多投资人,堪比雪中送炭。

沈劲则认为,没有零度智控的技术创新能力,高通的智能无人机战略便无法如此快速落地。

这是高通和科技创新公司联袂开创一个新市场,并最终结成更加亲密的投资关系的生动历程,这个故事的重要前提之一是,零度智控在无人机领域有超过九年的技术积累,而这恰恰在高通的战略版图之中。

这种最大化发掘合作方技术底蕴的能力,是高通日益强大的重要原因之一。但对于不同类型的前沿技术公司,沈劲的评判标准也各有不同。

沈劲把潜在的投资目标分为三种类型,第一类是技术公司,第二类是产品公司,第三类是注重运营的做市场的公司。

技术公司讲究技术门槛,在沈劲的投资哲学里,这类公司的技术积累一般要超过五年,才能吃透技术;产品类公司考察创始人的审美水准和市场结合能力;运营类公司则重在创始团队的市场人脉。

但这些公司能够成为前沿技术创新公司的最硬条件是,在某个前沿科技领域有一定的技术积累。

高通对其他前沿技术创业公司的遴选也遵照这一标准。例如,在交互语音领域,高通投资了云知声,云知声是一家典型的技术型公司,提供顶尖智能语音识别技术;另一家被司小熊尼奥(NeoBear)是一家产品型公司,它用AR技术实现交互式的3D教育产品,针对儿童教育市场。多向输血

今天,高通还在布局IOE战略的道路上狂奔。

IOE是一个全新的机遇,每个设备都需要一颗低功耗、小体积、能联网的芯片,这是高通的强项。高通基本可以提供整个平台的解决方案,包括整个芯片组从应用处理器到功率管理、显示处理器等,基本涵盖了整个移动架构的平台解决方案。目前使用高通技术的IoE产品已经超过10亿部。

但一个公司无法撑起一个产业。高通布局产业链上的初创公司,不仅为高通的未来战略提供了敏锐的嗅觉,更为高通在竞争激烈、唯快不破的市场上提供了子弹。

对于那些仍然有待验证的潜力市场,沈劲认为,投资初创公司的意义在于为高通提供了解新市场的窗口,获得关于新兴技术和商业模式的第一手信息,“这好比在各个点上都放了传感器”。

这符合高通作为大型公司风险投资的普遍定位,相对于一般投资机构,大型公司成立创投部门的逻辑更加深厚,除了财务上的回报,更多是为了母公司的战略和发展。由于大型公司对行业未来把脉更加清晰,对创业公司的资源帮助也不仅限于资金。

国际投资分析机构CBInsights新近梳理了2015年度全球最活跃的100家大型企业风投。按投资数量排列,英特尔以70起投资名列榜首,高通继谷歌风险资本(GV)之后位列第三。

高通在创业公司中的股权占比往往低于20%,这说明这家公司的投资风格相对稳健,在财务上没有强烈的回报需求。但正是由于对行业发展趋势精准的把脉,高通创投的财务回报也十分丰厚,跻身国内顶级风险投资阵营。

也有人认为,以高通为代表的大型公司风险投资的更大意义在于促成前沿科技领域更加理性和开放的投融资关系。

正常情况下,沈劲会为VC同行定期安排技术专家讲解前沿技术,为后者的投资决策提供专业参考。必要之时,他又会为有潜力的公司拉来更多VC,为创业公司提供更多燃料。