地理信息的三个基本特征范例(3篇)
地理信息的三个基本特征范文
关键词:文本挖掘;文本特征表示;特征提取;模式识别
文本挖掘主要完成从大量的文档中发现隐含知识和模式的任务,一般处理的对象都是海量、异构、分布的文档。传统数据挖掘所处理的数据是结构化存储于数据库当中,而文档都是半结构或无结构的。所以,文本挖掘面临的首要问题是如何在计算机中表示文本,使之包含足够的信息反映文本的特征。目前的网络信息中80%是以文本的形式存放,Web文本挖掘是Web内容挖掘的重要内容。
文本的表示与特征提取是文本挖掘领域中的基本问题。目前通常采用向量空间模型生成文本向量来表示非结构化的文本数据。但直接通过分词与词频统计得到的高维度文本向量作为文本表示,不仅给文本理解等后续任务,比如:文本分类、聚类等,带来巨大的计算开销,且精确也会受到影响。因此,研究有效的文本特征选择与压缩方法来进行降维处理,是十分必要的。
目前有P文本表示的研究主要集中在文本表示模型方法与特征选择算法方面。用于表示文本的基本单位通常称为文本的特征或特征项。在中文文本中,采用字、词或短语作为表示文本的特征项。目前大多数中文文本分类系统都采用词作为特征项。(但考虑到文本挖掘的不同具体任务,有时也会将字或者短语作为特征项。)如果把所有的词都作为特征项,那么其特征向量的维数将非常高,要高性能地完成文本分类、聚类等文本理解任务将非常困难。特征提取与压缩主要是为了保持文本核心信息表达的同时,尽量降低特征向量的维度,从而提高文本处理的效率。
特征提取主要有如下四种思路:一是用映射或变换的方法把原始特征变换为较少的新特征;二是从原始特征中选取一些最具代表性的特征;三是根据专家知识选取最有影响的特征;四是用统计方法找出最具分类信息的特征,这种方法适合于文本分类任务。下面将从文本特征评估方法、文本特征选择方法、以及基于领域语义理解的文本特征提取方法等方面,对文本表示与特征提取研究领域现有的研究成果进行综述,然后再展望未来文本特征表示与提取技术可能的研究热点。
1主流基于统计的文本特征评估方法
1.1词频(TF:TermFrequency)、文档频度(DF:DocumentFrequency)与TFIDF
(1)词频(TF:TermFrequency):即一个词在文档中出现的次数。将词频小于某一阈值的词删除,从而降低特征空间的维数,完成特征选择。该方法是基于出现频率小的词对文本表达的贡献也小这一假设。但有时在信息检索方面,频率小的词可能含有更多信息。因此,不宜简单地根据词频来选择特征词。
(2)文档频度(DF:DocumentFrequency):即统计在整个数据集中有多少个文档包含该词。在训练文本集中对每个特征词计算其文档频度,并且根据预设阈值去除那些文档频度超高或超低的特征词。文档频度的计算复杂度较低,适用于任何语料,常用于语特征降维。
考虑到文档频度超高或超低的特征词分别代表了“代表性弱”或“区分度低”这两种极端情况,故而需要删除。DF的缺陷是有些稀有词可能在某一类文本中并不稀有,即可能包含着重要的类别信息,如果舍弃将可能影响分类精度。
(3)TFIDF:它是由Salton在1988年提出的。其中IDF称为反文档频率,用于计算该词区分文档的能力。TF*IDF的基本假设是在一个文本中出现很多次的单词,在另一个同类文本中出现次数也会很多,反之亦然;同时考虑单词含有的类别区分能力,即:认为一个单词出现的文档频率越小,其类别区分能力越大。
TFIDF算法用于特征词权值估计就是为了突出重要单词,抑制次要单词。但IDF的假设认为文本频数小的单词就越重要,文本频数大的单词就越无用,并不能有效地反映单词的重要程度和特征词的分布情况,使其无法很好地完成对权值调整的功能,导致TFIDF算法法的精度并不是很高。特别是,TFIDF算法中没有体现出单词的位置信息对其重要性的影响,对于Web文档而言,权重的计算方法应该体现出HTML的结构特征。特征词在不同的标记符中对文章内容的反映程度不同,其权重的计算方法也应不同。因此如何对于在网页不同位置的特征词分别赋予不同的系数,然后乘以特征词的词频,以提高文本表示的效果,成为了研究者关注的热点。
1.2统计词与类别信息相关度的文本特征评估方法
互信息:互信息用于衡量某个词和某个类别之间的统计独立关系。
互信息作为计算语言学模型常用分析方法,原是信息论中的概念,用于表示信息之间的关系,即两个随机变量统计相关性测度。它被用于特征提取是基于如下假设:在某个特定类别出现频率高,但在其它类别出现频率比较低的词条与该类的互信息比较大。考虑到无需对特征词和类别之间关系的性质作任何假设,非常适合于文本分类的特征和类别匹配工作。
特征词和类别的互信息体现了特征词与类别的相关程度,被广泛用于建立词关联统计模型。它与期望交叉熵不同,它没有考虑特征词出现的频率,使得互信息评估函数更倾向于选择稀有词而非有效高频词作为文本的最佳特征。以互信息作为提取特征值的评估方法时,最终会选取互信息最大的若干特征词构成文本向量。互信息计算的时间复杂度平均值等同于信息增益,它不足之处在于权重受词条边缘概率影响较大。当训练语料库没有达到一定规模的时候,特征空间中必然会存在大量的出现文档频率很低(比如低于3次)的词条,而较低的文档频率必然导致它们只属于少数类别。但是从实验数据中发现,这些抽取出来的特征词往往为生僻词,很少一部分带有较强的类别信息,多数词携带少量的类别信息,甚至是噪音词。
二次信息熵:将二次熵函数取代互信息中的Shannon熵,形成基于二次熵的互信息评估函数。它克服了互信息的随机性。作为信息的整体测度,比互信息最大化的计算复杂度要小,可提高分类任务征选取的效率。
期望交叉熵:也称KL距离。反映的是文本某一类的概率分布与在某特征词的条件下该类的概率分布之间距离,特征词w的交叉熵越大,对文本类的分布影响也越大。它与信息增益不同,它没有考虑单词未发生的情况,只计算出现在文本中的特征项。如果特征项和类别强相关,即:P(Ci|w)就大,而P(Ci)又很小,则说明该特征词对分类的影响大。交叉熵的特征选择效果都要优于信息增益。
信息增益方法:用于度量已知一个特征词在某类别的文本中是否出现对该类别预测的影响程度。信息增益是一种基于熵的评估方法,用于评估某特征词为整个分类所能提供的信息量,即:不考虑任何特征词的熵与考虑该特征后的熵的差值。根据训练数据,计算出各个特征词的信息增益,删除信息增益很小的,其余的按照信息增益从大到小排序。某个特征项的信息增益值越大,对分类也越重要。
信息增益最大的问题是:它只能考察特征词对整个分类系统的贡献,而不能具体到某个类别上,这就使得它只适合用来做所谓“全局”的特征选择(指所有的类都使用相同的特征集合),而无法做“本地”的特征选择(每个类别有自己的特征集合,因为有的词,对这个类别很有区分度,对另一个类别则无足轻重)。
其它的文本特征评估方法:比如卡方统计量方法、文本证据权、优势率等,这些方法也都是用于评估特征词与文本类别的相关性。其中,在卡方统计和互信息的不同在于,卡方统计其评估权重只对在同类文本中的词是可比的,另外,它对低频词评估实用性不高。
2主流的文本特征选择方法
2.1N-Gram算法
其基本思想是将文本内容按字节流进行大小为N的滑动窗口分段,形成长度为N的字节片段序列。每个字节片段称为一个N-Gram单元,对全部N-Gram单元的出现频度进行统计,并按照事先设定的阈值进行过滤,形成关键N-Gram列表,作为该文本的特征向量空间。由于N-Gram算法可避免中文分词错误的影响,适用于中文文本处理。中文文本处理大多采用双字节进行分解,即:bigram。但是bigram切分方法在处理20%左右的中文多字~时,会产生语义和语序方面的偏差。而对于专业领域文本数据,多字词常常是文本的核心特征,处理错误将导致负面影响。于是有研究者提出改进的基于N-Gram文本特征提取算法,即:在进行bigram切分时,不仅统计bigram的出现频度,还统计某个bigram与其前邻bigram的共现情况。当共现频率大于预设阈值时,将其合并成为多字特征词。该算法,较好地弥补N-Gram算法在处理多字词方面的缺陷。
2.2主成分分析算法
该算法通过搜索最能代表原数据的正交向量,建立一个替换的、较小的特征集合,将原数据投影到这个较小的集合。主成分分析(PCA)按其处理方式的不同,又分为数据方法和矩阵方法。矩阵方法中,所有数据通过计算方差-协方差结构在矩阵中表示出来,矩阵的实现目标是确定协方差矩阵的特征向量,它们和原始数据的主要成分相对应。考虑到矩阵方法的计算复杂度随着数据维度n的增加,以n的二次方增长,有研究者提出了使用Hebbian学习规则的PCA神经网络方法。
2.3遗传算法与模拟退火算法
(1)遗传算法(GeneticAlgorithm,GA):是一种通用型的优化搜索方法,它利用结构化的随机信息交换技术组合群体中各个结构中最好的生存因素,复制出最佳代码串,并使之一代一代地进化,最终获得满意的优化结果。如果将文本看作是由若干个特征词构成的多维空间,那么将文本特征提取问题就转化为了文本空间的寻优过程。有研究者已经将遗传算法应用于这个寻优过程中。首先对文本空间进行编码,以文本向量构成染色体,通过选择、交叉、变异等遗传操作,不断搜索问题域空间,使其不断得到进化,逐步得到文本的最优特征向量。
基于协同演化的遗传算法使用其它的个体来评价某一特定个体。个体优劣的标准是由在同一生存竞争环境中的其它个体决定。这种协同演化的思想与处理同类文本的特征提取问题相吻合。同一类别文本相互之间存在着相关性,各自所代表的那组个体在进化过程中存在着同类之间的相互评价和竞争。因此,每个文本的特征向量(个体)在不断的进化过程中,不仅受到其母体(文本)的评价和制约,而且还受到其它同类个体的指导。基于协同演化的遗传算法不仅能反映其母体的特征,还能反映其它同类文本的共性,从而有效地解决同一类别的多个文本的集体特征向量的提取问题,获得反映整个文本集合最佳特征向量。
(2)模拟退火算法:将特征选取看作组合优化的问题,因而可以使用解决优化问题的方法来解决特征选取的问题。模拟退火算法(SimulatingAnneal,SA)就是其中一种方法。将模拟退火算法运用到特征选取中,理论上可以找到全局最优解,但在初始温度的选取和邻域的选取时,需要找到有效的策略来综合考虑解的性能和算法的速度。
3词向量(wordembedding)
深度学习(DeepLearning)中一般用到的词向量是用词向量(WordEmbedding)或分布式表达方法(DistributedRepresentation)所表示的一种低维实数向量。维度以50维和100维比较常见。这种向量的表示不是唯一的。词向量的提出,为的是将相关或者相似的词,在距离上更接近。向量的距离可以用最传统的欧氏距离来衡量,也可以用cos夹角来衡量。比如:用这种方式表示的向量,“麦克”和“话筒”的距离会远远小于“麦克”和“天气”。可能理想情况下“麦克”和“话筒”的表示应该是完全一样的,但是由于有人会把英文名“迈克”也写成“麦克”,导致“麦克”一词带上了一些人名的语义,因此不会和“话筒”完全一致。该方法很好地解决了传统的文本特征向量用于文本挖掘任务时可能出现的维数灾难问题,因而被很多研究者广泛地用于各类文本挖掘的任务当中。
4基于领域语义理解的文本特征提取方法
4.1基于语境框架的文本特征提取方法
有研究者发现,单单依靠统计无法完成语义分析。没有考虑句子的语义以及句子间的关系的情况下,无法提取准确的文本特征向量来表达文本语义。因此,研究者提出将语义分析与统计算法相结合的语境框架算法,并获得了丰富的研究成果。可以将语境框架看作是一个三维的语义描述框架,即:把文本内容抽象为领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个模块。在语境框架的基础上,从语义分析入手,实现了四元组表示的领域提取算法、以领域句类为核心的情景提取算法、以对象语义立场网络图为基础的褒贬判断算法。该算法可以有效地处理语言中的褒贬倾向、同义、多义等现象,表现出较好的特征提取能力。
4.2基于本体论的文本特征提取方法
有研究者提出了应用本体论(Ontology)模型,有效地解决特定领域知识的描述问题。比如:针对数字图像领域的文本特征提取问题,可以通过构建文本结构树,给出特征权值的计算公式。算法充分考虑特征词的位置以及相互之间关系的分析,利用特征词统领长度的概念和计算方法,能够更准确地进行特征词权值的计算和文本特征的提取。
4.3基于Z义网络的概念特征提取方法
文本挖掘,特别是中文文本挖掘,处理的对象主要有字、词、短语等特征项。但字、词、短语更多体现的是文档的词汇信息,而非语义信息,因而无法准确表达文档的内容。目前的大多数关于文本特征提取的研究方法只注重考虑特征发生的概率和所处的位置,缺乏语义方面的分析。向量空间模型(VSM)最基本的假设是各个分量相互正交,但事实上,作为分量的特征词间存在很大的相关性,无法满足模型的假设。基于概念的特征提取方法是在VSM的基础上,对文本进行部分语义分析,利用英文的WordNet或中文的知网等语义网络获取词汇的语义信息,将语义相同的词汇映射到同一概念,进行概念聚类。用概念作为文档向量的特征项,这样就能够比一般词汇更加准确地表达文档内容,减少特征之间的相关性和同义现象,从而有效降低文档向量的维数,减少文档处理计算量,提高特征提取的精度和效率。
5总结与展望
本文对近年来文本特征提取研究领域所取得的研究成果进行了全面的综述。随着人工智能深度学习技术的发展,在未来几年中,将可能从以下几个方面取得突破:(1)文本特征提取及文本挖掘在专业领域,比如:金融领域、军事领域等的应用研究。(2)新的文本特征表示模型,比如考虑使用层次结构的向量对文本进行建模,关键词向量能快速定位用户的兴趣领域,而扩展词向量能准确反映用户在该领域上的兴趣偏好。结合领域知识,采用概念词、同义词或本体来代替具体的关键词成为特征词,体现语义层面的需求和分析。(3)改进分词算法。比如针对特征提取的需要,应用深度学习算法框架,建构高性能的分词系统。(4)改进特征评价函数。比如考虑将表达文本结构的特征提取与表达文本语义的特征提取进行交叉解码,即对特征词的权重从表达文本结构与文本语义两个层面进行评价。
责编/魏晓文
参考文献
[1]BengioY,SchwenkH,SenécalJ,etal.NeuralProbabilisticLanguageModels[J].JournalofMachineLearningResearch,2003,3(6):1137-1155.
[2]SaltonG,BuckleyC.Buckley,C.:Term-WeightingApproachesinAutomaticTextRetrieval.InformationProcessing&Management24(5),513-523[J].InformationProcessing&Management,1988,24(5):513-523.
[3]刘健,张维明.基于互信息的文本特征选择方法研究与改进[J].计算机工程与应用,2008,44(10):135-137.
[4]成卫青,唐旋.一种基于改进互信息和信息熵的文本特征选择方法[J].南京邮电大学学报(自然科学版),2013,33(5):63-68.
[5]CavnarWB,TrenkleJM.N-Gram-BasedTextCategorization[C]//InProceedingsofSDAIR-94,3rdAnnualSymposiumonDocumentAnalysisandInformationRetrieval.LasVegas,US.1994:161--175.
[6]陈素芬,曾雪强.中心修正增量主成分分析及其在文本分类中的应用[J].中文信息学报,2016,30(1):108-114..
[7]郝占刚,王正欧.基于潜在语义索引和遗传算法的文本特征提取方法[J].情报科学,2006,24(1):104-107.
[8]晋耀红,苗传江.一个基于语境框架的文本特征提取算法[J].计算机研究与发展,2004,41(4):582-586.
地理信息的三个基本特征范文
关键词:三维人脸建模人脸特征CANDIDE-3模型
真实感三维人脸建模是目前计算机图形学、计算机视觉领域最根本、最困难的问题之一[1],具有重大的理论意义和应用价值。本文提出一种三维人脸的自动建模技术。该方法仅需一张人脸的正面照片,利用自动化方法定位出面部的关键特征点,利用具体特征点的信息调整一般人脸几何模型获取目标人脸的三维几何模型,最后通过纹理映射技术重构人脸的三维真实感模型。
1.通用人脸模型及人脸关键特征点的选取
本文提出的真实感人脸重构技术以面部的正面图像为数据,通过自动进行特征定位而得到关键特征点的位置,进而对通用人脸模型进行个性化调整,获得特征人脸的几何模型。
1.1通用人脸模型
由单张正面照片重构人脸的三维模型,只能获取头部的脸部数据,因此本文采用CANDIDE-3[2]人脸模型作为通用人脸的三维几何模型。CANDIDE-3人脸模型共有113个顶点和168个三角面片(如图1所示),它是一个标准的人脸参数化模型。CANDIDE-3人脸模型兼容MPEG-4标准中的人脸定义参数和人脸动画参数[3],因此在人脸的三维建模和动画领域被广泛采用。
1.2选取的面部关键特征点
面部的关键特征点需挑选最能表示人脸个性化特征的位置。我们以CANDIDE-3模型的顶点为主要参考,选取了面部26个(左右眼各9个特征点,鼻子3个,唇部5个)关键特征点进行自动定位(如图2所示)。为了更好地反映眼部特征,选取特征点时增加了右眼和左眼的眼珠中心点。
2.人脸关键特征点的定位方法
获取关键特征点的位置有两方面作用:根据定位出的人脸特征可以得到面部的一些重要数据,比如面部特征器官所在位置和形状,面部区域的大小等,这些数据是恢复人脸三维几何模型的基础。另外特征点的位置信息建立了面部特征与通用人脸模型的联系,从而为后期从图像上获取纹理信息建立了对应关系。我们首先对人脸图像进行人脸检测以确定人脸所在区域,然后在人脸区域内搜索各关键特征点。人脸检测部分我们采用AdaBoost人脸检测方法。图3给出人脸特征点提取的全过程。
2.1提取眼部特征点
通过人脸检测确定人眼所在区域后,本文采用特征区域灰度极小检测法[4]检测人眼特征点所在位置。下面对该方法作简要介绍。
假设眼珠直径为d=(d≈l),l为人眼的宽度,可通过人脸区域的大小来估计。然后设计尺寸为(-d,d)×(-d,d)的掩模,在左眼所在区域逐像素地移动该掩模,假设掩模覆盖的区域为A,此时掩模所在的位置可由区域A的中心位置(x,y)确定。令:
M(x,y)=I(P)(1)
其中P为眼睛区域中的像素点,I(P)=1?摇P∈A0?摇P?埸A,μ(A)为区域A的面积,即区域A中像素的个数。以(1)式作为卷积核与左眼图像区域做卷积,卷积结果最小的位置就是左眼眼珠中心。
检测到眼珠中心点的位置后,根据眼珠中心点和人眼其他特征点的位置关系可以检测出其余的人眼特征点。
2.2提取唇部特征点
唇部特征提取是先确定唇部区域,然后在该区域中分割出唇部,进而对嘴唇各关键特征点进行提取。在人脸区域中,唇部区域的边缘不如其他特征(如眼睛)的边缘明显,故不能利用唇部边缘定位特征点。目前对唇部进行检测的常用方法是利用唇色和肤色颜色分量的差异来检测。本文首先运用BR加权G色对比法[5]分割出唇部,进而提取唇部特征点。
2.3提取鼻子特征点
根据照片中人脸所在的位置估计出鼻子所在的区域,鼻孔的位置可以通过寻找灰度较深的区域来获得,搜索过程与检测眼珠中心类似。检测到鼻孔特征点后,设两特征点的距离为d,则在两特征点连线中心上方d/2处即可作为鼻尖点。
本文采用的人脸关键特征点的定位技术,提取特征点的准确性较理想,为后期的真实感三维人脸建模做了较好的基础性工作。图4是运用以上方法对正面人脸图像进行特征定位的结果。
3.真实感建模
对输入的人脸正面图像自动定位特征点后,就可根据特征点的信息进行三维人脸建模。真实感人脸重建是要恢复面部的三维几何模型和纹理特征,分为下述两个步骤:(1)恢复人脸的三维几何模型:利用定位出的关键特征点的位置信息,对一般人脸三维模型(CANDIDE-3模型)进行个性化调整,从而得到特定人脸的三维模型;(2)真实感建模:利用纹理映射技术将照片中的面部纹理投影到调整好的人脸几何模型上,获得目标人脸的真实感三维模型。
3.1三维人脸几何模型重建
恢复人脸的三维几何模型的过程是对通用人脸模型(CANDIDE-3模型)进行个性化调整的过程。模型顶点的调整主要包括模型的整体调整和局部特征调整。整体调整的目的是使人脸模型在平面上投影的大小和方向与照片中的人脸相一致,因此主要是对CANDIDE-3模型进行旋转和缩放;局部调整是利用定位出的特征点的位置信息来调整CANDIDE-3模型对应的顶点,使他们的位置在平面上相吻合。图5是目标人脸几何模型恢复的示例。中图为目标人脸图像,左图为通用人脸模型(CANDIDE-3模型),右图为调整后的目标人脸模型。
3.2真实感建模
得到个性化的三维人脸几何模型后,这时的人脸模型是由一些三角面片构成的网格模型,缺乏面部真实感,需要恢复面部纹理信息。我们采用纹理映射技术进行真实感建模,它是一种将图像上的纹理信息直接映射到3D模型上的技术,且获取真实感效果时不会改变模型的几何信息,实现起来也不需要过多的计算开销。对图5中调整后的人脸模型进行纹理映射,最终得到真实感的三维人脸(如图6)。
4.结语
本文提出了一种从二维人脸照片到三维人脸模型的构造方法。该方法具有如下优点:建模过程基于单张人脸照片,输入要求简单;建模速度较快,只需几秒钟时间就可建一个模型;三维人脸的建模过程完全自动化。本文提出的建模技术,尚有需要改进的地方。由于二维人脸图像的缺乏面部的深度信息,要更准确地恢复人脸三维模型,需进一步估计模型的深度信息,这是我们需要进一步研究的地方。
参考文献:
[1]胡永利.真实感三维人脸建模及其应用研究[D].北京工业大学博士学位论文,2004.
[2]Ahlberg,CANDIDE-3―anupdatedparameterizedface[R],ReportNo.LiTH-ISY-R-2326,Dept.ofElectricalEngineering,LinkǒpingUniversity,Sweden,2001.
[3]IgorS,Pandzic,RobertForchheimer.MPEG-4FacialAnimation.TheStandard,Implemen-tationandApplications[M].USA:JohnWiley&Sons,2002:18-22.
[4]王罡,骈俊生.一种基于人脸检测的人眼特征定位方法[J].阜阳师范学院学报,2010,27,(1):6-9.
地理信息的三个基本特征范文篇3
符号设计理念(1)语义驱动理念本文认为地图符号设计内容应包含以下3点:一是概念语义模型;二是符号设计赖以构成的物质材料基础———图形形式;三是符号的构造生成法则。符号是空间信息的载体,用于表征空间信息,因而在符号的构成范畴内,语义模型直接描述了空间信息的本质特征,图形形式是空间信息或语义模型的外在表现形式,构造法则更多的专注于符号的构造程序。因此,以语义关系作为符号图形构造的基准,通过语义关系控制符号的图形构成,这种以语义关系为“骨架”来驱动符号图形构造的符号设计思路,本文称之为语义驱动的符号设计理念。(2)符号与符号设计语言学中,“语言”和“言语”是两个彼此不同而又相互联系的概念[14]。可以简单的认为,语言为“话”,言语为“说”,语言和言语共同构成了言语活动,即“说话”。类比语言和言语的概念区分,本文界定了符号、符号设计及符号设计活动这3个基本概念,三者之间的关系如图1所示。符号(类比“语言”)是指面向某一领域的约定的符号标准、规范或体系;符号设计(类比“言语”)是指符号设计者(或使用者)通过自己的构思创造(或使用)符号的一种心理过程,是人驾驭符号语言能力的体现;符号及符号设计构成了符号设计活动的内容。图1符号、符号设计以及符号设计活动Fig.1Symboldesignactivities明确区分符号及符号设计的概念,才能真正使得地图符合人类“第二语言”这一称谓。这是因为:语言最为重要的特征在于交流,交流是一种双向的信息传输过程。作为人类第二语言的地图,理应具备空间信息双向传输(即交流)的能力,而这一能力体现在符号设计活动之中:符号设计者(或使用者)通过设计(或使用)地图符号进行空间信息的表达、传输和理解,实现空间知识的双向、互动交流,并最终实现地图符号语言的地理空间认知。相关概念(1)语义特征———亦称义素,反映了空间要素和现象的客观本质,是凭经验或对客观事物本质的了解而分析出来的语义成素。语义特征与词所表达的真实世界的本体有着密切联系。(2)符素———是借鉴语言学中“语素(mor-pheme)”的概念定义的,即一定图形形式和概念语义的最小结合单位。区别于符号,其不可以独立用于符号表达;区别于基本几何图元,其具有一定的语义内涵(基本几何图元仅是图形成素)。符素是地图符号图形结构中,介于符号和基本几何图元层次之间的概念。(3)组合、聚合语义关系———组合语义关系是符号所表达的对象或对象类之间的部分整体关系,具有序列性、整体性和扩展性等特点;聚合语义关系也称上下义关系,即一个类包含于另一个类,包含其他类的类中的词称为上义词,被其他类包含的类中的词称为下义词,具有类型性、继承性和置换与推理等特点[15-16]。符号设计流程以地图符号的语义结构关系为骨架驱动符号图形的构造,语义结构关系的约束使得所设计的地图符号具有较为显著的结构化特征。语义驱动的层次化地图符号设计流程如图2所示。①对应用领域的空间对象进行语义成分分析,提取语义特征词汇。②符素表设计,即合理使用视觉变量,设计步骤①语义特征对应的图形形式,形成符素;符素表即为一定数量符素的集合。③根据应用领域空间对象的内在结构特征,梳理符号系统语义的聚合关系,构建聚合关系语义结构模型。④单个符号组合关系语义描述,即对聚合关系语义结构中的每一个节点(单个符号),形式化描述为符号语义的组合关系结构;⑤符号图形构造,即根据符号组合关系语义结构,通过选取特征语义对应的符素图形形式,组合构造符号,完成符号设计;⑥按照符号设计的一般原则,对符号进行一定程度的简化、美观等操作;⑦遍历聚合关系语义结构的每一个节点,设计构造每一个节点对应的符号图形形式,完成整个应用领域的符号系统设计。图2语义驱动的层次化地图符号设计流程Fig.2Thedesignflowofthesemantic-drivenhierarchicalmapsymbols从图2看出,语义驱动的层次化地图符号设计方法的4个关键步骤是:语义特征提取(①)、符素设计(②)、语义建模(③)和符号构造(④、⑤),下文将对其进行详细分析。
地图符号设计方法
基于本体层次的语义特征提取在语言学、本体论和地理本体研究中,语义特征的提取尚无有效理论。例如,地理本体研究领域,常见的做法是通过收集和整理文献资料、领域标准规范,并结合领域专家知识等方法实现领域知识规范化,归纳概念语义[17]。从目前的研究情况来看,语义特征提取的主要手段是依靠经验和内省的方法,如杜清运[15]采用Guarino等的“本体层次”理念对空间信息的语义特征进行了系统归纳,例如:(1)物质(部分-整体层次):水、土、泥、石、沙、植物、人造材料等;(2)形态(形态层次):流动、静态、自然弯曲、规则形态、维度等;(3)大小(形态层次):大、中、小等;(4)功能(功能层次):交通、阻隔、居住、蓄积、旅游、养殖等;(5)等级(社会层次):政治、经济、文化等。其中,部分-整体层次、形态层次、功能层次等即为本体层次。以地图符号表征的地理要素的语义特征为例,可以进行如下的语义成分分析,进而得到语义特征:(1)河流-[水]+[流动]+[自然弯曲]+[交通]+[现状];(2)湖泊-[水]+[静态]+[旅游]+[养殖]+[面状];(3)公路-[人造材料]+[交通]+[约束弯曲]+[线状]+[经济含义];(4)围墙-[人造材料]+[阻隔]+[规则形态]+[线状];(5)建筑-[人造材料]+[居住]+[规则形态]+[面状]+[阻隔]+[政治、经济含义];符素设计符素是本文符号设计方法的核心概念,是区别于传统符号设计方法的重要特征。符素对地图符号的构成具有重要的承上启下作用:首先,符素是以基本几何图元(可参见文献[18])和视觉变量构造而成,其自身是数量有限的,但有限数量的符素可组合成无限数量的符号系统。其次,由于符素具有一定的语义概念,基于符素进行符号设计,降低了符号语义形式化描述的难度。最后,符素统一了地图符号的图形和语义的组合关系,使得符号更易于识别和解译,提高了地图符号的易用性。符素的设计应包含以下3个主要原则,以文献[19]和[20]为参照原型进行说明:(1)继承原则现有基本比例尺地图符号或专题图符号标准,均已经过了长期的设计实践积累,具有很高的科学性和广泛的认知惯性。符素是构成符号的基础,因此符素设计可遵从认知的惯性,从已有符号设计成果中汲取经验,在继承的基础上创新。最为简单有效的方法就是分析现有的符号规范标准,抽象提取满足符素条件的基本“图形-语义”结构作为符素。表1为从文献[19]、[20]抽取出来的符素,并标注有其表征的特征语义。(2)对立与统一原则统一是指对某一类型语义特征,应使用相同视觉变量的不同值进行表达。例如,在设计有系列关系的符素时,可使用不同颜色或尺寸变量进行表达,而不能部分应用颜色变量而部分应用尺寸变量。对立是指符素设计应能体现显著的区分特点。对立与统一原则能够保证符素能够清晰、易识别且不失系统规律特点。例如,可以使用颜色表示公路等级,但不同等级公路的颜色应当具有显著的可分辨特点。(3)相似与抽象原则相似是指所设计的符素图形形式应能够抓住其所表征的对象的某一特征,体现特征的相似性,以激发人的联想。抽象是指符素设计应注意符素图形形式的抽象设计,抓住对象的最主要特征,使得符素简单、规则。在符素设计过程中应把握这二者之间的平衡,过于抽象则符素难以识别,过于相似则易丧失简洁特点。聚合关系语义结构建模聚合关系语义结构建模与本体建模具有强烈的类同性。本体建模元语中,具有4类重要的概念之间的关系:part-of,kind-of,instance-of,attrib-ute-of[21]。就本质而言,符号语义的聚合关系即为本体建模元语中的kind-of关系,因此,本文认为聚合关系语义结构建模可视为kind-of这一特殊语义关系的本体建模。当前,关于本体的开发或建立方法,基本上均采用手工方式,没有形成一个统一的工程方法。归纳起来,比较著名的本体建模方法有MikeUscholdded&King的“骨架法”、Gruninger&Fox的企业建模法、Gomez-Perez等的Meth-ontology方法等[21]。总结这些本体建模方法,其一般步骤是:①明确本体范围:即梳理所要建模的本体范围,定义本体的边界条件;②本体建立阶段:即进行领域本体的获取、概念化、确定概念之间的关系、本体的形式化语言描述以及本体集成等;③评价与文档化:进行已构本体的评估和标准化,并最终形成本体成果并。在这3个步骤中,与聚合关系语义结构建模密切相关的是本体的建立阶段,借鉴于上述对本体建立方法的分析,总结了聚合关系语义树构建的一般步骤,如图3所示。其中,最为重要的步骤就是对象概念的语义分析,并确定与其他对象语义之间的聚合关系。目前,本体构建方法仍无法实现自动化建模,需要人的参与和领域专家知识的指导,对领域知识越了解,其所构建的语义聚合关系也就越完善和科学。根据聚合语义结构建模的流程,结合文献[20]可得到以下基础地理信息符号相关的聚合语义结构,如图4所示。国家基本比例尺地形图符号第一等级可划分为测量控制点、水系……植被与土质、注记等大类。每一大类均可以继续按照聚合关系进行细分,例如,测量控制点可分为三角点、埋石点、……等小类;三角点还可以分为(常规)三角点和土堆上的三角点。通过这一方式,可以有效地将整个基本比例尺地形图符号组织为一个完整的聚合关系树形结构模型。图4基本比例尺地形图符号聚合语义结构Fig.4Associativerelationstructureoffundamentalscalemapsymbols4.4语义驱动的地图符号生成本节主要讨论的是由符素组合为一个完整地图符号的方法。首先,地图符号的语义应该包括有以下两个部分构成:<符号语义>::=<构词规则语义>|<符素语义>其中,构词规则语义是指符号不同的空间造型赋予符号的含义;符素是构成符号的基础材料,因此,符素语义是符号语义的主体构成部分。其次,单个符号组合关系语义形式化描述。组合语义关系亦称部分整体关系,主要体现在“符素符号”的构造环节中。以语义“土堆上的三角点”为例,可以将其分解为如图5(a)所示的组合语义分解结构。其中,“土堆上的三角点”、“三角点”为语义特征的组合结构,其余为独立语义特征,该符号的语义对应的图形符号组织方式如图5(b)所示。最后,根据符号语义的组合关系形式化描述模型,驱动符号构造生成。图6示例了语义驱动的地图符号构建流程,符素“测量控制点”和符素“三角测量相关的”可以按照独立构造规则组合为“三角点”组合结构,该结构可以作为独立的符号出现,也可以作为组合更高一级符号的符素。符素“土堆”采取了极向旋转重复构词规则与符素“三角点”组合成“土堆上的三角点”符号。还可以进一步通过其他构造规则,添加例如高程、比高等语义信息,构建更为复杂、详细的符号。图6语义驱动的地图符号构建流程Fig.6Theconstructionflowofthesemantic-drivenmapsymbols语义驱动的符号生成方法具有以下典型特征:第一,符号的最终设计样式取决于语义信息的详细程度:语义信息越丰富,符号样式越详细具体,也更容易认知,反之亦然。第二,符号具有显著的结构规律可循,亦即符号设计时符素、构造规则是根据符号所蕴含的语义信息进行选取的,语义信息决定了符号的最终样式。第三,对于每一个符号,均可以使用这种方法将其分解为组合语义结构,进而根据该结构组构符号。
地图符号设计实验
本文设计了一组认知实验,用于验证语义驱动的层次化地图符号设计方法是否具有可行性和科学性。实验设计与实施(1)实验素材:素材I为从文献[19]中选取的部分符号组成;素材II是利用本文符号设计方法,对素材I进行重构改进而成。素材II包含有2个部分:一是符素表部分,将符素显式地展现给被试人员;二是按照聚合语义层次结构组织的符号系统。(2)实验人员:被试人员主要为信息工程大学二年级本科学员共计47人,所有人员视力、智力等各方面正常,但不具备地图符号的学习知识基础。实验一:不同符号系统认知效率测试实验。本实验通过测量两套素材在认知效率上的数值指标,数字化测定符号认知效率,以验证本文符号设计方法能否一定程度上提高符号认知效率。本实验设计6次“训练测试”循环,每次循环均给定训练时间(3~5min不等)。实验结果如图7(a)所示。图7(a)实验一认知正确率均值和方差曲线Fig.7(a)MeanandvariancecurveofcorrectratioofthecognitiveexperimentI实验二:符号信息传输过程模拟实验。本实验通过模拟自然语言交流过程,验证本文符号设计方法是否具有“语言交流机制”这一特征。实验方法是通过给定语义,被试A(或B)设计符号,并交予被试B(或A)识别解译,并通过相似度判断信息传输效率。实验共有6次循环,其结果如图7(b)所示。图7(b)实验二相似度比率均值和方差曲线Fig.7(b)MeanandvariancecurveofsimilarityratiooftheexperimentII5.2结果分析由于所有被试人员不具备地图符号的学习知识基础,因此,本实验结果反映了符号系统的学习、掌握和使用的效率。本次实验不讨论被试具备地图符号学习经验基础的情况。实验一结果表明:①总体趋势上,两套素材的识别正确率均随着学习时间的累积而提高,且标准差随时间累积而降低,反映了被试学习并掌握符号系统能力的提升;②重构后的素材II正确率均值均高于素材I,反映了本文符号设计方法在符号认知效率方面的高效性;③6次实验正确率方差曲线表明,重构后的符号系统在统计意义上具有更好的稳定性。因此,可以认为本文符号设计方法在符号认识效率测试方面表现较优。实验二结果表明:6次实验中,重构后的符号系统在信息传输效率方面均较优,且方差呈现出显著的下降趋势,这说明了本文重构的符号系统在模拟信息传输过程实验中体现了较为稳定的高传输效率。