计算机学科的认识(6篇)
计算机学科的认识篇1
Abstract:Thispaperanalyzesthenecessityoftrainingofstudents'computationalthinking,presentssomeoftheunderstandingabouttheproblemsinbasiccomputereducationforcollegesanduniversities,andexplainstheviewabouthowtotrainstudents'computationalthinkingbycomputereducation.Itgivesawaytoimprovetheoverallqualityofstudentsfromtheperspectiveofcomputereducation.
关键词:高等院校;计算机基础教育;计算思维
Keywords:collegesanduniversities;computereducation;computationalthinking
中图分类号:G642文献标识码:A文章编号:1006-4311(2013)21-0298-02
1培养学生计算思维的必要性
2006年3月,美国卡内基·梅隆大学的周以真教授在美国计算机权威期刊《CommunicationsoftheACM》杂志上给出并定义了计算思维(ComputationalThinking)。下面首先给出计算思维的定义与简单分析。
什么是计算思维?计算机科学不只是形象的具体的软硬件,更重要的是计算思维,周教授认为:计算思维是运用计算机科学的基础概念进行问题求解、系统设计、以及人类行为理解等涵盖计算机科学之广度的一系列思维活动。[1]它合用了数学思维、工程思维和科学思维。周教授同时强调:计算思维不等于计算机编程,它是一种基本的思维能力而非机械技能,不是一种机械式的重复。计算机不仅为不同专业提供了解决专业问题的有效方法和手段,而且提供了一种独特的处理问题的思维方式。熟练使用计算机和互联网,为人们终生学习提供了广阔的空间以及良好的学习工具。计算思维是21世纪中叶每一个人都要用的基本工具,它将会像数学和物理那样成为人类学习知识和应用知识的基本组成和基本技能。
2011年,在CCF中国计算机大会(第八届)上,中国科学院院士陈国良做了题为《计算思维:大学计算教育的振兴科学工程研究的创新》的演讲,演讲中提到:计算思维会令科学与工程领域创造出革命性的研究成果[2]。
虽然计算思维本身并不是计算机科学的专属,但是正是计算机的出现给计算思维的研究和发展带来了根本性的变化,强化了计算思维的意义和作用[3]。正如周以真教授所提到的,计算思维需要运用计算机科学的基础概念。计算思维的一些显著特征和方法在计算机科学中得到了很好的体现。由此可见,可以选择通过计算机教育教学培养学生的计算思维。
2对于目前高等院校计算机基础教育存在问题的一些认识
虽然“计算思维”这一概念早在2006年就已经提出了,但是到目前为止,人们对它的认识仍然非常局限。很多理论仍然认为计算机科学只是一门工具性学科,仅仅强调它的技能性,忽略了它的非工具性价值,即对于人的思维、认识及整体素质的有益性,而这往往对人的发展有更加深远的影响。由于认识上存在这样的局限性,导致在教学实践中出现了一些问题。笔者在高等院校从事计算机基础教学近十年,通过教学实践以及与其他院校同行的交流,给出笔者对目前高等院校计算机基础教育中存在问题的一些体会:
2.1局限于所谓“实用知识”传授的计算机基础教育教学理念科学教育应包括科学知识教育、科学方法教育、科学思维教育和科学精神教育等几方面[4]。目前的现状是科学教育的天平明显偏向于是知识教育,在一定程度上忽视了思维、方法的教育。具体到高等院校计算机基础教育也可以理解为“实用主义”,就是停留在教学生怎样将计算机作为专业的辅助工具使用,眼前够用就好。通俗的讲就是老师教什么,学生会什么;目前用到什么,就学什么。这样带有“功利”色彩教育理念显然无助于学生掌握计算技术中最重要的核心思想与方法。进而,学生也很难将计算机这个辅助工具真正运用到自己的医学实践中。现代社会,计算机技术飞速发展,仅获得所谓“实用知识”的受教育者,往往对新技术无所适从。在笔者的教学实践中,也深刻体会到,以获得细节知识为其学习内容的学生很难面对快速进步与变化的社会。
2.2学生水平存在差异由于地区差异,计算机知识的普及程度也各不相同,新生中既有中学阶段已经学过一些计算机知识的学生,又有以前从未接触过计算机的学生。农科院校的学生主要来自普通高中,尽管部分学生在初、高中阶段学习了“信息技术”课程,但也有一些地区(特别是农村贫困地区)的初、高中没有条件开设这门课程,或者即使开设了该课程,也可能由于各种原因,其教学效果不甚理想。这样就造成了入学时新生整体对计算机知识的掌握程度不尽相同,计算机知识及应用能力也相差很远[3],加大了教学难度。
2.3教师“灌输式”的计算机教学与学生机械记忆的被动学习目前高等院校的计算机教育与中学没有太大的本质区别,即围绕教师的“讲”中心,学生的学习处于被动的从属地位。教师习惯于单纯的教给学生“怎么做”,学生几乎没有自主的空间考虑去思考“为什么这样做”。作为教育主导者的教师不能及时的更新自己的知识与理念,缺乏教师的推动,学生只是忙于机械记忆应付考试。在这样的教学思路的指引下,学生对于计算机类课程的学习更像是对记忆力的训练,而在最终检验课程学习效果的考试也沦为学生间记忆力的比赛。例如,教学实践中有的学生甚至可以将一个软件菜单的位置背下来,可是换了一个软件马上无从下手,更不用提将这种知识升华、内化为自己的一种思维模式。
3将培养计算思维作为学生计算机教育的侧重点从而提高学生的综合素质
可以看到对于学生的计算机教育来说,“实用主义”工具论是很狭隘的,笔者认为,只有将培养学生的计算思维作为学生计算机基础教育的指导思想,才是真正能助力于培养高素质的人才。在具体的教学实践中,针对培养学生的计算思维,笔者有几点想法:
3.1改变教师的教学理念教师是教育的主导者,教师的教学理念在很大程度上影响学生的学习效果。陈国良院士认为:计算思维代表着人们的一种普遍的认识和一类普适的能力,不仅仅是计算机科学家,而是每一个人都应该热心地学习和运用它[2]。对于教师来说,应该将计算思维内化为自己的一种思维方式,计算机教师自不必说,哪怕对于其他专业课程教师,尤其是学科前沿与计算机相关联的课程,教师如果因循守旧,教出来的学生也必定是落伍的。在学习型社会和终身教育理念下,我国的普通高校有很好的继续教育制度,只需要充分发挥继续教育的作用,不流于形式,摒弃单纯的技能培训,将计算思维引入继续教育的课堂,首先更新教师的教育观念,使教师认识到计算思维是每个人的基本技能,在很多学科中都发挥着重要的作用,这样才有可能将这一理念传导给学生。
3.2合理交叉的课程结构设置合理的课程结构设置对于建构学生良好的知识体系有很重要的作用。首先在低年级开设计算机基础类课程,让学生对这门陌生的学科有所了解;之后通过计算机类通识课(例如网页制作等)加深学生的认识,培养学生的兴趣;最后在高年级开设计算机与学生所学专业的交叉类课程,引导学生利用计算机辅助解决专业性问题,使学生真正认识到计算机的有用性,用计算思维辅助指导专业实践。只有这样循序渐进、贯穿于整个大学教育期间的课程设置方式,才真正有可能培养、形成一种可以指导工作、学习、生活的计算思维方式。
3.3重视课堂计算机理论教学课堂理论教学不仅是学生获取科学知识与技能的主渠道,也是他们掌握科学方法、提高各种科学能力、形成科学观和科学品质、全面提高科学素养的主阵地。当然实践教学是非常重要的,但是要摒弃所谓的“狭义工具论”,遏制教学中不断的缩减课堂计算机理论教学比例的倾向。重新重视计算机理论教学,引导学生分析现象背后的原理。正如哲学中所说:只有掌握理论才可以更好的指导实践。例如对于某个具体软件的菜单介绍,不只是单纯告知鼠标如何点击,可以采用问题启发式教学方法,引导学生进行思考:为什么做这样的菜单设置?背后是何种思考方式?类似软件的菜单是否这样设置?其他软件菜单设置的规律?遇到新的软件该如何学习?等等。
3.4引导学生从计算思维角度解决某些专业问题教学中要教会学生主动分析问题和思考问题,形成科学的思维方式。引导学生从计算思维角度解决某些专业问题,无疑是培养学生计算思维的一种好的方式。教学中,可以采用目前流行的项目驱动式教学方法,更多的采用与专业结合的案例。需要注意的是,选择合适的案例是非常重要的,这要求教师在计算机知识和专业知识中找到恰到好处的交叉点。
3.5考核方式的真正转变考核可以说是一门课程总体教学的最后一个环节,无可避免的,课程考核方式很大程度上影响着学生学习课程的方式。如果将考试模式长时间的固化为一种模式,即简单的考查书本中的客观知识,那么学生的考试也是对客观知识的背诵。只有将课程考试的重心转移到思辨能力的考查上来,学生才会将学习的重心转移到对于一种思维、方法的掌握。计算机类课程的考核方式应不断加大主观题的比例,更多的考察学生对实例问题的解决,鼓励采用多种方式解决同一问题,同时结合书本理论阐述自己的观点。当然前提是在教学过程中更多的重视计算思维的培养,教学和考核是一个相互作用的过程。
4小结
社会需求和素质教育的培养目标均要求学生具有较高综合素质,而计算思维的培养有利于提高学生的综合素质,推动学生在自己的专业领域创新性的解决专业问题。学生计算思维的培养不是一蹴而就的,也不是简单的理论说教,这需要高等院校的计算机教育工作者不断的探索、实践,找到更好的方法,循序渐进的将计算思维融入教学。
参考文献:
[1]WINGJputationalThinking[J].CommunicationsofACM,2006,49(3):33-35.
[2]陈国良.计算思维:大学计算教育的振兴科学工程研究的创新[R].CCF中国计算机大会(第八届),2011.
[3]李廉.计算思维——概念与挑战[J].中国大学教学,2011(1):9-12.
[4]李志义.关于研究型大学本科教学的若干反思[J].中国大学教学,2011(9):9-12.
[5]王飞跃.计算思维与计算文化[N].科学时报http://,2007/10/12.
计算机学科的认识篇2
《中小学信息技术课程指导纲要》指出:“中小学信息技术程的主要任务是:培养学生对信息技术的兴趣和意识,让学了解和掌握信息技术基本知识和技能,了解信息技术的发展其应用对人类日常生活和科学技术的深刻影响。通过信息技课程使学生具有获取信息、传输信息、处理信息和应用信息能力,教育学生正确认识和理解与信息技术相关的文化、伦和社会等问题,负责任地使用信息技术;培养学生良好的信素养,把信息技术作为支持终身学习和合作学习的手段,为应信息社会的学习、工作和生活打下必要的基础。”
从目前各中小学信息技术课程的教学情况来看,中小学信技术课程教学基本上是在计算机教室里面完成的。而根据教专家研究表明,中小学生在机房的注意力集中时间约为15钟左右,因此,一堂信息技术课中教师讲解的时间不要超过5分钟,多讲无益。教师如何在这15分钟里充分发挥自己的教水平。是技术,也是艺术,笔者认为,信息技术课堂教学这十分的艺术应该从以下几个方面把握:
一、15分钟,激发学生学习热情
心理学研究表明,当人对某一事物感兴趣时,认识就快;如果毫无兴趣,认识就慢,或者不予接受。就中小学生的心理特点来看,一般说来,对他们学习兴趣起主导作用的是直接兴趣,作用时间也较长。教师应帮助他们形成直接兴趣,并根据学生的心理发展水平,适时地帮助他们把直接兴趣转化为间接兴趣。相对而言,在信息技术课程中,学生往往对直接接触计算机兴趣很大,愿意动手操作;而对于学习计算机原理,兴趣就小多了。有鉴于此,不妨在教学中让学生通过操作机器来学习新知识。这样,学生在计算机课的学习中就会感到轻松愉快,并保持较高的学习热情。在教学内容上,也应力求注意培养学生的学习兴趣。例如,可根据中学生的心理特征,有意识地介绍一些游戏软件、工具软件、优秀的辅助教学软件和作图方法等,让他们在比较轻松的学习情境中了解计算机知识,掌握计算机的基本操作程序。
二、15分钟,任务驱动玩出激情
“电脑不是学出来的,是玩出来的”,“任务驱动”的教学法就是这样的一种教学方法,对于学生来说,开始是模仿,制作出与教师的“成品”一样的作品,积累了一定的基础知识,接踵而来的便是丰富多彩的创造作品,这就是由“任务驱动”引发的学生的无穷的创造力。信息技术学科是开放性的、知识更新极快的学科,在课堂上不可能将一个软件的所有功能都学到,也没必要这样做。计算机教师在教会学生计算机基础知识的同时,更重要的任务应该是教会学生学习方法,“任务驱动”教学法正好给了学生这样一个机会。在一堂课上,不可能所有学生的学习进度一样,“任务驱动”让学生在每一堂课上为着“任务”、为着制作一件“成品”或“半成品”去动手操作,去克服遇到的各种困难,比如在《开心一刻》自选图形的课程中想让五环互相环套,却涂抹了圆的一部分弧;想嵌入几个漂亮的汉字,却一个字都输不上去等等,逼你提问题,去寻找解决问题的技巧。当大功告成,一种收获的喜悦、一种成就感油然而生,立刻又在考虑:“我不能白做,得留下,留在我的软盘上!”接下来就学存盘―――一节课没停手,既没感觉累也不感觉枯燥,不知不觉就下课了,要不是底下还有课,手怎么也不愿离开那小鼠标,这似乎不像考试,可再想想,难道这不说明你掌握了这节课的知识?完成了“任务”了吗?“任务驱动”创设着一种适当的情境,引起了学生的认知的冲突,使学生产生了一种悬而未决的求知欲,从而激发了学生的求知热情。
三、15分钟,培养热爱科学的观念,丰富学生感情
计算机学科的认识篇3
【关键字】自然辩证法计算机语言计算机技术编程语言因特网
面向对象正文一九九三年美国的克林顿政府提出了“信息高速公路”计划,从而在这十多年间在全球范围内引发了一场信息风暴,信息技术几乎触及了现代生活的方方面面,毫不夸张的说没有了信息技术,现代文明的生活将无从谈起;作为信息技术中最重要的部分,计算机技术无疑是其发展的核心问题,而我们知道计算机只是一台机器,它只能按照计算机语言编好的程序执行,那么正确认识计算机语言的过去和未来,就是关系到计算机发展的重中之重;以自然辩证法的观点认识和分析计算机语言的发展历程,将有助于更加全面地推动计算机技术的发展,有助于更加准确地掌握计算机语言发展趋势。一、科学认识大门的钥匙--当代自然辩证法自然辩证法,是马克思主义对于自然界和科学技术发展的一般规律以及人类认识自然改造自然的一般方法的科学,是辩证唯物主义的自然观、科学技术观、科学技术方法论。它主要研究自然界发展的总规律,人与自然相互作用的规律,科学技术发展的一般规律,科学技术研究的方法。马克思、恩格斯全面地、系统地概括了他们所处时代的科学技术成功,批判吸取了前人的合理成分,系统地论述了辩证唯物主义自然观、自然科学发展过程及其规律性,以及科学认识方法的辩证法,以恩格斯的光辉著作《自然辩证法》为标志,创立了自然辩证法继续发展的广阔道路。自然辩证法是马克思主义哲学的一个重要组成部分。在辩证唯物主义哲学体系中,自然辩证法与历史唯物论相并列。它集中研究自然界和科学技术的辩证法,是唯物主义在自然界和科学技术领域中的应用,它的原理和方法主要适用于自然领域和科学技术领域。学习和运用自然辩证法将有助于我们搞清科学和哲学的关系,从而更加清楚地认识科学的本质和发展规律,更加全面的观察思考问题,只有加深了认识,我们才能更好地发挥主观能动性,迎接新的科学技术的挑战。下面我将以自然辩证法的观点来分析计算机语言的发展历程。二、计算机语言的发展历程和发展趋势计算机语言的发展是一个不断演化的过程,其根本的推动力就是抽象机制更高的要求,以及对程序设计思想的更好的支持。具体的说,就是把机器能够理解的语言提升到也能够很好的模仿人类思考问题的形式。计算机语言的演化从最开始的机器语言到汇编语言到各种结构化高级语言,最后到支持面向对象技术的面向对象语言。1、计算机语言的发展历史:二十世纪四十年代当计算机刚刚问世的时候,程序员必须手动控制计算机。当时的计算机十分昂贵,唯一想到利用程序设计语言来解决问题的人是德国工程师楚泽(konradzuse)。几十年后,计算机的价格大幅度下跌,而计算机程序也越来越复杂。也就是说,开发时间已经远比运行时间来得宝贵。于是,新的集成、可视的开发环境越来越流行。它们减少了所付出的时间、金钱(以及脑细胞)。只要轻敲几个键,一整段代码就可以使用了。这也得益于可以重用的程序代码库。随着c,pascal,fortran,等结构化高级语言的诞生,使程序员可以离开机器层次,在更抽象的层次上表达意图。由此诞生的三种重要控制结构,以及一些基本数据类型都能够很好的开始让程序员以接近问题本质的方式去思考和描述问题。随着程序规模的不断扩大,在60年代末期出现了软件危机,在当时的程序设计模型中都无法克服错误随着代码的扩大而级数般的扩大,以至到了无法控制的地步,这个时候就出现了一种新的思考程序设计方式和程序设计模型-----面向对象程序设计,由此也诞生了一批支持此技术的程序设计语言,比如eiffel,c++,java,这些语言都以新的观点去看待问题,即问题就是由各种不同属性的对象以及对象之间的消息传递构成。面向对象语言由此必须支持新的程序设计技术,例如:数据隐藏,数据抽象,用户定义类型,继承,多态等等。2、计算机语言的发展现状:目前通用的编程语言有两种形式:汇编语言和高级语言。汇编语言的实质和机器语言是相同的,都是直接对硬件操作,只不过指令采用了英文缩写的标识符,更容易识别和记忆。用汇编语言所能完成的操作不是一般高级语言所能实现的,而且源程序经汇编生成的可执行文件不仅比较小,而且执行速度很快。
高级语言是目前绝大多数编程者的选择。和汇编语言相比,它不但将许多相关的机器指令合成为单条指令,并且去掉了与具体操作有关但与完成工作无关的细节,例如使用堆栈、寄存器等,这样就大大简化了程序中的指令。同时,由于省略了很多细节,编程者也就不需要有太多的专业知识。
高级语言主要是相对于汇编语言而言,它并不是特指某一种具体的语言,而是包括了很多编程语言,如目前流行的vb、vc、foxpro、delphi等,这些语言的语法、命令格式都各不相同。
高级语言所编制的程序不能直接被计算机识别,必须经过转换才能被执行,按转换方式可将它们分为两类:解释类和编译类。3、计算机语言的发展趋势:面向对象程序设计以及数据抽象在现代程序设计思想中占有很重要的地位,未来语言的发展将不在是一种单纯的语言标准,将会以一种完全面向对象,更易表达现实世界,更易为人编写,其使用将不再只是专业的编程人员,人们完全可以用订制真实生活中一项工作流程的简单方式来完成编程。下面是一张计算机语言发展图表,从中不难得出计算机语言发展的特性:²简单性提供最基本的方法来完成指定的任务,只需理解一些基本的概念,就可以用它编写出适合于各种情况的应用程序²面向对象提供简单的类机制以及动态的接口模型。对象中封装状态变量以及相应的方法,实现了模块化和信息隐藏;提供了一类对象的原型,并且通过继承机制,子类可以使用父类所提供的方法,实现了代码的复用²安全性用于网络、分布环境下有安全机制保证。²平台无关性与平台无关的特性使程序可以方便地被移植到网络上的不同机器、不同平台。三、面向未来的汉语程序设计语言:从计算机诞生至今,计算机自硬件到软件都是以印欧语为母语的人发明的。所以其本身就带有印欧语的语言特征,在硬件上cpu、i/o、存储器的基础结构都体现了印欧语思维状态的"焦点视角",精确定义,分工明确等特点。计算机语言也遵照硬件的条件,使用分析式的结构方法,严格分类、专有专用,并在其发展脉络中如同他们的语言-常用字量和历史积累词库量极度膨胀。实际上,计算机硬件的发展越来越强调整体功能,计算机语言的问题日益突出。为解决这一矛盾,自六十年代以来相继有500多种计算机语言出现,历经五代,至今仍在变化不已。汉语没有严格的语法框架,字词可以自由组合、突出功能的整体性语言。在计算机语言问题成为发展瓶颈的今天,汉语言进入计算机程序设计语言行列,已经成为历史的必然。1、发展汉语程序设计语言的理由:1)计算机语言问题解决,只能从人类语言中寻找解决方案;2)计算机语言的现存问题是形式状态与功能需求的矛盾;3)计算机硬件的发展已为整体性语言-汉语进入计算机程序设计语言提供了条件2、汉语程序设计语言的技术特点:1)汉文字的常用字高度集中,生命力极强,能灵活组合,简明准确地表达日新月异的词汇,这些优点是拼音文字无法企及的。2)汉语言的语法简易灵活,语词单位大小和性质往往无一定规,可随上下语境和逻辑需要自由运用。汉语言的思维整体性强,功能特征突出。3)汉语程序设计语言的发明者采用核心词库与无限寄存器相结合的方法,实现了汉语言的词素自由组合;将编译器与解释器合一,使汉语程序设计语言既能指令又能编程;以独特的虚拟机结构设计,将数据流与意识流分开,达到汉语程序设计语言与汉语描述完全一致,通用自如。具有汉语言特性的汉语程序设计语言的出现,打破了汉语言不具备与计算机结合的条件而不能完成机器编码的神话。还为计算机科学与现代语言学研究提出了一条崭新的路径,它从计算机语言的角度,从严格的机械活动及周密的算法上,向世人证实汉语的特殊结构状态,及其特殊的功能。四、计算机语言之父——尼盖德尼盖德帮助因特网奠下了基础,为计算机业做出了巨大贡献。尼盖德是奥斯陆大学的教授,因为发展了simula编程语言,为ms-dos和因特网打下了基础而享誉国际。克里斯汀·尼盖德于1926年在奥斯陆出生,1956年毕业于奥斯陆大学并取得数学硕士学位,此后致力于计算机计算与编程研究。1961年~1967年,尼盖德在挪威计算机中心工作,参与开发了面向对象的编程语言。因为表现出色,2001年,尼盖德和同事奥尔·约安·达尔获得了2001年a.m.图灵机奖及其它多个奖项。当时为尼盖德颁奖的计算机协会认为他们的工作为java,c++等编程语言在个人电脑和家庭娱乐装置的广泛应用扫清了道路,“他们的工作使软件系统的设计和编程发生了基本改变,可循环使用的、可靠的、可升级的软件也因此得以面世。”尼盖德因其卓越的贡献,而被誉为“计算机语言之父”,其对计算机语言发展趋势的掌握和认识,以及投身于计算机语言事业发展的精神都将激励我们向着计算机语言无比灿烂的明天前进。五、结束语用科学的逻辑思维方法认识事物才会清楚的了解其过去、现在和未来,计算机语言的发展同样遵循着科学技术发展的一般规律,以自然辩证法的观点来分析计算机语言,有助于我们更加深入地认识计算机语言发展的历史、现状和趋势,有了自然辩证法这把开启科学认识大门的钥匙,我们将回首过去、把握现在、放眼未来,正确地选择计算机语言发展的方向,更好的学习、利用和发展计算机语言。六、致谢首先感谢张老师,张老师幽默的讲解和精炼的内容使我受益匪浅,使我对以后的工作和生活有了更深刻的认识。另外要感谢本文所参考的文献的作者和相关网站。最后还要感谢在我写论文过程中提供无私帮助的人们,以及给我支持的家人和朋友。
参考文献
1.《计算机语言与计算机程序发展历史》博客中国网
2.《计算机发展史》上海科学技术出版社
3.《软件发展与社会进步》蔡希尧
4.《自然辩证法概论》北京航空航天大学出版社
计算机学科的认识篇4
关键词:信息技术;问题;对策
当前,以计算机技术和网络技术为主的信息技术正全面而深刻地影响着世界经济和社会发展的进程,先进的信息技术推动着国家经济和社会的发展.因此,信息技术的发展水平、教育水平和应用水平的高低,已经成为推动和制约社会发展的重要标志。众所周知,计算机科学既是一个知识更新快,新技术、新器件和新方法不断涌现的科学,又是一门实践性应用性很强的学科,计算机的应用已渗透到社会的各行各业和各个领域,而且任何一个计算机应用都会在中学生中普及和开展计算机科学与技术教学是适应社会的需求,也是21世纪对人才的基本要求。如何保证教学质量,培养学生的技术能力,是每一位教育者研究的方向和命题。但是,从现实中,不难看出,开展这项教学工作还存在一些问题,解决问题成为教师深入研究并不断改进、制定最佳方案的根由,笔者认为,唯有此,才能不断提高中学生的信息技术能力和教师自身的专业水平。
一、存在问题
(一)传统教学模式与现代计算机学的实践教学模式的矛盾。多数学校的授课教师由于受到应试传统教育模式的影响,在计算机授课的过程中往往按照传统的应试教育方法进行授课,这样一来计算机的课程很难对学生有吸引力,即使现在很多学校有了自己的多媒体教室、计算机机房,但是计算机科学的发展瞬息万变,很难满足学生知识的个性化需求。
(二)应试教育的局限性导致,很多重要性考试的科目中计算机课程的分值几乎为零。由于计算机的科技知识瞬间性,很多学校对计算机课程安排相对较少。大部分学校认为,和其它教学科目相比,计算机科目课程相对不太重要,课程安排不仅时间短,而且教材内容呆板,长期不变,不能及时更新,直接影响到中学生的信息技术教育。
(三)教学内容陈旧,教学方法落后。在教学内容、课程体系和培养模式上存在问题.难以满足计算机行业应用的需要。
(四)压缩计算机信息与技术课程,教学时间不充足。学生上计算机信息与技术是一种游戏心态,不重视,不进取。
(五)教育经费投入不足。教学设备数量少、质量差,尤其是硬件设备更差,并且实验设备更新缓慢,教育设施缺乏,学生难以得到较先进的综合型训练。
(六)教师学历层次、职称结构不合理,教学水平相对偏低。
二、对策
(一)学校方面要认识到重要性。面对计算机科学与技术教学存在的问题,首先学校要有统一的认识,认识到本门学科的重要性,从而在制定总体教学计划时,综合考虑到计算机科学与技术课的授课时间,解决硬件问题,配备齐全计算机,并能够将其纳入到必考学科之中,引起教师的重视和学生心中的重要性。要通过培训等,让计算机科学与技术教学的教师定期出外培训学习,提高专业水平,适应教育的需要,满足学生的需求。
(二)教师要认识到教学的重要性
1.教师的认识带动学生的认知。针对不少学生学习计算机课程目的不明确以及初中计算机课程不受重视这一问题,教师应该首先明确计算机课程的重要性,无论是对于教师自己,还是学生,都要明确计算机学习已经成为现代社会的必需。现代科技迅速发展,知识总量以前所未有的速度增加,计算机技术是现代信息科学技术的基础,是现代信息社会的主要技术之一,它已被广泛应用于社会的各个领域,对人类社会的进步与发展产生了重大而深远的影响,正在并将继续改变人类的学习方式、工作方式和生活方式。因此,计算机已经成为人们日常工作和学习中的必备工具,计算机能力也成为衡量一个人综合素质的重要指标。中学计算机教育是一项面向未来的现代化教育,是中小学素质教育的重要内容。计算机课程将逐步成为中小学的一门独立的知识性与技能性相结合的基础性学科,并为学生适应现代信息社会中的学习、工作和生活方式打下必要的基础。因此,初中教师要从思想上首先重视计算机教育,认真备课,在日常教学中多进行教法研究与教学交流,以促进初中计算机教学效果的提高。
2.突破传统教学走创新之路。计算机本身就是多媒体的重要组成部分,运用多媒体这一工具进行初中计算机辅助教学,意义重大。多媒体以图、文、声、像并茂的方式提供知识,不仅可以直观地展示教学内容,而且课程展示本身就是计算机的一种实际操作过程,教师会在教学过程中无形地渗透各种计算机操作要领。教师在讲课过程中的每一步操作都是值得学生学习的内容,久而久之,一些常用的电脑技能,教师不用刻意讲解,学生耳濡目染就能内化于心。多媒体计算机能够改变单纯的说教模式,迫使“注入式”“填鸭式”等不适合计算机学科的教学模式退出课堂,为供示范练习和边讲边练等多种形式教学创造了条件,大大地提高了教学的灵活性。
计算机学科的认识篇5
关键词:大学计算机基础;操作系统;教学策略
中图分类号:G642文献标志码:B
1问题的提出
计算机基础教学旨在为非计算机专业学生提供计算机知识、能力与素质方面的教育,提高学生的计算机素质,为将来利用计算机解决本专业实际问题打下基础。在计算机基础课程系列中,作为第一门计算机课程,“大学计算机基础”发挥着重要作用,承担着普及计算机基础知识,提高学生计算机操作水平,为后续学习做好准备的重任。
操作系统是计算机系统核心组成部分。从理论学习的角度看,操作系统实现中所采用的思想与方法也被广泛应用在整个计算机科学与技术领域。了解操作系统的功能和基本工作原理,对于理解计算机系统的工作机理具有重要意义。从操作技能培养的角度看,应用软件与操作系统的关系十分密切,学习操作系统知识有益于对应用软件的理解和对操作技能的掌握。
与计算机专业“操作系统”课程相比,“大学计算机基础”操作系统部分的教学存在着特殊之处:
(1)教学目标不同。“操作系统”课程是计算机专业的核心课程之一,目标是使学生掌握操作系统基本概念和结构,理解各子系统的工作原理及设计方法,培养其操作系统应用、维护、管理的能力,重在学习原理,掌握设计与开发技术。与之不同的是,“大学计算机基础”操作系统教学以基础知识教学为主、操作技能训练为辅,目标是使学生掌握一些系统软件基础知识,结合操作训练,加深其对计算机系统工作机理的认识,重在理解与应用。
(2)教学对象不同。计算机专业“操作系统”课程安排较晚,原因在于前导课程的教学需要一定的周期,包括“计算机程序设计”、“数据结构与算法”、“计算机原理”等,经过前导课程学习的学生建立了支持理解操作系统知识的知识结构,较为熟悉计算机系统。而“大学计算机基础”课程开设在入学之初,大部分学生缺乏系统的学习,对计算机的认识很多是靠经验和直观感觉获取的,与科学概念之间存在着差距。
(3)教学条件不同。从前导内容看,“操作系统”课程的前导课程较为完善,知识结构之间的衔接更为连贯;而“大学计算机基础”操作系统部分的前导内容仅涉及计算机基本组成、基本工作原理等,知识点之间联系较为松散。从课时上看,“操作系统”课程课时安排充分,而“大学计算机基础”能够分配给操作系统部分教学的课时相当有限,以我校为例,课堂学时仅4学时。从实验环节看,“操作系统”课程开设的多是验证性实验,与理论教学相呼应;而“大学计算机基础”操作系统实验以操作训练为主,重在对操作技能的培养。
这些区别表明“大学计算机基础”操作系统教学不可能采取“操作系统”课程的教学模式,要在短学时内取得较好的教学效果应设计更符合该课程特点的教学策略。虽然随着计算机技术的发展以及信息技术教育在中小学的普及,越来越多大学新生的计算机基础水平已经摆脱了“零起点”,但是,他们对一些基本概念的理解还仅限于直观认知的水平,大多并不系统和准确。大学计算机基础操作系统部分的教学重在理解与应用,其内容以基本概念为主,辅以基本操作训练,可以帮助学生建立基于科学概念的对计算机系统工作机理的正确认知。但是,根据认知理论,学生的学习是以其原有的经验、心理结构和信念为基础来建构知识的,学生缺乏对计算机系统准确的认知基础必然会给大学计算机基础课程教学带来不利的影响,增加其难度,因此,根据教学对象的认知特点设计教学策略就成为“大学计算机基础”课程教学研究的重要问题。
2基于迁移理论的教学策略设计
根据“大学计算机基础”课程教学对象的特点,我们可以将教学内容归纳为两类,一类是学生已经具有了一定的经验和直观认识,但认知不够准确或全面的知识点,另一类是学生完全缺乏相关经验和背景的新知识点。学习是一个连续的过程,任何学习都是在学生已有的知识经验和认知结构等的基础上进行的,而新的学习过程及其结果又会对学生原有的知识经验和认知结构等产生影响。因此,教学应尽可能的利用其原有知识、创设情境,促成新知识点与学生原有知识之间的关系。
迁移理论是教学策略设计中的常用理论,它体现了新旧学习之间的相互影响。迁移是“在一种情境中技能、知识和理解的获得或态度的形成对另一种情境中的技能、知识和理解的获得或态度的形成的影响”(JamesM.Sawrey)。迁移既可以是顺向的,也可以是逆向的。如果学生根据所学的科学概念解释了操作系统问题,或利用原有的其他领域知识获得了操作系统知识或解决了操作系统问题,这就是顺向迁移;如果学生原有的知识不严谨、不全面、不正确,不足以支持对操作系统的理解,需要通过教学,在肯定原有知识合理性的基础上,对其进行补充、改组或修正,这就是逆向迁移。
2.1基于前概念的教学策略
基于前概念的教学策略主要针对学生已经具有一定观念的知识点,教师应在肯定或者补充学生概念的基础上实现教师的引导。学生在科学领域学习某一概念和原理之前,根据日常经验或在学校教学情境中,对事物和现象的正确或不正确的看法和观念,称为前概念。前概念与错误概念不同,它可以与科学概念一致,只是缺乏严谨而科学的表述,对于这部分概念,教师只要稍做引导即可;它也可以与科学概念相冲突、甚至相悖,对于这部分概念,教师应该转变观念,试着去理解其合理性,进而对概念进行补充修正,实现知识的逆向迁移。根据我们的教学经验,大学新生的前概念相当普遍,如表1所示:
学生持有的前概念对于科学概念的学习既可能产生积极影响,也可能导致消极影响。利用与科学概念基本一致的前概念进行教学,教师只需对这些前概念做适当引导即可获得较好的教学效果,这并非研究的重点。与科学概念相冲突的前概念却可能给教学带来负面影响,学生的操作系统前概念大多是基于自身对计算机系统的观察和以及计算机操作经验而形成的,通过直观经验建立起的前概念通常具有相当的稳定性,拥有这些与科学概念相冲突的前概念,学生往往难以接受科学概念。
实现前概念向科学概念逆向迁移的首要条件是引发学生认知冲突,使得学生不满意自己的观点,认识到已形成概念的不足和不合理的地方,意识到新概念对于自己的价值,从而做好将新概念内化为自己知识体系内容的心理准备,提高教学的实效性。在“大学计算机基础”的操作系统教学中可以采取有针对性的设计实例或反例,或创设具体情境或背景的方法,使学生原有的操作系统观念无法解释新现象,转而接受更为合理的科学概念。
下面,以并发概念为例说明前概念向科学概念逆向迁移的方法。一般学生操作计算机时都会有同时运行多个应用程序的经验,如使用QQ聊天,同时使用MP3播放器听音乐,甚至还浏览网页、处理邮件等,但不会感觉到明显延迟。教学中可以基于这些直观认识引入并发概念。但是根据现实世界的经验,学生通常会认为在同一时间内有不同程序的多条指令在计算机中执行,如果排除高级体系结构、多CPU等因素,这显然与常用微机系统存在着不一致,此时如果提示学生注意只有一个CPU,即在同一时间内只可能有一个程序的一条指令能够获得执行,前概念认知就无法和实际系统相统一,从而引发学生的认知冲突。教师继续就该问题连续提问获取不同回答,则会进一步激化这种冲突,激起学生的求知欲,促使其积极思考。此时教师再适时提出正确的概念表述,科学概念就会很容易排除前概念的稳定性影响,得到学生的认可与接受。在原有观念被修正的同时,学生对并发概念的认知也进一步深入。过程如图1所示:
2.2基于相似情境的教学策略
一般而言,“大学计算机基础”中的操作系统内容比较浅显,以基本概念居多,大多可以通过日常经验或在教学情境中形成前概念,并以此为基础进行教学。但是,也有一些涉及计算机系统运行机理的基本原理、主要技术,受实验条件所限,很难获取直接经验,加上缺乏必要的前导知识,学生理解难度较大。学习是基于已有的知识经验和认知结构等进行的,因此,对于这些缺乏经验和背景的知识点,应采取不同的教学策略。我们可以从社会文化背景出发,创设学生熟悉的情境和背景,使其能够在已有生活经验的基础上建构知识体系。常用的方法之一就是根据日常生活经验设计相似情境,通过相似情境向新知识点的顺向迁移实现教学。一个好的相似情境不仅易于实现向新知识点的顺向迁移,使学生更容易理解和接受新知识点,而且能够提高学生的学习兴趣。
下面以进程三种状态的转换过程为例,说明基于相似情境的教学方法。该知识点属于操作系统基本原理,难以通过操作获取直观经验,我们选择排队就诊作为相似情境来阐释进程状态的变化过程,帮助学生理解。
进程状态转换与排队就诊之间的概念对应关系如表2所示(假设只有一个医生,一队病人)。
设计的排队就诊相似情境流程如图2(a),进程状态转换过程如图2(b)。
虽然设计的排队就诊流程与现实存在着一定差别,但是由于排队就诊是日常生活中的情境,因此,学生拥有足以理解该设计流程的经验背景。依图2可知,设计的流程与进程三种状态的转换过程具有很大的相似性,基于上述的概念映射关系,学生很容易实现从排队就诊流程向进程三种状态转换过程的顺向迁移,理解并接受新知识点。
3结束语
“大学计算机基础”是普通高等学校计算机基础教学的重要课程,操作系统在计算机系统中的重要地位决定了相关知识必然是该课程教学的重要内容。由于教学目标、教学对象和教学条件的差异,操作系统基础知识的教学历来是“大学计算机基础”课程的一个难点。本文根据这些特点以及教学实践经验,在知识分类的基础上,对“大学计算机基础”操作系统教学策略进行了一些探讨。实践表明,这些教学策略较好地解决了学生听操作系统内容枯燥、理解操作系统概念难的问题,不仅活跃了课堂气氛,而且更易于学生理解和接受操作系统基本概念、基本原理和方法,改善了教学效果。“大学计算机基础”课程还在不断发展完善中,随着社会的进步,该课教学目标、教学对象、教学条件等因素也在不断发展变化,相关的教学策略的研究也将继续。
参考文献:
计算机学科的认识篇6
虽然计算机设计的初衷是缘于数值计算,但是英国数学家图灵(a.m.turing)在《机器能思维吗?》(1950)一文中已经预见到计算机和自然语言将结下不解之缘,并且提出检验计算机智能的最好方法就是对语言信息的处理能力。1977年,费根鲍姆(feigenbaum)提出知识工程,计算机信息处理出现了从“数据世界”向“知识世界”的转移趋势。知识世界的载体是语言符号系统,语言信息处理的需求促使语言研究过程和语言研究成果的技术化趋势日益明显,当代语言学已凸显出“语言科学”与“语言技术”的二分互补格局,由此我在《南京师范大学语言科技系建设发展规划》(2001年2月)中提出“语言科技”的新思维。“语言科学”主要指基础性的描写语言学和理论语言学。“语言技术”主要指面向信息处理的应用语言学或计算语言学,其研究任务可划分为“文本处理技术”和“语言模拟技术”。简而言之,语言文本处理技术是通过编辑和编程,将印刷文本转化为可供计算机使用的电子文本的技术。语言系统模拟(simulation)或者语言能力仿真(emulation)技术是通过算法和编程,将自然语言的理解和生成能力输入计算机的技术。获得语言能力的计算机可以实现“人—机对话”而成为名实相符的“电脑”。为研制智能机服务的“语言系统模拟”,可比喻为“语言基因图谱分析工程”和“语言能力移植工程”。强调语言研究的技术化,并非忽视传统语言学研究存在技术性的一面,例如实验语音学和方言语音调查等。之所以以往未能突出语言研究的技术化,其原因在于——除语音研究可借助声学技术设备以外——语言研究的绝大多数领域还一直没有相应的实验性技术设备。
虽然当代语言学家不可能也不必要都转向计算语言学研究,但具有一定的语言信息处理意识却非常必要。早在1964年11月,美国科学院语言自动处理咨询委员会就在《语言与机器》的报告中明确指出:机器翻译遇到了难以克服的semanticbarrier(义障)。然而这一警告,除了致使机器翻译研究热的暂时消退以外,并没有引起语言学界的足够重视。1982年,日本制订了一个为期10年面向ai(人工智能)的“第五代计算机”即智能机的研制计划,其中包括自然语言处理装置。1992年结束时,只部分达到了预定目标。随后又公布了另一个为期10年的“真实世界计算机(rwc)计划”即“新信息处理技术计划”。(许万增1996,p.61-62)据说,90年代后期日本不得不宣布暂停研制,其根本原因就在于未能穿过语言研究的“瓶颈”。自然语言处理装置的任务无法实现,计算机谈何“真实世界”或“人工智能”。时至今日,这一“义障”仍然没有跨越。在《新世纪将对人类产生重大影响的十大科技趋势》(新华社北京2000年12月30日电)的报道中,列出21世纪的“认知神经科学领域”和“信息技术领域”,并分别提出来“探索意识、思维活动的本质”和“计算机向智能化方向发展”的任务,然而没有语言科技领域的合作——关键是认知语义结构网络研究的根本性突破——则不可能实现。
无论从手段还是就目标,对准自然语言处理的当代语言学研究,其性质都应界定为“语言科技”。“语言科技”的内涵是以理论研究为指导,以描写研究为基础,以应用研究为枢纽,促使语言研究向计算机应用、数学、认知科学和现代教育技术领域延伸,沟通文理工相关学科以实现语言研究过程及其成果的技术化;“语言科技”的外延表现为语言工程科技、语言教育科技和语言研究科技。语言学和计算机科学等学科相结合的“语言工程科技”,研究领域是“人—机对话”,其目标主要是自然语言能力的模拟。语言学与现代教育技术相结合的“语言教育科技”,研究领域是“人—人对话”,其主要目标是实现语言教育的多媒体和网络化。“语言研究科技”是将语言研究活动与计算机工具相结合,其主要目标是实现语言学自身的计算机化,包括语料库、词库和句库的研制,语言研究的分析性、统计性、比较性和实验性软件的开发等。这一新思维既突出了当代科技发展所要求的“语言学的技术化”,又体现了以语言学为本而沟通文理工相关学科的研究旨趣。
二、计算语言学的界定要突出技术性
20世纪50年代以后,在理论方法交叉渗透而形成诸多边缘语言学的同时,语言学与计算机结合的趋势开始出现。1954年,在美国乔治敦大学所进行的世界上首次机器翻译试验,标志着计算机科学与语言学的结合已经起步。在这一研究领域,立足于不同的学科视角或知识结构,先后出现了一系列名称术语,如“语言工程”、“语言工程学”、“自然语言的计算机处理”(工科视角)、“语言信息处理”(信息学视角)、“数理语言学”(数学视角)等等。20世纪60年代以后,计算机和语言学的结合逐步深入到语言学的各个领域,形成了包括计算语音学、计算词汇学、计算语法学、计算语义学等分支学科在内的计算语言学(computationallinguistics)。其中“计算语音学”等名词,虽然计算语言学界没人提过,因为已经存在着“言语识别”、“言语合成”等计算机应用专业术语,但是从“语言工程学”到“计算语言学”的术语演变中,透露出“语言学立场”在这门交叉学科中的日益强化。虽然目前的计算机运算速度已经可以满足语言信息处理的技术要求,但是之所以“人—机对话”尚未实现,其“瓶颈”就在于现有的语言研究成果无法满足计算机处理的要求。归根结底,语言信息处理的最终目标就是“计算机模拟语言能力工程”或“语言能力移植计算机工程”。探索语言能力的性质和描写语言系统的结构,这些艰巨性工作还得由语言学家先来完成。语言信息处理或计算语言学务必以语言学为本而以计算机为用。语言学家必须具备“数字化”意识,了解计算机需要怎样的语言描写成果,然后才可能将研究目标对准语言工程。
迄今为止,正如许多发展中学科一样,“计算语言学”的定义尚无一致认定,归纳起来盖有四种观点(侯敏1999,p.2—p.6):
第一种,计算语言学是以计算机为工具研究语言学。侯敏认为,任何一个学科在使用工具方面都是自由的,使用不同工具研究一个学科会带来不同特点,但不因为使用了新工具就产生了新学科。虽然并不排除新工具的使用没有导致新学科的产生,但同样不能否认工具的变革有可能带来学科体系的革命,以致于产生新的分支或交叉学科。现代自然科学之所以能够建立,无疑得益于望远镜和显微镜的应用,前者打开了人类认知的宏观世界之门,后者打开了人类认知的微观世界之门。望远镜和显微镜带来的不仅仅是“这一个工具”,而是人类认知方式的巨大变革,从而引起了天文学、生物学等自然科学的一系列革命,产生了一系列新学科。因此,问题在于如何使用新的工具或新认知方式。如果仅仅利用计算机做语言研究的统计工具,也许不会产生新的分支学科,但是利用计算机作为语音分析和合成的工具,则形成了计算语音学。
第二种,计算语言学是把语言学成果应用于计算机。侯敏认为,计算机的应用领域几乎没有限度,什么学科的成果都可以在计算机上应用,因此在计算机上应用语言学的研究成果不足以建立新学科。问题不在于在什么学科的成果能在计算机上应用,而在于在计算机上所应用的成果的性质。与其他学科研究对象的性质迥然不同,语言学科的研究对象——语言——是人类最重要的认知符号系统和知识载体,因此面向信息处理的语言成果应用于计算机足以建立新的学科。以往的语言学研究是面向人际交流,而计算语言学研究是面向人机交流,两者具有截然不同的性质。版权所有
第三种,计算语言学是研究语言中的可计算问题。侯敏认为,虽然利用可计算理论研究语言符号是建立了一个新学科,但是这种说法偏于保守,没有把计算语言学推进语言学发展的作用充分体现出来。问题在于面向信息处理的计算语言学研究,其显著特点就是语言的可计算性。“推进语言学发展的作用”这不是计算语言学的定义,强调“研究语言中的可计算问题”未必保守,反而突出了计算语言学的显著特点。
第四种,计算语言学是建立基于计算机科学理论的语言学理论。侯敏认为,把计算机科学的基本思想和方法引进语言学领域,不但可以产生许多应用性课题,而且能够促使研究者从新的角度观察语言学,建立与传统语言学不同的理论。因此计算语言学是一种基于计算机科学理论所建立的语言学理论。问题在于:一方面计算语言学需要理论但本质上不是一门理论科学,同时并非所有的计算语言学家都乐意或适合从事理论研究,另一方面计算语言学的应用性质决定了研究成果的技术性特征,而绝大多数人可能更适合于——实际上也更需要——语言信息处理的技术性研究。
第一种和第二种是欧洲流行的广义定义,主张计算语言学是计算机和语言学的交叉,第三种和第四种是盛行于美国的狭义定义,主张计算语言学是计算机科学和语言学的交叉。也就是说,前者仅仅把计算机当成语言学研究中的一种新工具应用,而后者强调计算机学科的要求和理论对语言学的影响。陈小荷(2001)认为,计算语言学就是以计算机为手段来研究自然语言,较严格的定义是“通过建立形式化的计算模型来处理自然语言的一门科学”。要建立形式化的计算模型来处理自然语言,首先要完成适合于计算机使用的自然语言系统的描写。这一面向“人—机对话”的机用语言系统,与以往面向“人—人对话”的日常语法系统不同。因此机用语言系统的描写应当纳入计算语言学的研究范围,即完成了“机用语言系统”以后,才能“建立形式化的计算模型”使计算机获得自然语言能力。综上所论,计算语言学可以定义为——利用计算机作为工具研究语言、研究机用自然语言系统、研究语言系统或语言能力的计算性,同时建构基于计算机应用、数学模型、认知科学等相关学科基础之上的语言理论的新学科。姑且图示如下:
工具性:利用计算机研究语言
计算语言学描写性:研究机用自然语言系统
技术性:研究语言系统的计算性
理论性:建构新的语言学理论
虽然计算语言学的关键任务是研究人机之间的语言交际问题,即“如何教计算机学会说话”。但是从本质上来说,研究语言系统或语言能力的可计算性和利用计算机工具来研究语言是相通的,只是前者探索的是适合于人-机对话的语言能力,而后者讨论的是适合于人-人对话的语言规则。
依据目前的语言研究成果和信息处理技术路线,计算语言学包括应用基础研究、应用研究和理论研究三个方面。(陈小荷2001)应用基础研究指语言处理的基本技术研究。现阶段的主要进展是:1.自动分词技术:这是计算机理解自然语言的第一步。目前汉语书面语自动分词的正确率达到95%以上。2.词语特征标注技术:现阶段的词语特征包括词性和义项,这是句法结构理解的基础。两种标注可采用相似的计算模型但后者要复杂得多,目前尚无大规模的实验结果报道。3.语句分析技术:句法结构和语义结构是自然语言理解的关键技术,目前分析真实文本句子的正确率仅在40%左右。4.语料库建设技术:语料库是为特定目的而收集的言语作品集,包括语料处理和检索。研究语句分析需要存放句法分析树的“树库”,但目前的汉语语料库加工程度较低,所建立的树库很少且规模不大。5.语言知识库建设技术:语言知识包括词汇知识、语法知识和语义知识等,事实性和规则性知识分别放在机读词典和规则库中。语句分析技术之所以不能取得突破,主要原因就是目前尚无适合于中文信息处理的大规模语言知识库。
应用研究指自然语言处理的应用工具的研制。现阶段的热点主要有:1.机器翻译工具:半个多世纪过去了,机器翻译的质量仍然令人失望。现在通行的是有限范围翻译和机器辅助翻译。2.自动文摘工具:微软公司的词处理器word有用于英语的文摘功能,哈工大研制的hit-863i型中文自动文摘系统可按用户设定的比例压缩原文。3.自动校对工具:现在存在的主要问题是误报率过高,并且深层错误难以发现。4.信息检索工具:有主题词检索、全文检索两种。前者需要预先有一个主题词表;后者任意字符串都可成为检索对象。另外从语料库中自动获取各种知识的“信息抽取”在线工具的研究刚刚兴起。5.言语识别和言语合成工具:言语识别(或语音识别)可分为词语识别(计算机口语命令)、有限词汇识别(电话订票)和无限词汇识别(将成段说话转为文字)。言语合成(或语音合成)指用计算机将书面语转换为口语即“文语转换”,存在的问题主要是断词不当且语调刻板,仿真度亟待提高。
然而,如果以为应用性特征明显的计算语言学仅仅是技术,则未免失之于偏颇。计算语言学有着相应的理论研究,大致包括人工智能理论(含计算模型理论。目前的人工智能研究,主要还是集中在人工体能、人工技能。在语言能力移植电脑过程未取得实质性进展以前,还谈不上真正的人工智能)和语言学理论两个方面。例如计算机如何或是否可以模拟人脑和语言能力,如何寻找合适的语言计算模型等,就是计算语言学家特别关心的理论问题。除此之外,还有对自然语言本质属性的重新认定、面向信息处理的机用语法学理论、语言系统与数学模型的关系、语言结构和数理逻辑的关系、语言符号的数字化可能性及其局限性、语言的异质性和受限性或语域理论、元语言理论和研究方法等一系列问题。总体而言,一方面,由于牵涉的学科太多,计算语言学的理论研究还相当薄弱,另一方面,与科技发展息息相关的计算语言学不容过多地沉醉于理论探索。计算语言学的强大发展动力植根于鲜明的应用性,必须通过实践推动理论探索。
三、语言系统的计算机模式化要求
从语言学家的立场出发,语言系统的计算机模式化要求,就是要了解计算机需要怎样的语言描写成果,传统语言学(此处指非面向语言信息处理的语言学)的研究是经验描写解释型,而计算语言学的研究是实验操作技术型,自然语言系统要能进行操作技术化处理,首先必须实现语言的计算机模式化。冯志伟(1999,p.215)认为自然语言处理一般应经过三个过程:1.形式化,将所研究的自然语言问题以一定的数学形式表示出来;2.算法化,把自然语言的数学形式转换为算法形式;3.程序化,根据自然语言的算法形式编写计算机程序。侯敏(1999,p.30)认为语言系统的形式化或计算机模式化必须满足三个要求:1.高度抽象化,即从语言现象中抽象出一般规则;2.元语言的形式化,即采取形式逻辑、数学公式、程序语言等形式语言作为元语言;3.运用过程的严密化,即运用过程必须具有数学与逻辑的严密性。
袁毓林(1993)认为形式语言至少具有三个特点:基本单元的明确性、基本运算和基本关系的明确性、运算优先级别的明确性,但是自然语言在这三方面皆不明确。具体而言,1.语法范畴的边界不明,例如语素、词和词组之间、词类之间的界限不明;2.结构关系难以定义,通常所说的结构关系,如主谓、动宾等往往很难明确界定;3.层次关系不外显,人们通常根据语感和语境等来识别结构层次。侯敏(1999,p.36—40)不赞同这种分析,针锋相对地提出:1.可以根据实际需要或应用目的来确立词项或划分词类;2.结构关系分析需要深入到语义平面;3.形式语法已经给出了体现层次的结构树,在分析歧义结构中可加入语义限制,至于有些连人都解决不了的层次歧义结构也不必要求计算机解决。侯敏的观点是“理论追求的是完美,工程追求的是适用”,避开理论困难而采取工程方法,可以建立一个语言分析的近似模型。
所谓“语法范畴的边界不明”,主要是因为这些“范畴”的设置从某种程度上肢解了语言事实;所谓“结构关系难以定义”,主要是因为这些“结构”难以反映语言的本质结构;而所谓“层次关系不外显”,恰恰是语言结构的特点之一。这些探索和争论,实际上反映了三个根本性的问题:1.汉语结构语法学中长期存在的一些困扰,不仅是套用西方语法学框架框范汉语事实所产生的龃龉,而且也是语形语法学自身无法克服的固有问题。几千年来的西方语形语法学研究之所以能够存在,就是因为人脑在发育过程中逐步自建构了与认知能力协同发展的语义结构网络,为语形语法规则提供了语义选择清单与路径。虽然这些语形语法规则在人际交流中可以使用,但是在语言能力的计算机移植中却顿时陷入困境,因为计算机不存在语义网络结构的自建构功能,缺少语义激活路径。根据语形语法规则,计算机造出来的符合自然语句标准的概率极低,多为与对象世界不存在一致性的随机词语串。2.计算语言学所要求的自然语言的形式化,是基于计算机运算模式的语言研究成果。移植进计算机的“定域受限语言系统”和自然语言系统并不完全相等,严格说来,只是一种接近自然语言的计算机模式化符号系统。3.计算语言学的理论和方法,必须建立在语言的本质共性语义性和和计算机数字化运算模式的基础之上。如果对人类语言的认知语义性没有足够的认识,依然安居于语形语法窠臼而迟迟未能建构语义结构网络,语言信息处理的目标则不可能实现。
中国信息科学界有一种看法,计算机对于形态结构的印欧语言处理具有良好的支撑能力,而对中文信息处理则不然(陈力为2000)。之所以计算机对印欧语文信息处理具有良好的支撑能力,是因为印欧语文结构类型便于建立计算机处理模型。从历史上来看,谷登堡印刷术和打字机键盘都是基于字母的简约性而发明的。一方面,字母系统的符号简约性便于进行数据化处理,汉字符号的繁复性难以进行数据化处理;另一方面,印欧语的形态变化为形式化提供了识别标志,而汉语的孤立结构却没有明显的标志。依据现在的计算机处理模型,汉字的繁复性和汉语的非形态性必然导致中文信息处理中存在一些特殊问题:1.中文信息处理的第一个“瓶颈”。汉语的常用汉字数量繁多,汉字需要解决键盘输入、内部代码、汉字识别和显示、程序语言的数据类型、数据库的排序和检索等一系列问题。2.中文信息处理的第二个“瓶颈”。印欧书面语采取词分写形式,而汉语书面语采取单字连写形式。由于采用西方词法学框架,因此必须研制自动分词技术。假定考虑以“字”和“字义块”等作为汉语的结构单位,自动分词技术将相应改为“字义块”切分技术。3.印欧语的同音词较少,而汉语的同音字较多,同义词和量词也十分丰富,这些都给中文信息处理带来必须解决的难题。4.印欧语可以借助实词的形态变化即在词法层面上进行处理,汉语只有在句法和语义层面上进行处理,需要把语序和虚字的语法信息归纳出来再让计算机掌握。5.印欧语的句子结构是以动词性词语为核心的“主—谓”结构,而汉语的句子结构是以体词性词语为核心的“话题—说明”结构。印欧语的句子结构划一而句界分明,汉语的句子结构多样、成分缺省并且前后句义缠绵。
如果说语言系统是一座“冰山”,那么以上这些语言信息处理中遇到的难题还都是语言系统浮在海水上面的那一小部分,真正的障碍是隐没在海水下面的那一大部分。无论哪一种结构类型的自然语言系统的计算机模拟,包括形态语言,迟早会无可避免地碰撞上坚硬实在而又难以捉摸的“语义结构”。语言研究需要敢于在冰海下持续探索“语义结构”的潜水员。从自然语言系统来说,要让计算机理解语言通常认为必须使电脑能够解决三个问题:1.消除自然语言的一词多义;2.揭示自然语言的潜在意义;3.掌握自然语言的联想推理。这些问题都离不开语义分析,而语义分析技术尚处于探索阶段。(侯敏1999,p.247)对于第一个问题,一词多义可给出不同义项的清单。对于第二个问题,给出每一义项的显性和潜性语义特征清单。对于第三个问题,给出义项或义场之间的语义关联模式。由此可见,必须在以往的经验语感法和先验演绎法基础上,引进实验归纳法和结构优化法,消除语义“泥潭”情结,潜心于冰海中的语义“冰山”,才能逐步建构造语义结构网络。
就世界各种语言来说,语言的计算机理解的深层次难点可能还在于:1.至今尚未揭示出人类理解语言的机制,计算机只能局部模拟自然语言理解的某些简单过程;2.至今尚未完成人类理解语言所凭借的知识系统,建立人类进行语言表达的完整理论,计算机尚无从掌握人类语言的知识系统以及语言表达机制;3.至今尚未对人类语言所兼具的规则性和离散性、精确性和模糊性做出定量和定性的系统分析,计算机尚无从掌握语言系统的复杂性和语言使用的随机性。(傅永和1999,p.238—239)既然语言的理解和表达是一个以知识系统为基础的综合,因此语言系统的计算机模拟必须进行跨学科的研究,特别需要语言学、计算机科学、数学和认知科学以及百科知识学者的合作。与侧重于面对自然人语言学习的语形语法学不同,如果面向语言信息处理,那么就需要以计算机智能模式来重新确定语言学的理论基础、研究重点和研究方法。
面向自然语言处理的计算语言学理论基础,目前主要有基于语言规则性的理性主义理论(即先验主义)和基于语言随机性的经验主义理论。依据理性主义的语言学理论主要有:短语结构语法(psg)、扩充转移网络(atn)、配价语法(vg)、格语法(cg)、范畴语法(cg)、概念从属理论(cd)、多叉多标记树形图分析法(mmt)、词汇功能语法(lfg)和蒙塔古语法(mg)等。这些理论和方法,因为从“理性”出发,因此不可能反映以感受性为基础的自然语言的真实面貌,其缺失已经日益明显。为了克服理性主义理论的不足,采取经验主义理论处理大规模真实文本的语料库语言学应运而生。在收集语言资源或建立语料库的基础上,运用统计方法进行语言信息处理,语言交际过程的随机性由此得到关注。面对传统语形语法学对自然语言过程的不相适应和语义研究的复杂性,甚至有人尝试撇开语言学家的语言研究,以借助语料库逐步实现自然语言系统模拟。虽然借助语料库可以解决语言信息处理的一些问题,但是仅仅依赖语料库实现自然语言系统模拟注定此路不通。因为自然语言不是一个语料仓库,而是一个语义和语形复合性结构系统。无论是理性主义还是经验主义,都必须意识到:语言信息处理中所处理的是定域受限语言。这一研究的理论基础既不应是纯粹基于语言规则性的理性主义,也不应是完全依赖语言随机性的经验主义,而应是突出语言受限性的实验主义。世界语言学的发展经历了从经验科学到先验科学的漫长过程,计算机的发明必将促使当代语言学成为一门实验科学。强调计算语言学的实验主义,并非一概否定理性主义和经验主义,而是要在实验主义的基础上运用理性和经验的理论方法。
自然语言处理的语言理论,目前主要有基于语形的语言理解系统和基于语义的语言理解系统。前者是以语形语法研究的成果为出发点,从句法形式入手;后者是以语义研究的成果为出发点,从语义关系入手。两种理解系统在文本输入、预处理和自动分词等早期环节上基本相同,不同的是基于语形的理解系统先进行词法和句法分析,后进行语义和语用分析,基于语义的理解系统先进行语义分析和语义结构生成,后进行目标语的形式组合。生成语义学认为句子的句法特点取决于语义,语义部分才具有生成能力。认知语义学把意义看作一个植根于知识网络和信仰系统中的认知结构,理解一个语言形式的意义必须激发相关认知领域中的其他认知结构。既然语形结构只是语义结构的表层投影,既然基于语义的理解系统才符合语言的生成机制,既然语义处理才是语言信息处理的关键,那么只有基于语义的理解系统才能满足计算机对自然语言的理解和生成。
李葆嘉:论语言科学与语言技术(下)
四、人脑语言和电脑语言的性质异同
根据与“人脑语言学”的对应关系,计算语言学也可以称之为“电脑语言学”。从人脑角度出发,电脑语言学的研究是将人脑语言系统移植电脑工具的电子工程;从电脑角度出发,电脑语言学是电脑程序模拟人脑语言能力的仿生工程。
不管是系统移植还是能力仿生,首先必须认识到人脑和电脑的异同。1.构造机制的不同:人脑是生物神经系统,具有生物认知机制,而电脑是电子计算系统,具有电子运算程序。2.伴随情感的有无:人脑具有驱动感觉、思维和表达进行的情感性,而电脑只具有执行程序运算的机械性。3.经验基础的有无:人脑具有以感受性为特征的经验基础以及知识系统,而电脑即使配备了一定的知识背景,也不可能具有人脑一样的认知经验基础。4.认知理性的异同:人脑的感受和认知可以区别为非语言层次和语言符号层次,非语言层次包括直觉和感觉,语言符号层次包括知觉(游移性印象)、象觉(清晰性意象)和统觉(逻辑性抽象)。电脑的认知理性只能够定位于语言符号的象觉和统觉层次,难以具备丰富的认知层级系统。5.交流对象的异同:人脑的交流对象分别为对象世界和人际关系之间,具有交流的二重性;而电脑的交流对象只有执行程序的人或“人—机对话”的一重性,所谓“机—机对话”的实质仍然是“人—机对话”的连网,互联网交流仍然是执行者之间的交流。由于计算机永远不可能直接认知人所面对的对象世界,必须以人类的认知为中介,因此计算机永远不可能超越人类的智慧,计算机统治人类世界永远是一种不必要的担忧。
其次,必须认识人脑语言系统和电脑语言系统的差别。人脑语法或自然语言法则是在历史上逐步形成的,具有随机性、规约性、类推性和耗散性特点;而电脑语法或机用语言法则只是自然语法的再抽象化和再规范化,具有受限性、是否性、程序性和封闭性的特点。即使将来研究出适合于语言信息处理的机用语法,也不等同于自然语法。电脑所能获得的语言能力,只是自然语言的一部分或有限语言能力。因此,移植进电脑的语言系统必须进行界定:1.定域化语言:因为人脑语言是一个可以分为不同语域的复合性层级系统,所以必须首先确定电脑语言与人脑语言的对应层级,最佳选择就是规范性的日常语域。2.受限化语言:只能采取有限网络模式,才能将自然语言裁剪成适合计算机运算模式的机用语言。3.形式化语言:必须将定域受限语言的语义结构和语形规则分别形式化。4.算法化语言:借助一定的数学模型,将形式化语义和语形系统数字化。5.编程化语言:依据一定的程序语言,将数字化语义和语形系统编程化。
语言信息处理的目标,就是在受限性语言层面上逐步实现人—机对话。归根结底,自然语法≠电脑语法,电脑语言系统是通过建立形式化的计算模型进行处理的定域自然语言系统。电脑的运算速度可以远远超过人脑的思维速度,但是电脑不可能具备人的能动性认知行为。语形语法学面对是人—人对话,人们在语言习得过程中不知不觉地形成了建立在认知能力之上的语义结构网络,为语形语法规则提供了一份语义可选性清单。语言信息处理面对的是人—机对话,而语言“白板”的计算机并不具备这份语义可选性清单。语形语法规则,在教计算机如何说话的过程中顿时陷入困境。几千年来的西方语法学之所以能够延续下来,全赖人们具有基于认知能力的语义结构网络的自建构功能。反之,正是这一语义结构网络的存在,致使以往的语言学家误以为语形语法就是语法的全部或主要,而将语义结构法则长期放逐出语法学领域。
自然语言系统的计算机处理对西方具有两千多年传统的语形语法学提出了根本性的挑战,也为东西方语言学的合流带来了新的契机。回顾20世纪东西方语言学合流的历程,之所以出现西方语法学框架和汉语事实的错位,是因为合流基点的选择陷入误区。西语具有丰富的语形结构(这里指形态变化)而汉语基本没有(汉语主要依靠语序、虚词、韵律和语气,另外对语境或语用具有极大依赖性)。选择建立在形态变化基础上的西方语法学框架作为合流的基点,必然导致这一过程的曲折。反思的结果显示,东西方语言学合流的基点应当是建立在人类语言所共有的语义结构基础上的语义语法学理论。随着对语言能力研究的进一步深入和语言信息处理对传统语言学的挑战,传统语义研究在新的形势下得以复活。随着世界语言学从20世纪60年代以来出现了从语形研究向语义研究的转移,东西方语言学研究的合流将在新的基点上逐步实现。
五、面向语言系统模拟的语义语法学
尽管乔姆斯基理论认识到语言形式化的重要性,但生成语义学才是语言研究本体的转向。虽然配价语法和格语法的引进和对汉语语法意合性的认定,促使语义句法研究成为当代中国语法学界的热点,但迄今为止,中文信息处理应用系统自觉而全面地运用语义研究成果的鲜见。这一现状的表象似乎是语义研究成果不多,其根源却在于没有彻底认识到——必须从人类(不限于印欧族群)普通(不限于欧洲唯理主义)语法(不限于形态语言)的高度,来解决语言理论和研究方法的创新。无论是语言信息处理,还是语言机制揭示,汉语研究都需要既能反映汉语个性又植根于人类语言共性的原创理论。
人类的认知表现为对象世界的符号化(认知对象的符号化形成语义单元)、范畴化(语义单元的范畴化形成语义类别)和关联化(语义类别的关联化形成语义结构)。西方语言中的词法范畴原型是先民通过语音形式所表现出来的认知范畴或语义类别。语言的形态标记性、单位分布性和结构层次性都是语义类别关联化在表达层面的投影或者制约。一方面,随着人们认知的发展,反映原始认知足迹的形态范畴(如原始生物观的“性”、原始计算法的“数”)的价值日益消解;另一方面,随着语言系统的演化,表现原始认知足迹的语法手段又不可避免地合并、弱化和丧失。语序、功能词等手段的补偿,导致语言结构类型从综合型向分析型方向嬗变。这一过程证明,原始词法范畴在句法结构中并不具有充分必要性。一种语言可以没有词法形态变化,但不可能没有语义结构规则。不同的自然语言之间之所以可能互译,其基础就是存在可互通性语义,尽管结构类型迥然不同。(李葆嘉2001)
由此可见,人类语言的本质属性是语义性,其他属性都是语义性的派生。人类语言的共性可以概括为:在人类感知对象世界的过程中,神经机制依据象似性模式促使对象世界语符化,音义一体化的语符具有实体性和范畴性,由此组成的语义结构具有语境性和关联性,语义结构的语境性表现为语用、语义结构的关联性投影为语形,而语义结构模式具有生成性。图示如下:
神经机制语义实体语境-语用性
象似性认知过程语符语义结构生成性
对象世界语音范畴关联-语形性
在自然语言能力移植工程中,计算机需要的是具有语言本质共性的语义结构网络,由此有必要首先建构语义语法学。所谓“语义语法学”不是“语义+语法的学”,而是以语义为研究对象的语法学。把语义结构的表层投影——语形作为语法研究的纯正对象,有悖于语言结构的真实本体。乔姆斯基试图在语形结构进行数理化描写的基础上,建构反映语言能力的生成语法体系势必捉襟见肘。这一初始思路必然导致“抛开语义——深层语义——语义解释——逻辑表达——逻辑式”这样的“不断革命”。虽然乔姆斯基强调语言研究的目的在于揭示语言天赋,但依据其理论思路:普遍语法(研究对象)——语言能力(哲学基础)——自然主义(学科性质)——数学方法(方法借鉴)——符号描写(形式载体)——形式语法(研究成果),显然缺少人类天赋中最关键的认知性语义能力这一环节。完全排斥语义的经典理论阶段,其句法结构规则必然导致生成出一批语言事实中并不存在的语符串。即使在不得不引进语义解释的标准理论阶段,也没有放弃把形式结构作为句法生成的基础规则。然而,任何脱离语义的语法形式化注定流产,不可能达到揭示语言生成机制或普遍语法的目标。
如果说语义语法学的语言观强调人类语言的本质共性是语义性,那么语义语法学的语法观则突出语义结构是语法的主要研究对象。在欧洲传统语文学中,“语法”主要指基于形态变化的词法和句法规则。在历史比较语言学时代,“语法”包括语音法则,因此才有“青年语法学派”之称。20世纪的结构主义和描写主义促使“语法”研究的对象日益窄化。依据语言是音义符号系统这一论断,所谓“语法”即语言结构之法,当包括语音结构法和语义结构法。在语言系统的第一次划分中没有通常所说的“语法”即语形结构法的位置。语形结构是语义结构的表层投射或制约,语形结构法依附于语义结构法。语言系统的音义二分以及相关研究学科,图示如下:
语音分析(生理语音学、物理语音学)
自然语音解析
语言(语音学)语音结构(音位系统学、语流节律学)
符号语形结构(语形语法学)
系统语义投影聚合性义场(词类)
(语义学)语义结构(语义语法学)
组合性义场(句模)
以往的“语音、词汇、语法”三分法,迷糊了研究者的视线。虽然语形语法研究在语言交际和语言教学中具有一定或者相当用途,但是从研究角度而言,却避开了关键的语义结构法则。
人类认知的本质是对世界图式的语义符号化,人所认识的世界就是存在于语言符号系统中的世界。语义结构网络表现为“实体范畴化”(聚合性义场)和“关系模式化”(组合性义场)的相互交错。广义语义不仅包括实体范畴化的词汇语义和关系模式化的结构语义,而且包括语境范畴化的语用语义。语法的真实本体或语法研究的切实对象应当是语义范畴及其关联模式。结构语法和生成语言的不同之处,在于前者强调“语言系统”,而后者强调“语言能力”,但其共通之处却在于皆以语义结构的虚象——语形作为研究实相,始终游离于语法真实本体之外。依据语形语法学的有限范畴和简略框架(词类划分、语形成分、短语结构、句子成分等),既难以深入分析句法结构,更不可能有效驾驭语言结构的生成机制。从表达来说,语义编码是一切语言编码的基础,要揭示语言的奥秘必须从语义入手。语形型语言(并非只有语形,而是语形隐含或遮蔽了语义语法)和语义型语言(并非没有语法,而是没有形态变化语法)的研究基础,都应是语符的语义性。语义语法学的语法观突出语义结构,表面上突出汉语的个性特征,实质上受制于人类语言的本质共性。关于语形型语言和语义型语言的大致异同,图示如下:
语形型语言:形态手段
语义范畴——语义网络(知识世界)——元语言(日常认知)
语义型语言:非形态手段版权所有
人类的语言符号系统,本质上是一个意义隐喻系统。作为人类认知基本能力的隐喻,其更深层次是源于动物性感受的模仿(基于事物的相似性)与借代(基于事物的相关性)这两种认知能力。关于语言符号系统的形成大致流程,图示如下:
神经机制情绪模式
认知机制具体感受元语言(日常认知)——语义网络(知识世界)
对象世界经验框架
西方语法学源于古希腊的“语言·哲学·逻辑”混沌母体,西方哲人的逻辑研究基于思辩性语言活动。因为逻辑的基本单位是概念和命题,因此人们往往把注重语义的语法研究混同于逻辑的研究。汉语实词的义类划分不是根据逻辑意义,而是借助日常语义;汉语句读之间的语法关系不是根据逻辑关系,而是遵循事理关系。虽然逻辑规则是语法规则的部分再抽象化,但泛逻辑主义却致使人们误以为语法规则都可以逻辑化。自然语言首先具有本能传情性和日常认知性,语言结构法则主要依据广泛存在于日常生活中的事理关系。这一事理关系包括:时序先后性、空间位置性、主观因果性、主观目的性和评估好恶性等等。不是日常语法以思辩逻辑为基础,而是思辩逻辑以日常语法为基础。同样,虽然可以借用数理符号转写具有算法性的语言结构法则,但不可把语言法则混同于数理逻辑规则。
语义语法学的技术路线,是从建构现代汉语元语言系统到建构现代汉语语义网络。虽然自然语言信息处理依赖于语义结构的形式化,但是一些语言学家往往视语义研究成果为“非语法”,并且对其形式化的可能性持怀疑态度。一方面语义单元不具备语形变化的显著标记,而包含较多的意会性;另一方面语义单元并非没有范畴标准,也具有感受或认知的一致性。所谓语义的客观性和主观性就是语义的集体认同性和个人联想性,其本质是个体使用的“素单位”和集体认同的“位单位”之间的矛盾。语义语法学的研究对象首先是具有集体认同性的“义位”(标准体),然后才有可能是仅具个人使用性的“义素”(义位变体)。尽管语义单元或语元数量众多,语义结构关系复杂,但它们以潜在的元语言系统为基础。语义结构网络由语元实体和语义关系组成。同类语元之间具有聚合性语义关系,异类语元之间具有组合性语义关系。换而言之,每一语元都具有两种互相制约着的语义关系,一是同一义场内的各个“义位”之间的“义征”(语义特征)异同,一是不同义场的“义位”之间的“义联”(语义关联)异同。由此,可以依据义征和义联的异同而建立聚合性义位系统和组合性义联系统,在两者基础上在编织语义结构网络。句法结构的形式化应当是语义结构的形式化,而语义结构的形式化就是义场关联模式。
现代汉语语义语法的基础研究是建立“现代汉语元语言系统”,这一研究可比喻为“语言基因图谱分析工程”。其研究思路是:首先归纳出现代汉语词典中用于释义的最低限量词汇,以建构释义元语言系统;其次依据日常语言交际和语言教学中的用词,参照释义元语言以建立词汇元语言系统;再次抽象出义征范畴以建立析义元语言系统,完成语义标记集。在以上成果基础上,一方面可以结合认知心理学和神经语言学的成果进一步研究认知元语言系统,另一方面可以依据语言信息处理的要求,建立机用元语言系统。(李葆嘉等2002)
在现代汉语元语言系统这一基础性工作完成以后,才可以逐步建构现代汉语语义结构网络。研究程序和主要方法大致如下:1.义征对比法。依据有限网络模型,借助析义元语言系统对义元进行形式化描写即标注义征。给出义元在义场内的语义特征,其目标是建构聚合性义场。2.义联配比法。依据有限网络模式,对语义符号的配比关系进行形式化描写即标注义联,在分析和描写过程中归纳出关联性元语言系统和语义结构关联框架。语义句法的本质是相关义场之间的配比,因此义联标记体现着义场配比。给出义场之间的语义选择或语义制约规则,其目标是建立组合性义场。3.语形标记法。汉语具有词序、虚词和韵律等形式手段。韵律手段属于语音句法,可姑且不论。汉语的语形大致可以概括为两种:附着在词或词组上的词语级语形是完构成分;附着在句干上的句子级语形是完句成分。在进行汉语语形范畴化研究的同时,寻找语义关联和语形成分之间的对应性,然后对语形系统进行层级性形式化描写。4.合成建构法。在义征、义联和语形研究成果的基础上,通过相关标记的合成以建构语义结构句模系统。
“语言能力移植工程”的语言学部分主要是语义结构网络研究。通过建立形式化的计算模型,可以将语义结构网络进一步形式化、算法化和程序化。语义语法系统研究的每一结果,都可以也应当用计算机操作作为验证。以往的语法学研究,除了执著于语形研究以外,还有一个根本性的缺憾,就是不具备自然科学研究中的实验手段,因此难免经验性、臆断性和游移性等。采取计算机作为研究和验证手段,从而使语法研究具有鲜明的技术性和可证伪性。人们常说,只有学会一门外语,人们才真正了解自己的母语。与此同理,只有计算机掌握了自然语言,人类才深入揭示出自然语言的奥秘。换而言之,根据语言学习对象的不同,可能存在三种教学语法:一种是母语教学语法(着重于语形语法,因为人类对语义结构网络和语言知识库具有自建构能力),一种是对外语言教学语法(需要在语形语法的基础上增加与语言理解相关的社会文化知识,因为不同语言的语义结构网络具有不同的文化性),一种是计算机模拟语言能力的语法(需要语义语法和语言知识库,因为计算机不具备语义结构网络自建构能力以及与语言理解相关的知识系统的自学习能力)。也只有揭示出语义结构网络,语法学研究才能够在语形语法研究的基础上取得全面突破,语法形式、语形语法意义和语义语法意义,才能够全面贯通。
尽管语义研究及其形式化相当困难,但是在语义语法学理论的指导下,根据定域(语言定域)、定量(词语定量)、定性(义元定性)、定式(义联定式)的“四定”原则逐层实施,自然语言的理解与生成有可能在单句模式系统中首先实现。只要对语言本质的探索和人脑语言移植电脑的目标不变,就必须穿越语义研究的沼泽地。如果说20世纪是语形语法学的世纪,那么可以预言21世纪将是语义语法学的世纪。
六、语言科技复合型人才的培养
自然语言的计算机理解和生成已经成为国际语言学研究的聚焦,语言信息处理的技术水平已经成为当前衡量一个国家现代化水平的重要标志之一,尽快培养兼通语言学、计算机科学、数学和认知科学的复合型人才迫在眉睫。据《美国计算语言学杂志》1986年统计,全球设置计算语言学博士学位的大学已有105所,其中美国63所。在英国曼彻斯特大学已有计算语言学的学士和硕士专业。(侯敏1999,p.27)
中国的机器翻译在20世纪50年代启动,但由于反复不断的政治动乱停滞了近20年。1981年,成立了中文信息学会。1987年,隶属于中文信息学会的计算语言学专业委员会成立。通过计算机专家和语言学家的努力,已经取得语言信息处理的一系列成果。但迄今为止,中国大陆计算语言学方向的研究生的培养,或附属在汉语言文字学、语言学及应用语言学学位点,或附属在计算机应用等学位点,专门性的本科专业迄今尚无设置。根据目前中国高等教育学科体系,一方面,语言学和计算机科学分属不同专业,兼通语言学和计算机科学人才的培养如隔重山;另一方面,“中国语言文学”学科中,作为学术或准科学的“语言学”在前而作为艺术或教化工具的“文学”为重,两者始终捏而不合。