从认知心理学视角分析词类划分论文

文章 2019-07-11 14:36:58 1个回答   ()人看过

我们为什么要划分词类?作为一种语法研究方法,词类划分体现了怎样的哲学观和认知观?词类所示意义与话语深层结构有怎样的关系?如何才能摆脱汉语词类划分的困境?本文将从认知心理的视角寻求问题的答案。

一、汉语词类划分的困境

词类划分一般遵循以下几类标准。

1.词法形态标准。具有悠久的欧洲语法学传统,对形态丰富的印欧系语言等适用。它发生于古典希腊语地区,传承于拉丁语地区,又主要发展成熟于法语、德语地区,这些语言都是典型的综合语,语法意义的表达主要依靠繁复的词形变化,词序等句法手段则相对次要,这种语言环境下建立的语法学体系,重词法、轻句法的取向是顺理成章的。只是,形态变化少的语言不适用词法形态标准,须从词的外部另寻标准。

2.句法功能标准。通常,名词充当主、宾语;动词充当谓语;形容词充当定语;副词充当状语,分工明确、职责清晰。但对汉语仍然不适用,试看:你快乐吗?怎样才能拥有快乐?快乐是人生的真谛。我愿做一只快乐的小鸟,快乐地面对每一天,也愿你每天都过得快乐!"快乐"可以充任全部六种句子成分,这是词的兼类?抑或词性活用?无怪乎我们感叹汉语词类研究的困局:若词有定类,则类无定职;若类有定职,则词无定类。既然形式无法解决,就只能求助于意义了。

3.概括语义标准。通常名词表示事物、动词表示过程、形容词表示性质和状态、数词表示数量,等等。概括语义符合人们思维意识中对词项所表达意义的主观感受,在跨语言对比中也有较高的接受度,这反映了词性应该具有超越具体语言的普遍基础,而形态变化等反倒可能仅是一种外在表象。据此标准,"学习"表过程,是动词;"成功"表状态,是形容词,但它们也都有名词性的用法,因为我们赋予了"过程"和"状态"被指称的能力,它们已然演变为一种"事物"了。可见,概括语义也不能完全解决词类问题。

4.分布标准。结构主义把词类看成词的分布,在词的组合和聚合中确定词的地位和价值。实质上这是一种综合标准:聚合关系体现的是同类个体的共性,类似于同类词具有相同的词法形态变化;组合关系则反映了词的搭配成句的能力,实现的正是词的句法功能;而词的概括语义则隐含在这两类关系之中。分布在汉语界的影响力是巨大的,若干重要的语法学著作无不以此作为词类划分的主要依据;然其效果却褒贬不一,原因在于分布综合了太多的标准,依此分出的词类数量往往很大,即便如此,在一个小类的内部,仍然无法保证所有成员的分布特征完全一致;但是,依据分布划出的词类具有描写精确、覆盖全面的特点,这在计算机自然语言处理领域,显示出一定的优势。

针对汉语词类划分的困难,学界也不乏创见,现举影响较广的两例:郭锐(2002)认为,词从本质上说是词的语法意义的类型,即词的表述功能,如陈述、指称、修饰等大的类型以及实体、位置、计量单位、数量、指示等小的类型。语法意义有不同的层次:性、数、格、时、体等表达的是较低层次的语法意义,是对概念意义的抽象;表述功能是较高层次的语法意义,它与语言的使用者关系密切,是在使用中表现出来的功能意义。郭锐进而又将表述功能划分为内在和外在两个层次,内在表述功能是词语固有的表述功能,是历时使用意义经约定俗成后固化的语法意义;外在表述功能是词语在某个语法位置上所实现的表述功能,具有一定的灵活性。例如"小王黄头发","小王"从哪个层面看都是指称;"黄头发"却不一致,它的内在表述功能是指称,外在表述功能则是陈述。

沈家煊(2009)提出了一种与众不同的汉语词类划分方案:名词、动词、形容词在印欧语中是分立关系,仅有少量的交叉;在汉语中则是包含关系,名词包含着动词,动词包含着形容词。这就很好地解释了汉语中动词可以充任主、宾语,形容词可以充任几乎所有句法成分的现象,但是包含关系却不是分类的常规模式,名词内部剔除动词、形容词之外的部分也应有相应的类属,否则就无法构成一个平衡的分类体系。

汉语词类划分的困难依然无法解决,这促使我们反思,词的定类与划分作为一种语法学的研究方法,其科学性如何体现?它是否真能反映语言(特别是汉语)的普遍规律?是否是我们唯一的选择?归结为一个更为本质的问题:我们为什么要划分词类?

二、词类划分是符号主义语言认知观的产物

回答这个问题,要从一种长期主导语言研究(乃至科学研究)的认知心理范式--符号主义(Symbolism)说起,该范式认为人脑的思维活动牵涉三类成员:一是源符号;二是规则系统;三是目标符号。思维过程可抽象为:一是源符号依次进入系统;二是规则对输入符号进行加工;三是生成并依次输出目标符号。符号主义着重于模拟人脑的功能,运用规则和符号的串行处理,就可以实现判断、选择、逻辑推导等思维运算。

上世纪30年代,Turing将符号主义机制抽象为一种架构简单却功能强大的数学模型--图灵机,图灵机的初衷是模拟人们利用纸笔进行计算的行为:一是在纸的某个位置写上或删除一个符号;二是把注意力转移到另一个位置;三是一套模拟人脑判断能力的处理规则;四是一个模拟人脑记忆能力的状态寄存器(佚名,1977)。图灵机架构具有强大的包容性,现实生活的许多问题都可以改写为图灵机可接受的形式,交由其处理。

之后,Kleene在图灵机的基础上定义了有限状态自动机(Finite-StateAutomaton),并证明其等价于图灵机。正则表达式(RegularExpression)是FSA的另一种实现,它由一套表达匹配规则的元字符组成,元字符的组合可以描述一系列特定模式的目标字符串。自此,图灵机作为处理语言现象的标准工具得到广泛应用。

现以RE为例,简述其工作原理:w[a-z]*er[s]可以表示任何以"w"开头,以"er"结尾的单词。其中,w表示以w起始,[a-z]表示任意一个小写字母,*表示[]中的内容可以重复0或任意多次,后面是字母er,er后的[s]意为空字符,表示单词结束。这就限定了一个符合特定要求的字符串,同样,只要稍加改动,我们不难利用RE生成一个符合"SVO"或"NP+VP"的句子来。

作为符号主义机器,图灵机、FSA和RE的基本架构是一致的,归结为有限客体在有限规则控制下经历的有限状态的转移,包括五个要素:一是有限的输入符号;二是有限的系统状态;三是状态转移函数(有限的规则);四是系统初始状态;五是系统终极状态(正常终止状态、错误状态等)。

这就是符号主义范式认知世界和模拟人脑思维的基本单元。虽然它略显简陋,但多个单元组合成系统后,就具有了强大的处理能力,足以解决生产生活中的大部分问题。我们编写的计算机程序,无论多么复杂,最终都无一例外地分解为单一的图灵机架构,这表明图灵机具有强大的描述和概括能力,Turing因此被尊为"现代计算机科学之父".

需要特别注意的是,图灵机架构中有三处提到了"有限",即:有限的输入符号、有限的状态、有限的转移规则。"有限"在符号主义范式中是十分重要的概念,其作用是把处理对象和处理过程限定在可控的范围内。如果输入符号是无限的,处理对象就不可控;如果状态是无限的,则处理过程不可控;如果转移规则是无限的,则系统将变得过于复杂而失去实用意义。

语言系统中存在若干集合,它们中大都是有限集合,例如音位集合、音节集合、声调集合、词法规则集合、句法规则集合、文字集合等,它们不经任何处理就能够满足图灵机的输入条件,成为图灵机的处理对象。但是,词汇语义却有些特殊,它是无限的、开放的集合(指实词),为了满足符号主义处理机的要求,必须事先经过有限化改写。于是,在符号主义几乎一统天下的语法学界,寻求有效的语义有限化方法自然成了一项重要的基础工作,各类方法也应运而生,其中具代表性的包括:语义场理论及义素分析法、逻辑语义分析、词的定类及划分、语义格分析等,它们都是符号主义语言认知观下的最基础的语义有限化方法。

遗憾的是,各种语义有限化的尝试都不算成功[1],归根结底,这都源于语义的开放性天生地与符号主义机器互不相容:完整的语义系统必须是一个无限元素的集合,而符号主义机器能接受的却只是有限集合。这个矛盾使得任何语义有限化的尝试都显得捉襟见肘,左右为难,以牺牲语义细节为代价的有限化方法也许从根基上就是有缺陷的,我们需要寻找一种可行的替代方案。

三、联结主义语言处理机不依赖语义分类

作为符号主义的反拨,联结主义(Connectionism)从人的自然生理结构出发,把人脑看成由众多节点相互联结组成的复杂关系网络,认知活动就是通过激发节点间的信息传导,引起节点状态的改变、数量的增减和相互关系的重置,并再次达到稳定平衡的过程。联结主义把关注的重点由规则移到了结构,认为规则并不具体存在于符号序列,而是在信号的激发和传导过程中从多维网络结构中自然浮现出来。

联结主义机制具有以下特征。

1.节点。节点是对人脑神经细胞的模拟,是构成网络的基本单元。人体中大约有1000亿个神经细胞,每个细胞通过树突和轴突分别与上千个其他神经细胞相连,构成一个庞大复杂的网络。网络的每个节点都是一个基本的信息存储器和处理器,它从其他节点获取信息,进行加工、存储并继续传输。每个节点都处在一定的状态中,或者休眠,或者激活,或者某个中间活性量。当节点获取的信息量超过一定阈值,或者一定时间没有信息输入时,就会引起节点状态的改变。节点可以增殖、湮灭或合并。语言系统的词或词素,反映的是人脑中的思维概念,它们都可以看作联结主义系统中的节点。

2.关系。关系由节点间的联结状态和联结方式决定。联结方式指具体与哪些节点相联;联结状态指联结的紧密程度,可以用权重来衡量,权重值可以调节,降为零意味着联结断裂,升为一意味着两个节点的合并。符号主义是基于规则的,它依据规则对符号进行串行处理,规则是一切行动的纲领;联结主义是基于关系的,它依据节点间关系的不同状态来选择处理信息的不同方式,同时依靠节点间权重的调节来存储信息。因此,联结主义实质就是一个研究关系和关系变化的范式,它可以很好地解释词或词素之间的多维语义关系。

3.并行。也称分布式处理,是人脑的本质特征之一,它使人类拥有了迅速处理复杂信息的能力,例如在一个嘈杂的环境中听取一段话语,或者瞬间看懂一幅油画的内容,等等。人脑的这种能力来源于它的网络结构,即节点和联结数量的广泛性和平行性,由此一个电脉冲可以经由多条路径和多个节点到达终点,这就是并行的实质。与此相对,计算机基本上是一个串行处理器,虽然它也可以模拟并行处理,但这是依靠把时间切成小片分配给不同的线程来实现的,实质上是一种伪并行。我们理解一个句子,依赖于对词项间多维关系的并行分析,后文将进一步说明。

4.容错性。符号主义的串行处理不能容忍错误的存在,前后步骤环环紧扣使得任何一环发生错误,都会导致不可预计的结果。联结主义网络实行分布式处理,任何一个具体的节点或联结都不是系统功能的唯一承担者,当系统的一部分发生错误或阻断时,可以激活备选节点和路径加以替代,也就是说,网络系统具有冗余性的特征。这种机制在多数情况下可以补全信息,纠正错误,顺利完成认知任务。我们能理解断续的话语、读懂拼错的生词,进行天马行空式的联想和非逻辑性的推理等等,这些认知能力大都建立在脑结构的冗余性特征之上。

5.自学习。联结主义建立起反馈机制对认知活动进行校验和控制。校验的目的是判定信息处理的正确性和认知活动的有效性。当结果发生偏差时,系统会自动调节节点的状态、数量、联结方式,并再次对输出进行反馈、校验和调节。经过多次循环,偏差达到极小,对信息的处理和认知达到最佳,系统状态得到强化和巩固。这就是联结主义网络的学习和记忆模式,它可以很好地模拟我们学习新词和新表达方式的过程,而符号主义模型则不具备自主学习的能力。

6.遗忘。网络需要持续的信息刺激以维持当前的状态,如果得不到适当的信息输入,随着时间的推移,联结会逐渐降低权重乃至断裂,节点会逐渐丧失活性乃至消失,这就是遗忘。遗忘是人脑的重要特征,适度的遗忘并不会严重影响认知活动的顺利进行,反而对保护大脑不受垃圾信息侵扰有重要意义。符号主义范式不能容忍错误,更加不能容忍遗忘,其每一条规则都是确实的,任何一项规则的丢失都有可能中止系统的运行。

7.规则浮现。规则在联结主义模式下具有"浮现特性"(EmergentProperties)。沈家煊(2004)指出,联结主义网络通过单元、激活、抑制、联结等特征能够有效地表征言语行为,而这种表征达到的有效程度使人觉得仿佛其背后有语法规则的支配。规则本身不需要在系统中明确表征,但却通过网络"浮现"而出。这就如同蜜蜂筑巢,主观上并不依据六角形规则,但群体行为的结果是蜂巢的每一个孔格都受到多方向挤压而呈现出六角形状。

联结主义范式的如上特征使其具有了"软处理"的能力,即输入内容没有严格的限制,处理过程没有唯一的路径,输出信息没有必然的结果。这不同于可重复验证的非零即一的符号主义范式,而与人脑的模糊认知和模糊反应有着很多相似之处。软处理不对处理对象做出限定,因此,联结主义范式下的语言观不以有限性为前提,不以语义切分为基础研究方法,而是建立在无限元素、普遍联系的"百科知识网络"之上。

声音是时间上的连续,文字是空间上的连续,它们都可以进行切分。意义则不同,它占据的是认知心理的空间,能否切分或者如何切分,就不是一目了然的事。

词是能够独立运用的最小语言单位,作为意义的载体,词大致对应于概念这个认知单位。词可以切分为词素,但词义并不等于词素义的简单相加,因此这只是形式而非意义的切分。词义也可以切分为义素,但这种切分带有很强的主观性,而且并不能构建一个可以合成任何词义的"义素周期表".词义(义位)切分的困难提示我们,人脑对概念的认知和表达也许并不依赖于概念内部若干要素(语义成分)的组合,而是依赖于概念外部的要素,即概念之间的关系。

以Lakoff与Johnson为代表的认知语言学者明确反对用形式化的方法切分语义,反对语义成分分析法,认为人们对意义的理解并不是简单的成分相加,而是必须建立在个人知识背景及百科知识网络之上。以单词"knee"为例,我们一般不会从分析语义成分开始理解和描述它,相反,我们更容易想到的是腿、灵活性、运动性、关节、支撑等由身体经验构建的语义知识库。对于另一些从未接触过的生词,只要上下文提供足够多的词义之间的关系,我们同样可以很好地理解它,并把它纳入百科知识网络。这种自顶向下、自外而内的语义认知观是对传统的语义成分分析的颠覆,它完全承认了语义无限状态的合理性,所以只把精力放在如何忠实地描述语义体系的结构和语义理解的过程,而放弃了切分提取语义单元的无谓劳动。

显然,认知语言学关于百科知识网络的提法与联结主义的语言结构观是一脉相承的,它的一个主要观点认为句法不是自足的系统,句法分析不能脱离语义,而语义描写必须参照开放的知识系统(Langacker,1987)。Fillmore用"框架("Frame)描述这个开放的知识系统,建立起基于广泛概念关系网络的框架语义学,并于1997年起带领团队着手实现在线词库FrameNet[2].除了FrameNet,美国普林斯顿大学的WordNet[3]、国内董振东的HowNet[4](知网)以及黄增阳的HNC[5]

(概念层次网络)也是以描写广泛语义关系为主旨的词库工程,它们可看作联结主义认知观下语言学研究的基础工程,虽然工作量巨大,且距离实际应用还有差距,却为语言学研究最终摆脱符号主义范式的束缚、摆脱传统词类划分的困境提供了可能的途径。

四、语法是概念多维关系经语言线性化后的补偿机制

概念关系是多维的、普遍联系的。深层语义结构依赖立体空间表达概念关系,立体空间可以容纳庞大的拓扑数据量,因此不需要语法单位的参与就可以胜任复杂关系的表达。前述联结主义的概念网络模型,即是一种多维关系网络,针对每个节点,可以布设任意多个连接来表达与其他节点的多重关系,是深层语义结构的理想模型。

从深层语义结构(概念结构)到表层句法结构,需经历一个重要的线性化过程,也称序列化过程(Serialization),原本立体结构的概念关系转变为线性结构的词项关系。例如:我用洗衣机把床单洗了。它的深层语义结构如图2所示,存在这样一些关系:一是"我"和"洗衣机"的使用被使用关系(句中已虚化为表方式的介词"用");二是"洗衣机"和"床单"的洗涤被洗涤关系;三是"我"和"床单"的处置被处置关系;四是使用、洗涤、处置等行为与参照时间的关系(句中用助词"了"表达);五是其他一些隐含关系,如"我"与"洗衣机""床单"的领属、借用关系、"床单"清洁程度的变化关系,等等。这些关系通过立体网络的多重链接加以表达,由于其关系表达十分充分,不需要额外的标记补充说明,因此深层语义结构只单纯地包含实体概念和概念间的联结。

语义结构由深层向表层转变,无一例外地成为线性结构,这是受到语音物理、生理属性制约的必然结果。语音在物理上表现为随时间变化的物质震动,生理上表现为气流对发音器官的持续冲击,因此语音与时间维度是紧密贴合的。为了满足时间维度的要求,深层语义结构必须将信息转变为适合语音特性的线性结构,这是语言序列化过程的原动力。图2的概念语义结构经过序列化,就成为下面的样子:我-用-洗衣机-把-床单-洗-了。

我们注意到,原本由多维结构承载的复杂关系信息,在序列化过程中被极大地破坏了,一维线性序列中的节点在形式上只能维持与左右相邻单位的极近关系,这与立体网络的关系表达能力不是一个数量级。为了弥补这种缺失,各种语言都通过全民约定俗成的方式,来改善一维序列的关系表达,例如汉语约定为SVO语言,日语约定为SOV语言;汉语定中结构为形容词+名词的类型,泰语定中结构则为名词+形容词的类型。这样,语序这一语法手段就正式出现在语言中,成为对语言线性化过程中损失的关系表达机制的弥补。其他各类语法手段的发生过程及动因也莫不如此。上例表层句子所增加的三个虚词词项"用""把""了"以及不占据时间轴的语序、语调、逻辑重音等,都是汉语中用于弥补关系表达能力的机制。

因此我们说,语法单位的产生有动因可循,它是受一维线性形式制约的多维关系表达机制,是言语序列化过程的必然结果。完善的语法手段可以胜任表达任何复杂的多维关系,但那只是理想状态,真实语言中语法手段的表达能力十分有限:首先是句子长度的限制,一个场景的表达往往需要多个句子协同完成,句子过长易产生词项关系混乱;其次是语法歧义的存在,类似于"Flying plane can be dangerous"这样的歧义句,可以理解为不同的深层语义结构,虽然这可以成为双关修辞的产生机制,丰富了语言表达方式,但现有语法手段难以区分和表达全部可能的多维语义关系,却也是不争的事实。

我们回到词类问题上,与其他语法手段一样,词性标签赋予词项的语法意义也是对线性化过程中损失的多维概念关系的补偿。它可以表达这样一些关系:实体-属性关系 名词-形容词 行为-对象关系动词-名词实体-行为关系 名词-动词 状态-行为关系副词-动词实体-数量关系 名词-数词 性质-实体关系形容词-名词行为-时间关系 动词-助词……上述概念关系只是示例,并不完整。

事实上,一旦对概念关系进行分类,就立即陷入了符号主义认知观的泥沼,因为概念关系本质上是普遍联系的、无限的,分类意味着切分,意味着有限化改写,这显然与联结主义原则相悖。对于概念语义这样的无限集,分类的作用仅限于使研究变得更有条理、更便于理解和记忆,但这是以破坏语义细节为代价的,而对于描述语义系统本身,分类绝不是最好的方法。如果能够用其他手段(如百科知识网络)完整表达概念语义关系,那么词类划分将不再是唯一的选择。

顶一下 ()  踩一下 () 

 

本文标签:

[!--temp.ykpl--]


友情链接: