用方格中的字组成词语 汉语中字与词的关系
「字」其实就是指「汉字」,字是中文最小的文字单位,国外汉字学的文献,通常将其译作「character」。所以每一个汉字,都能算作一个字。还有,根据维基百科对词(word)的解释:词是能独立运用并含有语义内容或语用内容(即具有表面含义或实际含义)的最小单位。
可是「词」的概念,根据不同学術观点,还有不同的定义。以下引用在
《The Morphology of Chinese: A Linguistic and Cognitive Approach》
提过的概念,尽量简单地说:
正书词(orthographic word)
正书词,是根据文字的书写常规而定义的,书写常规则通常以正写规作定义[a.1]。音位文字(或称「字母文字」)一般有空格分隔,所以全音位文字的用者,可从分词来直观地看出各词之间的分段。但正写规则对断词法进行规范时候,还是总得根据一些语言特征来制定的,也就是说还是要用另一个「词」的定义。
中文方面,最小的文字单位是「字」不是词。因此,如果用正书词这个概念来理解汉语的词汇,每个字都会被看作一个词,也就是「字」就等于「词」。
社会词(sociological word)
社会词,这概念最初由赵元任提出,是指社会意识上约定俗成的「大于音位而小于句子的语言单位」[2]。比如,英语的社会词和它的正书词,大抵相同。在英语,社会词的正书词唯一较难分清的情形,通常是由连接号造成的。所以一些有连接号的词,在英语中应该看作一个词还是两个词,还是有争议。中文的话,社会词指的就是「字」和有声语言的「词素」。
语汇词(lexical word)
「Lexical word」或称「listeme」,两者在中文可统一译作「语汇词」或「词汇词」,但也有学者建议将 listeme 译作「录位」。语汇词,是独立组合成的音义结合体[3];其音、义,并不符合一般通则。所以,语汇词是要单独记忆的。可是,按这个定义的话,所有英语
熟语
都可以是语汇词,唯有不符合这些定义的才不算作语汇词。因此,杰罗姆·帕卡徳(
Jerome Packard
)等语言学家也认为,语汇词不便于用来理解中文的词。
语义词(semantic word)
语义词,可理解作一个「整体概念」:能够整体表达出一个或更多概念、形象的语义,可算作「语义词」。另外一些学者,认为语义词就是
形式语义学
中的「基本语句」。基本语句,能构成更复杂的表达式,而且其语义已不能再细分,即表达整体概念的最小单位。但是,语义词忽略了语音等因素,所以语义词定义出来的东西不是「词」,反而是更接近「词素」的概念。
韵律词(prosodic word)
「Prosodic word」(韵律词)〖推荐〗或称「phonological word」(语音词),不过不少学者也提倡将两者区别。为免太过复杂,本回答不会刻意区分它们。
首先,所谓韵律词可分两类:基本韵律词、复合韵律词。简单地,韵律词就是有意义的语段,里面是没有停顿的,是一个「连续发音的单位」。但是,各韵律词之间,都会有小停顿[4]。请参考《使用韵律阶层及大量词汇的中文文转音系统》图三:
解释
「我今天要到台北去玩」是句子(S);
「我今天」和「要到台北去玩」是韵律片语(PP);
「我今天」「要到」「台北去玩」是韵律词(PW);
最後分成的有意义的单位就是词:「我」「今天」「要」「到」「台北」「去」「玩」。
可以看见,按此定义的话,句子中自然分成的每一节停顿,就是一个韵律词。而在句子,不能自然分段的有意义的单位,就是「词」。可是,韵律词还是不能用来做分清字、词的准则,它只能帮助我们进一步了解词的分析。
句法词(syntactic word)
句法词不同于语法词(function word;英语原文含歧义),不过也有翻译者将两者混同。句法词的语义结构,是能够被分析出的通过构词句法检测的词项[6]。
总结
〔注〕
[a] 文中译名多新译或少见,故附原文。
[a.1]「Orthography」的官方译法是「正写法」,但本文暂时将其译作「正写规则」,方便理解。如想知道官方的推荐译法,请见《汉语信息处理词汇02部分:汉语和汉字》:
「正写法,即是文字元号形体的规范和使用规则,包括正字法和正词法。汉字正字法可依据《简化字总表》、修订后的《第一批异体字整理表》、《现代汉语通用字表》等。汉语正词法可参照《汉语拼音正词法基本规则》和《信息处理用现代汉语分词规范》」。
参考
The Morphology of Chinese: A Linguistic and Cognitive Approach
《WORD 与「字」的形态结构对比研究》
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。