汉藏系语言研究法的检讨

簡體傳統

　　1939年李方桂先生在北京大学文科研究所作了一次讲演，题目是“藏汉系语言研究法”，1951年在《国学季刊》第七卷出版。这篇文献可说是讨论汉藏语比较研究法的经典之作，到今天仍有不可磨灭的真知灼见，现在引用那篇文章的结论作为本文的开场白：
　　比较的研究就是历史的研究的变相，主要的目的是想把两个或两个以上的语言找出多少套的相合点（correspondences），从这些相合点，我们可以假设它们有同一的来源，所以每一个相合点我们可以拟定一个原始型，并且从这个原始型可以依一定的规律变成现在的形式及状态。
　　这一段话有两个要点。第一、是要找到多少套的相合点，也就是许多套语音的对当，例如甲语言的p、t相当于乙语言的b、d；甲语言的元音i相当于乙语言的i，而在不同的条件下又相当于e。希望能一一说明对当的关系。第二、拟测原始语言，要设计合理的规律使得现在的形式得到良好的解释。换句话说，要注意语言自然演变的规律，用正常的规律解释演变的结果。
　　在亲属关系不明确的语言之间，部分对当的关系究竟是同源词或借词引起很大的争论，在这个问题上到现在没有良好的解决方法。因此有人提出“关系词”的说法指称“同源词和借词”（戴庆厦1992:52 ）或“两种语言间有语音对应的词”（陈保亚1996:165）。然后就关系词的种种现象提出“语言影响论”（戴庆厦1992:53 ）或“语言联盟说”（陈保亚1996）。又有人提出用“深层对应”的方法来判断同源关系（邢公畹1992:2）。以下就这几种理论提出个人的看法。
　　一语言联盟和语言接触无界有阶说
　　陈保亚（1996）对语言接触的问题有深入的观察和理论的探讨。他以云南德宏傣语和汉语西南官话的接触为对象做了长期追踪的研究，结论是汉语和侗台语之间是联盟关系，没有同出一源的亲属关系；彼此的接触是无界而有阶的，也就是说语言接触的影响可以深入到语言的多种层面，包括所谓核心的基本词汇在内。但是接触后语言的改变又是有阶段性的，结构因素形成不同的区别性特征，这些特征使得改变的速度和顺序可以分成不同的阶段。
　　他的看法通过实证，本来应该没有错误。问题在于他讨论“有阶性”的时候，引用了M.Swadesh（1955）的“基本词汇”（basicvocabulary）说。把Swadesh的200核心词和100 核心词作为衡量有无亲属关系的尺度。他说：
　　由此出发，我们从斯瓦迪士的200词减去100词，就得到两个阶：第一百词和第二百词。尽管第一百词不是绝对稳定的，但从概率上讲总比第二百词稳定，给核心词分阶的目的正是要反映出这种相对稳定性。（1996:185）
　　斯瓦迪士的两百词是在考察了一定数量的语言（特别是印欧语言）的基础上制定出来的，主要根据是经验，不能说完全满足上述前提，但至少可以排除文化词，而且绝大部分在其他语言中也都是组合指数很强的语素，因此当我们把斯瓦迪士的200 词分成“第一百词（一阶）”和“第二百词（二阶）”时，发现有一定的普适性，有亲属关系的语言总是一阶关系词高于二阶关系词，两个相互接触的语言所产生的关系词总是一阶关系词少于二阶关系词。（1996:187）
　　第一，Swadesh的基本词汇是为语言年代学（lexico-statistics或glottochronology）设计的，想从两个语言词汇的接近程度推算两者从母语分开的时间。无论从二百词或其后的一百词立论，在西方学者的验证下都不能成立（Bynon 1977:266—272）。陈氏没有提语言年代学的问题，只是用Swadesh的基本词汇，可说用旧瓶装了新酒。我们不能因语言年代学的不能成立，就说基本词汇说也不能利用。因此在立足点上，陈氏的做法并无可议。
　　第二，陈氏已经指出Swadesh的设计主要是根据印欧语言，我们难以认同一百词或二百词的内容具有适用于任何语言的普遍性。如何选择词汇是另一个困难，Gudschinsky（1956）就有不同的看法。例如：树皮（bark）和皮肤（skin）是两个词目，都在前一百词中，但并不是所有的语言都有这样的区分。比较第一部分的一百词和第二部分的一百词，有什么根据说前者更为核心？例如在前一百词中有树木（tree），后一百词中有草（grass），如何证明“树”比“草”更为核心？如果把属于“一阶”和“二阶”的词掉换几个，立刻影响统计的结果。利用这样少数的词汇立论，难以令人信服。
　　第三，陈氏把他的想法在许多语言中作了验证，结果都证明前一百词更为稳定，认为有亲属关系的方言间，第一阶同源词的比例都比第二阶同源词高。假定他的理论是正确的，问题出在他选择的语言或方言都是语源清楚的，例如以英语和古英语、德语、荷兰语、古冰岛语、哥特语比较，日耳曼语言经过多年的分析研究，语源差不多都清楚了，自然没有问题。他又以汉语各方言作比较，汉语方言同源的关系大致也清楚。如果推广到汉语和侗台语的关系就产生了困难，因为关系词还没有认清楚，如何能够谈比例。
　　陈氏（1997）从核心关系词的分布专论汉语与侗台语语源关系，他引用李方桂先生的研究，说明“汉台关系词在第100词集中有12例，第200词集中有18例，一阶核心词少于二阶核心词。 ”现在根据别人的材料加上以下的词汇：（注：见Manomaivibool 1976，“墨”字对应“黑”字是我的看法。）
　　词义标准泰语汉字汉语上古音（注：上古音用李方桂先生的系统，把声调符号改成平上去入。下同。）
　　附图

　　这七个词都属于前100的核心词，那么第100词集中就有19例，是不是就比第200词集中的18例多，因而就证明有亲属关系呢？难以说定，因为在第200词集中也可能增加若干新考订的关系词。所以对于关系词的研究直接影响汉语和侗台语是否有亲属关系的结论。目前在关系词的研究尚未了解清楚以前作任何推论都有危险。
　　第四、退一步说，即使陈氏的方法都没有问题，词汇也只能显示一部分的关系。因为词汇是语言系统中最容易产生变化的，语音对当和构词的比较可能改变现有的结论。
　　二深层对应说
　　这是邢公畹（1993）提出的一个学说，我现在根据他最新的说法（邢 1999）来检讨。他认为深层对应说是一个“语义学比较法”：
　　现在用汉台语的比较来解释：台语的一个“字”（语言上的“字”）和汉语的一个“字”在意义上相同或相近，在音韵形式上可以对应，我们说其中有同源关系的可能性；若是台语有一组意义各不相同的“同音字”，也能各自和汉语的一组“字”在意义上和音韵形式上相对应，我们就管它叫“深层对应”，其中的同源关系大体可以肯定。（1999:2）换句话说，他假定甲语言中一组同音而异义的字不会一起借到乙语言去，如果这样的一组字都可以找到对应，自然显示同源的关系。同时由于语言的历史悠久，有些字在语音上可能变得不大相近，但是仍有可能是同源关系。以下引用他所举的三组例字来说明：
　　广州
　　附图

　　“鞍”（注：“鞍＠①”两字原来都有平声的调号，现在改用数目字。泰语标音后的数目字也表示声调。）：泰
　　附图

　　附图

　　全变了呢或者只是部分变化？-n又在什么语音条件下变-i？这当然都是虚拟的规律与问题，如果这样的说法不对，那么正确的演变规律又该如何设想呢？讨论同源的语言关系对于这些问题应该有一个解答。
　　举两个距离极远的语言来说：
　　词义英语汉语词义英语汉语
　　燕子 swallow 燕（注：这个例子是梅祖麟告诉我的，在此致谢。）
　　树立 set 设
　　吞咽 swallow ＠② 放置 setting 设定
　　英语用同样一个字swallow表示燕子和吞咽，汉语正好也用同音的“燕”和“＠②”表达相同的意思，显然这是一个偶合的现象，偏偏这个偶合正好合于邢氏所说的“语义学比较法”和“深层对应”，我们要如何分辨这种偶合呢？那就不得不回到语音的对应规律，用语音的对当很容易否定swallow和“燕”有同源关系，那么对于上文所引汉语的装
　　附图

　　对应泰语的sai5就不得不问语音的对当关系如何？没有语音对当的例字难以采信。
　　即使语音对当没有问题，也可能是偶合。汉语的“设”是擦音声母，收-t尾，和英文的set很接近；正好“设定”和setting意义极近，语音也对当。显然英语的set和汉语的“设”没有同源关系，那么“语义学比较法”和“深层对应”的方法都可能有问题。
　　三语言影响论
　　这个理论是罗美珍（1983）和戴庆厦（1990）提出来的，戴氏的文章发表在后，现在引用他的说法来说明：
　　古越人使用的语言，不会是汉藏语系语言，而是与印尼语有关的南岛语系语言，后来这种语言长时间地、大面积地受到汉语的影响而发生了巨变，但它还保留了原有语言的某些词语及其他特点，逐渐形成为今日的壮侗语。壮侗语与汉语的关系，可以视为亲属关系，因为语言影响已导致语言的质变，而与影响的语言有机地沟通后形成亲缘关系。当然，这种亲缘关系与一般所说的由原始母语分化下来的亲属语言之间的关系有所不同。如果这个认识可以成立，就可认为汉藏语系内部的亲属关系实际上存在两种不同的类型：一是由原始母语分化下来的亲属语言（藏缅语与汉语），二是由语言影响形成亲属语言（壮侗语与汉语）。这是汉藏语系亲属关系不同于其他语系（如印欧语系等）的重要特点之一。（1990:15）
　　这段话等于是说，由于甲语言长期受到乙语言的影响，慢慢地甲语言只得保留了某些特点，大部分已被乙语言同化。“语言影响已导致语言的质变”，我认为如果“质变”了，那么就不再是原来的语言，而是乙语言的一支了，原来的甲语言只剩下一些可以找到的语言底层遗迹。
　　这个说法跟上述的“语言联盟说”有接近的地方，“语言联盟说”指出语言接触可以深入到语言的各种层面，如果深入到一个程度自然就会产生“质变”。假定德宏傣语继续受到西南官话的影响而慢慢起了质变，只剩下一些可以勉强辨认的泰语遗迹，那么德宏方言就是一种汉语方言了。我（1988）认为吴语有闽语的底层，但不能不说现在的语音系统是吴语。畲族从民族源流上说是少数民族，但大多数畲族在方言上已经说客家话。
　　重要的关键是从语言论语言，能不能分辨亲属关系和语言影响后的联盟关系的不同点，我认为在“质变”之后几乎无法辨认，我们如何从大部分畲族所说的客家话寻找原来语言的痕迹？只有在质变以前的语言中才能说明何者是本来语言的成分，何者是受影响而来的。在我们承认语言横向影响的同时，不禁要问侗台语果真是南岛语质变后的汉藏语吗？还是仍有亲属关系的可能？
　　四结语
　　回到开场白中李方桂先生的文章，上文已经指出两个要点，现在再来申论一下。
　　第一，语音的对当的数量很关重要，这是一个程度的问题，不能说要有多少套的对当就能确定亲属关系，当然越完整越好。以汉藏语的韵母系统来说，龚煌城（1995）找到了以下的对应：
　　汉语藏语缅甸语西夏语
　　附图

　　而藏语有五个单元音i、u、e、o、a。龚煌城找到了元音系统全面的对当，也解释了藏语e、o的来源。有些对当的关系相当复杂，主要是受到韵尾的影响。面对这样完整的对当关系，我们不得不承认汉语、藏语、缅甸语、西夏语四者有亲属上的同源关系。
　　第二，语音的对当要和基本词汇结合。语音的对当关系越全面越好，上文已经提到很难说多少的对当就可以证明有亲属上的关系。如果语音的对当能跟基本词汇结合，那么可信度就大为增加。例如汉语和藏缅语的同源词是这二十年来才大量增加的，主要是Coblin（1986）和龚煌城（1980，1995）的研究。Coblin的研究中有“一、二、三、四、五、六、七、八、九、十”等数词，有“我、汝、是（this／that）、何、无、共、大、永、细、女、夫、氓、鱼、虱、薪、叶、本、肤、角、头、耳、目……”等等所谓基本词汇，在基本词汇中显示语音的对当，令人无可怀疑。
　　第三，构词法和语法的研究。语法的研究不见得能解决同源与否的问题，例如藏语是“主语——宾语——动词”的语言，汉语是“主语——动词——宾语”的语言（丁1987），连最基本词序都不同。藏语的动词有丰富的形态变化，而汉语则很少。可是汉藏语同源却无可置疑，可见语音和词汇的研究在找寻语言之间的历史渊源时占有更大的比重。
　　我相信构词法应该比语音、语法、词汇更为保守，构词的功能最不容易移借，例如汉语的四声别义，“种子”和“种植”，清浊声母交替，“看见”和“发现”，是很有特色的。研究藏缅语、侗台语的人应该多发掘构词法的内容。据我所知，泰语也有类似四声别义并以声母的送气和不送气为手段的构词法，其他的侗台语又如何呢？最近陈保亚（1996:148）指出德宏傣语把汉语的“盖”字借去作动词用，表示“盖房子”，读213调；但当名词用时，并没有像汉语一样加“子”词尾成为“盖子”，反而改用35调的读法表示名词。他说：这个交替机制我们还无法解释。有没有可能这是德宏傣语的四声别义的构词法应用到借字上来了？如果是的话，这是一个很好的证明，说明傣语有这种构词法，而且是和汉语共有的。
　　第四，同源词的比较。要讨论汉语和侗台语的关系现在还没有到下定论的时候，发掘更多语音对当的词汇是当务之急。如果找到许多套的对当，到了一个程度，我们就不能否认两者的亲属关系；如果找不到对当，无法说明上古汉语四个元音和古台语九个元音的关系，那么我们就不能认为两者有亲属关系。上古汉语和古台语的元音系统都是李方桂先生（1971，1977）的拟测，更需要我们努力寻求两者的对当情形。
　　现在让我来举例说明基本数词的情形作一个试验：
　　词义古台语汉字汉语上古音
　　附图

　　当然，这里没有提到古台语的
　　附图

　　，也还有很多其他的问题没有解决，因为这只是举例的性质，例字只有十个数词，也可能数词全都是借词，但是元音和声调的对当似乎显示汉语和侗台语的关系相当深厚，不像只是语言影响的结果，也不像只是语言联盟的关系。那么要肯定或推翻这样的推测必须要深入寻找关系词不可。
中国语文京483～489H1语言文字学丁邦新20012001本文对国内汉藏系语言研究法的讨论作了一个检讨，对“语言接触无界有阶说”、“深层对应说”及“语言影响论”等提出不同的意见，归结到李方桂先生五十年前发表的文章，并加上几点作者的申论。汉藏语/同源词/语言接触丁邦新香港科技大学人文学院作者：中国语文京483～489H1语言文字学丁邦新20012001本文对国内汉藏系语言研究法的讨论作了一个检讨，对“语言接触无界有阶说”、“深层对应说”及“语言影响论”等提出不同的意见，归结到李方桂先生五十年前发表的文章，并加上几点作者的申论。汉藏语/同源词/语言接触

网载 2013-09-10 21:36:37

[新一篇] 漢字表象加工中的心理位移研究

[舊一篇] 漢譯歐洲中古文學的回顧與展望