2026年2月26日 星期四

中文三千常用字,潜力無窮

文言文多單字詞,上古漢語的《詩經》是典型代表。其中單字詞佔主導地位,遠多於雙字詞。據統計,《詩經》總詞彙量約四千個,單字詞2,938個,近四分三;二字詞1,329個,其中有雙聲 / 疊韻的聯綿詞(如參差、窈窕、輾轉)、疊字(如關關、蒼蒼),以及合成詞(如天子、君子、淑女)。

自秦漢起,漢語詞義開始從單音詞表達轉向雙音詞表達,例如:「臂」改說手臂,「波」改說水波,「髮」改說頭髮,「淚」改說眼淚。白話文的衣服、衣裳,文言文多用衣、服、裳、衫等。有學者選取唐五代《入唐求法巡禮行記》等四種文獻統計,「衣」與「服」用例190個,「衣服」與「衣裳」用例只52個;而清代《醒世姻緣傳》等五種文獻中,「衣」與「服」用例有268個,「衣服」與「衣裳」用例多達1,052個,差不多是前者四倍。

到近代,白話文取代文言文,兩字或多字合成詞更多,其中包括日本不少借古漢語用詞翻譯西方概念的合成詞,如文明、科學、民主、社會等。這些新詞融合了外來概念,意義異於與原詞,但對中國社會的發展影響巨大。

在雙音詞蔚然成風下,大量單音詞被棄置不用,大量馬字旁的字因而日常鮮見,例如「騭」被公馬取代了,「馵」母馬取代了。3,500個左右常用字,足以合成幾乎所有要表示的萬事萬物。哪怕你只認識最常用的約1,000個字,已經可以構成三萬六千多個雙字詞。香港小學課程要讓學生認識約 2,000至3,000個常用中文字,已足夠一般的讀書看報。

理論上,普通話約1300個帶調的音節,可以組合成169萬雙音詞。3,000個常用字(不帶調)可以組合成900萬個雙音詞。若每個字都有四個聲調變化,可組合成雙音詞就可達144,000,000個,即即一億四千四百萬個!

當然,這只是理論上而言。三千個常用字每字調出四聲,其中不少有音無字,無法組成雙音詞。可是即使這樣,打一個大折扣,三千個常用字的組詞潜力仍然大得驚人,起碼有幾千萬個。而組成的新詞,你我都會似曾相識,因為每字都是認識的,不會完全陌生。新詞都指義,動動腦筋即有所悟。剛遇到一個陌生的英文字 Non-Comedogenic,中文原來是「不致(不會引起)粉刺」,很好懂,甚至算不上是艱深的醫學專用名詞。

近年,隨着社會發展加速,漢語毋須增加新字就不斷創立新詞。《現代漢語詞典》2002年的第四版增收新詞新義1,200餘條;2005年的第五版,又新增6,000餘詞條;2012年的第六版,增收3,000多條;2016年的第七版,增收400多條,增補新義近100項,全書共收詞約69,000多條。

相對之下,《牛津英語字典》正持續更新的線上第三版已收字超過60萬個。《韋氏字典》則收錄約20萬至30萬個現代常用詞及部分專業用語。

中文難學?還是英文難學?

(下)

2026年2月25日 星期三

馬旁的字為何多冷僻?

馬年到來,很多人可能像我一樣,近日認識了不少馬字旁的字。

漢族並非馬背上的民族,但很久以來就與馬建立了密切關係,一方面是為了應付北方遊牧民族的侵擾,一方面是用馬輔助農耕和運輸。翻翻手邊的《廣州話正音字典》,馬偏旁的字有73 個,涉及馬的方方面面,如:驪(純黑馬)、驊(赤色馬)、騮(赤色黑騌黑尾馬).、騤(奔馬的威儀).....等等,還引伸到種種社會人事,如罵、騙、驕、騷……等。粵語用「冇陰質」罵人缺德,正寫應是「陰騭」,竟然也同馬有關係,騭其實是公馬。

這本字典的收字有限,例如沒有收進「騇」字,指母馬;沒有收進「馵」字,指左後腳白色的馬。各以一字分指公馬母馬,可以理解;不同腳呈白色的馬都有專名,這得增設多少個字啊!

漢字當初就是這樣逐步增多起來的,加上一個字可能有不同的異體字,漢字數量越來越大。宋朝官修的《集韻》收字53,525個,曾經是收字最多的一部書;後來《康熙字典》等多部字典都收近五萬字。到現代,中國內地的《中華字海》收字約 8.5 萬個,《漢語大字典》收字 60,370 個,台灣教育部編訂的《異體字典》,收字70,955個。

這些字典裡大部分的字可能是你一生都不會見到的,是冷僻字,其至僵尸字。

為那麼多字被棄用、冷藏了?

一種文字不是單字(詞)越多就越好的。字的多少,一為因應當時社會溝通的需要,二受到語言音節量的限制。三,得便於學習,要考慮人的學習能力。

語言是為了溝通而存在的,只要有表達需要,人自然尋求新的表達方式,包括語音和文字。社會不斷發展、複雜化,新字新詞自然不斷增加。同樣,字詞也會自然淘汰,新陳代謝。大家都有這樣的經驗:社會發展不斷加速之下,大量一度流行的「潮語」,不幾年就過氣無聞。這其實是好事,就如人要通過睡覺把一些「垃圾」從大腦刪除一樣。

漢字是單音節的,漢語一樣。漢語,不管是哪種方言(普通話其實也是一種方言),字音都由聲母、元音與韻母合成(包括零聲母的),每個字音又有音調變化,如普通話的四聲,粵語的九聲。據《現代漢語》教材,現代普通話大約有1300個音節數(包括聲調變化)。相比數以萬計的漢字少很多,每個音節自然有很多同音字,可能十個、二十個,甚至幾十個。這是中文同音字多而難學的根本原因。

漢字因而不應無限量增加,數量越多,溝通、學習就越困難,使用效率就越低。

這問題,我們的祖先很早就發覺,並有所對應。一個方法是擴大單字詞的義項,或是就一音而增字擴形,如由「复」衍生出復、複、覆,由「巴」字衍生成爸、把、芭、疤、笆等;由「青」衍生成清、情、晴、蜻、睛、靖等。這麼一來,同音字大增。

另一個方法是增加音節,也就是製造合成詞,可以是雙音詞、三音詞、多音詞。雙音詞表意明確,用字經濟,自然最簡便、最受歡迎。漢語詞於是形成向雙音(字)詞發展的趨勢和規律。

(上)


2026年2月17日 星期二

馬御春風至 歲華今日新

 

馬御春風至

歲華今日新

奮蹄有餘力

天道自酬勤

丙午啟歲賦詩並書

2026年2月3日 星期二

馬到功成,功在不捨



《荀子·勸學》有句云:「騏驥一躍,不能十步;駑馬十駕,功在不捨。」

騏驥與駑馬相對,騏驥是良馬,駑馬是劣馬。騏驥跑得快跑得遠,但奮力一躍亦不能過十步。駑馬不能與之相比,但只要努力不懈,兼程十日,也可跑得很遠。

「駑馬十駕,功在不捨」是千百年來的勵志名句,勉勵天賦欠佳的人:只要努力不懈也能達到遠大目標。

這句子似乎更宜自勉,若作贈言,則可能會被誤會,不是誰都願意接受自己是「駑馬」。

馬年來臨,「馬到功成」想必不絕於耳。這句子配上「功在不捨」,給「 功成」加上「腳註」,意思更完整、飽滿,「功成」都不是偶然。以之自勉,或作祈許,敬賀新年進步,都無不事。