2026年2月26日 星期四

中文三千常用字,潜力無窮

文言文多單字詞,上古漢語的《詩經》是典型代表。其中單字詞佔主導地位,遠多於雙字詞。據統計,《詩經》總詞彙量約四千個,單字詞2,938個,近四分三;二字詞1,329個,其中有雙聲 / 疊韻的聯綿詞(如參差、窈窕、輾轉)、疊字(如關關、蒼蒼),以及合成詞(如天子、君子、淑女)。

自秦漢起,漢語詞義開始從單音詞表達轉向雙音詞表達,例如:「臂」改說手臂,「波」改說水波,「髮」改說頭髮,「淚」改說眼淚。白話文的衣服、衣裳,文言文多用衣、服、裳、衫等。有學者選取唐五代《入唐求法巡禮行記》等四種文獻統計,「衣」與「服」用例190個,「衣服」與「衣裳」用例只52個;而清代《醒世姻緣傳》等五種文獻中,「衣」與「服」用例有268個,「衣服」與「衣裳」用例多達1,052個,差不多是前者四倍。

到近代,白話文取代文言文,兩字或多字合成詞更多,其中包括日本不少借古漢語用詞翻譯西方概念的合成詞,如文明、科學、民主、社會等。這些新詞融合了外來概念,意義異於與原詞,但對中國社會的發展影響巨大。

在雙音詞蔚然成風下,大量單音詞被棄置不用,大量馬字旁的字因而日常鮮見,例如「騭」被公馬取代了,「馵」母馬取代了。3,500個左右常用字,足以合成幾乎所有要表示的萬事萬物。哪怕你只認識最常用的約1,000個字,已經可以構成三萬六千多個雙字詞。香港小學課程要讓學生認識約 2,000至3,000個常用中文字,已足夠一般的讀書看報。

理論上,普通話約1300個帶調的音節,可以組合成169萬雙音詞。3,000個常用字(不帶調)可以組合成900萬個雙音詞。若每個字都有四個聲調變化,可組合成雙音詞就可達144,000,000個,即即一億四千四百萬個!

當然,這只是理論上而言。三千個常用字每字調出四聲,其中不少有音無字,無法組成雙音詞。可是即使這樣,打一個大折扣,三千個常用字的組詞潜力仍然大得驚人,起碼有幾千萬個。而組成的新詞,你我都會似曾相識,因為每字都是認識的,不會完全陌生。新詞都指義,動動腦筋即有所悟。剛遇到一個陌生的英文字 Non-Comedogenic,中文原來是「不致(不會引起)粉刺」,很好懂,甚至算不上是艱深的醫學專用名詞。

近年,隨着社會發展加速,漢語毋須增加新字就不斷創立新詞。《現代漢語詞典》2002年的第四版增收新詞新義1,200餘條;2005年的第五版,又新增6,000餘詞條;2012年的第六版,增收3,000多條;2016年的第七版,增收400多條,增補新義近100項,全書共收詞約69,000多條。

相對之下,《牛津英語字典》正持續更新的線上第三版已收字超過60萬個。《韋氏字典》則收錄約20萬至30萬個現代常用詞及部分專業用語。

中文難學?還是英文難學?

(下)

2026年2月25日 星期三

馬旁的字為何多冷僻?

馬年到來,很多人可能像我一樣,近日認識了不少馬字旁的字。

漢族並非馬背上的民族,但很久以來就與馬建立了密切關係,一方面是為了應付北方遊牧民族的侵擾,一方面是用馬輔助農耕和運輸。翻翻手邊的《廣州話正音字典》,馬偏旁的字有73 個,涉及馬的方方面面,如:驪(純黑馬)、驊(赤色馬)、騮(赤色黑騌黑尾馬).、騤(奔馬的威儀).....等等,還引伸到種種社會人事,如罵、騙、驕、騷……等。粵語用「冇陰質」罵人缺德,正寫應是「陰騭」,竟然也同馬有關係,騭其實是公馬。

這本字典的收字有限,例如沒有收進「騇」字,指母馬;沒有收進「馵」字,指左後腳白色的馬。各以一字分指公馬母馬,可以理解;不同腳呈白色的馬都有專名,這得增設多少個字啊!

漢字當初就是這樣逐步增多起來的,加上一個字可能有不同的異體字,漢字數量越來越大。宋朝官修的《集韻》收字53,525個,曾經是收字最多的一部書;後來《康熙字典》等多部字典都收近五萬字。到現代,中國內地的《中華字海》收字約 8.5 萬個,《漢語大字典》收字 60,370 個,台灣教育部編訂的《異體字典》,收字70,955個。

這些字典裡大部分的字可能是你一生都不會見到的,是冷僻字,其至僵尸字。

為那麼多字被棄用、冷藏了?

一種文字不是單字(詞)越多就越好的。字的多少,一為因應當時社會溝通的需要,二受到語言音節量的限制。三,得便於學習,要考慮人的學習能力。

語言是為了溝通而存在的,只要有表達需要,人自然尋求新的表達方式,包括語音和文字。社會不斷發展、複雜化,新字新詞自然不斷增加。同樣,字詞也會自然淘汰,新陳代謝。大家都有這樣的經驗:社會發展不斷加速之下,大量一度流行的「潮語」,不幾年就過氣無聞。這其實是好事,就如人要通過睡覺把一些「垃圾」從大腦刪除一樣。

漢字是單音節的,漢語一樣。漢語,不管是哪種方言(普通話其實也是一種方言),字音都由聲母、元音與韻母合成(包括零聲母的),每個字音又有音調變化,如普通話的四聲,粵語的九聲。據《現代漢語》教材,現代普通話大約有1300個音節數(包括聲調變化)。相比數以萬計的漢字少很多,每個音節自然有很多同音字,可能十個、二十個,甚至幾十個。這是中文同音字多而難學的根本原因。

漢字因而不應無限量增加,數量越多,溝通、學習就越困難,使用效率就越低。

這問題,我們的祖先很早就發覺,並有所對應。一個方法是擴大單字詞的義項,或是就一音而增字擴形,如由「复」衍生出復、複、覆,由「巴」字衍生成爸、把、芭、疤、笆等;由「青」衍生成清、情、晴、蜻、睛、靖等。這麼一來,同音字大增。

另一個方法是增加音節,也就是製造合成詞,可以是雙音詞、三音詞、多音詞。雙音詞表意明確,用字經濟,自然最簡便、最受歡迎。漢語詞於是形成向雙音(字)詞發展的趨勢和規律。

(上)


2026年2月17日 星期二

馬御春風至 歲華今日新

 

馬御春風至

歲華今日新

奮蹄有餘力

天道自酬勤

丙午啟歲賦詩並書

2026年2月3日 星期二

馬到功成,功在不捨



《荀子·勸學》有句云:「騏驥一躍,不能十步;駑馬十駕,功在不捨。」

騏驥與駑馬相對,騏驥是良馬,駑馬是劣馬。騏驥跑得快跑得遠,但奮力一躍亦不能過十步。駑馬不能與之相比,但只要努力不懈,兼程十日,也可跑得很遠。

「駑馬十駕,功在不捨」是千百年來的勵志名句,勉勵天賦欠佳的人:只要努力不懈也能達到遠大目標。

這句子似乎更宜自勉,若作贈言,則可能會被誤會,不是誰都願意接受自己是「駑馬」。

馬年來臨,「馬到功成」想必不絕於耳。這句子配上「功在不捨」,給「 功成」加上「腳註」,意思更完整、飽滿,「功成」都不是偶然。以之自勉,或作祈許,敬賀新年進步,都無不事。

2026年1月26日 星期一

西方文明會第四次「深呼吸」嗎?

「蠻族」的「蠻」從何說起?

「蠻族」屬遊牧民族,或稱遊居民族。在定居的農耕民族眼中,掠奪是「野蠻」與「罪惡」;但在古代游牧文化中,長途奔襲與掠奪是勇氣、榮耀與生存智慧的體現,是保證族群生存與繁衍的英雄行為,理所當然。於是,英語中的aggressive,既意為「侵略性」、「好鬥」、「挑釁」,又意為「積極進取」、「敢作敢為」,一體兩面。很多年前,一位跟一名外國人學英語的朋友說,老師對她的溫順性格不以為然,促請她要學會aggressive。Aggressive,似乎很正面。

「三次深呼吸」都體現着這種複雜而高度利己的族群性格。它至今像遺傳基因一樣,隱藏在源自「蠻族」祖先的一些國家和個人身上。

西方文明「三次深呼吸」之說源自誰?相關的中文網頁多把它追溯到德國歷史學家蘭克(Leopold von Ranke,1795-1886年)身上,蘭克的權威給此說無限加了分。可是AI無從在蘭克的著述中找不到此說的可靠依據。

提倡歷史研究要尋找原始文獻並核實訊息,正是蘭克為現代歷史學研究奠定基礎的重要貢獻之一。

可是,歐洲上述的三次衝動與衝擊是客觀存在,都對世界歷史的發展走向產生了重大影響。只是要知道,這論點其實是西方敘事下的一個歷史歸納,是歐洲中心論視角下的產物,它簡化了歷史的複雜性,忽略了非西方文明如伊斯蘭文明、中華文明對歐洲發展的持續影響。

在廿一世紀的當下,重溫西方文明的「三次深呼吸」卻大有好處。

「三次深呼吸」之間大致相隔五百年。這是否意味着,西方文明存在一個每五百年一次大規模對外掠奪的周期?從歐洲第三次「深呼吸」至今正好五百年。西方文明會不會有第四次「深呼吸」?當今除了面對百年大變局,還正面對着一個五百年大變局嗎?

今天的西方文明是以美國與歐洲為主體的文明。1500年間,歐洲文明從區域文明發展為全球文明,它的「三次深呼吸」分別對應了它的三個發展階段:從誕生、成長到成熟。如果存在成熟之後的第四次「深呼吸」,它對應的是一個怎麼樣的階段?

一段日子以來,歐洲的衰落,從政治、軍事、經濟、科技都有跡可尋,只在文化上還有老本可吃。自俄烏戰爭發生,歐洲之捉襟見肘,醜態畢現。到美國特朗普二進宮,歐洲各國被特朗普一點情面不留地拷打與羞辱,竟然唾面自乾,整個歐洲之頹敗衰弱,進一步震驚世界。

倒是特朗普治下的美國似乎仍留存着「蠻族風範」,以為弱肉強食、巧取豪奪仍然是生存智慧,有再一次「深呼吸」的衝動。只是他最新的《國家安全戰略報告》暴露,這樣的衝動不過是以進為退的幌子。

呼吸,一吐一納。歐洲過去三次「深呼吸」都是吐故納新的進程。世界舊的國際體系如今支離破碎,彷彿到了崩潰的臨界點。歐美若仍固執於舊的意識形態價值觀,不能從外部世界特別是從東方與南方的崛起中憬悟出新思維,不能蛻變升華,再一次深呼吸的,會不會是最後一口氣?

2026年1月25日 星期日

歐洲「三次深呼吸」的衝擊

 

關於西方文明的興起,有「三次深呼吸」之說。

「三次深呼吸」之說主要見諸中文網絡,指的是歐洲歷史上三次勢力擴張的衝動。這不但重組了歐洲的權力版圖,所掀起的狂瀾還衝擊了中東的伊斯蘭世界,以至全球。這一說把西方文明興起的關鍵轉折點形象化。

三波衝擊指的是:

第一次:「蠻族」入侵羅馬。

第二次:十字軍東征。

第三次:大航海開始,殖民全球。

在‌第一次深呼吸中,「蠻族」在四至六世紀入侵西羅馬帝國,洗劫羅馬,結束了羅馬帝國在西歐的統治,歐洲的「民族大遷徙」達到高峰。這終結了歐洲的古典時代,開啟了中世紀「黑暗時代」,日耳曼人部落制度與羅馬的古典文明、基督教文化融合,催生了以封建制度和基督教為核心的西歐文明雛形,拉丁語與日耳曼方言交融,誕生了德國、法語、西班牙語等,也催生了大批小王國,包括法、德、意、西等國的雛形。

‌第二次深呼吸是11-13世紀歷時二百年的十字軍東征,這是‌由羅馬天主教教皇烏爾班二世發動、歐洲基督教國家參與的九次宗教軍事行動,掠奪了東方的大量財富寶物,更有價值的是從阿拉伯文明裡帶回了古希臘和阿拉伯的學術典籍與技術,西歐自此重新接觸古希臘羅馬文化和當時最先進的阿拉伯文化,為歐洲文藝復興、科學革命和商業復興埋下伏筆。

‌第三次深呼吸是歐洲列強開啟大航海時代的全球擴張。15世紀末,葡萄牙、西班牙等國的航海探險開啟了歐洲的全球殖民時代,使西歐獲得龐大財富與資源,奠定了現代資本主義與世界體系基礎。歐洲人突破地中海局限,佔領美洲、大洋洲等土地資源,啟動了海外殖民與全球貿易,推動了資本原始累積、商業革命和工業文明的興起。第三次深呼吸比前兩次更暴力。源自蠻族的歐洲殖民者與非洲、新世界住民的每一次接觸都是最野蠻的屠殺。大航海是一次野性大釋放和財富大聚集,從這意義來說,大航海可以說是一次「新十字軍東征」,而劍指的不只是東方。它的強力刺激也讓歐洲人一鼓作氣突破了古代科學的徘徊狀態,推開了現代科學的大門。

「三次深呼吸」是對自西羅馬帝國滅亡至西方文明興起這段歷史的簡單而形象化的概括。至於西羅馬帝國的滅亡,是「蠻族」入侵所致,還是羅馬帝國的衰敗招致了「蠻族」的入侵,即孰是因、孰是果,至今是學術上富爭議的問題。 

「蠻族」(Barbarian)是個籠統的稱謂,是西元元年前後數百年中亞大草原的眾多遊牧部落合稱。他們這段時間在中國、印度、波斯和歐洲之間遷徙奔突,原因有不同說法。羅馬人也把萊茵河與多瑙河邊界外的民族為「蠻族」,其中許多人曾是羅馬軍隊的輔助兵。差不多同一時期,中國受北方民族不斷侵擾,出現五胡十六國,漢族衣冠南渡。近年不少研究指出,氣候變化是其中的重要因素,樹的年輪和冰芯都證明當時出全球氣候變冷周期。北方遊牧民族南遷於是不可避免。

2026年1月21日 星期三

「馬到功成」與「馬到成功」

木雕唐馬
這是2014年2月10日的舊文,近日點擊者頻多,想是馬年重臨,而坊間「馬到功成」與「馬到成功」混用讓人疑惑之故。在此特把文章重新上載,以滿足讀者需要。

馬年重來。新年之際,到處可以看到、聽到以馬字構成的吉利語。出現得最多的,是「馬到功成」或「馬到成功」。這兩個四字成語似乎在不同地域的華人中各有喜好,香港都說「馬到功成」,而在內地和台灣,則愛說「馬到成功」。我,愛說「馬到功成」。

我曾以為「馬到成功」為誤用,後來查找一下,才發覺「馬到成功」是古來用語,《辭源》等各大詞典都收錄,「馬到功成」則鮮見。

各部詞典的有關詞例都源自元朝,例如張國賓的元曲《薛仁貴》楔子:「憑着您孩兒學成武藝,智勇雙全,若在兩陣之間,怕不馬到成功。」鄭廷玉元曲《楚昭公》第一折:「害我父兄之讎,誓當報復,管取馬到成功,奏凱回來也。」可是鄭廷玉在《楚昭公》的第四折又有:「只願你馬到功成,奏凱而還。」可見在元雜劇中,已是「成功」與「功成」混用了,可能以「成功」為多。

據「百度」的詞條,是元雜劇大家關漢卿首先創作「馬到成功」一語的,這四字首見於他的《五侯宴》中。至於四字的源頭,則要追溯到秦始皇之拜石。

據說秦始皇統一天下的第二年(西元前220年)到榮成成山頭拜日,途中聽說花斑彩石是女媧補天時遺落的神石,能保佑江山穩固,便率兵馬沿着修好的專用馳道直奔花斑彩石,恭敬而拜。回朝後果然事事如意,花斑彩石所在的附近沿海因此稱為「馬道」。百官為拜石成功作詩慶賀,後來出海求仙不歸的術士徐福有詩曰:「萬馬千軍禦馳道,始皇拜石得成功。」這首「拍馬」詩當時未獲喝彩,倒是關漢卿數百年後提煉出「馬到成功」一語廣為接納了,流傳至今,以形容事情順利,迅速成功。

至於「馬到功成」與「馬到成功」的比較,我認為「馬到功成」在修辭上較佳。

中國文字的修辭,有「自對」之法。「自對」有別於「相對」。在對聯中,上下聯的詞、句要對稱,要兼顧詞性相同、虛實相同、平仄相對,這是正格。但又有變格,即上下聯表面看似不對稱,而上聯下聯實際上各自相對。當上聯下聯各自為對時,上聯下聯之間的相對就可寬鬆對待。這樣的自對可以小到一字對一字而形成的雙字詞,如「登」對「臨」、「日」對「夜」。梁羽生在《名聯觀止》一書的附錄中有這方面的專論,其中一例是著名的黃鶴樓聯:

我輩復登臨,昔人已乘黃鶴去;

大江流日夜,此心常與白鷗盟。

不明白「自對」,就不明白為什麼「登臨」可以對「日夜」。

「馬到功成」其實是一個很好的自對聯,「馬到」對「功成」。「馬到成功」就欠了這樣的修辭效果了。中文的雙字詞、四字詞有大量這樣的自對聯,如春去秋來、時來運轉、眉開眼笑、昂首挺胸、人情世故……。

曾看到有人在網上的評語中嘲笑行文愛用四字詞的做法。寫文章四字詞連篇,如港台包青天劇集的對白固然不好,但四字詞成語大都是千錘百煉的文字,是漢語的精華所在,實在不應輕蔑視之也。