中文表示里导入“汉音元素”的提案


中文表示里没有语音要素的问题早已引起很多关注和改进建议,但至今没有进展。

实际上,这个问题首次引起重视正是中国文明第一次大量吸收外部文明、面对如何翻译佛教的大量词汇的唐朝时代。例如,印度原始发音ra都被译为汉字“羅(罗)”,这说明当时在长安,“羅”的发音是ra。实际上,这也正是在长安留学、借鉴唐朝语言创造的日语汉字“羅”的发音,没有假名的古日语就是象现在中国一样,用这样的汉字来表示发音的。例如,梵文अर्हत् arhat、巴利语arahant,汉字译为“阿羅漢”,接近唐朝长安语音的日语发音あ(a)(ra)かん(kan)比今天的汉语发音更接近印度原始的发音。同理,ma的发音被译为汉字“摩”,印度古典诗文《罗摩衍那》如果译为《拉玛王子传奇》,更符合现在的中文语音和理解[1]

这个问题再次引起危机性的重视和突破性的改进是清末-民初年代。章太炎和吴稚晖等借鉴表示外来语发音的日语片假名,创造了注音字母,1912年由政府制定、1918年正式发布。在此基础上修改为注音符号,台湾至今以此为汉字的主要拼读工具;中国大陆自1958年推行汉语拼音方案后停止使用注音符号。

注音和拼音方案的意义自不用提,但都没有解决如何简明准确地表述任何一个语言中存在的语音要素(人名、地名、物名、音响等)问题。例如,王国维在“殷卜辞中所见先公先王考中考证到:甲寅岁莫,上虞罗叔言参事撰《殷墟书契考释》,始于卜辞中发现王亥之名。嗣余读《山海经》、《竹书纪年》,乃知王亥为殷之先公,并与《世本·作篇》之胲、《帝系篇》之核、《楚辞·天问》之该、《吕氏春秋》之王冰、《史记·殷本纪》及《三代世表》之振、《汉书·古今人表》之垓,实系一人。”就是没有准确表述人名发音的书面语音要素的一个灾难性的例子,类似的混乱例子举不胜举。这个问题之所以今天都没有得到解决,正如我在【突破“毕升难关”的汉语文字设想】(2009927日初稿)一文中指出的那样,很大的原因是方块字印刷的技术局限。在今天大量吸收外部信息的全球化时代,用表意汉字来翻译语音元素(如简单的地名Stockholm为译为复杂的汉字组合“斯德哥尔摩”)的局限越来越阻碍了中国人的思维。现在更需要一个创新的方案把表示语音的要素直接赋予汉字那样的地位同时表示在中文句子里,在技术上也相对容易了。

如何开始呢?以一句Ah! You are in California.“啊!你在加利福尼亚。”为例。如果直接导入拼音的表示:“啊!你在jialifuniya”、 “啊!你在jia li fu ni ya”或更准确的表示“啊!你在jia1 li4 fu2 ni2 ya4”,很难为人接受,因为拼音只是用于辅助单个汉字的发音,除了学习和在(只显示数字和拉丁字母的)键盘上输入汉字,不能在中文句子里表示/显示/印刷出来。

现在来看导入注音符号的效果:ㄚ!你在ㄐㄧㄚㄌㄧㄈㄨㄋㄧㄧㄚ。

懂日语“ア!貴方はカリフォルニアにいる。”的人马上会看出,把注音符号导入中文表示是一个非常简明、准确的方案。高深难懂的《罗摩衍那》译为《ㄌㄚㄇㄚ王子传奇》,小学生也能理解了。不用提,这同时会极大改善中文的思维,也顺带解决了许多历史上因为必须用表意汉字来表示发音引起的困惑。

以此更进一步,一、虽然非常困难,可以在原来只为了单个汉字注音的符号基础上修订出“汉音元素”,在计算机处理上,也容易加入现有的Unicode 10.5 Bopomofo一节;二、参照英文、日文(甚至从阿拉伯字母向拉丁字母转化的维吾尔语等[2]),把汉音元素之间的连接更合理地修改为适用于词而不是单字(如California大致表示为ㄎㄚㄌㄧㄈㄛㄋㄧㄚ);三、按照突破“毕升难关”的汉语文字设想改进汉字和汉音的显示/印刷(现在的系统无法显示出其效果),整个中文表示更接近我们的自然语言表达。

为了顺利实现汉音元素的导入,在过度初期,先把汉音以小体印刷/显示在原有汉字的上边;在过度后期,把汉音印刷/显示在句子里,而把原有汉字小体印刷/显示在汉音的上边。除了少数很有名的语音汉字/词,过渡期后所有的语音汉字/词都被汉音所取代。

希望以此文抛砖引玉,我在这里只能提供“异想”,需要大家来达成“天开”。 

[赵京,中日美比较政策研究所,201675日初稿,911日第一稿]   

 



[1] 本文初稿发表后,我陆续根据此文音译了许多印度古典词汇,有必要对拉丁化的梵语发音略为解释,以便统一。韵母上的-表示长音:如fā -> far, swīt -> sweet, cūl -> cool; h是送气音:如kh, gh,jh;声母如ćurch -> churchś介于ssh之间。Śivadāsa, The Five-and-Twenty Tales of the Genie, trans. Chandra Raian. Penguin Books,2006. Key to the Pronuciation of Sanskrit Words, xi. 不过,有些符号无法或很难在微软拼音中找到,音译也不严格。从根本上,汉音元素的制定必须得到公众的广泛认同,需要正式的确认,所以本文的译法主要是示范,暂时也没有打算推广到印度古典以外的外语翻译。

[2] 例如,伊利夏提[“东突厥斯坦还是东土耳其斯坦”?]2016419日, http://chineseblog.uhrp.org/?p=237)指出:[“Turkistan”是突厥人家园之意,“-stan”后缀来自波斯语,与维吾尔语(突厥语)中的“-yeyer”是同一个意思,表示土地、家园。称呼新疆为东土耳其斯坦’”不是源自维吾尔人,也不是维吾尔语,而是来自汉人的汉语音译!在维吾尔语中,土耳其被称为:“Turkiye”,和土耳其语发音一模一样,东突厥斯坦,在维吾尔语中,是被称为:“Sherqi Turkistan”,而不是“Sherqi Turkiye”。也就是说,在维吾尔语里,东突厥斯坦和土耳其两个地理名称中,除掉表达方向的前缀“Sherqi”(东),除掉共同的名词Turk(突厥),剩下的、表达归属的后缀-stan-ye(家园、土地)完全是两个不同的拼写,发不同的音!如果维吾尔人如上文作者所述,想要表达和土耳其的紧密关系的话,那维吾尔语中的东突厥斯坦应该是“Sherqi Turkiye”,而不是“Sherqi Turkistan”。然而,事实不是这样的!包括叙述近代东突厥斯坦历史的不少中文资料,也不都如作者所称,使用东土耳其斯坦;而是以其正确发音东突厥斯坦Sherqi Turkistan)来指称这块儿土地。]很显然,解决、回避这种故意或无意的错乱的方法就是导入汉音元素。