寻找壮文

南方人物周刊
+ 订阅

2012年1月10日,广西百色市平果县马头镇,壮族居民阅读壮文报刊

我开始想,哪里能听到壮语,见到壮文,以及历史上壮文发生了什么?

2017年秋天,郑子宁突然问我:“你发现没有,很多习以为常的事,我们却并不知道它们怎么来的,比如简体字。我们知道汉字简化的规则,也知道汉字自古简化的历史,但1950年代文字改革具体谁在操作,又如何中止,不得而知。”这其实也是我一直想做的选题。

在和语言学研究者的交流中,他们提到我国最有代表性的文字改革其实是壮文。壮族作为中国最大的少数民族,拥有自己的语言文字。我开始想,哪里能听到壮语,见到壮文,以及历史上壮文发生了什么。

于是,我和郑子宁踏上了寻找壮文的旅程。

汉语方言岛

◇◆◇

从南宁机场到市区的路上,一块块画着东盟各国国旗的广告牌在大道中央的绿化带里延伸了好几公里。我们到达南宁时是去年12月,气候温和,绿意盎然,整座城市都在大兴土木。地铁、快速路、高铁的建设让南宁交通拥塞异常,树木上敷着一层灰白扬尘。作为广西唯一的“大城市”,快速扩张的南宁吸引着、也需要着大量的外地人,我们打了几次的士,司机师傅都是从广西其他地方到南宁谋生,他们的普通话腔调各异。

根据法例,自治区所有机关单位的牌匾公章都必须汉壮并书。广西多次发文要求全区机关遵守规定,用两种文字制作印章牌匾、标语口号,甚至传统上不讲壮语的桂东南梧州、玉林、北海等县市也不例外。

我们很快在南宁找到了新壮文。南宁地铁每个车站都有壮文名,位于南宁市郊的“明秀路站”壮语名为“Camh Roen Mingzsiu”。“Camh”就是壮语的“站”,Roen则是“路”。但即便是这样简单的地名,官方壮文也有两种完全不同的拼写法:在公路路牌上,“明秀路”的壮文拼写为“Mingzsiu Lu”,完全是对汉语读音的转写。

这是整个南宁壮文使用的写照,到底应该是用汉语的转写,还是应该用更地道的壮语,注音者似乎并没有统一的标准。这一盲区延续到“南宁”这座城市本身。按照文件要求,“南宁”在机关牌匾上应写作柳州音的“NANZNINGZ”,但“南宁”在壮语里却有自己的名字——“NAMZNINGZ”。南宁地铁“火车东站”站的壮文是“Camh Hojceh Dunghcan”,两个“站”(“camh”和“can”)的读音都不一样。

其实,南宁是一座说汉语的城市。南宁的地理位置非常特殊。它几乎在广西连片汉语区的最西面,北面、西面、西南面都被壮语包围,只有东面和东南面才和壮汉双语区域衔接。而在南宁附近的这片汉语岛中,南宁城又是岛中之岛——南宁汉语岛主要说平话,而南宁城则说粤语。

1052-1076年,南宁先后遭遇了侬智高起义和宋越熙宁战争,城市两度沦陷,原有居民大量死难散逃。战乱平息后,在驻军影响下,南宁一带逐渐形成一种新的汉语方言——平话。至迟由此开始,南宁成为一座说汉语的城市。从宋朝一直到明朝,南宁和其周围的大片区域都是壮语包围下的一个说平话的方言岛。

但是,南宁平话的地位到明朝则遭遇了挑战。明朝开始,南宁城内的方言逐渐转为官话。官话在明朝为南宁城的达官贵人所使用,到了清朝,南宁城内已经以官话为主,平话成了郊区乡下人的标识。

晚清时期,广东南海、番禺、顺德等地的商人溯西江而上,进入广西经商落户。南宁作为广西南部的重要中心和邕江上的大码头成为许多广东人的定居地。这些说粤语的广东商人很快凭借他们的财富成为西江沿岸各重要市镇的优势居民。南宁城区的语言环境也相应开始改变。

清末民初,南宁城大概维持了官话和粤语人口各半的局面,而到了20世纪20年代,粤语已占据强势地位,说官话的人开始改说粤语,南宁城的官话区域开始萎缩到老城区下郭街附近。抗日战争时期大批广东人西迁避祸更是加剧了官话和粤语之间的不平衡。到抗战结束,粤语一统南宁的局面已经彻底奠定,一直维持到1990年代大力推广普通话为止。而下郭街附近现在也只有少数高龄老人才会说官话了。

因此,可算作“南宁话”的汉语方言竟有平话、官话和粤语三类。南宁市总人口中55.78%是壮族,然而三种汉语把壮语挡在了南宁的远郊,进城的壮族人几乎都迅速转用汉语。他们的口音夹杂着壮语。2016年中文网络流行一时的把“难受想哭”说成“蓝瘦香菇”,正是所谓的“夹壮”。

在南宁,新壮文拼法不一,壮语鲜有人用,方块壮字无处可寻。于是,我们驱车前往新壮文的诞生地、壮语标准音的采集地——南宁市武鸣区双桥镇。

拉丁化

◇◆◇

其实,想要见到拼音壮文,有一个更简捷的方法:掏出你的钱包,随意翻出一张人民币,反面右上角都有五种文字写成的“中国人民银行”,前四种分别是汉语拼音、蒙古文、藏文、维吾尔文,最后一种文字用拉丁字母拼写。这一小行“Cunghgoz Yinzminz Yinzhangz”的符号,就是中国最大的少数民族的官方文字——新壮文。

这种拉丁字母拼成的壮文创制于20世纪50年代,又在80年代被改良。和创制于公元7世纪的藏文以及创制于公元13世纪的蒙古文相比,壮文非常年轻。然而,壮族文明史极为悠久,其先祖可追溯到遍布中国南方的百越先民。他们是水稻的驯化者,世世代代以平地农耕为主要生活方式。

事实上,新壮文是20世纪几股潮流的产儿。首先是拉丁化,20世纪,现代化席卷全球,许多古老帝国被新兴民族国家取代。一个民族要统一,必然需要提高人民的识字率,提高识字率就要使用简单易学的语言文字,这就使文字改革被摆到首位。

在改革方向上,拉丁字母是仁人志士们理所当然的选择。这种脱胎于古希腊字母的文字伴随着古罗马人扩张的脚步,占领了整个西欧,等到大航海时代,西欧殖民者又把拉丁字母扩展到美洲、非洲、大洋洲。

拉丁字母具有先天的优越性:简单,易掌握,视觉区分度高。反例是以草书连写为正体的阿拉伯字母,一个大学四年专业阿拉伯语的人,可能都难流利书写;拉丁字母还具备极强的延展性,真正的古罗马拉丁语中并不存在英语sh、ch等音,但是英语却可以把两个拉丁字母进行组合,以供自己使用。

自身的不断变革让拉丁字母具备了拼写任何人类语言的理论可行性,而西方世界的先进性更让它成了进步和统一民族国家的象征。现代化的浪潮在很多国家如山崩海啸一般激烈,传统文字的“落后”让其成为众矢之的。越南、土耳其纷纷在20世纪放弃了方块喃字和阿拉伯-波斯字母的奥斯曼文,改而以拉丁字母为新的官方文字。这个潮流延续至今,2017年11月,中国的邻国哈萨克斯坦宣布哈萨克语将改用拉丁字母书写。

但这股拉丁化潮流在波及东亚汉字文化圈时却频频受阻,一大阻力便是汉字的同音字问题。

一个汉语读音可以对应意义大相径庭的汉字。如果废除汉字,仅用汉语拼音,将无法在书面语中区分口语同音的字。比如拼音yi能对应两百多个常用字,如果不标声调,yiyi可以是意义、一一、异议、依依、一亿、熠熠、亦以、姨姨、一役、亦已、已矣等等。

据语言学家潘悟云回忆,他有个朋友曾是中国人民大学的教授,推崇文字改革,一生坚持用拼音写日记。“文革”时,红卫兵抄家,把他的日记抄出来,认定是间谍密码。他称是日记,红卫兵让他现场朗读,他发现自己根本读不出来,结果就被批斗。

直到今天,汉字文化圈里的同音字问题仍然能引发严重的事故,2010年韩国修建高铁时,因为将轨道枕木连接处需要的“防水”垫误认为“放水”(两词朝鲜语汉字音均为"방수/bangsu"),导致大量枕木报废、工期延误。

近代以来的学者,比如钱玄同、鲁迅,一直都大力提倡汉字拼音化,但诸如同音字的问题让东亚汉字文化圈拼音化的尝试举步维艰。写过《施氏食狮史》这类游戏文章的“中国语言学之父”赵元任,从来都是汉字拉丁化的坚定支持者——他设计了汉语拉丁化《通字方案》,试图引入古代读音和方言读音,来削减过量同音字,但是没能有效推广。

这种磕磕碰碰延续到新中国成立,汉字拼音化成为汉字改革的最终目标。但由于存在现实困难,暂以汉字简化为国策,而少数民族语言文字则作为拼音化的试点。

壮文恰恰具备作为试点的条件:古壮字,即方块壮字,是模仿汉字而来,其造字法基本处于汉字框架内。部分汉字被直接拿来表示壮语,如“古”的发音被拿来表示壮语的“我”(音gou),“歌”则直接按照壮语读成fwen。方块壮字最主流的造字法是形声字,如表示“田”的一个上那下田的字,音“naz”,声旁是“那”,形旁是“田”。除此以外,汉字的会意、反切、象形等造字法在壮字中均有所应用。作为少数民族文字中少有的和汉字极其相似的文字系统,将壮字改造为拼音文字几乎可成为未来汉字拼音化的完美预演。

壮族常用比喻、转义、联想的方法构造新词。比如,dungxsaej(肚肠)意思是才学,dinfwngz(手脚)意为手艺,gwndaenj(吃穿)是生活。总体而言,在壮语词汇体系中,反映社会制度、社会组织、社会经济方面的词语很少,反映农耕和家庭饲养业以及水生动物的词语却很丰富。

更让改革者为之鼓舞的是,缺乏标准规范的方块壮字,改革阻力远远小于汉字。

汉字自诞生之日起就是一个相对标准的系统。秦始皇书同文后的两千多年中,这个系统在数百万平方公里的广袤土地上的稳定和统一达到了匪夷所思的程度。一个唐朝的长安人和一个今天的北京人已完全不可能对话交流,但只要后者会用繁体字,两人仍可笔谈。

方块壮字却缺乏统一的规范,多是直接根据当地发音从汉字中借来、生造,这使得方块壮字的字形因地而变,甚至同一个地区由于造字者不同,一个词也会造成不同的字。如表示“鸟(音roeg)”的字,凤山一带直接用汉字“六”,武鸣一带则写作“六鸟”。表示尾巴的词在靖西读taeng,写作“堂尾”,但在龙州读haeng,写作“尾康”。

1980年代出版的《古壮字字典》收字规模多达10700字,但是其中被认定为正体的不到一半,剩下的全是各地写本中的异体字。直到今天,壮文学者仍在试图厘清、确定不同的壮字。想要做一个方块壮字标准化字典仍遥不可及,历史、方言差异且不说,至今各地壮人还在不断新造壮字。由于方块壮字的随意性,哪怕壮族人自己也对方块壮字缺乏自信:壮语中壮字称为Sawndip,意思是“生字”——不成熟的文字,与之对应的成熟文字就是汉字了。

相对汉字的强大历史惯性以及巨大的改革阻力,造字法类似汉字、又有诸多弊端的方块壮字,在当时人看来,便非常适合作为汉语拼音化改革的实验品。

明秀园

◇◆◇

离开南宁市区一路向北,经过高速旁被来往货车熏灰的树,不到一小时就到了南宁市武鸣区明秀园。武鸣原来是一个县,后并入南宁成为区。西江流经此地绕了个弯,园子就坐落在弯曲处。这里山清水秀,树木繁茂,阳光和煦,闹中取静。

1955年,前苏联专家谢尔久琴柯和中国语言学家袁家骅等人在明秀园制定《壮文方案》(草案),新壮文诞生,也就是我们今天在人民币上见到的拉丁壮文的原型。距离明秀园不远的武鸣县双桥镇的方言被选中,成为壮语标准音。

明秀园

在《关于创建民族文字和建立标准语的问题》中,谢尔久琴柯认为:“考虑的主要是文化、政治条件,而经济条件不是直接规定语言发展……中心地点有很多学校,培养着大量的知识分子和干部。由于社会的需要,中心地区现在没有铁路的地点,比方武鸣吧,将来也会有的。这些条件决定了标准音应以中心地点为准。”

事实上,武鸣至今未通铁路。今天的双桥镇和一般的广西小镇看起来并无不同。满街的粉店和杂货铺,十块钱三斤的皇帝柑,卖卷粉的小摊和Oppo/Vivo广告牌,毫无“文化中心”的迹象。

不可忽略的是20年前的一次语言调查。

1935年,中央研究院历史语言研究所研究员李方桂到南宁收集壮族的语言,写下《武鸣土语》,被誉为“少数民族语言研究的开山之作”,李方桂也被冠以“非汉语语言学之父”的称号。等到1952年中央人民政府决定创制新文字时,李方桂的这本书成了调查人员的必读书。三路调查人员在极其不便的交通条件下几乎跑遍了广西所有说壮语的县。苏联专家谢尔久琴柯并未参与调查,他在调查结束后才来到明秀园,提出以武鸣音为标准音。

当时调查条件简陋,交通不便,搜集语言经常需要撞运气。被调查的地方要么离大城市近,要么是恰好有当地人在城里念书。1939年,李方桂又采集了剥隘壮语,是因为他当时在昆明乡下遇到了一个自剥隘来昆明读书的人。此人发音清晰,擅长讲故事,于是有了《剥隘土语》一书。李还采集过中越边境上的龙州壮语,并著有《龙州土语》。但剥隘、龙州都离南宁极远,谢尔久琴柯等人并没有再次造访这些地方。

尽管有前人调研在先,武鸣区双桥镇这个选点也存在问题。广西壮语大体以右江-邕江一线为界分南北两大方言,武鸣地处邕江北岸广西壮语南北交界处,属北部方言,但和南部方言近在咫尺。武鸣附近的壮语口音差异比较大,即使双桥镇的口音都和武鸣县城有差别。“所以武鸣话的覆盖面相对而言是不大的。他原来也考虑过,开始就说选柳江、来宾这些地方,但是这个专家(谢尔久琴柯)就说,那个不是(政治)中心。当时咱们说来宾又有一个矿,但经济不是影响语言最重要的东西,所以就(舍弃了)。”壮语研究学者、广西大学教授林亦对我们说。

无论如何,1955年,专家们选定了语音差别较小、使用人数占壮族人口2/3的北部壮语为基础方言,以武鸣县双桥镇的壮语为标准音。为了“扩大适用面”,方案把武鸣话的bl-、ml-、gl-换成by-、my-、gy-,并增加ny-声母和ei、ou两个韵母。

“僮(僮即壮)族语言是属于汉藏语系汉傣语族的一个语言,僮文是其中第一个新创的拼音文字,它对其他民族有很大的影响,对汉字改革也有帮助。”中国科学院语言研究所、中央民族学院顾问谢尔久琴柯在1956年内部发行的《关于创建民族文字和建立标准语的问题》里写道。

按照拼音文字的逻辑,武鸣双桥镇人最适合使用新壮文,因为新壮文就是用他们的方言习惯拼写。对他们来说,所读即所写,他们只需要掌握新壮文的字母拼读,就可以流利书写和使用新壮文,就像最开始那些拉丁化提倡者设想的一样。

意外的是,现在的双桥镇鲜见壮文,居民们还在说着壮语,但除了区人民政府、农业技术推广站等机关的双语招牌,我们找不到民间使用新壮文的迹象,公开场合里壮文的出现频率低于南宁。

立于2014年的新碑保留了烈士名的原写法

我们在双桥唯一一次见到方块壮字,是在进入双桥镇的路边。在一块立于1953年的烈士纪念碑上,烈士的名字仍然用方块壮字书写。

于是,我们的下一个目的地选在壮族比例最高、99.7%的人口为壮族、被称作“壮乡中的壮乡”的地方——靖西市。

靖西

◇◆◇

通往靖西的高速公路平整顺直,两边桂南喀斯特地貌中锥形石灰岩山连绵不断,山间的小块平地上,刚樵好的稻田里铺满了黄色秸秆。路边散布的小村庄,传统的壮族房屋已属少数,多数房屋和内地新修的农民房并无二致。

高速公路上的路牌才透出边境特色。在“靖西/Jingxi”的汉字和拼音路牌上,还有一行陌生的文字:Tĩnh Tây。我兴奋地问郑子宁这是不是新壮文,开车的他扫了一眼。

“越南文。”他极肯定地说。

下高速后则是几公里的宽阔大道,这里的道路命名颇有特色。比如,我们走的这条名为绣球大道,两边的路灯都修成了绣球形。远处是壮锦大道,左拐是通灵大道。绣球与壮锦是靖西的特色民族手工,在绣球大道尽头,一个名为“锦绣小镇”的旅游地产项目正在修建。据说,这里将成为全国第二个壮族特色古镇旅游区。

进入靖西城区,宣传品上的“民族风情”就不明显了。表面看,靖西县城和任何一个缺乏规划的岭南小城差不多。弯曲如迷宫的巷弄,仍维持着旧时的格局,水泥房拔地而起,让小巷显得更加逼仄。昏暗的光照下,服装店、粉店、杂货店鳞次栉比。

在城市新开发的商业中心附近,Oppo和Vivo比邻而居,肯德基(KFC)和欢乐堡(LFC)跨街相望——后者生意似乎还更好些。不远处,烤玉米摊上三五个市民边烤着玉米,边用壮语聊天,随处可见的烤玉米摊也是靖西一大特色。

人口几乎全为壮族的靖西是全广西壮语最强势的地方。在广西很多地方,县城甚至乡镇都说汉语,只有乡村才是壮语的天下。然而,壮语在靖西全城通行无阻。1980年代,靖西出生的语言学家郑贻青说,靖西是方块壮字使用最广的县之一,歌本、剧本、巫经自然用方块壮字书写,就连契约、乡约乃至报纸,也有使用方块壮字的,甚至当时在靖西机关工作的汉人,多数也通晓壮语。

今天的靖西仍然是个壮语的世界,街头四顾,几乎所有成年人说的都是壮语,饭店店家看到我们进店,自然地用壮语询问想吃什么,见我们毫无反应才改说汉语。

然而,这个壮语世界现在也难觅壮字的踪影。按常理,壮剧团所使用的剧本是壮字的重要载体,不过如所有地方戏一样,靖西壮剧团由于缺乏观众,在城里演出的场次已经不多。位于市中心的壮剧团冷冷清清,看不出有活动排练的痕迹,临街的一面楼已经租给了奶茶铺、健身房和学生兴趣培训班,楼里小孩的吵闹声和几米外寂静的壮剧团大院仿佛是两个世界。在壮剧团寻找壮字的计划就此搁浅。

离壮剧团几百米远,是中国最重要的壮锦生产地之一,靖西壮锦厂。这些锦线拼出的美丽图案,让壮锦成为中国唯一出自边疆地区的四大名锦,我们想再去那里碰碰运气。

壮锦店的老板娘热情介绍各色各样的漂亮壮锦。“这些壮锦有没有壮字图案的?”我们问。

“什么?”

在反复尝试了方块壮字的各种名字,如“土字”、“壮族的文字”、“当地字”乃至壮语的“SAWNDIP”后,老板娘仍然如坠云雾,最后我们说:“就是那种方块字。”

“哦,方块子啊,这些都是啊,你们旁边的就是。正方的、菱形的、长方的都有。”她的手指向了印着几何图形的壮锦。

几经寻访后,我们在靖西市文化馆找到了方块壮字的踪迹。

在靖西市中心的中山公园里,引吭高歌的市民多得让公园里回荡着微妙的和声。这些歌和内地任何一座广场上唱的并无区别,几乎全是流行歌或者红歌。但是在公园边沿的文化馆里,我们听到了若有若无的壮族山歌声。

这是当地的业余山歌团,他们正在排练一首歌颂近年靖西发展的山歌,方块壮字写成的歌词显然是最近的,中间有十九大内容。作词者是山歌团的韦老先生。他本来是当地的老师,退休前没有接触过方块壮字,退休后在家里闲得无聊开始对壮族山歌感兴趣,只花了两个月时间就掌握了当地方块字的写法。山歌团的老头老太多是退休后开始练习山歌,我们到访时,几乎人手一本韦老先生创作的歌本,对于学过汉文的人来说,掌握当地的方块壮字很简单。

我们问起韦老先生为什么不用拼音壮文,他的回答非常直率:“看都看不懂。”显然,对于说南部壮语的靖西人来说,拼音壮文并没有实现其初衷——让壮人学会标准壮语。

多次受挫后,我们决定以山歌为寻访的新目标,广西唱山歌最有名的是百色市平果县,我们听说那里每天都有人在公园里唱山歌。

平果

◇◆◇

到达平果的江滨公园是下午1点,右江在这里呈“几”字形向南流向南宁。公园对面开着一家书法培训班,它旁边和对面分别是台湾手抓饼店和粉店。我们问书法班老师,会不会写方块壮字,或者哪里有会写方块壮字的老人,他的反应和靖西壮锦店老板娘差不多——没听说过。

江滨公园门口,老人们聚集成群,打牌,或者下一种半覆盖棋面的象棋。公园正对面的大招牌上写着:“你和丈母娘之间的距离,只差一套房,没有,你只能喊阿姨!”

但历史上,壮族的婚娶并不是有房就能喊丈母娘。广西素有“歌海”的盛名。壮族人擅长山歌,山歌以壮语演唱,以壮字书写歌词,在壮族老人的回忆中,经常提到自己在十六七岁的时候,跟着村中的歌王用壮字歌本学习山歌,只有在山歌对歌中脱颖而出,才会受到异性的青睐。

写着方块壮字的歌本

在河边栏杆旁,我们看到四个老人坐在台阶上唱歌,两男两女,男人拿着写着方块壮字的歌本——这是我们第一次在日常生活中见到普通人使用方块壮字。老人们说:自己刚刚把孙子送到学校,唱完歌还要去接小孩放学。唱完一首,他们掏出包里的金科手机,点开“多媒体”,原来他们在边唱边录。

歌声隐约传来,我们沿着河往前走,见到了这次寻访最为震撼的一幕:

在公园中央,数十个壮族老人每四人一组,坐在草地、石凳、台阶和地上,用壮语唱歌。他们都是两对男女为一组,两个男人先唱主歌,然后两个女人应和。每一组老人都拿着一个歌本,上面写满了方块壮字。唱歌时几乎都是男人手持,边看边唱,女人基本不看歌本。

多数歌曲的旋律并不复杂。基本都是男女对歌为一小节,唱完一小节后,双方会以同样的顺序和旋律,换一种填词,循环歌唱。有的组合和声技巧更为复杂高超,一个男人先起头,另一个男人用较低的声调唱和声,然后两个女人再用更高的声调加入。高潮时,四种声音交错盘旋,袅袅不绝。中国古代传统音乐鲜有和声,壮族却极具音乐天赋和热情,另一个近年来广为人知的民族和声也是来自于广西——侗族大歌。

说是江滨公园,其实就是沿着右江的一小片狭长的树林和草地,公园另一侧就是喧闹的马路和隔街相望的餐厅、烧烤店。这些壮族老人们正对着马路放声高歌,身后便是青色的右江和群山,他们毫无羞怯,无比自然。我们问了几个过往路人,没有人知道他们唱的内容是什么。

平果的江滨公园,壮族老人用壮语唱歌

《右江日报》记者罗慧芳报道过百色市德保县壮人,一生“几乎都在歌声中度过”,“遇事必歌、逢场必唱”,出生有“三朝歌”、“满月歌”、“背带歌”,成年时代有“岁时农事歌”、“恋情婚仪歌”,老年听“祝寿歌”。“其中的情歌独具特色,有一首十来句的排歌,在同一首歌里,后奇句常重复前偶句的1至6字,形成连环式的复沓叠唱,有情深缠绵之感。”报道中写道,“有歌圩必设擂台赛歌,县内外的歌手像朝圣般从四面八方涌向歌场,皆为对歌而来,较大的歌圩延续二三天才结束。”

年轻人

◇◆◇

由于种种原因,汉字简化、汉字拼音化的政策一一中止,但作为拼音化试点的壮文,改革似乎仍未成熟。民间仍然使用的方块壮字缺乏规范,使用范围日渐萎缩。官方推广的拼音壮文,还局限于法例要求的场合和牌匾。

1980年代,为了适应计算机技术,新壮文又经历了一次改革。为了与计算机编码技术接轨,壮文拉丁化成了26个字母。

但仍然有人试图把壮文拉回到现代日常生活中来。在湛江,我们见到了陈永聪,他外表文静,不善言辞,是国际标准化组织(ISO)表意文字小组(IEC)的个人成员,这个小组的目的是编码所有表意文字,包括汉字、壮字、越南喃字等所有方块文字。他接触到壮文是“因为湛江话本身就有很多跟壮文一样的字”,他住在家里,凭着自己的兴趣参与着方块壮字的编码工作,目的便是让人们以后在手机上也能输入壮字。

这些文字被陈永聪和他的同事们确定编码后,就会提交给ISO,再收入ISO/IEC 10646字符集,最后由字体公司绘制,人们就可以在电脑和手机上输入这些字了。从某种意义上讲,陈永聪和他的同事们决定了哪些方块字,能够在我们的手机上打出来。

大多数时候,我们并不会感受到“无法输入”的烦恼,因为现在通用的汉字早已被编码收录。一个比较有名的例外是广州西塱地铁站,这一站始建于1997年,但“塱”字没有被收录到当时的字符集里,所以只能以“西郎”代称。等到”塱”字被收录到新字符集,原本因为“塱”无法输入而代以”郎”字的店面、站牌都改回了“西塱”。但地铁站改名因为牵涉众多方面,始终未果,所以,现在在同一个地方同时存在着“西朗”地铁站和“西塱”公交车站。结果是,查地图时,地铁和公交车站需要分别使用这两个字。而建站较晚的佛山地铁“礌岗”站,就由于当时“礌”字已被收录而顺利对接。

但是对于壮字来说,之前并没有人将它们编码收录,它们只停留于手抄本中。想要收录方块壮字,首先面临的困难便是,一个壮字有那么多写法,究竟哪个才能作为正体。陈永聪的工作,便是筛选出那些“被学者认可的、字形简单的、不那么怪异的”壮字。广西大学的林亦教授就在做常用方块壮字字表,筛选出最常用的方块壮字,再配上新壮文作为标准读音。

除了中国,英国、美国、越南都有人在从事这项工作。国外的汉学研究和地名标注要用到方块壮字,但筛选只是最初的工作,一批新字征集、定稿,得花四五年才能使用。

去年,林亦提交了壮字研究部分的文件,编码部分还没有完成时,她发了个信息给陈永聪,“背了六年的包袱终于放下来了。”从2006年到现在,林亦和陈永聪们一共交了两批壮字字表,已经有1621个壮字进入国际标准,这1621个方块壮字可以在电脑、手机上打出来了。但要把现在筛选出的所有壮字编入,起码还需要十年。

本文首发于南方人物周刊第544期

文 / 特约撰稿 郑子宁 陈楚汉

发自广西南宁、靖西、平果

编辑 / 周建平 rwzkjpz@163.com

加载全文
版权声明:未经许可禁止以任何形式转载
热门评论
快来抢沙发

    继续阅读
    还没看够?打开南方+看看吧
    立即打开