历史

计算模拟历史

以前闲着无聊的时候曾经做过一个《资治通鉴》的字频统计,单以频率计,中国历史不过是“王”与“人”,“义”与“忠”,“将军”与“刺史”,“长安”与“洛阳”。

既然有了频率,自然也就有了概率和条件概率。根据条件概率,当给出一个序列的字词后,预测下一个字词是什么,就变成了一个简单的最大似然估计问题。如果觉得这个序列太长,计算起来太麻烦,可以假设简化的马尔科夫结构,譬如假设下一个词的概率取决与之前的n个词而不是整个序列,这基本上就是计算语言学里的 n-gram 算法了。

所以我们可以用《资治通鉴》作为语料得出经验条件概率,然后来随机模拟出历史文本,产生原汁原味(至少是统计意义上的)史书 (技术细节见附录)。 虽然这只是文字游戏,但是仍然能从概率上看出《资治通鉴》记述的历史中,最容易重现怎样的事件。

譬如下面这则 (random seed = 2000):

撰 刘 崇 俊 以 惟 岳 又 从 入 关 , 宣 等 从 太 子 也 , 惧 履 危 亡 之 事 , 发 步 骑 二 十 骑 自 北 至 北 寺 狱 , 竟 不 使 宗 庙 社 稷 。 宗 元 为 柳 州 司 马 。 坚 大 怒 , 士 气 彫 沮 , 无 事 , 更 为 后 拒 , 倍 急 于 亡 命 聚 众 二 万 会 麻 秋 、 姚 、 宋 赤 眉 将 逢 安 为 新 都 , 剽 掠 。

我们可以这样翻译:

刘崇俊因为惟岳(人名,可能是李惟岳。刘崇俊是五代人,李惟岳是晚唐人,相差不算太远)一起入关(姑且认为是潼关,但是李惟岳在和河北,真实历史是不会入关的),而宣(人名)等人却追随太子而去,害怕这是危亡社稷的事情,于是发步骑二十骑(区区二十骑!估计是武林高手),从北面到北寺狱(这是东汉时候黄门署属下的监狱,鞫禁将相大臣的,好吧,晚唐也有宦官之祸,这里东汉的宦官乱入了,不过二十骑到北寺狱,难道是要劫狱?),最终也没有拜谒宗庙(不把皇帝放在眼中啊)。

柳宗元被任命为柳州司马(二王八司马嘛,承接上文,还是和阉祸有关)。

(某)坚大怒(不知道是孙坚?苻坚?杨坚?),士气不振,好在也没有什么大事,继续抗拒(王师?)。 因急于亡命,聚众两万人与麻秋汇合(麻秋登场,那么坚应该是苻坚了,但是麻秋很早就被苻坚的伯伯苻健杀死了)。

(与此同时)姚、宋(姚崇,宋璟?)率领赤眉军把逢安(这个地名是自动产生的,历史上似乎没有,权且当作是四川 蓬安 吧)作为新的都城,四处剽掠。

我们来梳理一下这段模拟历史的脉络:

这大概是一个王朝末年的乱象。 地方农民起义(赤眉),建立政权(所以有新都),负责讨伐的将领反而形成军阀割据,一些军阀随权臣(刘崇俊)入京,干预朝政(惟岳),一些军阀在地方反叛(坚),勾结外敌(麻秋是羯族人)。这一切的原因可能是因为朝廷宦官弄权已久(北寺狱),忠良被贬(柳宗元)。 军阀入京大概是打着清除宦官的名义(所以要发兵北寺狱),但是同时他们也不把社稷放在眼里。 京城在军阀到来前似乎已经被反贼攻克,所以皇帝和太子分道逃亡。如今皇帝似乎已经回到京城,而太子却还在外面招兵买马(宣等人追随),似乎有不臣之心。

简而言之: 中央朝政腐败,宦官专政,两宫不和。地方盗贼风起,军阀割据,外患不断。

难道这就是随机生成的中国历史最典型的场景? :-)

附录

文中使用的通鉴文本是从维普网上下载的,做了一些简单的清理,上传到了百度云(链接)。 为了避免古文分词的麻烦,在作 n-gram 的时候以字为单位,所以用 gsub 在每个字的后面加入空格。 n-gram 选择 n=2.

 library(ngram)        
 file<-"C:/Users/Zeng/Downloads/zztj.txt"     
 str=scan(file,"character",encoding="GB2312")      
 s = concat(str)      
 s = gsub("(.)", "\\1 ", s)         
 ng = ngram(s, 2)  
 o = babble(ng, 100,seed=2000)  
 Encoding(o)<-"UTF-8"  
 o  
Blog分类: 

脍炙《通鉴》

(这是一篇关于很枯燥的技术,很枯燥的历史文本,和不太枯燥的统计的 blog)

看过一篇关于《全宋词》词频统计文章,挺有趣的,想用类似的方法处理一下《资治通鉴》,所以就趁周末花了几个小时作了一下。

词是长短句,统计两个字组成的词频比较合适,《通鉴》是古文,文字结构不同,所以我统计了单字频,两字词词频,三字词词频,四字词词频,和五字词词频。同时也记录各个统计单位(字或词)出现的卷数。《通鉴》294卷,从三家分晋到五代结束共共1362年,所以卷数可以作为时间的度量。

《全宋词》的词频是用 R 作的。R 虽然是不错的统计软件,也是我的最爱之一,但是 R 并不适合作文本分析,更不适合来作数据库操作。所以就用了 C# 和 Kdb +3.0。 C# 用来分析文本,.Net 是懒人的福音,并且多线程运算非常简单,能够大大提升文本处理速度,Kdb+用来储存数据,它差不多是性能最好的 in-memory 数据库了,从它的网站上能下载到免费版本。这个分析里数据库是重头戏,因为需要查询数百万行的数据 row,如果用 MySQL,估计会龟速到死。另外 Kdb + 本身只有 300多K,不用安装,很方便。还有就是 Kdb+ 的 Q 语言也能满足编程需要。

Kdb+ 的网站提供了各种语言 API 的源码,C# 的 API 不支持多线程,所以需要在适当的地方加锁。Kdb 唯一的问题是不支持 UTF-8。它用的是 UTF-7,所以在注入中文文字数据的时候可能会出现乱码,为了省事,从 C# 里 publish 数据的时候,直接 publish 为三字节的 int[] 了。query kdb 时用了一个免费的 GUI QPad。QPad 似乎是用 Java 写的,它的编码默认是 UTF-8,所以在 query  Kdb 的时候直接把三字节的 int vector  cast 成 char,在 QPad 里显示的就是中文了,所以也很方便。

产生数据的 C# 代码非常简单,发布数据的时候自动生成 Kdb 的 schema。使用的《资治通鉴》的文本是网上广为流传的国学网简体版,在生成数据前,先用 C# 作了预处理,主要是用正则表达式替换掉了现代语言的“污染”(譬如:“后一页”,公元xxx年 等)

下表是各个字、词频的数据量:

类别 数据行数
单字            2,586,329
双字            2,102,023
三字            1,633,875
四字            1,221,713
五字                851,403

从上表看,《资治通鉴》应该有近两百六十万字。

单字的字频统计如下:

排名 次数 百分比 累积百分比 
1 66087 2.56% 2.56%
2 39874 1.54% 4.10%
3 35677 1.38% 5.48%
4 34376 1.33% 6.81%
5 21578 0.83% 7.64%
6 21279 0.82% 8.46%
7 20182 0.78% 9.24%
8 20100 0.78% 10.02%
9 19035 0.74% 10.76%
10 18209 0.70% 11.46%
11 18083 0.70% 12.16%
12 使 17160 0.66% 12.82%
13 16116 0.62% 13.45%
14 16031 0.62% 14.07%
15 15600 0.60% 14.67%
16 15558 0.60% 15.27%
17 15252 0.59% 15.86%
18 14746 0.57% 16.43%
19 12826 0.50% 16.93%
20 12536 0.48% 17.41%

“之”字当之无愧的排在了第一位。第一个非虚词是“王”,它包含了姓和爵位,第一个动词是“曰”。“人”的频率也很高,“将”,“军” 在双字词频中也会遇到。“帝”字排名32,“后”字排名33。但是因为是简体字,“后”并不专指皇\王后。

下面是价值观念的排名:

排名 次数 百分比
152 3507 0.14%
181 3004 0.12%
223 2475 0.10%
240 2287 0.09%
253 2190 0.08%
294 1935 0.07%
767 694 0.03%

义、忠、孝排名在前,智排名最后,倒正印证了司马温公那句话:“凡取人之术,苟不得圣人、君子而与之,与其得小人,不若得愚人。”当然这个数据里噪音很多。

另外还有很多有趣的东西,就不一一叙述了。下面看一下两个字的词频:

排名 最早卷数 次数 百分比
            1 将军 1             6,176 0.29%
            2 刺史 21             4,790 0.23%
            3 州刺 21             4,110 0.20%
            4 节度 29             3,698 0.18%
            5 以为 1             3,479 0.17%
            6 度使 203             3,202 0.15%
            7 天下 1             2,972 0.14%
            8 尚书 20             2,742 0.13%
            9 太子 1             2,584 0.12%
          10 陛下 6             2,492 0.12%
          11 不能 1             2,375 0.11%
          12 不可 1             2,351 0.11%
          13 太后 3             2,165 0.10%
          14 皇帝 6             2,050 0.10%
          15 太守 5             2,010 0.10%
          16 大将 6             1,813 0.09%
          17 遣使 4             1,501 0.07%
          18 司马 1             1,480 0.07%
          19 二月 4             1,477 0.07%
          20 馀人 2             1,463 0.07%

“将军”出现的频率最高,在第一卷里就出现了,“度史”显然是“节度使”里出现的,虽然在203卷才出现,但是它居然出现了3202次,唉,唐朝啊!“节度”一次出现的要比“节度使”早。“皇帝”一次最早在第6卷出现,其实那时还是昭襄王元年,但是因为文本中出现了“秦始皇帝上”。

两字地名出现的最多的是“长安”,排名43,最早出现在第5卷,不过那里的“长安”并不是长安城,而是赵国的长安君。“洛阳”其次,排名81,最早出现在第2卷,三家分晋不久,洛阳附近就成了三晋与秦国的战场。

三个字的词频:

排名 最早卷数 次数 百分比
1 州刺史 21 4102 0.25%
2 节度使 210 3195 0.20%
3 大将军 6 1547 0.09%
4 平章事 203 933 0.06%
5 同平章 203 901 0.06%
6 十二月 4 704 0.04%
7 之子也 13 700 0.04%
8 十一月 7 686 0.04%
9 部尚书 70 655 0.04%
10 指挥使 254 578 0.04%

比较有趣的是“之子也”,老子英雄儿好汉。

四字字频:

排名 最早卷数 次数 百分比
1 同平章事 203 900 0.07%
2 仪同三司 49 403 0.03%
3 都指挥使 254 374 0.03%
4 日有食之 1 368 0.03%
5 中书侍郎 73 325 0.03%
6 节度使李 217 312 0.03%
7 散骑常侍 69 308 0.03%
8 开府仪同 79 300 0.02%
9 府仪同三 79 283 0.02%
10 御史大夫 9 281 0.02%

鉴于“州刺史”在三字字频中频繁出现,所以频率出现比较高的各个州刺史的频率单列出来:

排名 最早卷数 次数 百分比
15 豫州刺史 58 220 0.02%
19 荆州刺史 49 195 0.02%
26 兗州刺史 37 172 0.01%
32 徐州刺史 30 167 0.01%
38 扬州刺史 24 152 0.01%
42 雍州刺史 65 147 0.01%
52 江州刺史 86 122 0.01%
64 益州刺史 39 113 0.01%
68 二州刺史 49 111 0.01%
74 秦州刺史 79 109 0.01%
101 青州刺史 21 91 0.01%
105 梁州刺史 84 90 0.01%
107 冀州刺史 27 88 0.01%
114 并州刺史 52 84 0.01%
135 凉州刺史 31 71 0.01%
165 幽州刺史 50 62 0.01%
196 广州刺史 80 55 0.00%

豫州刺史第58卷时才登场,但是雄踞第一,而豫、荆、兖、徐、扬也勾勒出了中国政治地理的热点。顺便提一句,最早登场的豫州刺史是王允,而最早登场的荆州刺史是杨震。

五字词已经没有太大的意义:

排名 最早卷数 次数 百分比
               1 府仪同三司 79 283 0.03%
               2 开府仪同三 79 283 0.03%
               3 尚书左仆射 77 167 0.02%
               4 皇帝上之下 10 140 0.02%
               5 为中书侍郎 84 118 0.01%
               6 尚书右仆射 81 115 0.01%
               7 军都指挥使 256 111 0.01%
               8 骠骑大将军 39 107 0.01%
               9 河东节度使 214 101 0.01%
            10 督中外诸军 74 97 0.01%

最后看看慕容家的英杰们谁的全名被提到的次数最多:

次数
慕容彦超 27
慕容垂 26
慕容廆 24
慕容绍宗 15
慕容恪 18
慕容评 18
慕容皝 17
慕容农 15
慕容翰 15
慕容仁 12
慕容白曜 10

似乎是慕容彦超险胜慕容垂……慢着!慕容垂最初的名字是慕容霸,而慕容霸被提及了10次,所以慕容垂以 36 次远远胜出 (慕容缺这个全名并没有出现在《通鉴》中:))。

Blog分类: 

寒食·算术

今天做计算的时候突然想到的一个问题:

  1. 传统上,寒食是冬至后105天,在 Excel 里算了一下,所以寒食应该是今天 4月5日;
  2. 传统上,寒食在清明前一天或者两天;
  3. 今年清明是 4月4 日;

所以就有了矛盾,今年的寒食在清明之后。白天没功夫儿细想,现在才想明白其中缘由:古代用平气,现在(从清代开始)用定气,所以定气导致清明节离冬至的距离缩短,以至于清明和寒食的时间错位。

中国古代的历法是阴阳历,一年的长度大约等于一个回归年。在清代以前,节气是以冬至为起点、二十四等分回归年来确定的。所以清明在冬至后 365.25/24*7 = 106.53 天,根据冬至的具体时刻,这个数字折合成天数,可以是冬至后106天或者107天,寒食在冬至后105天,所以正好是清明前1天或者2天。同时因为12个朔望月的长度短于一个回归年的长度,所以使用平气,也可以确定闰月,凡是没有中气的月份就是上个月的闰月,这样一来差不多十九年有七闰,协调了朔望月与回归年之间的矛盾。

南北朝的时候,古人发现太阳的视运动不均匀(地球的轨道是椭圆的),因此隋代的刘焯在《皇极历》里把周天二十四等分,太阳每行 360/24 = 15 度,就是一个节气,这样得到的节气是定气,两个节气之间相隔的日子是不等的。但是因为定气一般都用在历法的计算中,民间一直用等分回归年的平气,所以寒食始终在清明前一天或者两天。

清初废明代《大统历》,使用《时宪历》,在民用历法中也用定气,所以自清初起,寒食与清明的位置就颠倒了。计算了最近十几年清明和冬至的精确时间差,平均是 104.1537 天,最大104.1646天,最小 104.1458 天,所以自清初开始,寒食要么和清明同一天,要么比清明晚一天:)

Blog分类: 

茶荒

T25PmfXaRbXXXXXXXX_!!383390319

眨眼到清明,又是每年“茶荒”的日子了。(清)明前,(谷)雨前,是出新茶的日子,去年的茶喝到现在,差不多要见底儿了,从二月初到现在,就只能参杂着陈茶数日子。

纽约虽大,却着实找不到一个能买到好茶叶的地方。唐人街的茶叶铺绿茶似乎只卖龙井,并且还是陈了若干年的龙井。饮茶就是饮故乡水土,生不在江南,自然喝不惯江南茶,更别说江南陈茶了。

所以试过在网上买茶,但是却屡屡失望。网茶大多迎合美国市场。而美国人对于“茶”也许有不同的概念,虽然近些年了颇有饮茶的风气,星巴克的小黑板上也不断的写着各种加了或是不加糖、奶、香料的茶,但是那个也许只是产在相同或者相近的一种植物上的叶子而已,和真正的茶相去太远。(八卦一则:1762年现代生物学分类命名的奠基人林奈曾把茶树分为红茶种和绿茶种 –_- )

原来茶荒的时候也试过日本茶。从某种意义上说,日本的很多文化是中国文化的化石。就像一个 version control 系统下 branch 出去而又没有再 re-integrate 的一个发展分支一样。既保留了中国某个历史时期文化的残存,又被他们改的面目全非,譬如抹茶。中国明代以前是饮茶的习惯大致和日本的抹茶相似:先将茶饼碾碎成茶粉,然后烧水,水初沸的时候冲茶碗,大沸以后,加几匙冷水,然后冲茶粉,为了让茶粉和水混合均匀,需要用到“茶筅”—— 现在你要是直接搜索“茶筅”,出来的肯定是一串儿日语的结果,因为现在日本抹茶还在用,中国已经不用了。当然日本从茶叶到茶道都做了有日本特色的改进,中国古代的点茶,茶色贵白,所以黄庭坚比之为“琼蕊”。而抹茶反而崇尚浑浊的绿了。

中国人更改饮茶习惯源自朱元璋:

国初四方贡茶,以建宁阳羡为上,犹仍宋制,碾而揉之,为大小龙团。洪武二十四年九月,上以重劳民力,罢造团茶,惟采茶芽以进。其品有四:曰探春、先春、次春、紫笋。…… 按茶加香物,捣为细末,已失真味…… 今人惟取初萌之精,汲泉置鼎,一瀹便饮,遂开千古茗饮之宗,不知我太祖实首辟此法。陆羽有灵,必俯首服。蔡君谟在地下,亦咋舌退矣。—明· 沈德符 · 《野获篇补遗》

“茶加香物,捣为细末,已失真味。” 就像我们已经在运行 茶7.0 ,而日本还在继续改进 茶3.1。当然,升级也不一定都是进步。

也是因为饮茶习惯的改变,茶具也发生了变化,明以前特别是宋时因为点茶汤白,所以用黑色的建盏,明以后瀹茶汤绿,所以要用白色的宣瓷。也是因此,原来和朋友聊起过《红楼梦》里妙玉同学用的古董茶具其实并没有太大的意义。当然也可能是曹大叔别有深意,大叔的心都是复杂纤细的(出自某集《银魂》)。

瞎贫了这么多,都是茶荒闹的,就像大叔冯谖靠在柱子上弹着剑唱:“长铗归来乎!食无鱼。” :)

Blog分类: 

辫子、胡桃夹子和黄道周

SAMSUNG            上周周末晚上去林肯中心看芭蕾舞《胡桃夹子》,本来是圣诞节的剧目,图个热闹高兴,但是第二幕在 Land of Sweets 中出现的三个中国人模样的角色确实让人觉得怪异。一男两女。男的戴着斗笠留着辫子,让人想到晚清时西方人对于中国人的 stereotype —— 又想到,在京剧的剧目中,但凡是牵扯到西方或者北方的“番邦”角色,他们的打扮也多是一副满人的辫子装束,譬如《大登殿》、《四郎探母》等等,所以犹为觉得辫子刺眼 —— 我们用来戏谑番邦的装束却又被被人强加在了我们自己身上,不舒服之余,又觉得有些 ironic ...

早一些时候去大都会博物馆看了“十七世纪中国政治异见者艺术展”,其实就是黄道周、八大山人、石涛、洪仁等人的书画展。特别是黄道周,书画造诣都很高。并且就道德而言,黄道周被乾隆称为“一代完人”。但是不敬的想一下:黄道周和后来成了贰臣、“道德很有问题”的洪承畴相比,在崇祯帝吊死煤山前,究竟谁对明朝贡献更大?

黄道周和洪承畴都是闽南人,都是进士出身。黄道周大概算是理想主义者,对于朝政多有不满,不能见容于朝臣,所以一共在朝廷为官的日子也没有多久,并且主动或者被动的不断被牵扯入东林党人的党争。而洪承畴的大多数时间都忙碌在镇压农民起义上。

杨嗣昌被崇祯皇帝任命为兵部尚书,黄道周和洪承畴对此都有异议。黄道周主要是在争两点:一 为天下纲常,也就是杨嗣昌夺情之事,二为边防大计,是杨嗣昌与后金媾和。洪承畴的异议主要在于杨嗣成不合乎实际的镇压农民军的方案,认为他所谓“三月”灭贼只是大话。

黄道周积极反对杨嗣昌,平台召对之后被连贬六级,离开了朝廷;洪承畴虽然深知杨嗣成的计划不切实际,但只是私下里尽量消除杨嗣昌计划的不利之处,后来大破李自成,几乎完成了对李闯的镇压……

黄宗周被贬似乎对于明朝没有太大的影响,但是洪承畴的投降却给了明朝沉重的一击 —— 才有了后来的辫子。

有时历史也挺 ironic 的,让人忍不住想,明朝的这些完臣到底是对于明朝有怎样的影响,譬如和黄道周写入同一列传的刘宗周,在南明风雨飘摇之际,一会儿上奏说要斩这个,斩那个,似乎能不能斩、该不该斩都不必要,只要“可斩也”三个字便足以昭显自己的正气凛然。读书至此,总让人觉得似乎大敌压前,当务之急不是任何实际的御敌之道,而是如何才能成就个人的完美与道德 …… 不知道这算不算不道德。

而对于黄道周,最后一个 ironic 之处在于尽管他坦言要效仿魏征:“臣愿为良臣,毋为忠臣”,但是最终他却成了忠臣而不是良臣。

Blog分类: 

大登殿

1166672953

中午吃饭听了一会儿戏,管波、李胜素和于魁智的《大登殿》,讲的是薛平贵打进了长安城,封赏王宝钏和代战公主的故事。突然想到,京剧里代战公主的装扮是满人贵妇摸样,虽然代战公主是个俏皮可爱的角色(据说尚小云演的最好,可惜搜索了一下,只找到尚小云《武家坡》里演的王宝钏),但是戏词里不乏对代战公主和她的西凉国的揶揄之词,譬如马达说西凉国女子行礼:

到了咱们那国行礼,是山东老爷开宝,大敞门。

而说起中原女子行礼(万福礼),紧上加紧,代战公主很天然呆的说:

哟,那不成了兔捣碓了嘛

一旁的江海接到:

不捣碓,八月十五不给您月饼吃

这不正是把代战公主比作了兔子么?-_-||| 《大登殿》这戏来自于清代乱弹《红鬃烈马》,清末应该就有了吧,京剧早期和程长庚、余三胜齐名老生张二奎就唱过薛平贵。

其实不只《大登殿》,《四郎探母》、《雁门关》里的辽人也是满人打扮(譬如铁镜公主),并且番邦女子一贯的耍宝逗趣。

呵呵,所以晚清真是变了啊,想雍正那会儿,翰林徐骏因为在奏章上笔误,把陛下,误写为“狴”下,又在诗中有“清风不识字,何得乱翻书”一语,就被雍正帝认为是讥讽满人不识字而就掉了脑袋。到了清末, 满人“不捣碓,八月十五不给您月饼吃”也无妨了,呵呵。

Blog分类: 
Free Tags: 

教皇· 伶人

'Absolute Monarchs -  A History of the Papacy' By JOHN JULIUS NORWIC

前阵子早上挤地铁的时候一直在看 Absolute Monarchs: A History of the Papacy,从 Android 的 Google Book 上下载的免费预览,只能看前四章。被这本书的名字吸引主要是因为 Perry Anderson 的巨著 Lineages of the Absolutist State。Absolutism 的兴起是欧洲 17 到 18 世纪的事情了,所以很好奇可以追溯到公元初的教皇如何是 absolute  monarch。但是就能免费读到的四章而言,没有任何关于 absolutism 的讨论, 倒是有教皇和教会的不少八卦,譬如早期教会的某位长老(presbyter)是一名太监,同时还掌管着罗马皇帝康茂德(Commodus)的后宫。当然也有一些其它比较有趣的事情,譬如在基督教的早期,东部教会关于教义曾有数次比较大的辩论,而此时以罗马为中心的西部教会却并未积极参与(例如第一次尼西亚会议),除了地理上原因外,另一个主要原因是当时的拉丁文语言词汇不如希腊文那么丰富,许多语言上的细微差别无法在拉丁文中体现出来。

可能原来是学外交的缘故,对于这类语言的细微差异总是很感兴趣,因为对于国家而言,语言上的细微差别可能是一场战争的诱因之一,譬如鸦片战争。第二次鸦片战争结束缔结的《中英天津条约》,其中第五十一款:

嗣后各式公文,无论京外,内叙大英国官民,自不得提书字。

哥伦比亚大学刘禾教授所著的 The Clash of Empires: the Invention of China in Modern World Making 对于“夷”字翻译导致的中英冲突有详细的考证。“夷”字的英译,该在 foreigner 与 barbarian 之间,但是英语中无法用一个词准确的与“夷”对等以至于后来简单的把夷与 barbarian 划上等号,导致争端不断(当然这也不纯粹是翻译的问题,古语云,欲加之罪,何患无辞)。其实,如果“夷”字是 barbarian 的话,那么《孟子·离娄》中的这句话该怎么翻译?

孟子曰:“舜生于诸冯,迁于负夏,卒于鸣条,东之人也。文王生于岐周,卒于毕郢,西之人也。

不仅是在过去,即便是现在,仍有这样的问题,记得原来上课时仔细讨论过公报中 recognize 和 acknowledge 的差别,两者翻译成汉语都可以翻成“承认”,但是英语本身的差异就消失了。

然后免费的前四章就读完了,由于保持着念博士时的“优良传统”—— 只看书不买书 (可惜现在没有图书馆了),所以“专制”教皇的故事就只能读到公元六世纪末的 Gregory the Great 。

然后只能翻手机上的存书。所以又翻开了章诒和的《伶人往事》,因为这是一本很不错的地铁读本,故事都比较短(除了马连良那一章),适合10分钟时间的阅读,有始有终。以前读过几遍,注意的多是八卦掌故等叙述性的部分,这次再读,仔细看了作者的一些议论。

既是“往事”,所以感慨大多怀旧,或者厚古薄今。前后翻阅,又觉得作者逻辑难以自洽,比如她感慨现在的剧坛处处可见官、商的影子,但是旧时代的剧坛又何尝不是?其实作者应该乐见官、商捧出来的剧坛(就像四大名旦之所以成为四大名旦与背后捧的人密不可分一样),因为她本人是不喜欢“人民的剧坛”的(建国后对于戏剧文化的一系列改革)。

又好比作者感慨现在没有堪比旧时代的戏剧大家了,其实这也未尝不是一件好事 —— 说明普通人的选择多了,不必被某种职业所禁锢。要知道倡、优与隶、卒在古代都是地位远低于士农工商的贱民(也就是入贱籍的人),往往世代相传,不能变更,出身乐户,就不得不作一辈子的乐工倡优。所以身隶贱籍,唯一能有所改变的,就只有做好一行,以希望能得到上层人士的青睐(譬如唐明皇,李后主,后唐庄宗这样的人物)。后来虽然雍正帝“开豁为良”,革除了各地贱籍,令其改业为良,但是正如《伶人往事》中所记录的,很多人其实也只有到了走投无路才去做伶人,因为社会习惯上的偏见是根深蒂固的。倘使程砚秋有别的选择,估计他也不一定再选择梨园行,就像程砚秋成名后发誓不让自己的儿女再入学戏一样——后来也确实如此,程砚秋三子一女,没有一人入梨园。当然确实也有人完全是因为兴趣而唱戏的,譬如过去的那些票友们,但是不同之处仍然是在于这些人是有选择的。所以人们能选择是否演戏是一件好事,像程砚秋这样被棒打出来名角儿,不要也罢(程砚秋在出师前腿就被师父打伤,后来一直到他到欧洲考察戏剧时,才由德国医生手术治好)。

虽然不很赞同作者的一些议论,但是她的叙述部分还是很好看的。特别是一些小掌故,譬如一位叫做陈叔通的 fans 兼好友给程砚秋的信:

再弟尚有一语,兄所得之钱乃血汗得来,股票不可买,不可入股,银号即利厚不可贪,弟意存入中国与兴业两行均可,千万!千万!此中事我较明白,决可负责。

读罢乐而开笑。继续看了他给程砚秋的一些书信:

假如满洲得往演唱,恐亦不能去!此即有名之人不易做人也。

可惜马连良没有一位这样的有远见的挚友! 还有新中国刚成立时的信:

以后不再是挂头牌的时代。

后来戏剧改革时期:

你以后千万对周(扬)、田(汉)、夏(衍)要谦虚,说明要他们指教……

虽只言片语,足见得此人高远。 陈叔通是清末进士,选庶吉士,后来做过商务印书馆的董事和兴业银行的董事。卒于1966年2月17日,正好是《五一六通知》前三个月,享年90岁。

Blog分类: 

嘉庆朝

The_Imperial_Portrait_of_Emperor_Jiaqing2前两天说起清代大臣的谥号,因为太忙没时间,未能尽言,现在有点儿空闲,多说两句。

美谥有点像时尚,流行的原因有时也不太可考,就像后世以为最荣的“文正”,如果找出它成为 No 1 的原因,大概源头还在司马温公那儿。《宋史·司马光传》上说:

夏竦赐谥文正,光言:“此谥之至美者,竦何人,可以当之?”改
文庄。

司马光认为夏竦不能谥文正,而他自己后来又谥文正,大概正是因此,抬高了“文正”的行情。宋人笔记《梁溪漫志》里也提到:

谥之美者极于文正,司马温公尝言之而身得之。国朝以来得此谥者惟公与王沂公、范希文而已,若李司空(昉)、王太尉(旦)皆谥文贞,后以犯仁宗嫌名,世遂呼为文正,其实非本谥也。如张文节、夏文庄始皆欲以文正易名而朝论迄不可,此谥不易得如此,其为厉世之具,深矣。

所以到了清代,一般大臣的谥号,内阁拟定就可以了,唯独“文正”这个谥号必须要皇帝特准,因此清代一共只有八位“文正公”(当然这个数目比起宋代还是算多,正如上面引文所言,宋代有些“文正”的谥号是因为避讳从“文贞”而来的,旧时“贞”、“正”同音,不算真正的文正)。而这八位文正公除了一两位外,大概都未能和宋代的范文正(仲淹)或者司马温公相比,而里面最问题最大的恐怕要数嘉庆、道光两朝的曹振镛了。

中国历史上不乏忠奸良佞之辩,而曹振镛从各个角度来看似乎都不算奸佞之臣:他忠厚、清廉、退让、谨慎。特别是清廉,在乾隆以后贪渎横行的时代,是否清廉几乎成为判定良臣的最重要标准之一。譬如在对待工程的态度上,通常贪官都恨不得皇帝天天大兴土木,以便中饱私囊,而曹振镛却屡次请罢不急工程,撙节糜费。曹振镛是安徽人,世代和盐商有很大的联系,但当朝廷改行淮北票法伤及旧盐商利益时,他也没有护短,而是说“焉有饿死之宰相家?”,支持改革。曹振镛也算是忠厚之人,尽管很多情况下,很难界定圆滑和忠厚,但是他毕竟也没有像传统意义上的权奸一样大肆排挤贤良。

但是正是像曹振镛这样的良臣彻底把清朝拖入了“嘉道中衰”。道光朝一位叫做朱琦御史有一篇《名实论》,认为德行有“乡曲之行”和“大人之行”之分:乡曲之行“曰忠厚 ,曰廉隅 ,曰退让”;大人之行,“在于经国家 ,而安社稷 ,有刚毅之节 , 为人主所惮 ,有深谋远虑 , 为天下长计 ,合则留 ,不合则以义去 ,身之安否 ,不遑计也。世之指擿, 不敢逃也。” 嘉道之间的问题就在于所谓的良臣都是有着“忠厚、 廉隅、 退让”乡曲之行的人,这些人“峨冠博带 ,从容缓趋于廊庙之间 ,上之人固亦深信不疑, 以为渊厚不可以测, 一旦遇大利害, 束手无措, 缄口结舌而不敢言, 所谓忠厚廉隅退让至此遂举无所用 !”

曹振镛就着这样良臣的代表,虽然他生极恩宠, 死备哀荣,但是逐字逐句读《清史稿》、读清代的笔记野史,你根本找不出他到底有过什么事迹。他的一生,倒是真像朱克敬在《瞑庵杂识》里录入的《一剪梅》描述的那样:

仕途钻刺要精工 ,京信常通 ,炭敬常丰 ,莫谈时事逞英雄 ,一味圆融 ,一味谦恭。
大臣经济要从容 ,莫显奇功 ,莫说精忠 ,万般人事要朦胧 ,驳也无庸 ,议也无庸。
八方无事岁年丰 ,国运方隆 ,官远方通 ,大家赞襄要和衷 ,好也弥缝 ,歹也弥缝。
无灾无难到三公 ,妻受荣封 ,子荫郎中 ,流芳身后便无穷 ,不谥文恭 ,便谥文忠。

曹振镛把词中的境界发挥到了极致,但问题是清代到了嘉道间并非“八方无事岁年丰 ,国运方隆”,而是危机重重。

重重危机,有些危机已经是很“现代”的问题,譬如美洲白银产量激增(因为使用了新的冶炼技术)和中国对外贸易顺差带来的输入性通货膨胀。

美洲白银产量的激增就像现在美国量化宽松政策一样,大量的白银通过贸易顺差涌入中国,首先带来的是“汇率”的问题 —— 铜钱和白银比率的问题。

顺治三年的旧制,制钱每十文准银一分,清代一直贯彻这一比率,一两白银兑换铜钱一千文,所有的货币支付,数少时用钱,数多时用银。但是大量白银的流入,导致这样的比例无法维持,康熙六十一年时,钱银比已经涨到七百八十文易银一两,为了维系1000:1的比率,政府只能加大制钱的投放量,康熙间,京局每年铸币大约六、七亿文,到了乾隆、嘉庆两朝,每年大约铸币十五六亿,铸币增长了近三倍。

增加货币投放量的结果是通货膨胀。虽然从一定程度上讲,康乾间的通胀刺激了经济的发展,对于“康乾盛世”也功不可没,但是持续的通胀亦是“嘉道中衰”的罪魁祸首之一。从康熙到嘉庆间,物价大约涨了三倍,但是国家的正式财政收入却并没有增长。特别是嘉庆帝恪守康熙帝“滋生人丁永不加赋”的许诺,并未增加丁银,物价上涨而赋税未涨。

嘉庆帝始终牢记着“明亡于万历”的祖训,不敢增加税赋,自嘉庆初平定了川陕白莲教起义以来,财政一直吃紧。

同时,国家控制的专卖的盐业也因为实行官方定价(清代盐价提价必须得到皇帝的批准,哪怕只是一斤涨价一两文钱),不随市场价格浮动而不断亏损,譬如长芦盐厂,到了乾隆末每年亏损折合银七八十万两。

官员俸禄自雍正朝颁行养廉银以来也未在提高,显而易见的后果就是更加大规模的贪污 ,无官不贪。

到了嘉庆朝,通胀累积的结果就是中央财政日渐衰竭,地方官员贪污成风。

然后还有人口问题。人口激增,人均土地减少,出现大量无地流民(可以类比现在的失业率),如果政府主导发展工商业,这些流民还可安置,但是嘉庆帝偏偏没有延续康乾间对于工商业的宽松政策,反而禁止民间开矿等等,于是无地的流民民变不断。。。

各种问题累加,社会怪象层出不穷。譬如嘉庆八年,竟出了中国历史几乎空前绝后的平民刺杀皇帝事件(明代的梃击案毕竟针对的还只是东宫)。一个叫做陈德的厨子,因为妻子亡故,岳母瘫痪在床,膝下有一对未成年的儿子,自己又被东家辞退,没有了生计,因为萌发了刺杀皇帝的念头,于光天化日之下在神武门持短刀刺杀嘉庆帝,在场的侍卫们从未经过这样的场面,竟都吓的呆若木鸡,幸亏有大臣格挡,刺杀并未成功。

而面对这样的危机与问题,嘉庆皇帝几乎茫然不知所措,而朝廷重臣曹振镛对于一切问题的答案只是“多磕头,少说话。”。。。。

。。。 其实历史有很多可以借鉴的地方。

Blog分类: 

英雄事

39298_1一边 debug C++ codes,一边听昆曲《牡丹亭》,随便点开的是一出《怅眺》,末了一首联句很有趣:

越王自指高台笑, 刘项原来不读书。

前半句是皮日休的《馆娃宫怀古》,后半句是章碣的《焚书坑》,这个笑字用的很妙,因为汉王和项王总是一副难兄难弟(二声“难”,不是四声“难”)的模样,譬如杜牧的杜牧的《过骊山作》:

始皇东游出周鼎,刘项纵观皆引颈。

可以想象这哥俩儿踮着脚,伸着脖子,拍着前面人的肩膀说:“低点儿,低点儿,挡着我了”的样子(这也大概就是《史记》上刻意说的“纵观”,恣意的观看。)

两人见过秦始皇的反应也像,刘邦说:“嗟乎,大丈夫当如此也!”。项羽说:“彼可取而代也。”

其实两人那时确实很像,都是楚人,家离的不远,在那之后的一段时间里,都非常符合俺心目中英雄的形象。

借用韩信的话,我对英雄的定义是“匹夫之勇,妇人之仁”。这话本是韩信用来形容项羽的:

项王喑噁叱咤,千人皆废,然不能任属贤将,此特匹夫之勇耳。项王见人恭敬慈爱,言语呕呕,人有疾病,涕泣分食饮,至使人有功当封爵者,印刓敝,忍不能予,此所谓妇人之仁也。

韩信自然是在贬低项羽,但是换个角度想,如果一个人既是千人敌,又能恭敬慈爱,不正是英雄的形象么?

孔子说:

知,仁,勇,三者天下之达德也。

其实“知”往往与“仁”、“勇”矛盾。 “知”,让你凡事深思熟虑,让你 rational,但是一旦深思,大概就会犹豫“仁”与“勇”,古人说:

仗义每从屠狗辈,负心多是读书人。

所以不读书的刘项,在那时都是英雄。譬如刘邦夜里私自放走送往骊山的刑徒,害得他丢了他的亭长,逃入芒、砀山间,这是妇人之仁;又譬如众人杀了沛令,需要推选领袖的时候:

萧、曹等皆文吏,自爱,恐事不就,后秦种族其家,尽让刘季。 ……於是刘季数让。众莫敢为,乃立季为沛公

念过书的萧何、曹参都知道当带头大哥风险太大,如果起事不成(按当时的情况,这是很可能的),就会被灭族,思量了风险之后,一致决定推立刘邦,而刘邦也就答应下来了,这正是匹夫之勇。

所以刘、项皆英雄,直到楚怀王决定入定关中。那时秦军正盛,项梁新死,所有的诸侯都很理智的不愿入关,只有刘邦和项羽愿意向西击秦。

刘、项两人大概也就从此开始分道扬镳,主要的原因之一是刘邦再次遇到了张良。张良辅助刘邦取得的第一场大胜利用的就是诡道 —— 先派人劝降了峣关的秦将,然后趁其不备,又发兵攻击峣关,当然是大胜,但是这样的作为大约很难算的上是英雄。

对比项羽的巨鹿之战,破釜沉舟,烧庐舍,持三日粮,大破曾经傲视六国的秦军,这是何等的英雄。

当然,从兵家的角度讲,兵者,诡道,不战而屈人之兵自然是上等,但是纯粹靠战场外的欺骗实在算不上英雄,相比之下,远远不如韩信的背水一战——毕竟韩信的阴谋仅限于战场之上,而张良的为人让人觉得处处都是阴谋——就像以前提到的张良计,他赞同郦食其去出使齐国,劝降齐王,大概他一开始就预料到了韩信不会止步不前(因为有李左车作韩信的谋士),而郦食其即使说降了齐王也不过是去送死。可怜的高阳酒徒,拿着酒罐子,高高兴兴去说服了齐王投降,然后因为韩信趁齐国不备破齐而被齐王给烹了-_-#

鸿门宴上,项羽继续妇人之仁,直到乌江畔:

[项羽] 顾见汉骑司马吕马童,曰:“若非吾故人乎?”马童面之,指王翳曰:“此项王也。”项王乃曰:“吾闻汉购我头千金,邑万户,吾为若德。”乃自刎而死。

“吾闻汉购我头千金,邑万户,吾为若德。”不知吕马童此时心中是何感想。。。

呵呵,英雄事,千古意,一凭阑。

Blog分类: 

关于隋代学术界和明代魔幻圆周率的一点八卦

88_10083412_f0a2302c9ec0947

(因与人论及祖冲之的历法对于后世历法的(无)影响,而纯粹的八卦文字^_^)

祖冲之的历法其实对后世没有太大的影响,大明历在陈灭亡后就废止了,隋朝开始用的是北周的大象历,后来用开皇历,都和祖冲之的大明历没有什么关系,并且要比祖冲之的大明历落后很多。

北朝也有和祖冲之一样对历法比较精通的人,但是他们的历法和祖冲之在世的时候一样,没法得到官方的承认,刘孝孙抱了自己的 paper,带着棺材去向隋文帝哭诉,但是也斗不过学霸(祖冲之活着的时候也没斗过当时的学霸),后来也病死了。

刘孝孙同学病死以后,一个叫做张胄玄的同学抄袭了刘孝孙的 paper,并且最终获得了学霸们的首可,被颁行为大业历,但是因为不是他自己的 original research,所以错误多多,但是张胄玄同学和学霸们保持了非常好的关系,以至于有人(刘焯)举报张胄玄抄袭刘孝孙时,仍然遭到了张胄玄和当权学霸们的联合打压,《隋书·律历志》里还保留有这封举报信:

“胄玄后附孝孙,历术之文,又皆是孝孙所作,则元本偷窃,事甚分明。”

刘焯也没有斗得过学霸和抄袭者,也死了。。。。

直到唐高宗时期,因为历法问题多多,才又把刘孝孙、刘焯的 research 找出来,重新采纳,这就是李淳风的麟德历。

北朝自己的历法还如此之多的坎坷,更别说南朝的祖冲之了,早已湮灭了。

但是并不能以此否认祖冲之的地位和影响,欧洲数学的发展也是有断层的,也是不断的再重新发展,并且祖冲之算圆周率的方法,应该不同于刘徽的割圆术,他的算法已经失传,但是能算出 355/113 这个密率,还是很牛 X 的,这个确实领先了欧洲一千多年,这个分数绝对不是他拍脑袋猜出来的,只是算法不详。

要说拍脑袋猜圆周率,我们是在不得不提及一下明朝的数学家们。这里确实没有明黑的意思,但是中国的数学经过了宋元的 boom 之后,到了明代,突然变得 joke 起来,网上被盛赞的一位明代音律学家算出的圆周率是 sqrt(2)/0.45,而其他诸多数学家,有算出3.126 的,也有算出3.15 的,真可谓光怪陆离。

当然数学的衰落确实有更深层次的原因,林毅夫同学曾经还在某个 journal 上灌过水解释这个现象,大意是说明代的科举开始僵化,读书人为了应付考试,需要浪费大量的时间和精力来背书,就没有创造性思维的机会了,这倒也能解释元代数学的发展,因为聪明的汉人很难通过考试来进入仕途,所以就只好琢磨数学了,因此成就了很多大家,所以相较之而言,我们还是应该欣赏一下宋代的,在保持正常的科举同时还造就了大量的数学家。

所以祖冲之和他同时代的人对我们的启示是:

1)不要试图扳倒学霸;

2)有 paper 赶紧发,哪怕装孙子恭敬的review 一下学霸的 paper,因为他很可能是你的 reviewer;

3)working paper 要注意保管,不要让学霸的弟子赶在你之前发表,是在不行,就委屈一下co-author ;

4)注意身体,不要病死,切切。

所以说祖冲之对于我们的裨益还是很大的:)

Blog分类: 

Pages