生活

一二·岁暮

旧年最后一天,新年第一天。好久没写 blog,提笔写下"岁暮"二字(应该是键盘拼音敲出"岁暮"二字,语言需要与时俱进),于是 conditional probability 开始作怪,马上就想到"夜寒",确实也很冷,但是接着就是"残漏",然后一乐,家里Ikea买的挂钟因为懒得换电池都不再滴答作响,哪里能听得"滴漏",时间不过是电脑、手机、电子钟上默默跳动的数字,dead end。(说起时间,想到最近刚见到的一个单词,picosecond, 10^-12 秒,这是高频交易最新的单位,原来的nanosecond, 10^-9 秒已经不够用了,说不定下个 version 的 Kdb+,timestamp最小的时间单位就不再是 nanosecond,而是 picosecond了。想着每天用 恒河沙分之一秒作为单位的生活,突然觉得古人"滴漏"的生活是一种多么的奢侈啊!)

另外一条 thread,"岁暮"=>"西风", 查了 weather.com 今天倒真是西风(时报广场看大苹果的人们肯定很冷),然后就贝叶斯到了"故园",勉强吧,小时候住的居民小区是有几个花池,栽种着不需要怎么打理的月季,然后就是"碧纱",仔细想来,小时候家里的纱窗倒确实是绿色塑料纤维加了金属边框作成的,那时的乐趣之一就是拿刀片划纱窗玩。所以关于岁暮思乡的thread可以勉强的继续下去,只是印象里没有"一缕茶烟透碧纱",有的只是因为黄河南岸不许通暖气的政策而家户户冬天烤火炉顺着烟囱溢出的袅袅的充满着二氧化硫味道的煤烟,但是这样的煤烟味还是会让人怀念,到了年底还是会想家。

再有一周就要回趟家,一定要回去和卢舍那大佛合一张影。时间在跳,城市在变,几年不回家,熟悉的街道,常去的便利店,都不复存在,只有奉先寺的卢舍那大佛仍然是千年不变的微笑。记得初中的时候给她起了个英文名字 Valerie ,源自她的梵语名字 Vairocana 和她那神似武则天的面容。

故园三万里。(Google Maps上查的,从纽约到洛阳,三万六千里)。平时只能去趟大都会博物馆,看看从 Valerie 家里凿下来的壁画,遥想一下故乡。南朝四百八十寺,同时期的洛阳四十年修了一千三百多所寺庙,然后在接着的几十年里,又毁了这一千三百多所寺庙,那时的遗存,现在正安静的挂在大都会博物馆二楼中国展厅门厅的高墙上。

这一年,一眨眼的功夫就过去了。

想起两周前去佛罗里达度假,要找几本中文书看,翻来覆去,最后从书仓上找来一本《围城》,一本《边城》。此时再看《围城》与高中或者刚上大学的时候看《围城》感觉截然不同。 那时读《围城》,感叹的是钱钟书的学识与旁征博引,无一字无来处。现在再看《围城》,更像是一个读了一肚子有用或者无用书的留学生的无聊、无奈、怅惘与不彻底的自嘲。相比之下,倒真不如茶峒溪旁,养着一个孙女和一条黄狗,给往来客商摆渡的老汉痛快。六月大缸里有解渴的茶水,腰上扎着的有解馋的烟叶。

因为不抽烟,所以还是希望新的一年像六月大缸里的茶水一样解渴:)

Blog分类: 

弈棋·十年

flash-chess

西晋的傅玄说:“人之涉世,譬如弈棋。”钱钟书的《管锥篇》里,将之与西方民俗比较,援引美国社会学家萨姆纳《民俗论》(Folkways) 中的 the aleatory element in life / 人生中的掷骰子成分,认为“掷骰、弈棋,无非逢遇、幸偶之拟像而已。”

细想来,钱氏的类比并不准确。掷一颗理想的骰子是幸偶,但是弈棋并不是纯粹的逢遇,因为弈棋至少还有可以控制的选择。

大概这也是弈棋迷人之处,不同于一个决定性的动态优化问题(譬如 Cass-Koopmans Optimal Growth Model,每一步该怎么作都是可以实现计划好的),弈棋总是一系列的 contingency plan /应急计划,每一步或者取决于上帝/自然(i.e. 随机的事件),或者取决于诸多弈棋的参与者(i.e. 其他人的优化)。

今天是来美国十周年,十周年的今天来到美国,本科刚毕业,依照当时的计划是在美国念一个政治学博士学位然后回外交部工作,虽然当时也并不是特别的喜欢外交部,但是就像下棋,选择本身是路径依赖的,一旦你走上某条路径,在未来不可完全预知的情况下,只有按照这条路径优化 —— 当然对于未来的期望也是基于当时现有信息的,如果预期有偏差,那 ex ante 的优化与选择也许就是无意义的了 —— 事实也大概也是如此,因为念博士是一件很费时间的事情。

就像下棋,每一步当随机的部分realize之后,剩下的就是优化了,当然“人之涉世”是一个复杂的弈棋,里面有各种内生性问题,一层层的路径依赖,当然路径也有交错的时候,就像一个重重叠叠的二叉树,站在每个交叉点上,有时是上帝掷骰子帮你做出了下一步的选择,有时是你基于自己对于 state of the world  的 belief 做出的优化选择(如前所言,你的 belief 很可能是有很大偏差的)。

所以时间久了,回头再看走过的路径,不断的弈棋反而像一条布朗运动的轨迹,尽管你每一步都在优化,但是从起点到终点没有太强的相关性(或许会有一个不大的 drift term ,但正如不是所有的骰子都是 fair 的)—— 这样看来弈棋与掷骰之间倒也有相通之处。

所以十年后的现在,在华尔街的一家投资银行做期权量化交易,和十年前初到美国的打算大相径庭,唯一的相同之处大概就只有马克思和熊彼特从不同角度对于资本主义做出的预言了。

回到钱钟书引用的那句 the aleatory element in life。 aleatory 源自于拉丁语 alea/骰子。这个词在现代英语里几乎唯一使用的地方是一句成语: Alea iact est / The die has been cast 。 据说这是凯撒带兵渡过卢比孔河向庞贝和元老院宣战时说的。这句话倒是成了以上讨论一个不错的脚注:不管事前选择种种,骰子掷下了就掷下了。

呵呵,纪念来美国十年:)

Blog分类: 
Free Tags: 

茶荒

T25PmfXaRbXXXXXXXX_!!383390319

眨眼到清明,又是每年“茶荒”的日子了。(清)明前,(谷)雨前,是出新茶的日子,去年的茶喝到现在,差不多要见底儿了,从二月初到现在,就只能参杂着陈茶数日子。

纽约虽大,却着实找不到一个能买到好茶叶的地方。唐人街的茶叶铺绿茶似乎只卖龙井,并且还是陈了若干年的龙井。饮茶就是饮故乡水土,生不在江南,自然喝不惯江南茶,更别说江南陈茶了。

所以试过在网上买茶,但是却屡屡失望。网茶大多迎合美国市场。而美国人对于“茶”也许有不同的概念,虽然近些年了颇有饮茶的风气,星巴克的小黑板上也不断的写着各种加了或是不加糖、奶、香料的茶,但是那个也许只是产在相同或者相近的一种植物上的叶子而已,和真正的茶相去太远。(八卦一则:1762年现代生物学分类命名的奠基人林奈曾把茶树分为红茶种和绿茶种 –_- )

原来茶荒的时候也试过日本茶。从某种意义上说,日本的很多文化是中国文化的化石。就像一个 version control 系统下 branch 出去而又没有再 re-integrate 的一个发展分支一样。既保留了中国某个历史时期文化的残存,又被他们改的面目全非,譬如抹茶。中国明代以前是饮茶的习惯大致和日本的抹茶相似:先将茶饼碾碎成茶粉,然后烧水,水初沸的时候冲茶碗,大沸以后,加几匙冷水,然后冲茶粉,为了让茶粉和水混合均匀,需要用到“茶筅”—— 现在你要是直接搜索“茶筅”,出来的肯定是一串儿日语的结果,因为现在日本抹茶还在用,中国已经不用了。当然日本从茶叶到茶道都做了有日本特色的改进,中国古代的点茶,茶色贵白,所以黄庭坚比之为“琼蕊”。而抹茶反而崇尚浑浊的绿了。

中国人更改饮茶习惯源自朱元璋:

国初四方贡茶,以建宁阳羡为上,犹仍宋制,碾而揉之,为大小龙团。洪武二十四年九月,上以重劳民力,罢造团茶,惟采茶芽以进。其品有四:曰探春、先春、次春、紫笋。…… 按茶加香物,捣为细末,已失真味…… 今人惟取初萌之精,汲泉置鼎,一瀹便饮,遂开千古茗饮之宗,不知我太祖实首辟此法。陆羽有灵,必俯首服。蔡君谟在地下,亦咋舌退矣。—明· 沈德符 · 《野获篇补遗》

“茶加香物,捣为细末,已失真味。” 就像我们已经在运行 茶7.0 ,而日本还在继续改进 茶3.1。当然,升级也不一定都是进步。

也是因为饮茶习惯的改变,茶具也发生了变化,明以前特别是宋时因为点茶汤白,所以用黑色的建盏,明以后瀹茶汤绿,所以要用白色的宣瓷。也是因此,原来和朋友聊起过《红楼梦》里妙玉同学用的古董茶具其实并没有太大的意义。当然也可能是曹大叔别有深意,大叔的心都是复杂纤细的(出自某集《银魂》)。

瞎贫了这么多,都是茶荒闹的,就像大叔冯谖靠在柱子上弹着剑唱:“长铗归来乎!食无鱼。” :)

Blog分类: 

eDiary 3.0: 跨越八年的更新

camel-leather-diary-47 1999年,有了我的第一台笔记本电脑。在某一期《大众软件》或者类似刊物附送的光盘里,发现了 eDiary ,一个免费的写日记的软件。那个时候网络还不算发达,web 2.0 的概念还很遥远,所以开始把原来用纸笔写的日记,改在电脑上敲出。这是使用 eDiary 的开始。

因为那个时代自己建网站还不是很方便,所以也不能及时从网络上得到一款软件的更新,最多只能等待附送光盘的杂志或者去那时很有名气的“华军软件园”里看一看,所以最初的这个 1.0 的版本用了很久。

刚开始的时候,没有备份数据的习惯,那个时代没有网络云备份,一般电脑也不能刻录 CD ,更别说 DVD,流行的只有 2.5 寸软盘。所以早先的日记也零零散散丢过一些,还有一些存在软盘里,不知道搁在那里了。现在电脑上 eDiary 里可以追溯的最早一片日记是 2001年1月31日。这一日,日记的内容是空白。第一篇有文字的日记是 2001年2月7日,这一天除了琐事以外还记录了:

离考试还有36天。这36天要做的事情:完成国内题第二遍,北美题的第三遍(以复习总结为主),坚持背单词,做ETS的POWERPRE,还有LSAT的逻辑题,顺便读一读GMAT的阅读。记住要不断的总结。

考试说的是 GRE,从这里推断,原定的考试时间是 2001年3月15日。但是认真往后看去,真正的考试时间是 2001年4月20日 ——往后足足拖了一个月,看日记就像看镜子里的自己。

2003年11月29日, eDiary 发布了 v 2.53。然后这个作者就神秘的消失了,仿佛离开了地球。那时他已经有了一个在网易申请的免费空间,还有一个免费的域名自动转向服务。多亏了这个域名自动转向服务,从那里知道了作者最新的网站。作者有了自己的域名。不过还是沉寂。

意外的是,这个最初运行在 Windows 98 上的软件,在后来的岁月里,可以稳定的运行在 Windows 2000, Windows XP,Windows Vista 一直到 Windows 7。并且这个软件一开始就是“绿色”的,不需要安装。

所以尽管时间已经到了2011年底,却仍然使用着这个 2003 年发布的软件。好的软件是独立于时间的。

然后到了2011年12月底的某天,无意点开了软件作者的网页,居然发现他更新了!推出了 v3.0 beta 1,距离上次更新已经有了 8 年多!

一个 decade 差不多就这么过去了,外面的世界发生了翻天覆地的变化,萨达姆倒台了,拉登被杀了,苏丹分裂了,然后作者竟然更新软件了!:)

前不久在 Virtual Box 上装 Windows 8,做的第一件事就是确认 eDiary 是否能运行,总担心某一天它无法再适应新的操作系统,看到作者又重返地球,心里踏实了很多,至少不用再担心软件陈旧,无法使用。

又能安心的写日记了。“以铜为鉴,可正衣冠;以古为鉴,可知兴替;以人为鉴,可明得失。”日记里的自己就是“古”“人” 。

再次跳跃回1999年,新浪提供电子邮件服务,注册了 kzeng # sina.com 的邮件,但是没怎么用过,那时主要是是 263 ,然后是 hotmail,gmail。再跳回到2012年,终于开通了新浪的微博 —— 没写过一条微博,只有一个关注, eDiary

Blog分类: 
Free Tags: 

舞剧《牡丹亭》

img_111

昨天在林肯中心看了金陵艺术团的舞剧《牡丹亭》,很震撼。从头到尾没有对白的演绎这样一个复杂的爱情故事,并且能让我这样的舞蹈门外汉能够马上意识到舞剧的每一幕对应的是原剧的哪一出,在结尾的时候还被深深感动,我觉得这个舞剧改编得很成功。(文科博士的一个通病就是过于 critical ,这都是当年被逼读 N 多 paper,写 N 多 review 留下的后遗症,如果不 critical 到 cynical, 便无法体现所谓独立思考之精神 -_-)。这部舞剧是我今年看多的最好的演出,没有之一。

金陵艺术团这个名字可能有些陌生,其实它就是南京军区政治部前线文工团,大概是对外演出的需要,所以有了这个艺名,否则 Battlefront Culture Troupe of the Political Department of Nanjing Military Area of the Chinese People's Liberation Army 听起来太斯大林了。 07年春晚深受好评的舞蹈《小城雨巷》就是前线文工团的作品,那时的领舞胡琴心就是现在《牡丹亭》的杜丽娘。

“金陵”这个名字起得很好。中国每一个地名都是千百年来的文化沉积的印象符号。这样的符号已经被人格化。 就像金陵对应的该是吟着婉转南曲:“则为你如花美眷,似水流年,是答儿闲寻遍”的书生柳梦梅;而燕京对应的该是唱着粗壮北曲:“猛见了荡地惊天女俊才,咍也么咍,来俺里来。”的地府胡判官。长安是杜宝,洛阳是年轻的甄氏(年轻的三个字很重要,但是《牡丹亭》里并没有写年轻的甄氏是如何的,只是说她是魏朝甄皇后之后,所以我们权且以洛神替代^_^)。杜丽娘还是金陵。这是一部关于杜丽娘和柳梦梅的舞剧,自然要金陵来演。

《牡丹亭》出彩之处在于文字,改编成了舞剧,没了语言,很多场景的表达变得艰难起来,譬如《闺塾》的春香闹学,几句话语,“今夜不睡,三更时分,请先生上书”,“俺衙内关着个斑鸠儿,被小姐放去,一去去在何知州家”,春香的俏皮可爱跃然纸上,但是在舞剧里却很那体现的这样淋漓尽致,大概这也是为什么舞剧中把《闺塾》改为一群丫头陪读,而春香这个角色也泯然于众人中。

这样的更改也算合理,因为只有两个小时的演出,勾勒的人物过多,则重点人物不突出,冲突也冲淡了。不过有些舞剧中的有些人物,譬如陈最良和石道姑,虽然只有寥寥几笔(陈最良主要是在剧中的《闺塾》,石道姑剧中的《冥誓》),但是也充分体现原作人物的特点,当然也许是因为这两个人,特别是陈最良本来就比较脸谱化,在戏中没有太大的性格发展吧。

舞剧由序和四幕构成,改编中也有不少惊喜,本着不剧透的原则,只说一下框架上的更改,对于两个小时的舞剧而言,我觉得这样的改动还是比较合理的。

《序》主要是柳梦梅的原作中《言怀》里提到那个梦。但是鉴于后面的发展,也许《序》其实是写实的——柳梦梅和杜丽娘真的邂逅有一面之缘,但是我自己更倾向于是柳梦梅的梦,传奇般写实就俗套了。

第一幕《闺塾 惊梦》,涵盖了原作第三到第十出的内容,剪裁的很得当,由闺塾、毛诗而梦柳梦梅;

第二幕《写真 离魂》,相思成疾,写真、离魂。

第三幕《魂游    冥誓》,是对原作的大改。杜丽娘离魂之后并没有去冥司受判,也未魂游于旧花园中,而是游荡在集市上看到了赴京赶考的柳梦梅,而柳梦梅也并未拾画于山石之下,而是意外的购得丽娘的画像于市井之中。然后他回梅花观歇息,对着画茶饭不思,丽娘也从集市中随画而至,接上原作《幽媾》,《欢挠》,而后《冥誓》,丽娘和柳梦梅私结百年之好;

第四幕《冥判 回生》。舞剧中的时间始终定格在杜丽娘香陨前后,没有枉死城三年的等待,杜丽娘死后魂魄遇到了柳梦梅,并与之冥誓。冥誓之后,生离死别,杜丽娘方才被黑白无常压入地府,接受冥判,丽娘抗争不屈,而人间的柳梦梅则捧着丽娘的画像四处向人寻问,直到打听出画上的人是杜丽娘,他直奔杜府而去,而此时的丽娘正陨世不久,杜府上下正抚尸痛哭。阴间里,冥司的胡判官或因丽娘不屈、或因柳杜二人的情真意切,或者两者兼而有之,终于让丽娘回生,丽娘在柳梦梅的怀抱中复苏。大婚结局,就是上面那张绚丽的婚妆。

整个故事都是围绕着杜、柳二人,没有完颜亮,没有李全,没有杨夫人,没有中状元,比原著简单了许多,但是舞剧的演绎一样的感人,辅以恰到好处的舞台道具设计,确实是一部佳作。

唯一稍感遗憾的是我们看得那一场并不是胡琴心和许鹏的杜丽娘和柳梦梅,而是许(?)馨予和韩波二人搭档。介绍的册子上仍然写的是胡琴心和许鹏,不知道换角的原因是什么。 但是对于我这个外行而言,许、韩二人跳得也已经非常好了。

结尾时,幕布落下,幕布上一字一字写下的,正是汤显祖《题词》中的句子:情不知所起,一往而深,生者可以死,死者可以生。

Blog分类: 

数据挖掘:eBay上的Galaxy Note

Rplot01

从有Samsung  Galaxy Note 的消息开始,就很期待这款 5.3 寸屏的手机(5.3 寸啊!5.3 寸啊!5.3 寸啊!),但是不出所料,这款手机要很迟才能在北美上市(甚至连会不会上市都还是一个未知数),所以当 Galaxy Note 在欧洲和亚洲发布之后,就只能关注 eBay,等待它从亚欧流入北美。

当欧洲刚刚发布这款手机的时候,eBay 也同步有人开始售卖,一开始的价格大约在 $1000 左右,并且数量很少。等了一段时间,香港的发布会过后,随着大量香港卖家的加入,价钱开始迅速下跌,很快跌倒了$800左右。作为以数字为生的人,当然会“萌”任何时间序列的漂移、扩散和跳跃(不负责的翻译 drift,  diffusion, & jump),但是不断的刷新去查看eBay页面是在令人厌恶,于是就写了一个简单的 C# 程序,定时去“挖掘”eBay 页面上的价格。

但凡提及买卖/价格,就不能不考虑风险(风险也是钱啊),特别是在 eBay 这样高风险的地方。eBay 正好在推出一个新的 beta 产品页面,在 这个页面上 eBay 已经利用自己的算法选出了风险和价格最优的产品,这样一来,挖数据就简单多了,就像附在后面的 C# codes 里显示的那样,只要 request 页面数据,把数据转化成 string,然后利用 C# 自己的 string search/index method,找到相关数据 CSS class, 读入数据即可(数据量很小,所以任何优化都不用做)。然后把数据不断存入 txt 文本。

开始测试时是每两个小时 quote 一次,后来改成一个小时 quote 一次。屏幕上跳出的数字,很像交易所的证券,所以就干脆把它用 chartSeries (R 的 quantmod package)画出来,然后就从数据里发现了很有趣的规律:

  1. 首先总的价格趋势是下跌的,因为开始的高价格完全是因为 supply 的不足,再加上消费类电子产品本身的贬值以及与之相竞争的 HTC,Samsung Android 手机的推出(譬如在北美正式销售的 Galaxy SII skyRocket)

  2. 其次从 Nov 11 到 Nov 14 之间,在微观结构上是两个卖家相互竞争导致价格下跌。为了拿到 eBay 页面上的产品推荐,风险相同的卖家不得不通过降价来相互竞争,但是降价的幅度一般都比较小,特别是从 Nov 13 开始,基本上就是几毛几毛的降;

  3. Nov 15 左右出现了一段价格的稳定期,大约是一家放弃了价格的竞争;

  4. Nov 16 其中一家的货卖完了,剩下的一家觉得自己暂时处在低风险卖家的垄断地位,所以遽然的开始升价,我们看到了一个大大的 jump;

  5. 但是 jump 过后显然市场的反应冷淡,并且我们在上面说过价格的总体趋势是下跌的,如果不能及时卖出,卖家始终有一个 negative carry (也就说价格对于时间的一阶导数是负的),还有最重要的是差不多这个时候,Apple 开始 ship unlock 的 iPhone 4S ,价格大约在 $649 ,对于 Galaxy Note 的价格也是一个打击;

  6. 所以过了 Nov 17 同一卖家又开始降回比原来更低的价格水平

  7. 然后 Nov 18, 价格又开始大幅度的下调,因为有一个新的竞争者出现,而现在手里还攒有大量货的早期卖家基于自己的进货成本,不得不加大降价的力度, theta bleeds :)

当然数据有限,很多只是我的猜测,不过数据本身挺有趣的,不仅本身是一个很 behavior economics的测试,如果数据点足够的多,还能 fit 出一个 term structure 模型来。。。

。。。 所以到后来忘了,我只是来买手机的。。。

image

附 C# codes:

using System;
using System.IO;
using System.Net;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading;
 
 
/// <summary>
/// Fetch eBay Price 
/// </summary>
class WebFetch
{
    static void Main(string[] args)
    {
        while (true)
        {
        // used to build entire input
        StringBuilder sb = new StringBuilder();
 
        // used on each read operation
        byte[] buf = new byte[8192];
 
        // prepare the web page we will be asking for
        HttpWebRequest request = (HttpWebRequest)
            WebRequest.Create("http://www.ebay.com/ctg/Samsung-Galaxy-Note-32GB-Black-Unlocked-Smartphone-/110509414");
 
        // execute the request
        HttpWebResponse response = (HttpWebResponse)request.GetResponse();
        
            // we will read data via the response stream
            Stream resStream = response.GetResponseStream();
 
            string tempString = null;
            int count = 0;
 
            do
            {
                // fill the buffer with data
                count = resStream.Read(buf, 0, buf.Length);
 
                // make sure we read some data
                if (count != 0)
                {
                    // translate from bytes to ASCII text
                    tempString = Encoding.ASCII.GetString(buf, 0, count);
 
                    // continue building the string
                    sb.Append(tempString);
                }
            }
            while (count > 0);
 
            string page = sb.ToString();
 
            //page = Regex.Replace(page, @"<(.|\n)*?>", "");
 
            // print out page source
            string targetString = "bbx2-pv";
            int first = page.IndexOf(targetString);
            string price = page.Substring(first + targetString.Length + 2, 7);
 
            targetString = "ship tfsp bbx2-s";
            first = page.IndexOf(targetString);
            string temp = page.Substring(first + targetString.Length + 2, 20);
            targetString = "</s";
            first = temp.IndexOf(targetString);
            string shipping = temp.Substring(0, first);
 
            if (shipping == "Free shipping") shipping = "$0";
 
            DateTime time = DateTime.Now;
 
            string path = @"C:\Users\Kai\Dropbox\Mis\Android App\GalaxyNote.txt";
 
            using (StreamWriter sw = File.AppendText(path))
            {
                sw.WriteLine("{0}\t{1}\t{2}", time.ToString(), price, shipping);
            }
 
            Console.WriteLine("{0}\t{1}\t{2}", time.ToString(), price, shipping);
 
           Thread.Sleep(1000 * 60 * 60);
        }
        
    }
}
Blog分类: 

办公室的威士忌

PIC-0106  PIC-0107

备份手机上的文件,发现了这两张挺“古老”照片。看拍摄时间,第一张是 2008 年 7 月 4 日凌晨 11:48:36, 第二张是 2008 年 7 月 6 日 凌晨 12:07:20,两张照片相差差不多24 小时,地点是念研究生时的办公室。

那时办公室总放有烈酒,Jim Beam 的肯塔基波本威士忌或者 Jack Deniel's 的田纳西威士忌,没有冰,也不用 mixer,只有一次性塑料杯,半杯入腹,挑灯夜读,精神百倍,感觉就像肯塔基或者田纳西的庄稼汉喝罢了酒,兴致高昂的扛着锄头下地 —— 当然这只是我那时的想法,肯塔基和田纳西并不一定要种庄稼,他们下地也不一定扛锄头。

也喝苏格兰威士忌,在看《1Q84》,书中又提到 Cutty Sark,记得村上春树在《发条鸟编年史》就提到过 Cutty Sark —— 价钱、味道和作用都和 Jim Beam 差不多,只是无法满足我关于庄稼汉锄地的遐想,苏格兰的威士忌总让人想起临死前喊着 freedom 不想锄地的庄稼汉,不符合我熬夜看书写论文的意境 —— 想过在答辩之后,跑到校长住的钟楼前大喊 freedom,但是这个想法在清醒的时候总记不起来。(其实校长不住在钟楼里,但是因为学校有一个很高的钟楼,从一开始看见它,我们就假设校长住在里面。一位金融界的前辈说过:“if it acts like a duck, it is ok to assume it is a duck.” 既然我们不知道校长住在什么地方,那么假设他住在钟楼里也无妨。)

后来酒被研究所的老板发现了,说我这样在办公室放烈酒不好。所以思考了一下,就把威士忌放在樱桃可乐瓶子里了,于是总在案头放一瓶樱桃可乐。

现在看来,被教授发现酒瓶应该是 2008年 7 月 4日或者5 日白天的事情。 这就是图片的奇妙之处,仿佛把一切时空都固定下来,而两张图片又让时空动了起来 ——

譬如我的纸杯都扔了,因为喝樱桃可乐不需要纸杯;

譬如我当时还在教一门《国际关系》的课,因为我的桌子上还放着本《Essentials of International Relations》(第一张照片杯子后面那本花皮的);

譬如我当时还在读芝加哥警察局的机密档案(书架上成堆的大信封),因为要作一个关于芝加哥犯罪率的研究;

酒瓶下面始终压着两本书,白皮的是 《Stochastic Games and Applications》,红皮的是《十一届三中全会以来 重要文件汇编 (机密)》(记得本科学公文时学过,我国的文件分密、机密、绝密三等),是当时主要在钻研的两本书。

没想到是若干年后,会一直跟 stochastic 打交道了( game也在玩,现在在玩一个叫做 Dragon of Atlantis 的网页游戏,只是不再搞 stochastic game 了);还有就是不再看我国的机密文件了:)

还有就是不喝酒了。。。

Blog分类: 

Gambler’s Fallacy?

193888_10150161408806083_619986082_8650414_6822855_o

更新:有一个错误,算 risk-adjusted 的 payoff,其实类似于 Sharpe Ratio, significantly different from zero 没有什么实际意义,至少要 significantly 大于 1 才算是 reasonable 的 strategy :) -- July 24, 2011

三月份的时候路过拉斯维加斯去国家公园旅行,发现了一种新的自动机械轮盘赌,虽然在停留时间短暂,但是仍然在这台机器上赚了不少钱,于是想到了一个古老的问题:Gambler’s Fallacy (GF)

举个 GF 的例子,譬如一个 fair coin (这个假设很重要),如果连续仍了10次,都是正面朝上,那么当我们扔第十一次的时候,是不是更可能出现背面呢?如果你认为背面出现的概率会更大一些,这就是 GF 了,因为基础的概率学告诉我们,每次投掷都是独立事件,第十一次投掷的结果正面和背面的概率仍然是相等的。

单单看这个例子本身没有什么太大的意思,但是同时我们从统计的角度看这个问题,因为大数定理的存在(i.e. 这个 process 是 mean reversion 的,你仍的次数足够的多,你的期望值趋近于 0.5 ),那很自然就会想到,如果我们不只是简单作单次的预测下注,而是从大量重复统计的角度上下注(赌反方向),那么我们的收益会不会比纯粹 uninformed 的投注(譬如随机投注,或者只压正面)要好?

需要强调的是,我们考虑的只是投注的策略,而不是做时间序列上的预测 (forecasting),因为就预测而言,这是一个明显的白噪声过程。也就是说我们只考虑一个策略优化问题。

当然这既是一个 theoretical 的问题,也是一个 empirical 的问题,我们偷懒的只从 empirical 的角度看这个问题。

我们把问题简单化,只关注简单策略,也就说我们的策略必须是能用大脑计算的,否则即便是你通过收集这个自动机械轮盘赌的数据,发现了这个机械的 idiosyncrasy 导致投掷的结果出现统计规律,能用譬如一个 exponentially weighted moving average (EWMA) 来预测,但是你如果不能快速心算出你的策略,这也是没有什么实际意义的。

我们考虑三种策略,前两种是 uninformed 的,也就是说策略是独立于你新获取的信息的,最后一种是 informed的,策略是基于新获取的信息的。

第一种策略称之为 Odd Even Strategy (OES),顾名思义,就是第一压正,第二次压反,第三次压正,重复直到赌博结束;

第二种策略称之为 Straight Bet Strategy (SBS),也就是不管怎样,都只压正(或者压反);

第三种策略称之为 Looking Back Strategy (LBS),每次压住前往前看 m 个 periods,given 一个 threshold value rho (0.5<rho=<1), 如果这 m 个 periods 的 average 大于 rho, 则压 1 (譬如 1 表示正面),对称的,如果 average 小于 1-rho,则压 0。 如果条件不满足,什么都不压。假定 m =10,我们向前追朔10个periods (同时也符合一般轮盘赌提供的历史数据),利用一些简单的optimization 和 calibration,  大概估算 rho= 0.618。

假设我们玩1000次,下注的时候每次下注 $1 ,我们的赌本是 $1000,三种策略的收益如下图:

image

上图的收益并不能说明什么,只是一个 realization,但是相对而言,第三种策略的标准方差相对比较小,原因之一是因为第三种策略并不是每次都下注,如果把图放大其实可以看到蓝色线条有很多“平顶”,这是不下注的时候。

基于这三种策略,我们作一个简单的蒙特卡洛模拟,结果见下表:

  n=10^4 n=10^5  
  r-adj payoff sd r-adj payoff sd
 OES -0.01797056 0.02302582 -0.006824031 0.007238402
SBS -0.03311233 0.02290396 -0.01122852 0.007258676
 LBS 0.1144682 0.02278219 0.1226927 0.00721828

 

上面提到 r-adj payoff 指的是 risk-adjusted final net payoff, 它是用每1000次轮盘赌的最终净收益除以这1000次轮盘赌收益的标准方差得到的(类似计算 Sharpe Ratio 的算法),n=10^4 是1万次模拟的结果,n=10^5 是10万次模拟的结果。模拟的结果说明:

  1. Uniformed 的策略(OES,SBS)的风险调整净收益都不 significantly different from zero (at 5% significance level)。这和理论的预期是符合;
  2. Informed 的策略(LBS) 的风险调整净收益是正的并且significantly different from zero。

也就是说这样简单的informed的策略是能够带来正收益的。注意这个策略只是告诉你什么时候下注,和如何下注,把它和其他一些特定的投注策略(譬如 modified  martingale betting strategy)结合,应该能够提供一些可观的收益,所以我们在拉斯维加斯赢的钱也不完全是运气。

这个结果同时一些 empirical observation 项符合:1)这种机器不是在每个赌场都有,只有拉斯维加斯的 MGM才有;2)这个机器前排队的人很多;3)这个机器很容易坏。

离我们的比较近的 Atlantic City 没有这种机器,所以在那里赌博,只能靠运气了,不过上周的运气不错:

243452_10150258617601083_619986082_9247826_1760032_o

哈哈,这样的小概率都让我撞上了,狗屎运:)

P.S. 这个问题也有很广泛的意思,譬如股票交易,比较 liquid 的股票的 log return 几乎肯定是一个白噪声(Fama 的 Efficient Market Theory,呵呵,不知道他什么时候能得诺奖),如果我们有 high frequency data,我们能否有一些策略,通过白噪声的 mean reversion 来获利?猜测是由于 transaction cost 的存在(bid-ask spread, commission fees) 上述 payoff 可能会小于零,因此没有太大的现实意义,但是赌博可以一试。

P.S. 希望上述的运算和模拟里面没有错误,有空会验算一下:)

Blog分类: 

买车记

IMG_6577

和 LD  在和煦的阳光中沿着哈德逊河步行了 29 里去吃拉面之后,决定还是需要买辆车。

作为托马斯·霍布斯的信徒,我们坚信 Scientia potentia est (知识就是力量,这句话的最早的书面表达来自于霍布斯的 De Homine ,翻译成英语就是 Concerning Man,但是通常却被认为出自弗兰西斯·培根)。

所以——

信息经济学告诉我们,因为 hidden information, 买旧车的风险多多(当然这也是 common sense,所以 Akerlof 的这篇 paper 最初被 AER 和 RES 因为过于 trivial 而据掉),所以决定买新车;

固定收益金融学告诉我们,贷款会有利率风险,贪婪的银行通常会多收取一个 call option 的钱来对冲 prepayment risk, 同时也会收取高于 risk-free rate 的 premium 来对冲 default risk (尽管我们不会 default, 但是就像我们不知道旧车会不是 lemon 一样,借贷者也不确定我们是不是 lemon,当然 credit score 可以部分的解决这个问题),所以决定不贷款一次付清;

下一个问题就是车了,对于选什么车没有任何的头绪,所以不得不依赖(不可完全信赖)的专家意见,看了(主观)认为比较可靠的 Consumer Reports 的 2011 年新车推荐, family sedan 这类推荐的是 2011 Nissan Altima,再加之我们上一辆车就是 Altima,开了很多年,从来没有出过太大的问题,也很喜欢,所以就决定买 Altima。

选好颜色,银色或者红色,添加了几乎所有可以添加的 package: convenience , convenience plus, 2.5 SL , premium audio, etc, Nissan 的网站给了建议零售价,大约 $28k,这则信息告诉了我们价格的上限,然后查 truecar.com 得到实际价格的 distribution ,再查了 NY 州和 NJ 州的消费税,开始向附近的 dealer 询问价格。 重点是 truecar 上资源公布价格的 dealer —— 这又是一个信息经济学的问题,如果 dealer 能够提供低价,它肯定有 incentive 公布它的低价,否则它不会把自己的价格作为 public information 公开,所以这是一个 seperating equilibrium。当然问题是 dealer 是否会 honor 它的 commitment, 所以这点 truecar 作的还不错,它把所有的 price quote 都作为 contract —— 至于 contract 是否能被执行,这就是一个更宏观的政治经济学问题了,买辆车大约不用考虑这个层面上的问题,好吧,在美国,我们 assume 大部分的 contract 都可以执行。

拿到价钱,比建议零售价自然要低很多,然后就是去试驾和讲价钱了。就试驾而言,我们也开了七八年车了,一点点儿经验还是有的,至于讨价还价 —— 好吧,我本科学外交,我博士研究 bargaining theory,对付一个小小的 dealer 。。。结果。。。结果被 dealer 秒杀了 –_-# 。对于实际的 bargain,LD都比我强很多,最终 dealer 只肯再便宜 $700,然后就不为所动。

Rational 的讲,这个价钱已经在我们预期可以接受的范围之内,所以成交,于是耗时1.5 小时就买了这辆车。

本来第二天已经租好了车,因为打算去 Atalantic City 过周末,正好有了自己的车,退掉了租车,一来一回就算是长途试驾了,感觉很不错,终于又可以像以前一样自由了:)

唯一的遗憾是开车15分钟就能吃到的拉面,不如步行3个小时吃到的好吃,由此可见,步行 29 里是好吃拉面的必要调料。。。

Blog分类: 

博物馆·玉砚台

IMAG0428

08年的时候回国,虽然时间很紧,但是专门去了一趟中国历史博物馆(那时已经改名叫做中国国家博物馆),到了门口,发现正在闭门整修,询问一旁站岗的警卫,什么时候才能开放,原本想如果是一两天的时间,可以稍后再来,但是警卫严肃的告诉我 2011 年 –_-# 前两天看新闻,整修过后的博物馆三月一日正式开放了,以后再回国,一定要去看看。

大学四年在北京,比较自由的时候,几乎一两个星期就去一趟中国历史博物馆,半晌起床,吃罢了 “brunch”,骑着自行车到博物馆,一直逛到喇叭提示关门,才迎着夕阳骑着自行车沿着长安街回学校,高兴的时候还会吼两句“我只有一张吱吱呀呀的床”,路过西四去吃一间铺面很小的饭店的卤煮火烧,特别是秋天的时候,很是惬意,然后拐进鲁迅博物馆门前那条小巷,那有一间很正宗的“茶汤李”,算是饭后的点心,饭饱之后,慢慢腾腾的骑自行车回学校,满脑子的金石字画,背着书包正好赶上晚自习。

在芝加哥的时候经常去 The Art Institute of Chicago,周四的傍晚免费,说实话,第一次近距离看到梵高的《自画像》和莫奈的《睡莲》还是很震撼的,AIC的中国藏品不算很多,倒是南边的 Field Museum 的玉器展馆,几乎都是来自中国的古物,甚至包括为清孝庄文皇后(就是清宫剧里常出现的庄妃/孝庄太后)上谥号的玉册,估计是那个时代流出的吧。一直想去芝打的 Oriental Institute 看它的波斯宝藏,可惜总也都没有机会,直到离开芝加哥。

到了纽约,便成了 MET 的常客。MET的中国展馆很大,包括《魏孝文帝礼佛图》,说来让人感慨,这原本该是家乡石窟的浮雕,第一次看到它却是在万里之外纽约。转角上楼梯,有一个展出各种中国服饰和饰品的小展厅,在那里我看到了玉砚台。

之所以特别会注意玉砚台,是因为笃信以前一个老先生告诉我的玉不可为砚,老先生是古董的行家,他的断语自然被我奉为圭臬,但是没想到在MET竟然看到了清代的玉砚台,如果我们也信奉 Bayesian statistics,由此推断出玉砚台应该并非罕见之物,后来看到宋代米芾编撰的《砚史》,确实记录的有玉砚,也印证了这一点。

所以觉得奇怪,究竟是我记错了老先生的原话,还是他本人的疏忽,时间太久,已经不可弄个明白了。不过这也是常去博物馆的好处,至少更正一个错了很久的印象 。

P.S. 错误的印象时间越久就越难更正,譬如很小的时候读刘亚洲的《攻击,攻击,再攻击》,里面很多情节都信以为真,直到博士快毕业的时候,某一天和朋友谈及以色列的特种部队,还援引了刘亚洲的例子,只是那一瞬间觉得这样的故事讲出来自己都觉得不再可信,正好手头有1816年到2006年所有 Militarized Interstate Dispute 以及 War 的数据(著名的 COW 数据库),仔细的核对了时间,才发现刘亚洲写的是小说。

Blog分类: 

Pages