国学

索尼的电子图书阅读器与EBook

sonyreader 这个周一索尼宣布将会在Borders书店卖它的新的电子阅读器,这应该是正式发布的第一款使用E·Ink的阅读器。虽然飞利浦以及翰林汇都推出了使用这一技术的电子阅读器样机,但是还都没有正式投放市场。下周到Borders逛逛,看看能不能找到这款阅读器,不过肯定不会买,因为价钱在300到400美元作用,差不多和一款主流Pocket PC一个价钱了,只是想感受一下E·Ink与一般的Pocket PC或是Palm的显示有什么不同。其实Ebook也不算是一个新的概念了,早在2000年的时候微软就联合Barnes & Noble在网上卖微软阅读器格式的电子书,但是因为销量不是很理想,所以后来Barnes & Noble就不再卖了。其实觉得一个关键问题是阅读硬件的问题:不会有太多的人喜欢端坐在电脑前看书吧?Pocket PC与Palm应该是一个不错的看电子书的解决方案,特别是Pocket PC,广泛的支持文件格式可以方便的找到阅读资源,但是缺憾之一是中文读物中没有一个统一的精心组织的"免费电子书项目",一个类似Project Gutenberg的公益项目,来整理发布已经没有版权的图书的电子版。目前大致有四个比较大的中文电子书项目:一是超星;二是国学网;三是百度国学;四是维基文库。从数量与质量上来说,超星最不错,虽然不是免费的,但是收费并不昂贵,唯一的不足是使用自己的文件格式,无法在手持设备上阅读。国学网的古籍做的不错,但是似乎没有开源与共享的打算,否则也不会出"屎后主"的问题了,另外好像国学网的很多没有版权的古籍如果阅读也是要收费的;百度国学做的有些粗糙了,感觉是在匆忙中想对抗Google的中文学术搜索催生出来的产品,但是也是有一些用处的,譬如想起一首古诗,大致可以背下来,但是为了查证有没有被错的地方可以用一下百度国学,因为它摒除了很多不相关的"noise"。本来最有希望的是维基文库,但是现在由于在国内无法访问维基,这个项目估计也要大受影响了。不知什么时候才能有中文的古登堡!

Blog分类: 

屎后主讳纬?

在google上无聊的google李商隐,翻阅到了著名的那句“小怜玉体横陈夜,已报周师入晋阳”,点开原来是维基百科的高纬词条,词条的下面有一个《北齐书·帝纪第八》的链接,随手点击进去看看,却发现一件很有趣的事情,这个天津中医学院转载的《北齐书·帝纪第八》开首第一句:

屎后主讳纬,字仁纲,武成皇帝之长子也。

呵呵,我们都知道齐后主荒淫无道,但是写《北齐书》的李百药断不会在后主前加一个“屎”字,所以纳闷,既然这个天津中医学院要在维基百科上链结自己的东西,为什么不先校勘一下自己的文字?不过更有趣的是想这个“屎”字是怎么来的,于是google了“屎后主讳纬”,终于找到了始作俑者,原来是国学网站,大概是为了防止别人任意复制它的内容,它网站上收录的文字的前后加入了不少冗字,直接在它的网站上阅读时显示不出来,但是如果ctrl+A全选就可以看到,如果转贴的人不注意,只是ctrl+A,ctrl+C, ctrl+V,就着了国学网站的道,贴出一个“屎后主讳纬"的结果来。呵呵,一切都不知为哪般:)

Blog分类: 

初评百度的国学搜索

原来说百度的[国学搜索网站|http://guoxue.baidu.com]要等到1月12日才上线,可是今天发现已经可以访问了。于是好奇随便查了一些句子,但是结果并不是很让人满意,甚至不如网上已经有的一些资料。我随便搜索了一下“墨子”中的一些章节,发现百度不过是做了些纯文本的页面在那里,没有注疏,什么都没有,远不如[国学网站|http://www.guoxue.com]做的注解版的《史记》、《资治通鉴》等古籍,不论是搜索(与google或是古登堡计划相比)的方面看,还是国学(与已有的国学网站相比)的方面看,百度国学搜索的技术含量都很低,并且有一些明显的纰漏与错误,以[《墨子·备城门第五十二》|http://guoxue.baidu.com/page/c4abd7d3/13.html]为例,中间有些句子根本读不通,很多异体字要么用偏旁拼凑的七零八散,要么就不伦不类的杂糅在那里,譬如下面这句: 城四面四隅,皆为高磨衤斯,使重室子居亓上,亻侯適,视亓亻能状,与亓 进左右所移处,失亻侯,斩。 首先,排版有些问题,在不该换行的地方有硬换行,感觉像是从什么地方拷贝粘贴过来的。 其次,既然需要做国学搜索,就该做的专业些,显示不出来的字最好用图片表示,这样分开的(衤斯)字远不如 [http://www.kzeng.info/files/J010193AB.jpg] 看起来方便,而分开的(亻能)字也不如[http://www.kzeng.info/files/J010193AC.jpg]方便。这样字作起来并不难,不知道百度为什么不“勉为其难”? 再次,简体字、繁体字、异体字与通假字杂糅在一起,又不给注释,显得非常混乱,譬如“適“字,虽然它是敌(敵)的通假字,但是不知道为什么不简化为”适“?还有这个(亻侯)字,不知道为什么百度要加个单人旁,我在超星上查了清人孙诒让的《墨子间诂》,这里不过是一个普通的”候“字,不知道百度在这里卖得什么关子? 再再次,还是想强调注疏与训诂的重要性,这些古籍到了以考据为癖的清朝人那里,几乎都有了比较完备的集前朝历代考据之所成注本,如果能将这些书也汇入,那才更有意义。譬如上面的这句引文按照吴毓江的考证,本不该在《备城门》这里,而应该在《号令第七十》那里,[清华网站上的《墨子》中|http://rwxy.tsinghua.edu.cn/rwfg/ydsm/ydsm-qw/02-%C4%AB%D7%D3/015.htm]有较详细的注解。 总的来说,感觉百度的这个国学做得非常的一般,还没有达到[国学网站|http://www.guoxue.com]的水平。
AttachmentSize
Image icon J010193AB.jpg1.92 KB
Image icon J010193AC.jpg1.94 KB
Blog分类: 

百度的国学网站

套用《庄子》上的一句话,百度现在是“ google 亦步,亦步;google 亦趋,亦趋 ”。google 有了专门的[图书搜索|http://print.google.com]和[学术期刊搜索|http://scholar.google.com]后,百度马上也要推出一个[国学搜索|http://guoxue.baidu.com],多少有些效颦之嫌。不过想想,在国内的图书搜索已经有了[超星|http://www.ssreader.com]和[读秀|http://www.duxiu.com]了,百度从头再来倒不如买了读秀;而期刊搜索,又没什么好搜的,国内比较好的一些paper都发在SCI索引的期刊上了,其中多半是洋文,百度也不可能和google在这方面竞争;所以在针对印刷品的革命上,只好把矛头指向国学了。 这也确实是一件好事,毕竟系统整理国学著作,方便互联网检索是一件很有意义的事情。[国学网站|http://www.guoxue.com]原先是一个很好的榜样,但是后来它的一些内容需要付费才能查阅,多有不便,所以如果百度真的能收录现存的所有古代文献,套用网络一句俗语:这个无论如何都是要顶的!:)希望百度在整理典籍的时候把各家的注疏也收录其中,这样可以大大方便读者。在这一点上,台湾教育部的一个在线异体字字典是一个典范,每一个字都详细的罗列各朝各代辞书的详细注解,为了保证原汁原味,这些古书全都以图片而非文本的格式放在网站上的。 呵呵,拭目以待百度的国学搜索,但是建议现在那里的首页作一下更改,现在那里摆放了三本书《诗经》《四书五经》和《史记》。第一本书和第二本书重了,建议第一本换作《庄子》:)
Blog分类: 
Free Tags: