搜索

修改 Google Scholar 学术搜索

Google Scholar 是一个非常有用的工具,但是搜索返回的结果却很芜杂。虽然可以通过“高级选择”输入特定的期刊,但是这样比较费时间,因此写了一个简单的 HTML 页面(如下),可以快速的搜索特定期刊,提高搜索效率。因为最初是在学校的只支持 HTML 的服务器上使用的,所以功能非常的单一,如果有时间,可以用 PHP + MySQ 写一个更加完善的页面,通过对比期刊的学术因子,过滤掉一些影响因子比较小的期刊,然后把结果在同一个页面按照引用频率和时间的加权列出,这样就可以迅速的知道某个 topic 的发展程度了。呵呵,当然更实际的用途是为了写 paper 的 literature review。



  • American Journal Political Science
  • Econometrica
  • International Economic Review
  • International Organization
  • Journal of Economic Theory
  • Journal of Political Economy
  • Quarterly Journal of Economics
  • Review of Economic Studies
  • The American Economic Review
  • The American Political Science Review

Blog分类: 

是谁在鼓励 Blog Spammer?

是Google。

Spam一直是Blog比较头痛的问题。虽然各种各样的模块与过滤器可以非常有效的控制Spam,但是稍一不留神就会有新的评论或是Trackback Spam冒出来,有时像雪崩一样,瞬间冒出一百多条Spam。正是因为如此, 一些比较Popular的blog譬如Boing Boing,已经不再允许让访客直接留下评论,而是通过Technorati的backlink来实现评论的功能,这一点与Google的Blog比较相似,唯一不同的是Google的Blog用的是自己的blogsearch的backlink。通过这种方式虽然有效的制止了Spam,但是无疑也为用户留言制造了麻烦。举个例子,直接的留言系统好比朋友或是熟人直接照面打个招呼,而backlink式的评论却好比熟人想打个招呼还必须规规矩矩的写信,并且这信还不一定投递的到,因为你首先需要Technorati或是blogsearch收录你的blog(注意:书信的格式还有要求,必须是blog,通常还必须是主流blog,否则blogsearch等未必会买你的帐,icerocket现在还拒绝承认我的blog :< 不过还比较庆幸的是现在blog搜索的主流是Technorati与google的blogsearch,而drupal对于这两者还是很友好的。)呵呵,如果blog不能直接评论,那么blog还能作为web 2.0 的代表之一么?或者这样无法评论的blog还是blog么?用乔治华盛顿大学一个政治学教授的话说,这样的blog"[is] just a glorified press release",譬如一些美国国会议员的"blog"。都是由于Spam的存在,很多流量较大的blog却不得不使用上述间接的留言方式,而造成这种局面的一个重要因素是因为Google。

或者更准确的说是以Google为代表的搜索引擎。与垃圾邮件不同,blog spam还有另外的一个目的就是获得更高的pagerank,从而在搜索引擎的搜索结果中脱颖而出。Six Apart的VP

The prime actor that made this behavior [指Spamming] valuable was Google, which created economics around links. Links on the Web have almost direct monetary value because of Google's PageRank system.

不尽如此,Google还默认blog中出现的链接的价值要比一般网站上出现的链接的价值要高,这更鼓励Spammer。虽然这并非Google的本意;虽然Google也在使用"nofollow"等trick防止spam,但是Google的搜索算法确实鼓励了这种做法,也算是一个unanticipated consequence吧。这两天看新闻,看到Google花了大价钱买了新的搜索算法,呵呵,不知道Google会不会改进它的pagerank的算法来杜绝blog spam.

Blog分类: 

微软明天推出“学术搜索”?

"无数"的迹象(或是谣言)表明微软要于明天推出它自己的学术搜索(academic.live.com)。感觉上,微软的live.com总是很低调的不停充实着自己,每次去看时都会发现新的变化(当然也许不是微软太低调而是Google的粉丝太多)。按照先前的说法,微软的学术搜索将提供:

  • 摘要:允许搜索者在预览窗口中阅读文章的摘要(估计比较类似现在live.com的风格);
  • 全文:如果文章不是放在需要订阅或是限制访问的网站,则允许用户阅读全文。(我猜想是一些放在个人网站上的working paper,目前google的学术搜索还不能搜索这些文章)
  • 订阅:对于需要订阅或是限制访问的网站内的文章,如果搜索者订阅了这些网站,则可以直接阅读全文。(这个应该与google学术类似,譬如使用学校IP或是拨VPN访问google学术,会在链接后面显示 Find at xx Universty的标示)
  • 引用:可以导出文章的引用到不同的格式,包括RIS和BibTex等(这个google没有,事实上Google显示的引用格式很不规范)
  • 寻找最近的图书馆:可以搜索附近的图书馆里是否有你查询的书或者期刊(类似Google)
  • 购买文章:通过British Library购买查询到的文章(Google目前似乎还没有这个功能)

不管怎样还是很期待这个学术搜索引擎的,因为我正好开始准备dissertation proposal了,多了一个学术搜索,就省去一分翻阅浩瀚文献的繁劳。想起原来一个老教授说的话:当年他写毕业论文的时候,手指头翻图书馆的index card都翻出老茧来了。呵呵,科技的力量啊!:)

Blog分类: 

[help]Drupal如何才能支持中文搜索

1、问题:我的Drupal不能搜索
2、症状:英文搜索没有结果;中文搜索根本就不能用,都是乱码;
3、系统配置:WinXP sp2, Drupal 4.6.1, Apache 2.0.53, MySQL 4.1.11, PHP 4.3.11;
4、Drupal的相关配置:本地运行Drupal;数据库使用UTF-8编码;已打开search module;

我在drupal.org看到你的留言“It may be caused by your settings (e.g. did you configure your cron job?)”,但我不知道cron到底该怎么设置,cron是不是必须在linux等系统才能用啊?

Drupal讨论区: 
Taxonomy upgrade extras: