google

Google的Measure Map

Google总会释放出一些好玩的小东西,譬如这这个最新的Measure Map,它和Google Analytics 有些相似,也提供免费的统计数据,但是它是针对blog的,它有如下的特色:

Measure Map helps you understand what people do at your blog, and what influence you are having on the world.

  • Easily navigate the numbers that matter
  • Track links to see who sends you traffic
  • Find out what people do at your site
  • Setup is a breeze — it only takes a minute

呵呵,已经忍不住去Sign Up,等待Invitation了,估计这次Google是吸取上次Google Analytics的经验,如果是开放式的申请,大量的访问马上就会把Google的服务器给当掉,所以这次又用了邀请(其实Google Analytics开放申请了不久,就改为邀请了),希望早日得到Invitation,试一试这个新鲜的小东西,blog 是越玩越有趣了:)

Blog分类: 

Gmail for your domain以及演示

Gmail宣布推出 Gmail for your domain 测试版,也就是说,你只要拥有一个域名,就可以通过Gmail获得自己域名的邮箱,这个邮箱是完全由Gmail支持的,不需要你自己的任何硬件支持。这个想法挺不错的,在这里可以提交参加测试的表格。San Jose City College已经参与了这项测试服务,所以在这里可以看到Gmail For Your Domain的演示,注意,Gmail允许你有自己的logo:)

Blog分类: 
Free Tags: 

Google 的中文名字?

在新浪上看到Google要起一个中文名字,以便与百度竞争中文搜索市场

“Google中国本地化的下一步是斟酌起一个中国名字。”Google大中华区总裁周邵宁表示,要真正融入中国市场,必须有一个独特而不俗的中国名字,“不一定要像可口可乐、宝马那样朗朗上口,但一定要深入人心”。

呵呵,胡思乱想一下gogle的汉语翻译成什么才会比较上口,百度自然是“众里寻他千百度”的意思,那么google呢?我觉得如果想婉约一些,不如把google翻译为“顾盼”,这边顾盼,那边百度,挺有趣的;或者更直白一些,翻译为“顾问”,不管怎样,这个“顾”字还是挺不错的,及谐音,又谐意。呵呵,不过这样的翻译还是比较差劲,远不如可口可乐与宝马翻译的好,当年刚学的德语的时候,课后列出了一些常用缩写,读到Bayerische Motoren Werke,一楞神,巴伐利亚摩托工厂,好土的名字,一看缩写BMW,原来是宝马!:)

Blog分类: 
Free Tags: 

初评百度的国学搜索

原来说百度的[国学搜索网站|http://guoxue.baidu.com]要等到1月12日才上线,可是今天发现已经可以访问了。于是好奇随便查了一些句子,但是结果并不是很让人满意,甚至不如网上已经有的一些资料。我随便搜索了一下“墨子”中的一些章节,发现百度不过是做了些纯文本的页面在那里,没有注疏,什么都没有,远不如[国学网站|http://www.guoxue.com]做的注解版的《史记》、《资治通鉴》等古籍,不论是搜索(与google或是古登堡计划相比)的方面看,还是国学(与已有的国学网站相比)的方面看,百度国学搜索的技术含量都很低,并且有一些明显的纰漏与错误,以[《墨子·备城门第五十二》|http://guoxue.baidu.com/page/c4abd7d3/13.html]为例,中间有些句子根本读不通,很多异体字要么用偏旁拼凑的七零八散,要么就不伦不类的杂糅在那里,譬如下面这句: 城四面四隅,皆为高磨衤斯,使重室子居亓上,亻侯適,视亓亻能状,与亓 进左右所移处,失亻侯,斩。 首先,排版有些问题,在不该换行的地方有硬换行,感觉像是从什么地方拷贝粘贴过来的。 其次,既然需要做国学搜索,就该做的专业些,显示不出来的字最好用图片表示,这样分开的(衤斯)字远不如 [http://www.kzeng.info/files/J010193AB.jpg] 看起来方便,而分开的(亻能)字也不如[http://www.kzeng.info/files/J010193AC.jpg]方便。这样字作起来并不难,不知道百度为什么不“勉为其难”? 再次,简体字、繁体字、异体字与通假字杂糅在一起,又不给注释,显得非常混乱,譬如“適“字,虽然它是敌(敵)的通假字,但是不知道为什么不简化为”适“?还有这个(亻侯)字,不知道为什么百度要加个单人旁,我在超星上查了清人孙诒让的《墨子间诂》,这里不过是一个普通的”候“字,不知道百度在这里卖得什么关子? 再再次,还是想强调注疏与训诂的重要性,这些古籍到了以考据为癖的清朝人那里,几乎都有了比较完备的集前朝历代考据之所成注本,如果能将这些书也汇入,那才更有意义。譬如上面的这句引文按照吴毓江的考证,本不该在《备城门》这里,而应该在《号令第七十》那里,[清华网站上的《墨子》中|http://rwxy.tsinghua.edu.cn/rwfg/ydsm/ydsm-qw/02-%C4%AB%D7%D3/015.htm]有较详细的注解。 总的来说,感觉百度的这个国学做得非常的一般,还没有达到[国学网站|http://www.guoxue.com]的水平。
AttachmentSize
Image icon J010193AB.jpg1.92 KB
Image icon J010193AC.jpg1.94 KB
Blog分类: 

百度的国学网站

套用《庄子》上的一句话,百度现在是“ google 亦步,亦步;google 亦趋,亦趋 ”。google 有了专门的[图书搜索|http://print.google.com]和[学术期刊搜索|http://scholar.google.com]后,百度马上也要推出一个[国学搜索|http://guoxue.baidu.com],多少有些效颦之嫌。不过想想,在国内的图书搜索已经有了[超星|http://www.ssreader.com]和[读秀|http://www.duxiu.com]了,百度从头再来倒不如买了读秀;而期刊搜索,又没什么好搜的,国内比较好的一些paper都发在SCI索引的期刊上了,其中多半是洋文,百度也不可能和google在这方面竞争;所以在针对印刷品的革命上,只好把矛头指向国学了。 这也确实是一件好事,毕竟系统整理国学著作,方便互联网检索是一件很有意义的事情。[国学网站|http://www.guoxue.com]原先是一个很好的榜样,但是后来它的一些内容需要付费才能查阅,多有不便,所以如果百度真的能收录现存的所有古代文献,套用网络一句俗语:这个无论如何都是要顶的!:)希望百度在整理典籍的时候把各家的注疏也收录其中,这样可以大大方便读者。在这一点上,台湾教育部的一个在线异体字字典是一个典范,每一个字都详细的罗列各朝各代辞书的详细注解,为了保证原汁原味,这些古书全都以图片而非文本的格式放在网站上的。 呵呵,拭目以待百度的国学搜索,但是建议现在那里的首页作一下更改,现在那里摆放了三本书《诗经》《四书五经》和《史记》。第一本书和第二本书重了,建议第一本换作《庄子》:)
Blog分类: 
Free Tags: 

海洛因,尼龙与 google

海洛因,阿司匹林,尼龙,留声机,热水瓶,激光等等这些东西有什么共同点呢?在读过[这篇文章|http://www.sutherlandsurvey.com/]之后,才意识到这些东西都曾经是注册商标,并且是非常成功的品牌,但是正是因为它们的异常成功,它们的使用被政府“没收”,成为收录入字典的普通词语,结果给研发这些产品的公司带来了极大的损失。而 google 这个单词很可能成为下一个受害者。 海洛因(Heroin)有一个很好听的名字,让人联想起英雄(hero),事实上,这个单词确实与英雄同源。 1874年一位英国化学家首先合成了这种化合物,在发现它有舒解疼痛的功效后,德国著名的制药公司[Bayer|http://www.bayer.com/page52.htm]将其作为药品投放市场,并注册了Heroin这个商标。这个商标来自于德语heroisch,是个形容词,等同于英语的heroic或是heroical,也就是“英雄的”,用来形容这种药在止痛方面的神奇功效,由于这个品牌塑造的过于成功,被普通使用,成为二乙酰吗啡的代名词,于是法庭裁决这个名词不再是专有名词,Bayer公司也就因此丧失了对这个商标的拥有权。 不过让Bayer公司损失更大的是另外一个商标:阿司匹林。同样是因为这个商标的成功,1921年法院判定这个词不再是专有名词,Bayer再次失去对这个商标的拥有权。现在在药店还能买到Bayer生产的阿司匹林,注册商标已经改为Bayer,但是商标下有一行小字:真正的阿司匹林。字里行间多少有些无奈。 即便是在最近,也有不少这样的例子,索尼于2002年在澳大利亚丢掉了对"Walkman"这个词的专有权,因为澳大利亚的最高法院认为这个词已经成为随身听(ft,这个词不知道在汉语里是不是索尼的注册商标)的代名词,所以已经成为普通名词了。 而 google 也面临着这样一个问题,并且 google 更加危险,因为按照习惯用法,google是一个动词而非一个专有名词。为了防止专有名词成为普通名词,一些大的公司已经积累了一些防止的办法,譬如 Coke这个词,可口可乐为了防止这个词成为普通碳酸饮料的统称,积极地监督着这个词的用法,一旦在正式场合(譬如报刊杂志)这个词的使用者没有大写第一个字母C,可口可乐公司就会专门联系使用者要求更正。不过在汉语里,似乎"可乐"这个词已经变为普通词语了,譬如娃哈哈的非常可乐,当然也让中国的百事公司钻了空子,应该是可口可乐首先告诉了中国人什么是“可乐”,然后百事可乐就趁便了。 可是 google 是一个动词。google公司无法要求每个用户把它作为专有动词来使用,因为毕竟英语里面没有专有动词一说。更糟糕的是人们已经造出了google的现在分词,过去分词等变形形式,譬如在google上google "googling"这个分词形式,你能得到1,840,000个结果。而在新编的韦氏字典 Webster's New Millennium™ Dictionary of English 中,google这个词已经被收入,释义为: to search for information on the Internet, esp. using the Google search engine 注意这里是 esp. using the Google search engine,也就是说这个词的用法已经普及化了。 如果这个词被法院裁决为普通用词,那这对Google公司来说肯定是一个莫大的损失,这个损失有多大,不妨在百度上google一下:)
Blog分类: 
Free Tags: 

搞笑的Google Maps

原来只见过MSN Maps在欧洲地图上出过一次糗,最短的路径居然让人家绕了半个波罗的海,结果这次google的地图居然也搞出个这样的问题。不过现在已经更正了,这是今年6月份的地图。今天和一个欧洲的同学谈起美国人世界地理观念极差时,他发给我的:)

Blog分类: 

对awLatestSearches的进一步修改

呵呵,其实对awLatestSearches稍加修改可以增加不少的其他有趣的功能,譬如添加其他搜索引擎的搜索结果,举个例子,如果想添加百度的搜索结果,只需要在原来的代码上添加
...
#Baidu
else if (strpos($refer->url, 'ttp://www.baidu.', 1) == 1) {
$count++;
$link = $refer->url;
$text = preg_replace('/^.*?p=/', '', $refer->url);
$text = preg_replace('/&.*$/', '', $text);
$text = _awLatestSearches_cleanupText($text);
if (strpos($link, '&start=') === FALSE &&
strpos($link, '&b=') == FALSE)
$firstPage = TRUE;
else
$firstPage = FALSE;
$output .= 'Baidu: ' . (($firstPage) ? '* ' : '') .
l($text, $link) . '
';
}
?>
就行了。其他的搜索引擎也可以类推,只要稍微改动搜索引擎的地址即可,但是这样更改后,结果的排序就不准确了,因为作者判断排序的变量 $firstpage 是根据google的搜索结果url来判断的,对百度的判断可能不准确。

其实进一步,对这个模块稍微修改一下就可以得到你的网站在搜索引擎(特别是google)的排名到底在第几页,原理也很简单,根据 $firstpage的定义方式,定义 $secondpage, $thirdpage等等,或者直接定义一个 $nth_page 变量,判断结果的排在第几页。

可惜的是我无法一试了,上次设置cron任务的出错的时候,我的Drupal的数据库中的accesslog表发生了错误,虽然后来用 MySQL的repair指令进行了修复,但是似乎不能写入最新的“访问记录”了,所以我的右上角的“Latest Incoming Search”其实是几天前最新的搜索结果,最近一两天的结果由于accesslog表的问题,其实是无法显示出来的,呵呵,还是重新检查一下数据库最关紧:)

Blog分类: 

搜索引擎的查询结果中,你排名第几?: 一个有趣的模块及修正

发现了一个很有趣的模块,出自于编写awTags的[自动巫师|http://www.autowitch.org/blog]之手。刚刚浏览[inertia的blog|http://heterotopias.org/node/619]时发现他在讨论这个模块,也十分好奇,就装上看看。这个模块可以列出从五大搜索引擎(Google, Yahoo, MetaCrawler, Altavista and MyWebSearch)通过搜索结果进入你的网站的访客搜索时使用的关键字,如果你在那个关键字的搜索结果中排在第一位,那么结果的前面就会用一个“*”表示。譬如根据我网站右上角的那个block的显示,我的blog在“李广利”,“李陵”,“唐朝地图”,“川菜谱”等几个关键词的搜索中列搜索结果的首位。 由于作者在编写这个模块的时候主要考虑到的是西方语言的用户,所以在显示中文的结果时会出现乱码,[inertia|http://heterotopias.org/node/619]似乎也遇到了这个问题,其实在作者最早发布awTags模块的时候也出现过一个类似的语言问题,不过和那个相比,这个问题简单的多,只需要略加更改一下模块最后一行的代码即可,更改如下: 更改为: 呵呵,忘记说了,这个模块的名字是awLatestSearches,可以在[这里|http://www.autowitch.org/node/4352]下载到。
Blog分类: 

Pages