google | 寱语

Google的Measure Map

Submitted by kzeng on Wed, 2006-02-15 23:43

Google总会释放出一些好玩的小东西，譬如这这个最新的Measure Map，它和Google Analytics 有些相似，也提供免费的统计数据，但是它是针对blog的，它有如下的特色：

Measure Map helps you understand what people do at your blog, and what influence you are having on the world.

Easily navigate the numbers that matter

Track links to see who sends you traffic

Find out what people do at your site

Setup is a breeze — it only takes a minute

呵呵，已经忍不住去Sign Up，等待Invitation了，估计这次Google是吸取上次Google Analytics的经验，如果是开放式的申请，大量的访问马上就会把Google的服务器给当掉，所以这次又用了邀请（其实Google Analytics开放申请了不久，就改为邀请了），希望早日得到Invitation，试一试这个新鲜的小东西，blog 是越玩越有趣了：）

Free Tags:

Blog分类:

Gmail for your domain以及演示

Submitted by kzeng on Mon, 2006-02-13 03:51

Gmail宣布推出 Gmail for your domain 测试版，也就是说，你只要拥有一个域名，就可以通过Gmail获得自己域名的邮箱，这个邮箱是完全由Gmail支持的，不需要你自己的任何硬件支持。这个想法挺不错的，在这里可以提交参加测试的表格。San Jose City College已经参与了这项测试服务，所以在这里可以看到Gmail For Your Domain的演示，注意，Gmail允许你有自己的logo：）

Free Tags:

google

gmail

Blog分类:

趣物

Google 的中文名字？

Submitted by kzeng on Sat, 2006-01-14 22:05

在新浪上看到Google要起一个中文名字，以便与百度竞争中文搜索市场：

“Google中国本地化的下一步是斟酌起一个中国名字。”Google大中华区总裁周邵宁表示，要真正融入中国市场，必须有一个独特而不俗的中国名字，“不一定要像可口可乐、宝马那样朗朗上口，但一定要深入人心”。

呵呵，胡思乱想一下gogle的汉语翻译成什么才会比较上口，百度自然是“众里寻他千百度”的意思，那么google呢？我觉得如果想婉约一些，不如把google翻译为“顾盼”，这边顾盼，那边百度，挺有趣的；或者更直白一些，翻译为“顾问”，不管怎样，这个“顾”字还是挺不错的，及谐音，又谐意。呵呵，不过这样的翻译还是比较差劲，远不如可口可乐与宝马翻译的好，当年刚学的德语的时候，课后列出了一些常用缩写，读到Bayerische Motoren Werke，一楞神，巴伐利亚摩托工厂，好土的名字，一看缩写BMW，原来是宝马！：）

Free Tags:

google

百度

Blog分类:

趣物

初评百度的国学搜索

Submitted by kzeng on Mon, 2006-01-09 16:24

原来说百度的[国学搜索网站|http://guoxue.baidu.com]要等到1月12日才上线，可是今天发现已经可以访问了。于是好奇随便查了一些句子，但是结果并不是很让人满意，甚至不如网上已经有的一些资料。我随便搜索了一下“墨子”中的一些章节，发现百度不过是做了些纯文本的页面在那里，没有注疏，什么都没有，远不如[国学网站|http://www.guoxue.com]做的注解版的《史记》、《资治通鉴》等古籍，不论是搜索（与google或是古登堡计划相比）的方面看，还是国学（与已有的国学网站相比）的方面看，百度国学搜索的技术含量都很低，并且有一些明显的纰漏与错误，以[《墨子·备城门第五十二》|http://guoxue.baidu.com/page/c4abd7d3/13.html]为例，中间有些句子根本读不通，很多异体字要么用偏旁拼凑的七零八散，要么就不伦不类的杂糅在那里，譬如下面这句：城四面四隅，皆为高磨衤斯，使重室子居亓上，亻侯適，视亓亻能状，与亓进左右所移处，失亻侯，斩。首先，排版有些问题，在不该换行的地方有硬换行，感觉像是从什么地方拷贝粘贴过来的。其次，既然需要做国学搜索，就该做的专业些，显示不出来的字最好用图片表示，这样分开的（衤斯）字远不如 [http://www.kzeng.info/files/J010193AB.jpg] 看起来方便，而分开的（亻能）字也不如[http://www.kzeng.info/files/J010193AC.jpg]方便。这样字作起来并不难，不知道百度为什么不“勉为其难”？再次，简体字、繁体字、异体字与通假字杂糅在一起，又不给注释，显得非常混乱，譬如“適“字，虽然它是敌（敵）的通假字，但是不知道为什么不简化为”适“？还有这个（亻侯）字，不知道为什么百度要加个单人旁，我在超星上查了清人孙诒让的《墨子间诂》，这里不过是一个普通的”候“字，不知道百度在这里卖得什么关子？再再次，还是想强调注疏与训诂的重要性，这些古籍到了以考据为癖的清朝人那里，几乎都有了比较完备的集前朝历代考据之所成注本，如果能将这些书也汇入，那才更有意义。譬如上面的这句引文按照吴毓江的考证，本不该在《备城门》这里，而应该在《号令第七十》那里，[清华网站上的《墨子》中|http://rwxy.tsinghua.edu.cn/rwfg/ydsm/ydsm-qw/02-%C4%AB%D7%D3/015.htm]有较详细的注解。总的来说，感觉百度的这个国学做得非常的一般，还没有达到[国学网站|http://www.guoxue.com]的水平。

Attachment	Size
J010193AB.jpg	1.92 KB
J010193AC.jpg	1.94 KB

Free Tags:

Blog分类:

百度的国学网站

Submitted by kzeng on Fri, 2006-01-06 20:25

套用《庄子》上的一句话，百度现在是“ google 亦步，亦步；google 亦趋，亦趋 ”。google 有了专门的[图书搜索|http://print.google.com]和[学术期刊搜索|http://scholar.google.com]后，百度马上也要推出一个[国学搜索|http://guoxue.baidu.com]，多少有些效颦之嫌。不过想想，在国内的图书搜索已经有了[超星|http://www.ssreader.com]和[读秀|http://www.duxiu.com]了，百度从头再来倒不如买了读秀；而期刊搜索，又没什么好搜的，国内比较好的一些paper都发在SCI索引的期刊上了，其中多半是洋文，百度也不可能和google在这方面竞争；所以在针对印刷品的革命上，只好把矛头指向国学了。这也确实是一件好事，毕竟系统整理国学著作，方便互联网检索是一件很有意义的事情。[国学网站|http://www.guoxue.com]原先是一个很好的榜样，但是后来它的一些内容需要付费才能查阅，多有不便，所以如果百度真的能收录现存的所有古代文献，套用网络一句俗语：这个无论如何都是要顶的！：）希望百度在整理典籍的时候把各家的注疏也收录其中，这样可以大大方便读者。在这一点上，台湾教育部的一个在线异体字字典是一个典范，每一个字都详细的罗列各朝各代辞书的详细注解，为了保证原汁原味，这些古书全都以图片而非文本的格式放在网站上的。呵呵，拭目以待百度的国学搜索，但是建议现在那里的首页作一下更改，现在那里摆放了三本书《诗经》《四书五经》和《史记》。第一本书和第二本书重了，建议第一本换作《庄子》：）

Free Tags:

Blog分类:

海洛因，尼龙与 google

Submitted by kzeng on Thu, 2006-01-05 11:39

海洛因，阿司匹林，尼龙，留声机，热水瓶，激光等等这些东西有什么共同点呢？在读过[这篇文章|http://www.sutherlandsurvey.com/]之后，才意识到这些东西都曾经是注册商标，并且是非常成功的品牌，但是正是因为它们的异常成功，它们的使用被政府“没收”，成为收录入字典的普通词语，结果给研发这些产品的公司带来了极大的损失。而 google 这个单词很可能成为下一个受害者。海洛因（Heroin）有一个很好听的名字，让人联想起英雄（hero），事实上，这个单词确实与英雄同源。 1874年一位英国化学家首先合成了这种化合物，在发现它有舒解疼痛的功效后，德国著名的制药公司[Bayer|http://www.bayer.com/page52.htm]将其作为药品投放市场，并注册了Heroin这个商标。这个商标来自于德语heroisch，是个形容词，等同于英语的heroic或是heroical，也就是“英雄的”，用来形容这种药在止痛方面的神奇功效，由于这个品牌塑造的过于成功，被普通使用，成为二乙酰吗啡的代名词，于是法庭裁决这个名词不再是专有名词，Bayer公司也就因此丧失了对这个商标的拥有权。不过让Bayer公司损失更大的是另外一个商标：阿司匹林。同样是因为这个商标的成功，1921年法院判定这个词不再是专有名词，Bayer再次失去对这个商标的拥有权。现在在药店还能买到Bayer生产的阿司匹林，注册商标已经改为Bayer，但是商标下有一行小字:真正的阿司匹林。字里行间多少有些无奈。即便是在最近，也有不少这样的例子，索尼于2002年在澳大利亚丢掉了对"Walkman"这个词的专有权，因为澳大利亚的最高法院认为这个词已经成为随身听（ft，这个词不知道在汉语里是不是索尼的注册商标）的代名词，所以已经成为普通名词了。而 google 也面临着这样一个问题，并且 google 更加危险，因为按照习惯用法，google是一个动词而非一个专有名词。为了防止专有名词成为普通名词，一些大的公司已经积累了一些防止的办法，譬如 Coke这个词，可口可乐为了防止这个词成为普通碳酸饮料的统称，积极地监督着这个词的用法，一旦在正式场合（譬如报刊杂志）这个词的使用者没有大写第一个字母C，可口可乐公司就会专门联系使用者要求更正。不过在汉语里，似乎"可乐"这个词已经变为普通词语了，譬如娃哈哈的非常可乐，当然也让中国的百事公司钻了空子，应该是可口可乐首先告诉了中国人什么是“可乐”，然后百事可乐就趁便了。可是 google 是一个动词。google公司无法要求每个用户把它作为专有动词来使用，因为毕竟英语里面没有专有动词一说。更糟糕的是人们已经造出了google的现在分词，过去分词等变形形式，譬如在google上google "googling"这个分词形式，你能得到1,840,000个结果。而在新编的韦氏字典 Webster's New Millennium™ Dictionary of English 中，google这个词已经被收入，释义为： to search for information on the Internet, esp. using the Google search engine 注意这里是 esp. using the Google search engine，也就是说这个词的用法已经普及化了。如果这个词被法院裁决为普通用词，那这对Google公司来说肯定是一个莫大的损失，这个损失有多大，不妨在百度上google一下：）

Free Tags:

Blog分类:

搞笑的Google Maps

Submitted by kzeng on Sun, 2005-09-18 00:41

原来只见过MSN Maps在欧洲地图上出过一次糗，最短的路径居然让人家绕了半个波罗的海，结果这次google的地图居然也搞出个这样的问题。不过现在已经更正了，这是今年6月份的地图。今天和一个欧洲的同学谈起美国人世界地理观念极差时，他发给我的：）

Free Tags:

Blog分类:

对awLatestSearches的进一步修改

Submitted by kzeng on Sat, 2005-05-07 22:49

呵呵，其实对awLatestSearches稍加修改可以增加不少的其他有趣的功能，譬如添加其他搜索引擎的搜索结果，举个例子，如果想添加百度的搜索结果，只需要在原来的代码上添加
...
#Baidu
else if (strpos($refer->url, 'ttp://www.baidu.', 1) == 1) {
$count++;
$link = $refer->url;
$text = preg_replace('/^.*?p=/', '', $refer->url);
$text = preg_replace('/&.*$/', '', $text);
$text = _awLatestSearches_cleanupText($text);
if (strpos($link, '&start=') === FALSE &&
strpos($link, '&b=') == FALSE)
$firstPage = TRUE;
else
$firstPage = FALSE;
$output .= 'Baidu: ' . (($firstPage) ? '* ' : '') .
l($text, $link) . '
';
}
?>
就行了。其他的搜索引擎也可以类推,只要稍微改动搜索引擎的地址即可，但是这样更改后，结果的排序就不准确了，因为作者判断排序的变量 $firstpage 是根据google的搜索结果url来判断的，对百度的判断可能不准确。

其实进一步，对这个模块稍微修改一下就可以得到你的网站在搜索引擎（特别是google）的排名到底在第几页，原理也很简单，根据 $firstpage的定义方式，定义 $secondpage, $thirdpage等等，或者直接定义一个 $nth_page 变量，判断结果的排在第几页。

可惜的是我无法一试了，上次设置cron任务的出错的时候，我的Drupal的数据库中的accesslog表发生了错误，虽然后来用 MySQL的repair指令进行了修复，但是似乎不能写入最新的“访问记录”了，所以我的右上角的“Latest Incoming Search”其实是几天前最新的搜索结果，最近一两天的结果由于accesslog表的问题，其实是无法显示出来的，呵呵，还是重新检查一下数据库最关紧：）

Free Tags:

Blog分类:

搜索引擎的查询结果中，你排名第几？：一个有趣的模块及修正

Submitted by kzeng on Sat, 2005-05-07 02:52

发现了一个很有趣的模块，出自于编写awTags的[自动巫师|http://www.autowitch.org/blog]之手。刚刚浏览[inertia的blog|http://heterotopias.org/node/619]时发现他在讨论这个模块，也十分好奇，就装上看看。这个模块可以列出从五大搜索引擎（Google, Yahoo, MetaCrawler, Altavista and MyWebSearch）通过搜索结果进入你的网站的访客搜索时使用的关键字，如果你在那个关键字的搜索结果中排在第一位，那么结果的前面就会用一个“*”表示。譬如根据我网站右上角的那个block的显示，我的blog在“李广利”，“李陵”，“唐朝地图”，“川菜谱”等几个关键词的搜索中列搜索结果的首位。由于作者在编写这个模块的时候主要考虑到的是西方语言的用户，所以在显示中文的结果时会出现乱码，[inertia|http://heterotopias.org/node/619]似乎也遇到了这个问题，其实在作者最早发布awTags模块的时候也出现过一个类似的语言问题，不过和那个相比，这个问题简单的多，只需要略加更改一下模块最后一行的代码即可，更改如下：更改为：呵呵，忘记说了，这个模块的名字是awLatestSearches，可以在[这里|http://www.autowitch.org/node/4352]下载到。

Free Tags:

Blog分类: