人们常说,一个企业,到达顶峰时通常会有两个标志,一是写传记,一是盖大楼。对全球最大的中文搜索引擎百度来说,除了纳斯达克上市当天的股票记录带给人们的心理顶峰之外,另外两个现实的顶峰标志就是马上要出版的《相信中国》和正在北京上地建设的总部大楼。除了现实中那栋建筑,百度也在不停加盖着搜索服务的大楼,最新完工的一层就是1月12日正式发布的国学频道。
人们常说,一个企业,到达顶峰时通常会有两个标志,一是写传记,一是盖大楼。对全球最大的中文搜索引擎百度来说,除了纳斯达克上市当天的股票记录带给人们的心理顶峰之外,另外两个现实的顶峰标志就是马上要出版的《相信中国》和正在北京上地建设的总部大楼。除了现实中那栋建筑,百度也在不停加盖着搜索服务的大楼,最新完工的一层就是1月12日正式发布的国学频道。
作为全球第一个国学搜索频道,百度国学频道的内容主要来源于专业国学网站“国学网”的提供,目前包括了10多万网页,1.4亿字。收录大部分上起先秦、下至清末两千多年间以汉字为载体的历代典籍。百度产品市场部总监边江介绍说,与那些普通搜索中由于互联网的海量信息而造成的良莠不齐的“国学信息”相比,国学频道的搜索只在频道内部进行,不会出现网页的搜索结果,是一个“干净”的搜索频道,为网友提供免费的国学典籍在线阅读以及搜索服务。
互联网上可以搜索到的国学信息并不少,可为什么百度偏偏要做一个独立而干净的国学频道呢?百度公司副总裁梁冬说到,“事实上在百度推出国学频道之前,就已经有很多关于国学的论文了,可以检索到很多相关国学的信息。我们为什么要推出国学频道呢?就是有一些章节、有一些典籍需要明确,有些会让我们的消费者模糊,所以百度国学为此开辟了一个三高的土壤,高精度、高质量、高能度”。
事实上,像百度这样认识到了网络搜索中的有效信息的有限性后转向建设专业知识库的人并不在少数——先于百度国学频道一天推出的Google学术搜索,不久之前发布的新浪爱问,甚至再早一点Google图书馆计划和各种百科全书上网计划,已经有太多的互联网大鳄们都纷纷梳理信息,开始试图做网络图书馆或网络资料库。百度国学频道和国学网的合作,Google学术搜索和万方数据资源系统,新浪爱问与《中国大百科全书》,Google图书馆与英美五大图书馆,他们都将目标转向了互联网知识库的建设。
为何这些互联网大鳄们都选择了如此不约而同的华丽转身?事实上,互联网的大部分网页是在11年前Netscape研发出第一个大规模商用的浏览器后才开始创建的,而真正的网页爆炸和泛滥也是在互联网的第一次春天1997年以后。可以说,1995年之前的即时性历史很多都已经被互联网屏蔽掉了,1997年之前的新闻搜索也变成了互联网最大的空洞,剩下的不过是我们的近十年。正如纽约国会图书馆馆长詹姆斯·H·毕灵顿在谈到Google时所说的,“互联网的历史太短,大多数网页1995年后才被创建,而且其中还有超量的性、运动和流行歌手”。
而网络有效信息知多少?除了美国人那句广为人知的“输入apple后只能盼望在读完2800多万个关于电脑产品的条目之前能找到一个跟植物学有关的网站”之外,国内的一位网站编辑也在梦工厂被收购之时,在自己的博客上写道,“在输入Dreamworks之后,满页满页都是梦工厂制作的电影的预告片链接,几乎找不到想要知道的梦工厂的人和事”。所以,尽管搜索技术不断提高,但还是会出现大量良莠不齐的信息和不断重复的仅有的几条有效信息,面对这些,不少人甚至给自己下了一个翻看搜索页数的底限,有的人看了6页就不再继续翻了,有耐心的人可能坚持到第10页。
事实上,很多时候用Google、百度确实没有用英语维基百科或大英百科全书来得更为迅捷有效,在Google上费力寻找的某条新闻可能只是英语维基百科上解释详细的词条后面的一个相关链接。所以,也便不难明白,为什么这些大名鼎鼎的搜索网站或门户网站都开始了知识库的建设,这样,他们便能在既有的强大的搜索功能后再拥有庞大的信息量,弥补互联网近十年的内容缺省。这以后意味着的,可能就是看似并不矛盾的最为自由的开放与共享及最大化的商业利益。而依托着全球最大中文搜索引擎的百度国学,虽然可以在频道中干净地搜索到估计的文本,但权威注释、生僻字和不同版本的提供这些问题还有待解决。毕竟,如果只是纯文本的搜索,百度国学对一部分人来说可能就是并未知多少,而对另外一部分人来说,则是互联网的自由与分享。■
发表评论