建站动态

  
查找:
 
 
寻找更好的搜索引擎
    至少从某一方面来讲,物理学家和我们这些人没什么两样。上网找资料时,他们的期待与普通人一样。 
  斯坦福线性加速器中心(Stanford Linear Accelerator Center)是加利福尼亚的一家高能物理实验室。负责运营该中心网站的比博.怀特(Bebo White)对此深有体会。他说:“如果我们不能尽快让他们找到有用的结果,他们会很失望。”

  那么,那些浏览此网站的专家最关注的是什么呢?网站的另一位技术人员鲁斯.麦克邓恩(Ruth McDunn)透露说,是当天餐厅的菜单。

  人们对于搜索引擎的期望值飞速飙升,可称之为google效应(Google Effect)。他们普遍认为,无论是复杂的专业知识,还是一些鸡毛蒜皮的小事,只要点一下鼠标,所有的东西就应该唾手可得。

  想要找到专常可能会出奇地困难,即使是那些用去几百万美元用来吸收和占有它们的公司也一样。储存档案和固定分类等传统方法都是不够的,因为专业技巧和其它资产不一样。它们依附于不同的环境之中,这使它们难以被描述和分类。

  当Google把这种新要求变成一种商业模式,并获得巨大反响的时候,人们的期望值开始让全世界的公司头大。他们的客户,员工和管理者现在都要求能够立刻获得所需要的信息。

  无论他们是在访问一家公司的公众网站、浏览企业的内部网,还是从堆积如山的员工电子邮件中寻找信息,而用户的期望值也一样高。

  在一个庞大复杂的公司或是政府部门内,寻找相关信息是个问题,这个问题引发了许多新技术的反应。一些相关的公司宣称,它们的技术复杂精密,已经远远胜过Google,并且代表了搜索技术的下一波浪潮。

  Autonomy是英国一家专事研究搜索技术的公司。它的首席执行官麦克.林奇(Mike Lynch)表示:“搜索引擎的整个故事还远未结束。现在运用的只是可以被实现的技术中很小的一部分。”

  作为一种现代生活工具,搜索引擎的崛起反映了“无组织”数据资料的大量增长。它们存在于万维网和公司的内部信息系统中。有组织的数据资料,顾名思义,储存在有架构的数据库中:它们被排列成表格形式,便于摘要和分析。而另一方面,无组织数据资料则是一团糟。一封电子邮件或是一个Word文档中的信息无法适用于任何组织原则。然而它们正日益成为寻找一个公司最重要信息的地方。

  对于“企业型”的搜索引擎来讲,它们所面临的挑战和Google在因特网上所面临的是截然不同的。Google的页面排行(PageRank)技术通过分析网站之间的链接解决了筛选数以百万计网页的难题:拥有越多的链接,该网页的信息被认为越有用,而它在搜索结果排行榜上的位置也越靠前。Google在此基础上融合其它技术,不断完善自己的搜索引擎。而这些技术至今仍然是机密。

  但是,通过网页的流行程度来评估它的价值有它的局限性。安德鲁斯(Andrews)先生说:“对整个互联网来说,Google的技术很棒。但它对公司是否普遍适用,这个方面还不明朗。” 对于流行程度这个标准,斯坦福的麦克邓恩先生补充说:“它对于我们想要找的信息没有太大帮助。”然而这并没有阻挡Google进军企业搜索业务。它正在销售的是一种预装在服务器内的软件,名为Google搜索用具(Google Search Appliance)。

  Google提供的如果只是在某一任意时间,它对网络搜索结果的最佳估算,那么另外一个问题是,企业级搜索引擎必须符合非常高的准确性标准。而且,这些数据资料要从200多种不同的文本格式中提取出来,这比通常在网上碰到的HTML, PDF和Word格式要多得多。

  安德鲁斯先生说,一大群专业搜索引擎公司现正致力于解决这些问题。大量的智力资源被用于编写新的运算法则,以更好的评估搜索结果的有用程度。

  美国搜索公司Verity的首席技术执行官普拉波哈克.拉格哈文(Prabhakar Raghavan)认为,评估搜索结果实用性的一些基本方法已经有了。现在的问题是,如何把这些不同的方法融合起来,以获得更好的结果,这个过程被称为“调谐”(tuning)。

  为了创造搜索领域的下一次飞跃,技术创新主要被运用于两个主要方面。其中之一,是通过自动化分类技术给无组织的数据创建一个初步的组织架构。拉格哈文先生说:“当你将那些无组织的内容组织起来,你就赋予了它们新的价值,并使它们可以被某些应用程序利用。”

  但是,在“分类法”成为搜索领域最热门话题的同时,给这些一团糟的数据整理头绪的尝试仍然处于一个初级阶段。第二个新的热门话题是“个性化”。搜索引擎公司表示,当用户不得不从搜索结果中仔细辨别需要的信息时,他们变得越来越没有耐心。

  大多数人使用网上工具的方法不当,成为导致这个问题的部分原因。挪威一家名为FAST的搜索公司的市场总监阿里.里亚兹(Ali Riaz)指出,人们经常无法精确地提出他们的搜索要求。

  他说:“人类在提供信息方面非常懒惰,但却很贪婪的要得到它们。”

  这也是那些访问斯坦福线性加速器中心网站的物理学家的特点。怀特先生表示,他们很少在引擎中输入一个以上的单词。但是,假如搜索结果没有精确地按照他们的特殊要求排列的话,他们就会失去耐心。

  想要判断用户期望的回答是什么,还得看他们在公司内部的具体职位。这种方法已经为人们使用。即使市场部和法律部的职员输入同样的条件搜索,他们想要的信息类型也可能会不同,这也是合情合理的。

  Google和yahoo等服务于大众市场的搜索引擎也正努力使它们的搜索结果对上使用者的特殊要求。

  有如此多的研究工作正在开展中,大多数专家都信心十足地预测,未来会有更大的突破。哪怕这些预测伴随着对Google的一份嫉妒,这也是情有可原的。Autonomy公司的林奇先生表示:“一种新的、更好的搜索引擎将会出现,比所有人期待的来得更快。”
日期:2007/12/28 阅读:731
添加到收藏夹】 【 打印 】  
 
深圳市国通网企科技有限公司   联系电话:0755-84810325(20线) 全国统一服务热线:0755-84810325(7d×24h)  
版权所有 Copyright ©  www.LgSite.com.cn All Rights Reserved
 

提交您的需求  

  • 项目名称:
  • 公司名称:
  • 联系人:
  • 联系QQ:
  • 联系电话:
  • 联系Email:
  • 联系地址:
  • 需求概要: