谷歌搜索:一年改进超过500项

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:hlwang72
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  当用户在输入搜索内容,并在转瞬间得到想要的搜索结果时,他也许不会知道谷歌的系统在后台都做了哪些工作,更不会知道这些关于搜索的工作也在不断发生变化。
   负责搜索质量评估和移动搜索的谷歌工程总监斯科特·霍夫曼在搜索领域已经有超过15年的经验。在接受《中国计算机报》记者越洋视频采访时,他详细介绍了谷歌在搜索方面进行的各项改进。“十年前,我们搜索某一信息得到的结果看起来和今天完全不一样。以前,搜索结果只是些网页链接,没有更丰富的内容,而今天我们得到的搜索结果的内容非常丰富,包括网页链接,以及相应的图片、视频、地图等各种各样的内容。除了内容更加丰富外,用户还可以直接搜索到问题的答案。比如搜索‘北京天气’或某个航班号,谷歌可直接给出用户所需的答案,而不是链接到一系列无关的网页。此外,在用户体验方面,谷歌搜索的变化更大。”他表示,谷歌会不停地对搜索引擎进行改进,以便让用户获得更合理的搜索排名结果。
   在搜索流程的诸多环节中,如何对搜索到的结果进行排序,是提升搜索质量的关键。对此,斯科特·霍夫曼表示,谷歌用几百个指标衡量搜索结果并对其进行排序,目的是为用户呈现相关度最高和质量最高的搜索结果和文件。这些指标包括关键词在文件中出现的频率及出现的地方等。例如,如果关键词出现在标题中就比它出现在文章的第十行或更靠后的地方更重要。此外,谷歌还会考虑用户的情况,比如用户输入“纽约”,而他的位置又位于纽约,谷歌就不会提供“纽”和“约”分开的搜索结果。另外,其他网页对这份文件的重视程度也是一个衡量的指标,比如文件被引用的程度和频率,被引用得越多就表示这个网页的质量越高或者越重要,这个网页的排名也就越靠前。
   针对不同关键词,排名需要考虑的指标还有很多。比如用户在搜索医学类问题时,最重视的肯定是网页的权威性,而不希望看到一个博客里谈到这种疾病;北京的用户搜索餐馆,上海的餐馆信息对他就没有什么价值;用户在搜索“奥运会”一词时,大多是想得到与即将召开的伦敦奥运会相关的信息。
   除了根据多种多样的指标对搜索结果进行排序,谷歌对排名的方法进行动态实时的更新和改进。“我们首先会对大家提出的各种新构思进行必要性评估,然后对其中的一部分进行小规模试验。如果的确能给用户带来更好的搜索结果,就会进行下一阶段的实时在线试验。”斯科特·霍夫曼介绍说,谷歌会随机选取一些用户进行试验,如果你经常使用谷歌搜索引擎,可能你已经在不知不觉中参与了在线实时试验。据悉,2011年谷歌共做了5万多次这种试验,并且对搜索引擎进行了超过500项改进。
其他文献
你可以靠营销手段吸引大众眼球一时,但一个品牌要想走得长远,不仅要有一个清晰的定位,要有长期贯彻的理念,更要有过硬的技术、产品和服务。  —— 本报记者 王沛霖    小米手机又“放卫星”了!   近日,小米手机开放了第五轮10万台的网上销售,虽然此次开放购买限制了每人(每账号)只能购买一台,但产品还是在35分钟内被狂热的米粉们一抢而空。   在饥渴营销战术的运用方面,小米手机貌似已经超越了苹果
本报讯 11月25日,民政部、工业和信息化部在上海联合举办全国社区公共服务综合信息平台建设推进会。会议表示,要扎实推进社区公共服务综合信息平台建设,要突出抓好业务平台、信息平台、技术平台三个平台建设,突出抓好信息安全保障,充分发挥社区信息化在提升公共服务水平,促进基层社会服务管理创新等方面的重要作用,推动公共服务水平迈上新的台阶。
三年前,曙光推出了符合SSI标准、支持HPCSC规范,扩展性很强的TC3600刀片服务器。用TC3600搭建的星云超级计算机充分展现了曙光在高性能计算方面的造诣。不过,在曙光眼中,TC3600似乎并不是最完美的高性能计算解决方案。“如果把产品和市场对应的话,TC3600对应的是企业信息化市场,而不是高性能计算市场。”曙光刀片服务器产品经理付雪华介绍。  那么,曙光认为什么样的刀片服务器更适合高性能
将传统HPC领域的技术下沉至企业级数据中心市场,势必引发更加激烈的市场竞争。Nvidia与IBM的联手是其在激烈的市场竞争中树立自身体系的现实考量。问题是,需求驱动与概念驱动,究竟应该是谁先谁后?  —— 本报记者 李奕  今年8月,IBM宣布将联合Google、Nvdia、Mellanox、泰安等厂商组建OpenPower联盟。消息一出,立即在业界引起轩然大波,被视为数据中心领域的“新ARM模式
IBM在研发上的投入和取得的成果是有目共睹的。IBM 连续18年专利数全球第一,2010年IBM公司发明的专利达到了创纪录的5896项,超过第二到第六名专利数的总和。正是创新能力保证了IBM基业长青。  研发部门是IBM创新的主要载体。比如IBM CDL(中国开发中心)就承担了IBM全球软件研发的重要工作,很多重要的软件项目都是CDL来承担的,比如近期的大数据解决方案就主要由中国开发团队承担。IB
《生活大爆炸》中有这样一个场景,Raj迷恋上了iPhone 4s的Siri语音助手功能。在梦中,他来到苹果总部的Siri办公室。这不禁让人想起1950年图灵提出的判定人工智能的标准——图灵测试。Siri的出现是向图灵的致敬。  2012年5月22日 来自新浪微博  “我在1977年就见过比尔·盖茨。我们当时以2.5万美元的固定价格购买微软BASIC,并令其兼容苹果,之后再赠送给用户。这是苹果率先
IBM把自己定位为软件服务提供商,这如同一个风向标,引领着软件行业企业的转型。事实上,传统的以销售软件产品为主的经营模式已经不适应当今社会的发展需求,因为随着整个社会和经济模式的不断发展,个人作为终极用户,其需求在不断提高,这就向上要求每一层级的服务商提升服务水平,包括服务质量和个性化服务等,也导致很多服务商的转型升级,软件作为几乎所有行业的服务商,其转型已经成为软件企业发展的必然。   客户需
南威软件股份有限公司(简称南威公司)自2002年成立以来,一直专注于政务信息化、党务信息化、军队信息化等领域的软件研发、系统集成和技术服务,是国内知名的电子政务解决方案与应用软件提供商,是国家电子政务标准的制定单位之一是国家规划布局内重点软件企业、国家火炬计划重点高新技术企业、全国电子政务十大杰出IT品牌企业。  面向全国发展  目前,南威公司共承担建设了多个国家核心机要部门的信息化建设项目,是北
“业务部门不配合”,是ERP项目实施乃至整个信息化项目都会面临的“老大难”问题。IT经理可以借势“一把手”,通过定期的会议与报告机制,加强宣传及动员,化解沟通难题。     A房地产集团的IT部经理钟明最近很烦躁,原因是他今年在公司里最关键的的任务遇到了严重的问题,而这个任务的完成情况事关他的前程。  项目卡壳   今年是A公司集团化运营的第一年,也是A集团从一家城市级公司向区域级集团公司发展
“信息孤岛不能破除的原因除了大量本位主义的因素外,很多情况下也是由于缺乏需求造成的。我们有一些部门或单位至今不重视信息化建设,有不少人不懂得依据数据信息而仍然在凭感觉、凭想象作决策。”国家信息化专家咨询委员会(下称专家委)副主任杨国勋在接受记者采訪时,犀利的观点冲击了记者原有的看法。而在采訪中,记者愈发对这位长者产生敬意,因为他总是高屋建瓴地阐述观点,让笔者顿如醍醐灌顶。   素有“中国电子政务