首页 理论教育 有影响的大型综合性搜索引擎介绍

有影响的大型综合性搜索引擎介绍

时间:2022-10-13 理论教育 版权反馈
【摘要】:下面介绍几种较有影响的中文和英文搜索引擎。百度搜索引擎拥有中国最强大的搜索技术开发团队,并申请了国内第一个搜索引擎专利“中文姓名的计算机识别及检索方法”,第一个支持中文GBK搜索,并实现了“动态网页”检索。2001年10月百度根据李彦宏先生的第三定律和百度自身庞大的搜索用户群,适时推出了搜索引擎的竞价排名的商业模式。

随着Internet在中国的普及和发展,许多以中文为母语的国家和地区都相继开发出了各种各样的中文索引擎,世界著名的搜索引擎公司,如Yahoo!,Google,AltaVista,Lycos,Excite等先后也推出了中文版。下面介绍几种较有影响的中文和英文搜索引擎。

4.3.1 百度搜索

网址:www.baidu.com。

百度搜索是全球最大的中文搜索引擎,1999年底成立于美国硅谷,2000年1月该公司移回到北京发展,它的创建者是在美国硅谷有多年成功经验的李彦宏和徐勇。

百度一直致力于向人们提供“简单,可依赖”的信息获取方式。最初,百度将自己定位于一家向网站提供后台支持的公司。百度的主要产品是基于全球的中文网页搜索。百度搜索引擎拥有中国最强大的搜索技术开发团队,并申请了国内第一个搜索引擎专利“中文姓名的计算机识别及检索方法”,第一个支持中文GBK搜索,并实现了“动态网页”检索。百度是互联网中文信息检索和传递技术供应商,它的搜索引擎技术是各大门户网站的坚强后盾,如曾一度被新浪、搜狐、263、Tom、21CN等采用。

百度在向门户网站提供搜索服务的同时,学习了Google的商业模式,把公司的网站改为搜索网站,同时也迅速添加了类似于Google的网页快照、地图搜索等特色功能。2001年10月百度根据李彦宏先生的第三定律和百度自身庞大的搜索用户群,适时推出了搜索引擎的竞价排名的商业模式。

“众里寻他千百度,蓦然回首,那人却在,灯火阑珊处。”这是一种何等蜿蜒曲折、意犹未尽、令人惊喜的意境啊,这里的“百度”二字,十分完美地体现了百度搜索对开发中文信息搜索引擎技术执着的追求,不但是“路漫漫其修远兮,吾将上下而求索”,而且还饱含信心满满、志在必得的决心和勇气!

在位于北京大学附近的百度总部,李彦宏(英文名Robin)接受了记者的专访,面对记者他追忆自己的人生点滴。人们只看到百度上市成功后的李彦宏,却很少有人注意到,李彦宏在美国工作最得意之时,毅然放弃外国公司丰厚待遇和期权,回国创立了百度。他是一个一直都很成功但仍能不断否定自己从而获得更大成功的人。

他以山西阳泉全市第一名的成绩考上北京大学图书情报专业,几年毕业后立志到美国继续学习和发展。当他收到美国布法罗纽约州立大学计算机系的录取通知书时,正值圣诞节。23岁的李彦宏背着行囊,穿云破雾,踏上了人生的第二次征程。

美国布法罗纽约州立大学一年中有6个月飘着雪。在这里,他忍受过深夜彻骨的冰冷。白天上课,晚上补习英语,编写程序,经常忙碌到凌晨两点。在这里,他经历过中国留学生初来乍到的所有困苦。“现在回想起来,觉得当时挺苦的,但年轻就应该吃苦。”李彦宏评价这段经历时说。

毕业后李彦宏受聘到华尔街工作,在接下来的3年半时间里,每天都跟实时更新的金融新闻打交道,先后担任道·琼斯子公司高级顾问、《华尔街日报》网络版实时金融信息系统设计师。

1997年,李彦宏离开了华尔街,前往硅谷著名搜索引擎公司InfoSeek(搜信)公司。在硅谷,李彦宏亲眼见到了InfoSeek在股市上的无限风光以及后来的惨淡。InfoSeek被迪斯尼公司收购后,公司对搜索引擎项目渐渐失去了兴趣,李彦宏感觉十分失落,遂决定自立门户,回国创业,并邀请好友徐勇做合伙人。

场景转移到2000年初北京大学,李彦宏与合作伙伴徐勇,在北大的资源宾馆租了两间房,连同1个财会人员和5个技术人员,一行8人,悄无声息地开始了创业。创业初始,定位于搜索技术,业务是为其他网络企业提供中文搜索技术服务——这是李彦宏从风险投资商手里拿到首期120万美元投资的“概念”。很快,包括新浪、网易在内的国内主要门户网站陆续用上了百度的技术,百度借此收取一定数额的技术服务费。

中文搜索百度登录美国纳斯达克的当天,百度股价上涨354%,开创纳市5年来新股首日增幅之最。

上市前一个月,李彦宏开始逐步调整策略,宣布百度坚持独立发展,拒绝被Google收购,上市之后,李彦宏进一步与Google划清界限。“百度不仅是最大的中文搜索引擎,还是最大的中文网站,如果不能够控制在中国人手中的话,我觉得可以说是一个民族的悲哀。”李彦宏说。

当李彦宏从纽约归来走出首都机场时,疲惫的眼神一下子变得有些惊讶:五六束鲜花、十几个镜头一下子围了上来。登录美国纳斯达克股市的中国企业已经20多家了,这样的凯旋场面估计还是第一次。当然,上市第一天股价便狂涨350%的公司也只有百度一家。

古往今来之成大事业者,必经过3种境界。“昨夜西风凋碧树。独上高楼,望尽天涯路”乃第一境。“衣带渐宽终不悔,为伊消得人憔悴”此第二境也。“众里寻他千百度,蓦然回首,那人却在,灯火阑珊处”为第三境界。千百劳作,终有所成,这是何等的喜出望外,但又恰属于情理之中!一分耕耘、一分收获;一分探索、一分成功。

(扩展阅读请见参考资料来源:http://it.people.com.cn/GB/42891/42894/3687320. html)《京华时报》(2005年9月12日B33版,作者辛苑薇,张见悦)

(1)百度的检索方式

百度搜索提供了简单搜索、高级搜索和网页目录等几种方式。当打开百度主页后,直接进入简单搜索方式,只需在搜索框内输入需要查询的内容,按“Enter”键,或者鼠标单击搜索框右侧的百度搜索按钮,就可得到最符合查询需求的网页内容,如图4.3所示。

图4.3 百度的简单检索画面

(2)百度的检索特点

1)百度快照

每个被收录的网页,在百度的服务器上都存有一个纯文本的备份,称为“百度快照”。当检索到的链接网页打开速度较慢,或者是网站服务器暂时中断或堵塞、网站已经更改链接、“该页无法显示”(找不到网页的错误提示信息)等。可通过“百度快照”快速到达页面的文本内容。不过,百度快照只保留文本内容。

2)高级检索

高级检索可定义搜索结果中“包含以下全部的关键词”(相当于and)、“包含以下完整关键词”(相当于and且“精确匹配”)、“包含以下任意一个关键词”(相当于or)、“不包括以下关键词”(相当于not)。还能设置每个显示页显示多少条记录、搜索网页的时间、文档格式、关键词位置以及指定要搜索的站点等,通过这些限定条件,使检索结果更为准确。

与大多数搜索引擎相同,百度搜索提供“分类检索”和“关键词查询”两种方法。关键词检索将会有目录、网站、网页、新闻这4种依序的结果,除非先选定其中之一。检索结果的页面中检索词显示为红色。

百度同样支持多关键词查询。关键词之间可用空格、逗号、+以及&符号,它们都代表AND,而用竖线符号“|”代表OR,“-”仍然为NOT(例如,要武侠小说,但不要金庸,则输入“武侠小说-金庸)。在输入的关键词前加“t:”将搜索网站标题(title),加“u:”则搜索网站地址(URLs)。

为了避免检索结果数量过多(这是大多强力搜索引擎的“通病”),百度对网页检索结果进行了一些技术处理:一是“站点类聚”,是指在检索结果中,如果来自同一站点的网页不止一页,则只提供内容最相关的一页,其余隐藏,同时会提供该网站的一个链接,显示为“此站点上的更多结果”;二是“内容类聚”,是指在检索结果中,如果某些网页内容相同,则同样只保留一篇,其余隐藏。

3)精确检索——使用双引号和书名号

如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。给查询词加上双引号就可达到不拆分查询词的目的。中文书名号检索,如《计算机网络技术》,则书名号会出现在搜索结果中,而且被书名号扩起来的内容,不会被拆分。

(3)百度的特色产品简介

百度的产品和服务范围非常广泛,涉及人们生活的方方面面。其产品多达100多种,包括MP3搜索、图片搜索、新闻搜索、地区搜索与影视搜索等。以下只简单介绍百度贴吧、百度知道、百度百科等几个与文献相关的最有特色的服务。

1)百度贴吧

百度贴吧是世界最大的中文交流平台,这是一个自由网络空间。贴吧里每天都有无数新的思想和新的话题产生。贴吧的形式类似于一些社区网站的BBS,但是它的创建比在BBS上发帖、找帖方便得多。贴吧通过用户输入的关键词自动生成讨论区,使用户能立即参与交流,发布自己所拥有的关于感兴趣话题的信息与想法。

2)百度知道

百度知道于2005年11月正式发布,是一个基于搜索的互动式知识问答分享平台。与大家惯用的搜索服务不同,“百度知道”并非是直接查询那些已经存在于互联网上的内容,而是用户自己根据具体需求有针对性地提出问题,通过积分奖励机制发动其他用户来创造该问题的答案。同时,这些问题的答案又会进一步作为搜索结果,提供给其他有类似疑问的用户,达到分享知识的效果。百度知道的最大特点,就在于和搜索引擎的完美结合,让用户所拥有的隐性知识转化成显性知识,用户既是百度知道内容的使用者,同时又是百度知道的内容的创造者,在这里累积的知识数据可以反映到搜索结果中。通过用户和搜索引擎的相互作用,实现搜索引擎的社区化。

3)百度百科

始于2006年4月的百度百科是一部内容开放、自由的网络百科全书,也是全球最大、最全的简体中文知识性百科全书,涵盖所有领域知识、服务所有互联网用户。

在百度百科中每个人都可以自由访问并参与撰写和编辑,分享及奉献自己所知的知识,所有人共同编写成一部完整的百科全书,并使其不断更新完善。它为用户提供了一个创造性的网络平台,强调用户的参与和奉献精神,充分调动草根大众的力量,汇集上亿网民的头脑智慧,积极进行交流和分享,同时实现与搜索引擎的完美结合。

4)百度文库

百度文库是供网友在线分享文档的开放平台,在这里,用户可在线阅读和下载涉及课件、习题、考试题库、论文报告、专业资料、各类公文模板、法律文件、文学小说等多个领域的资料。平台上所累积的文档均来自热心用户的积极上传。“百度”自身不编辑或修改用户上传的文档内容。

百度百科与百度贴吧、百度知道、百度文库四位一体的服务,共同构筑了一个完整的知识搜索体系,成为百度网页搜索的有力补充,更好地提升了用户的搜索体验。

4.3.2 谷歌搜索

网址:http://www.google.com.hk/。

Google是一个功能强大、使用方便的搜索引擎。图4.4是Google中文的检索界面。

谷歌是易用性最强的搜索网站,它提供了简单易用的免费服务,用户几乎可以在瞬间得到相关的搜索结果。Google与其他搜索引擎最大的不同在于,使用复杂的自动搜索方法,可避免任何人为感情因素。Google的结构设计确保了它绝对诚实公正,任何人都无法用金钱换取较高的排名。Google可以诚实、客观并且方便地帮助用户在网上找到有价值的信息。

图4.4 Google简洁的检索界面

(1)谷歌概况

谷歌不止是一个搜索引擎。可以说谷歌是一本最大的词典,也可以说谷歌是一本百科全书,谷歌还是全球第一的媒体公司。

全球最大的搜索引擎服务商谷歌,每天24 h不停地对全球互联网进行反复、蜘蛛网式搜索,将不同的网页收集在一起,再按照一定的算法将所有的网页编辑成统一格式的索引,供用户使用。事实上,用户利用谷歌进行搜索时,搜索的并不是互联网,而是储存在谷歌服务器中的互联网网页拷贝(即所谓“网页快照”)的索引。据称,谷歌的目录中收录了全球24亿多个网址,并逐一将其网页下载、复制,以网页快照形式存放在其12万余台分布式服务器中,使用200多条T3级宽带。谷歌平均每天提供约2亿次搜索服务。为了安全起见,谷歌还对上述信息资源做了异地备份,并定期对所存内容进行更新。目前,谷歌目录中存有80亿个网页。

谷歌的网页分级(PageRanking)技术是谷歌的两位创始人拉里·佩奇(Larry Page)和赛吉·布林(Sergey Brin)在斯坦福大学的博士论文,他们利用网络的链接结构,而不仅仅是使用文档的属性来判定文件的重要性,从而实现了更好的搜索效果,使谷歌在搜索技术方面取得突破并领先同行。谷歌对所有的互联网网页编制索引。

虽然很多人认为谷歌的成功在于发展了一种可以对网页搜索结果进行优先级排序的算法,实质上,除了拥有搜索引擎的核心技术之外,它最大的成功之处是将全球的互联网网页整个拷贝(镜像)下来这样一个有胆有识和非常具有战略意义的举措。

一个搜索引擎系统,12万台服务器,这样大的规模,技术的复杂性姑且不论,敢想就不易。但是,谷歌认识到,随着信息技术的发展,存储器的成本与信息内容的价值相比,已经可以忽略不计。“信息是信息时代最重要的资产”,谷歌则把全球的信息资源变成了它的信息资产。谷歌利用互联网的开放性,几乎不花一分钱的代价就把全球不知多少人、花了不知多少钱、多少时间和精力,所生产的数字信息资源变成了自己的财富和利润的源泉;而且,就控制和拥有全球的信息资源而言,谷歌变得具有战略的重要性。谷歌已经改变了许多人的工作方法、学习甚至研究方法。有谷歌在,人们会觉得互联网就在身边;没有谷歌,很多人将无所适从,好像小学生没有了字典、科学家没有了图书馆。一旦没有了谷歌,人类就似乎失去了数字世界,对工作、学习和生活的影响是难以想象的。谷歌显示出了其在互联网时代举足轻重的意义。

2005年底,公司员工总数约5 680人,年营业额却达到了61.3亿美元。2005年6月11日的《华盛顿邮报》报道,谷歌的市值在6月7日这天达到800亿美元,超过时代华纳20亿美元,成为世界第一媒体公司;而此时距离2004年8月谷歌的上市,为时仅10个月。当时,谷歌的股票每股只有85美元;现在,它的每股价值接近480美元。2006年,谷歌的营业额为106亿美元,员工已超过1万人。

“googol”,是美国数学家Edward Kasner的侄子Mition Sirotta创造的一个词,表示为10100,即1后边带有100个零的数字。Google把这个词的词尾略加调整后作为公司名,暗含征服网上无穷无尽资源的雄心大志。Google已经被公认为是现代规模最大、最受欢迎的搜索引擎,它给广大网民提供了免费的、最便捷的网上信息查询,还向AOL(美国在线)、CompuServe、Netscape、Yahoo!、中国网易等知名门户网站和搜索引擎提供后台网页查询服务。

2010年Google由于不愿意签署中国政府提出的对网上不良信息的筛选协议,加之在中国耕耘4年后,市场份额增长有限,于是部分退出了中国市场,并将总部搬迁至中国香港。但由于很多用户已经习惯了使用Google,因此,很多人仍然通过其他方式使用Google搜索引擎和工具。

(2)谷歌的功能和特点

1)界面简洁

谷歌界面有时甚至让人觉得过于简陋,它既没有分类目录,也没有什么广告、新闻等服务项目放在主页上拥挤不堪。首页作为用户开始接触的门户,美观、简洁是一大根本,可使用户直观地感觉到搜索引擎功能的存在,而且意识到其搜索功能的强大,从而有继续搜索操作的愿望。

由谷歌创始的简略界面后来被众多搜索引擎纷纷起而仿效,这真应了一句老话,“简单的便是强大的”“简单就是美”。当你打开一个门户网站,满屏充塞、挤满了无数链接,还有众多的游动广告,看得你眼花缭乱,这时你的心情无形中处于压抑状态。而谷歌放弃了在小小屏幕上尽量展示互联网丰富多彩内涵的无助且无奈的企图,干脆让屏幕空着,给人以简单、深邃、有力和美的感受,并给人留下想象的巨大空间。

2)PageRank算法

Google采用了新一代的网页级别(PageRank)自动鉴别技术,这种技术是该公司独创的,以一个网站被其他网站链接的频率来评介该网站的检索级别。网页的质量和被其他页面链接的次数成正相关。PageRank算法是链接分析流派中的一个典型代表,也是第二代搜索引擎的重要特点。Google将所发明的PageRank算法成功地运用到搜索结果的排序之中,此举使混沌的、杂乱无章的数以万计的查询结果变得井然有序,即网页内容与查询关键词的相关度较大的排在前面,使得人们在利用Google检索网络资源时,只需阅读前几页的结果即可基本满足要求。在Google分类目录里的网页摘要中,用一条长短不等的绿色横线标记网页被链接的频率,使用户一眼就明了网页的重要程度。

3)技术先进、搜索结果精确、排序公正

有别于其他搜索引擎,没有人能花钱买到谷歌的一个更高级别的PageRank,保证了排名的客观公正。谷歌搜索就是以这样诚信的服务让用户非常容易地找到高质量的网站。

除了具有其他搜索引擎已有的功能外,谷歌还有非常多的特色功能。例如,谷歌智能化的“手气不错”功能,提供可能最符合要求的网站。可选择的语言界面有72种之多(包括简体中文和繁体中文);语言翻译功能,能够把法语、德语、意大利语、葡萄牙语、西班牙语和英语、中文等互相翻译。

4)搜索快速

谷歌搜索速度的快捷是它的又一大特色,用户所输入的任何关键字或信息,都能得到快速的响应,且其超链分析的算法还会将搜索结果排列出优先次序,从而使重要的结果排列在前,节省了用户的查询时间。谷歌在全世界拥有超过10 000台Linux服务器,200多条T3级(传输速率可达44.736 MBit/s)宽带链路,在超过20亿的网页中搜索、返回最相关网页的时间不到1.5 s。目前,每天都有数千万用户登录谷歌,处理的网页搜索量达到每天超过1.5亿次。这方面某权威杂志的评价很有代表性:“由于简单有效,Google已成为广大互联网用户的宠儿。”

(3)Google的检索方式

1)简单搜索

①独特的检索语法

Google界面中有“高级搜索”“语言工具”和“使用偏好”这3个链接。其中“使用偏好”可选择26种不同的语言,Google具有自己独特的语法结构,它不支持“and”“or”和“*”等符号的使用,它自动带有“and”功能,当需要使用类似功能时,只需在两个关键词之间加空格即可,如“计算机 信息检索”。由于不支持“or”查找,所以谷歌无法接受“或者包含词语A,或者包含词语B”的网页,用户如需获取两种不同的信息,例如查milk或eggs,则需分两次检索,一次查milk,一次查eggs。

Google不支持“词干法”和“通配符(∗)”检索,要求所输入的关键词完整、准确、一字不差,才能得到最准确的资料。要获得最实用的资料,则需要增加关键词的数量,并逐步缩小检索范围。

②忽略部分词语

通常Google忽略http和com等字符,以及数字和单字,此类字词过于频繁出现于大部分网页,不仅无助于查询,而且大大降低搜索速度。用“+”可将这些字词强加于搜索项,但“+”前面必须留一空格。也支持“-”功能。

③Google搜索不区分英文字母大小写

所有的字母均当作小写处理。Google对英文单词的拼写有纠错功能。例如,当对单词psychiatrical(精神病学的)的拼写不是很确定时,就可根据拼读规则在Google搜索框中输入大致的单词拼写,如输入spychiatrical进行搜索,Google就会提示“您是不是要找psychiatrical?”,这样就可判断出目标单词正确的拼写形式,这肯定比用书本字典方便快捷得多。Google还可检验某种表达方式或搭配是否正确。例如,要表达“浓咖啡”时,是用powerful coffee还是用strong coffee呢?这时只要分别在搜索框中输入powerful coffee和strong coffee,就会发现英语中有strong coffee,但没有powerful coffee的表达方式,除非其后有grinder等别的词(powerful coffee grinder表示“功能强大的咖啡研磨机”)。也就是说,英语中strong可以和coffee搭配,但powerful却不可以直接修饰它。

2)高级搜索

对于某些专用语的查询,可单击“高级搜索”按钮,进入高级检索界面。例如,要查找名言警句等专有名词时,要在键入的专有名词上加上双引号(英文字符双引号)。

Google可指定域名或指定文件类型进行搜索,如利用“site:xxx.com”可在某个特定的网站进行搜索。例如,如果搜索中国教育科研网上关于搜索引擎的技巧,那么可这样输入: search engine tips site:edu.cn。如果要排除某网站或者域名范围内的页面,只需使用“-网站/域名”即可;利用“filetype:文件类型”可在一类文件中进行搜索,如“filetype:pdf”“filetype:ppt”等。

此外,Google还支持在一些词后加冒号,指定关键词出现的位置,如“inurl:”要求搜索的关键词包含在URL链接中;“link:”要求搜索所有链接到某个URL的网页;“intitle:”要求在网页标题中;“inanchor:”或“allinanchor:”要求搜索的关键词包含在网页的“锚”中。

3)其他重要检索功能

①“网页快照”功能

Google进行网页遍历的时候,会给网页做一份索引快照(Snap Shot),并将其存储到Google的服务器中。当用户只是想大略浏览一下,或网页无法访问,或已被删除时,“网页快照”功能可很好地满足用户要求。

②“手气不错”功能(I’m Feeling Lucky)

如果在输入关键词后选择“手气不错”,Google将带你到它所推荐的网页,无须查看其他结果,省时方便。

③“类似网页”查找功能

如果单击“类似网页”链接,Google会启动“侦察兵”寻找相似网页。Google一般都是找同一级别的网页,如若该页是某个大学图书馆,则“侦察兵”能找到的多半也是一些大学图书馆的网页。而若搜索结果是Google所推荐的网站时,在搜索结果末尾会有RN标志。

④网页翻译功能

如果用户使用Google搜索外文网站,会惊喜地发现搜索结果页面上多数网站链接后面都出现了“[翻译此页]”链接,单击它就可以看到Google自动翻译的中文页面,目前该网页翻译服务仅局限于中文用户翻译英文网页。

⑤学术搜索(Google Scholar)

Google的Google Scholar于2004年11月24日推出,是世界上第一个针对学术期刊、论文、著作、摘要的免费学术搜索引擎,它的面世为我国科研用户查找英文文献提供了一个强有力的学术搜索工具。

如今,甚至可通过Google scholar直接搜索维普、万方数据库的资源,对于有权使用全文的用户可直接下载全文。Google学术搜索可从同一个位置方便地搜索各种资源,查找报告、摘要及引用内容,通过用户所在的图书馆或在Web上查找完整的论文,了解任何科研领域的重要论文。

⑥地图搜索

Google地图搜索提供超级强大、友善的地图技术以及本地公司、餐饮等资信,包括公司位置、联络资信以及行车路线指示等。

在北美的部分地方,谷歌开通了“街景视图”服务。使用者可通过街道上的视角查看街景(如公交车站、商铺等)。但是该服务却有侵犯个人隐私的嫌疑,因为街景视图的照片是由Google的甲虫车在街上随机拍到的,街边路人的动作,停泊点上的车牌号都是一清二楚。

谷歌迅速搜索的基本技能:目标信息一定含有的关键字(用“”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。

4.3.3 雅虎(Yahoo!)

网址:http://cn.yahoo.com/(中文主页,简称“雅虎中国”)。

(1)雅虎简介

Yahoo是Internet上最早的搜索引擎之一,Yahoo的超强大数据库涵盖全球120亿个网页(其中包括雅虎中国的20亿个网页),拥有数十项搜索技术专利,有着精准的运算能力,支持38种语言,近万台服务器,为全球一半的互联网用户提供搜索需求。雅虎总部设在美国加州圣克拉克市,在欧洲、亚太区、拉丁美洲,以及加拿大及美国均设有办事处。其中,中文Yahoo网站于1999年9月正式开通。

在许多人的心目中,Yahoo是搜索引擎的同义词,它也确有其过人之处,其分类目录查询就做得相当出色,无论从网站的数量还是分类的合理性方面都可圈可点。站点目录分为14个大类,每一个大类下面又分若干子类,搜索十分方便。该站点连接速度快,包含范围广,数据容量大,简便易用,是查询各种信息的好去处。

Yahoo在登录我国的最初几年,我国网络用户给了Yahoo很高的赞誉,但在Google和Baidu面世后,中文雅虎开始衰落,终于在2005年8月被阿里巴巴收购。阿里巴巴董事长马云曾宣称:要把中文雅虎打造成中国最大的互联网搜索平台,在搜索技术上和Google及Baidu比肩。

(2)雅虎的得名和创始故事

Yahoo是Yet Another Hierarchically Officious Oracle的首字母缩写,直译的意思是“另一个层次目录型正式指南”,但从西方软件命名往往以圣经或神话人物着手,就用雅虎本身一查,得知Yahoo一词最早出现在1726年。这一年Jonathan Swift(乔纳森·斯威夫特)创作了脍炙人口的《格列佛游记》,yahoo这个词正是Swift在书中杜撰的一种人。在故事里,格列佛第四次航海时遇到海难,被海水带到一个不知名的岛屿上,那里就生活着那些yahoo们。这些被称为yahoo的人从没有受过教育,非常愚笨且野蛮。原来yahoo的原意竟是“乡巴佬”!

杜撰这么一个荒唐可笑的名称的不是别人,正是开发Yahoo!搜索引擎的两个年轻人——斯坦福大学的博士生杨致远(Jerry Yang)和大卫·费罗(David Filo)。杨致远1968年出生,并在中国台湾度过了他的童年时光,他的母亲是讲授英语和戏剧的教授。在杨致远两岁时其父去世,之后一直由母亲抚养和教育他和弟弟。杨致远有一个姨妈生活在美国。10岁时,杨致远随家人移民到美国的加利福尼亚。

这两位在斯坦福大学计算机系小有名气的高材生,起先也很有一番常青藤大学学生发迹的常规思路:好好读书,拿上一连串的“A”到大公司报到上班。一日,两人无意中登录了一个叫“梅尔玫瑰”的搜索站点,尽管该站点内容空洞贫乏,缺少新意,但整个站点采用的分类目录的做法吸引了他俩。为什么不组织一个像这样可供登录者按自己的需求查询内容的站点?这种创新的思路导致了雅虎的诞生,并成为后来雅虎建立网站的技术方向。

雅虎每天要接待数以万计的访问者,任何拥有大量忠实追随者的事物总是有价值的,杨致远坚信这一点。于是杨致远便中断了学业并成立了雅虎公司。公司的股票在华尔街上市后,杨致远的个人资产在一瞬间飞升为1.7亿美元。杨致远是Internet催生的亿万富翁。Internet上充满了机会,杨致远抓住了机会,在Internet上威风八面的Yahoo,就是这位来自中国中国台湾的华裔青年研制的。

Yahoo两位创造人几乎是从零开始的,当时他们还只是两名穷学生。Yahoo的成功在全美乃至中国台湾刮起了一股创业旋风,大学生们不再追求进入待遇优厚的公司或者攻读MBA什么的,他们两三个人自成一伙,杀入互联网络,像当年开拓西部荒野的牛仔,义无反顾。Yahoo的成功证明,眼光等于50%的成功。

(参考扩展阅读:百度的百科名片:雅虎)

(3)雅虎的各语言版本

雅虎是一个以分类目录、网站检索为主,附带网页全文检索的搜索引擎。有中文、英文,以及法、德、意、西班牙、丹麦、日、韩等10余种语言版本,各版本的内容互不相同,如英文版主要收录英文网站,日文版主要收录日文网站,可以说,每一个不同的版本都是一个不同的、相对独立的搜索引擎。

雅虎英文版除主站外,又有多个地区分站,如亚洲站雅虎、加拿大站雅虎等,这些网站分别以收录这一地区的英文网站为主,也可视为独立的搜索引擎。

中文雅虎主要收录全球各地的中文网站,包括简体、繁体和图形中文网站。在同类搜索引擎中,它收录的网站相当丰富。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈