导航菜单
首页 >  搜索结果  > 如何在互联网高效搜索信息?关于搜索引擎的分享与总结

如何在互联网高效搜索信息?关于搜索引擎的分享与总结

要说在中国知名度最高的网站,百度应该是当之无愧的第一名;要说我们日常使用最频繁的网站,尽管每个人的使用习惯与工作需求不同,各大主流搜索引擎依旧名列前茅。但是,你真的了解这些功能强大、在你的工作学习中不可或缺的互联网「伴侣」吗?你又真的会使用它们吗?希望通过这篇小文章,带领屏幕前的你们对目前主流搜索引擎的基本原理形成基本认知,并在此承诺不会涉及过多专业知识(毕竟我也不太懂……),更重要的是,希望用我的一点点经验和认知,帮助大家学会更好使用搜索引擎进行各种内容的搜索。

搜索引擎的基本原理

(注意:这里所说搜索引擎是指狭义上的搜索工具,例如谷歌、百度、微软必应等,并非广义搜索引擎,如专门搜索特定类型文件的搜索引擎,或是各大应用内部检索内容帖子的搜索功能,仅对狭义搜索引擎的基本原理进行叙述。)

先看定义,搜索引擎是指根据一定的策略,运用特定的计算机程序搜集互联网上的信息,并对所搜集到的信息进行组织和处理,为用户提供检索服务的系统。从定义上来看,搜索引擎的功能实现主要经历以下三个步骤:

1. 从互联网上获取信息。搜索引擎主要通过特定计算机程序——蜘蛛系统程序(也就是人们通常所说的爬虫)在互联网联通的各大服务器中爬取网页,并沿着各种网页中的所有URL爬到其他网页,不断延伸爬取的「触角」,并把所有爬到的网页收集回来。

2. 对所搜集到的信息进行组织处理并建立索引数据库。由特定分析程序对搜集到的网页进行分析,提取网页上的相关信息(包括URL、网页内容及其关键词、与其他网页的关系等),并根据一定的相关度算法进行计算,得到网页与特定关键词的相关度,并依据相关度进行排序后建立索引数据库。这里的相关度和排序便是你在某个搜索引擎搜索内容时呈现出的答案排列依据,不同搜索引擎依据不同的指标得出的内容顺序也不相同,例如某度前些年被曝出的广告商可出钱购买特定排序,广受网友抨击。因此,所呈现搜索内容的排序也是判断一个搜索引擎是否能提升我们搜索效率的重要指标之一。

值得一提的是,现在的搜索引擎大多支持「超链分析」技术,即不只是分析网页本身内容,还会分析索引数据库中所有指向该网页

相关推荐: