搜索引擎排名工作原理流程2.16

目前主流的搜索引擎包括百度、360搜索、谷歌搜索和搜狗搜索等等。搜索引擎通过蜘蛛这款抓取程序对全网进行抓取,各搜索引擎公司定义自己的的抓取程序名字各不相同,如:百度 Baiduspider。当用户通过搜索栏键入关键词、产品目标词或者叫用户需求问题等,搜索引擎通过复杂的计算后,会通过排名方式将用户需要的内容展现到搜索结果里。这个过程涉及到搜索引擎排名原理。搜索引擎的排名原理是什么呢?通过学习总结为以下四点:1、抓取2、过滤3、存储、4、展现。下面就我个人学习做如下陈述:1、抓取 搜索引擎公司编制自己的抓取工具,俗名:蜘蛛spider、机器人robot或爬虫。爬虫会顺着互联网中的链接采用深度抓取、广度抓取和两者相互结合的抓取方式进行全网抓取活动。顾名思义就是只要爬虫去过的网页都进行过抓取活动。但是网页上有些内容是不利于爬虫抓取的:如:javascript程序、img图片、flash、table、需要登陆后显示的内容等,但是网页进行相关优化后,更有利于抓取,比如设置图片Alt属性、flash文字说明等。2、过滤 当爬虫抓取成功后,对低质量的网页进行过滤,去糟粕,留精华。什么是低质量的网页呢?就是那些网页价值较低、文不对题、没有具体内容的网页。比如COPY的网页等。爬虫更青睐那些高质量的网站,图文并茂、原创等。3、存储索引库 经过过滤后,搜索引擎会建立索引库,在服务器进行存储。方便用户在检索的时候及时调用。4、展现 当用户在搜索栏中键入关键词或目标词组后,搜索引擎快速调用索引库(数据库)储存的信息,搜索引擎通过一系列复杂的算法对即将呈现的结果进行复杂的分析计算后,排出先后名次后,呈现在用户面前,方便用户浏览体验。此上为搜索引擎排名工作原理,希望老师批评指正。