搜索引擎是一种特殊的计算机程序。它按照一定的策略从互联网上收录信息,对信息进行处理,为用户提供检索服务,并将检索结果显示给用户。
SEO(SEO)是指利用搜索引擎规则来提高网站在搜索引擎中的自然排名。为了获得更多的免费流量,让其在行业中占据更高的优势,获得更多的收益。
只有深入了解搜索引擎的原理,才能熟悉信息采集策略,掌握搜索引擎自然排名的规律,做好SEO工作。综上所述,搜索引擎有两个功能:一是主动从互联网上抓取网页,经过处理后存储在数据库中,等待用户检索;二是响应用户检索数据库,并按照一定的规则显示给用户。具体如下图所示:
搜索引擎主动抓取网页,经过内容处理,建立索引,存储数据库,其过程一般如下。
1发送spider将网页抓取回搜索引擎服务器,并按照一定的策略存储原始网页;
2链接分离、内容处理、噪声消除、主文本提取和分词统计;
3删除重复网页,建立网页索引和关键词映射;
搜索引擎根据一定的规则响应用户的搜索请求并返回查询结果。过程一般如下。
1接收到用户查询请求后的搜索词处理,收录指令处理、中文分词、停止词删除、拼音校正等;
2根据用户区域和搜索日志的特点,充分了解用户需求、集成触发、搜索框提示等;
3搜索引擎首先搜索历史缓存。如果它已经存在,大多数数据可以直接返回。同时对更新进行调整,对返回的查询结果进行整合;
4如果缓存不存在,则检索关键字索引库,并根据页面权重、内容相关性(关键字用法、词密度、词位置、锚定链接等)、用户体验(页面结构、信任度、点击率、评论率、评论数等)返回排名结果集。过滤和微调后,反作弊策略将显示给用户。同时,缓存关键字搜索结果并记录用户行为日志,以便下次快速响应用户查询。