正排索引和倒排索引的区别

 SEO基础知识     |      2020年05月15日

建立索引是搜索引擎对网站页面的tagtitle、metadescripiton、描述、抓取记录、页面外链等等,进行标记添加的行为。这其中,还将对页面中的关键词信息进行识别和储存,当用户搜索的时候,能有内容展现出来。

正排索引和倒排索引的区别

那么,正排索引和倒排索引有什么区别呢?


1、正排索引


蜘蛛爬虫经过文字提取、中文分词、去重等操作后,得到的就是独特的、能反应页面的主题内容、以词为单位的字符串。接下来搜索引擎索引程序就可以提取关键词了,为该页面建立与关键词的对应关系,而这个过程就叫做正排索引。


2、倒排索引


当用户在搜索引擎搜索框中输入关键词的时候,搜索引擎就会把和关键词有关的页面展现给用户,而这个过程就叫做倒排索引。


正排索引是不能直接用于排名的,如果只存在正排索引,排名程序需要扫描所有索引库中的文件,找出包含这个关键词的文件,在进行相关性的计算。这样就不能实时返回排名结果。


所以,搜索引擎会将正排索引数据库重新构造为倒排索引,把页面对应到关键词的关系表,转化为关键词对应的页面。


这样,当用户搜索某个关键词的时候,排名程序在倒排索引中定位这个关键词,就可以马上找到所有包含这个关键词的页面。


当蜘蛛爬虫在分析页面的时候,会根据页面中关键词出现的频率、次数、格式、位置等信息,判断一个页面重点优化的关键词是什么,然后建立关键词和页面的对应关系。


所以,在优化网站的时候,应该重点突出每个页面中优化的关键词,提高关键词出现的频率、出现的次数,也可以使用标签进行突出强调。


原创·大金SEO http://www.dajinseo.com/p/446.html