搜易达软件官网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1998|回复: 1

搜索引擎对索引库的检索过程可以简单描述如下:

[复制链接]
发表于 2015-9-7 12:51:23 | 显示全部楼层 |阅读模式
本帖最后由 younico 于 2019-1-22 12:56 编辑

关键词匹配:
搜索引擎对索引库的检索过程可以简单描述如下:
1.把用户提交的搜索词分成词A和词B.
2.同时使用词A和词B在索引库中进行检索,并提出所有包含词A或者B的文件,组成文件集合L.
3.在文件集合L中把同时包含词A和词B的文件优先提出来组成文件集合M排在前面 ,把只包含词A或词B的文件排在后面。
4.继续对文件集合M进行分析,把完全包含用户搜索词的文档提出来组成文件集合N,并排在后面,把内容中没有完全匹配搜索词的文件排在后面。
5.再根据搜索词在网页中出现的次数,位置,密度和形式等对文件N中的文件进行排序。
6.搜索引擎还会分析文件的外链数量,质量和锚文件,根据锚文本辅助分析文件和关键词的相关度,外链的数量和质量来确定文件的重要程度,以进行排序调整。
以上只是简单模拟搜索引擎的检索排序过程,为了描述方便,引入了“文件集合”。在整个检索和排名过程中,关键词匹配程度,密度,频率,位置,形式和外链情况会应用到所有文件上,而不仅仅是上方所提到的文件集合上,由以上检索排序模拟过程可以看出,搜索
引擎判断一个网页或者文件与搜索词的相关度,主要根据文件中关键词出现的频率(次数),密度(占全部内容的比例),最终分词后关键词之间的距离(是否完全匹配),位置和形式(是否在标题,内容比较靠前的位置以及是否黑体,变色,H标签等突出显示),文件
外链锚文本(是否和内容有统一的文件描述)等,外链的数量和质量并不是判断内容相关性的因素,只是判断文件重要程度,内容质量或可信任度的标准。
同时在关键词匹配中,搜索引擎为了使返回的结果都是用户真正需要的,会分析判断搜索词分词后的词语,哪些是用户主要关心的,哪些是次要关心的。比如,搜索引擎会弱化搜索词中的常用或者意义不大的定语,在百度搜索 “我们的航母”,搜索结果中前几页的网页内容都
会完全匹配“我们的航母”这个关键词。多向后翻几页,当没有能完全匹配该搜索词网页时,会明显感觉到后面的网页都可以“航母”为主要关键词的。

相关的内容推荐:
搜索引擎如何判断页面的质量给予对应排名        

分享五大因素决定你网站在首页还是在前五页        

什么样的网页才算是重要的网页呢?         

【SEO软件】全网推广引流总体策略概述   

分享解决百度快照更新慢、无快照、删除快照的方法!     

网站优化推广高手教你如何制作高质量的页面!     



回复

使用道具 举报

 楼主| 发表于 2019-1-5 22:50:13 | 显示全部楼层
文章好就要多多留言
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|搜易达软件论坛 ( 粤ICP备12093907号-1 )

GMT+8, 2019-7-21 18:42 , Processed in 0.061738 second(s), 15 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表