搜索引擎对于搜索词的处理
1.中文分词。与网页页面索引时一岸,地索词也必须进行中文分词,将查询字符串数组转化为以词为基础的关键词组合。分词原理与网页页面分词一样。
2.去停止词。和索引时一样,搜索引擎也要把搜索关键词中的停止词除掉,最大限度地提升综合排名关联性及高效率。
3.和“方法”两个词,搜索引擎排序时默认设置认为,使用者寻找的是既包含“瘦身”,也包含“方法”的网页页面。只包含“瘦身”不包含“方法”,或者只包含“方法”不包含“瘦身”的网页页面,被认为是不满足检索条件的。当然了,这只是极其简化的为了事实上原理的叫法,事实上我们依然会看到只包含一小部分网站关键词的搜索结果。
另外使用者键盘输入的查询词还可能包含某些高级搜索指令,如加号、减号等,搜索引擎都要做出识别和相应加工处理。有关高级搜索指令,后面还有详细说明。
4.拼写错误矫正。使用者如果键盘输入了明显错误的字或英文单词拼错,搜索引擎会提示使用者正确的用字或拼法。
5.整合检索引起。某些搜索关键词会引起整合检索,比如明星姓名就经常引起图片和视频内容,当前的热门话题又易于引起新闻资讯内容。哪些词引起哪些整合检索,也要在搜索关键词加工处理阶段计算。
6.搜索框提示。据合肥网站优化小编了解使用者在搜索框填写信息过程中,搜索引擎就依据热门搜索数据提供多组可能的查询词,减少使用者键盘输入时长。