加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

产物司理必要相识的搜刮算法:搜刮引擎之倒排索引

发布时间:2017-09-04 16:11:43 所属栏目:建站 来源:人人都是产品经理
导读:副问题#e# 注:互联网期间,信息纷繁海量,人们通过搜刮引擎直达“心中所想”已是常态。那么搜刮引擎到底是怎样高效查找方针内容呢?本文首要先容搜刮引擎里一个较量重要的布局——倒排索引。 一、倒排索引简介 倒排索引(英文:Inverted Index),是一种索

基于上述两点,将文档内容转换成一个或多个term后,在查询时,最抱负的环境是用户输入的要害字恰恰与term完全匹配,现实上,许多时辰用户输入的query与词条之间每每不会完全匹配,而用户们照旧但愿query能与词条举办匹配,好比用户在查询“color”时,用户必定也但愿能看到关于“colour”的返回功效。词条归一化的使命就是将一些看起来不完全同等的词条分别为一个等价类,好比英式单词colour和美式单词color归为一类、Air-conditioner和airconditioner归为一类等等;这样,用户在查询时,只要对等价类中的恣意单词举办搜刮,城市返回包括等价类中的恣意一个单词的文档。

(4)词干提取、词形还原

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读