加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程 > 正文

开源搜索引擎评估:ucene sphinx

发布时间:2018-04-21 09:23:00 所属栏目:编程 来源:鲁塔弗的博客
导读:开源搜刮引擎措施有3大类 lucene系,java开拓,包罗solr和elasticsearch sphinx,c++开拓,简朴高机能 Xapian,c++开拓 搜刮引擎措施这个名称欠稳当,严酷说来应该叫做索引措施(indexing program),早期首要用来做中文全文搜刮,可是跟着互联网的深入遍及,各家网站

开源搜刮引擎措施有3大类

  • lucene系,java开拓,包罗solr和elasticsearch
  • sphinx,c++开拓,简朴高机能
  • Xapian,c++开拓

搜刮引擎措施这个名称欠稳当,严酷说来应该叫做索引措施(indexing program),早期首要用来做中文全文搜刮,可是跟着互联网的深入遍及,各家网站局限越来越大,索引措施在优化网站架构上施展了更大的浸染:更换mysql数据库内置的索引

  1. 让mysql no sql化,只包袱数据耐久化存储的成果
  2. 消除join查询/子查询,进步数据库的并发处理赏罚手段

行使状况

Lucene出自王谢,子孙旺盛,并且它的兄弟Hadoop风头正盛,以是名气最大,而sphinx由于简朴靠得住,代码布局精良,机能很是好,在海内大型网站中行使最广.xapian用户太少,不提议行使

技能选型要选人最多的偏向,不行标新立异

Lucene系

  • Lucene 就是一个纯粹的索引措施代码包,行使的时辰,你得写一个简朴的server措施(接管要害词-通过lucence查询-返回功效),然后设置在应用处事器中(tomcat/Resin),一样平常来说,这个server措施会回收http协议,可能xml-rpc,直接用tcp那也太无聊了

  • Solr 有大侠急公好义,帮你把上文提到的web 措施写好了,你只必要设置陈设就可用,这就是solr,solr对外的接口是http协议,也支持漫衍式索引

  • Elasticsearch,新项目,最近很红,着实也是Lucene的马甲,有如下特点

    1. restful接口
    2. 漫衍式导向,包罗漫衍式搜刮,漫衍式索引,零设置,自动分片,索引自动负载
    3. 针对及时搜刮专门优化:先把索引放在内存中,按期同步到硬盘
    4. 附带web 图形化打点器材

sphinx均匀查询时刻一样平常=20ms,elasticsearch稀有听说是200ms

elasticsearch 从计划思绪上是针对 Amazon CloudSearch,它的要害词是

  • 漫衍式
  • 及时
  • 高可用

这几点一看就是高富巨,日uv几百万的网站,索引也只有几十G,平凡玩家是用不着的

可是从紧跟前沿技能的角度,假如你的索引处事器高出3台,可以实行陈设elasticsearch,机能此刻是差点,但硬件和时刻会帮你搞定统统

本文地点: http://lutaf.com/158.htm 鲁塔弗原创文章,接待转载,请附带原文链接

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读