问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

怎么部署lily hbase index

发布网友 发布时间:2022-04-23 17:15

我来回答

2个回答

懂视网 时间:2022-05-06 13:53

Lily以NoSQL技术为主题,是建立在云计算上的内容仓库(content repository)。它是基于Apache的 HBase(存储)和Solr(索引/搜索),并提供了大型内容集合存储与检索的解决方案。可运用在 门户网站,内容管理系统,及时搜索,档案应用,文案管理,等等。 Lily项目

Lily以NoSQL技术为主题,是建立在云计算上的内容仓库(content repository)。它是基于Apache的 HBase(存储)和Solr(索引/搜索),并提供了大型内容集合存储与检索的解决方案。可运用在 门户网站,内容管理系统,及时搜索,档案应用,文案管理,等等。

Lily simple architecture diagram

Lily项目与传统的Lucene框架相比体现了以下几点关键性的优势:
·伸缩性 –> sharding/MapReduce
·可用性 –> replication
·及时性 –> real-time update index
·容错性 –> no SPFO

另外,Lily 借用了Apache的 HBase进行存储 ,Solr进行Index/Search;
Lily 重新构建大数量的索引Lily会采用MapReduce把索引当做文件切在HDFS上;
Lily 索引更新时切换并没有像LinkedIn的Zoie那样保存在内存里,Lily在Hbase上建立了secondary indexes;
Lily 在建立索引的结构方面 借鉴了Google App Engine的索引设计思想;
Lily 提供REST 和 API 2种方式提供客户端调用;

BTW:关于上面提到了LinkedIn的Zoie我想多数两句,Zoie跟LinkedIn的其他产品捆绑的非常紧密,导致你如果单一的使用Zoie总会觉得很变扭,而且文档非常少,那篇让人貌似惊喜的中文文档仍然不够详细,只好对Zoie望而却步了。

Lily的系统架构由4个主要的部分组成:
1.Zookeeper – 对分布式环境中的状态和配置进行管理,让Client可以知道当前有多少个工作的 Lily Node。
2.Lily Node – a)WAL(预写日志)、b)Message Queue(消息队列)、c)Indexer(索引策略)、d)Lily Repository(索引CRUD) 组成。
3.HBase -作为存储单元,最终的消息、索引、数据和二进制数据还是存储在HDFS上。
4.Solr – 建立Lucene框架基础上查询器,并且支持分布式搜索,切片的策略由Lily Middleware中的Indexer部件提供。
5.Client-客户端的访问入口基于Avro的协议(类似于PB)操作Repository,

如图所示:

lily architecture

废话1:
1.Lily 提供了快速入门的模拟集群工具(Minicluster),不需要搭建HBase/Hadoop/Zookeeper环境,只要有JDK你第一次上手20分钟内也能跑起来一个例子。
2.Lily 在分布式的环境中不能使用Apache的原版Hbase和Hadoop,需要使用改装过的版本,HBase是Lily自己改装的,Hadoop是Cloudera的 0.20.2+737版 。
3.Lily 为了简化开发和将来对项目的维护,在代码上使用了Spring作为集成工具。
4.Lily 考虑使用HBase和Solr作为基础平台纠结了很久,最终给出了一些依据。

废话2:
1.zookeeper作为JEE分布架构中最上层防止单点(SPFO)系统接口是不错的选择,不仅是Lily在这样做,HBase本身也是这样。
2.分布式搜索中需要异步架构的支撑,消息中间件是最佳的选择,用来对索引进行CRUD和挂起的操作。
3.对于大数量的索引合并和更新是MapReduce实战才能的时候了。
4.通过Lily项目对于HBase的使用场景又有了新的参考。

废话3:
1.Srping也对云计算的话题蠢蠢欲动,Spring Framework HBase Template 列入计划中。
2.在众多HBase ORM中pigi 算是不错的一个,使用简单,Pigi Project 。
3.JMXToolkit 可以对HBase进行监控,并且可以和Cacti、Nagios进行集成。

相关文章:
MySQL向Hive/HBase的迁移工具
HBase入门5(集群) -压力分载与失效转发
Hive入门3–Hive与HBase的整合
HBase入门篇4
HBase入门篇3
HBase入门篇2-Java操作HBase例子
HBase入门篇
基于Hbase存储的分布式消息(IM)系统-JABase

–end–

热心网友 时间:2022-05-06 11:01

se表启用replication
创建HBase表时启动列族的replication功能。使用如下命令:

[plain] view plain copy

create 'table',{NAME => 'cf', REPLICATION_SCOPE => 1} #其中1表示开启replication功能,0表示不开启,默认为0

如果是对于已创建的表,可以使用如下命令:

[plain] view plain copy

disable 'table'
alter 'table',{NAME => 'cf', REPLICATION_SCOPE => 1}
enable 'table'

2.创建一个你需要索引的Solr Collection
创建流程参看:http://blog.csdn.net/kissmelove01/article/details/45043955。需要说明的是,在schema.xml中uniqueKey必须为rowkey,而rowkey使用'id'字段表示,所以<field>中必须要有id字段,这个在Cloudera Search文档中并没有说明,查了很多资料才找到相关说明。其它需要索引字段根据用户需要自定义即可。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
弹钢琴时手指速度总是不自觉变快怎么办? 弹钢琴时速度总是不自觉变快怎么办? 微信发表情包上限是多少 ...8.0.3版本更新什么?微信表情包上限变成999是什么 成人毛线斗篷式开襟披肩编织 江苏洛社商贸城项目有哪些主要特点和设施? 永明镇的乡镇建设 蓝光花满庭小区基本信息 洛社商贸城项目概括 怀孕了能不能吃汤圆 简述bigtable,hbase,mongodb和 oracle的异同和关系 如何使用HBase构建NewSQL org.apache.hadoop.hbase.masternotrunningexception在哪个jar包_百度... HBase中rowkey设计有哪些注意点 solr怎么给hbase建立索引原理 请教一个问题,hive导入hbase时,中文变成了乱码应该如何解决 HBase列族是怎么定义的,一个表要定义几个列族较好?求帮助,谢谢了 高层建筑结构体系有哪些,适用范围如何? 使用框架结构有什么好处?请举例说明。 框架结构为何适用于高层建筑?工程中如何设计框架结构? 高层建筑混凝土结构的结构体系有哪些?其优缺点和适用范围是什么?_百度... 混凝土框架结构的特点和适用范围? 什么是框架结构,它的结构性能与使用特点是什么 简述高层建筑钢筋混凝土框架结构的定义,优缺点及适用范围 框架 砖混结构的适用类型? 框架结构的建筑有哪些优点? 目前框架结构的适用性存在的原因 作业6 1.框架结构适合于哪些建筑 框架结构的应用领域 什么是邮箱地址 为什么说hbase是一个面向列的数据库 手办收藏会不会升值 日本vs中国,史上最贵手办到底在哪? 在某宝上卖的散货手办可靠吗? 哪家店买手办比较便宜? 学生党想买手办 大家根据自己经验能不能推荐给我一些优质的祖国版手办店orz 你有遇到过特别羞耻的手办吗?是什么样的呢? 手办是在实体店买还是在网上,,实体店太贵了,, 手办,有没有心动 一个月大部份工资都买了手办是怎样的体验 伏见猿比古的军装手办你们是预定还是等现啊 我只有钱买国产手办,,正版买不起但我喜欢二次元。。总被人骂伪漫迷。。 如何克服手办一买就想买一套的想法? 养BJD娃娃的人都是出于什么想法养的? 花几千元或者上万元买一个动漫手办,是一种什么体验? 闪光少女 二次元少女买的什么东西很贵 你认为宁愿吃土也要买的东西是? 大家买过最贵的手办是什么角色的? 小米mix2s的摄像头imx363和之前imx362相比区别大吗?