zookeeper只是起注册和负载均衡的作用,服务端将服务在zookeeper上注册,zookeeper会将服务端的注册信息告诉消费端,然后消费端就可以直接找到服务端进行服务调用了。请求是不会经过zookeeper的...
1、您对“大数据”一词有什么了解?大数据是与复杂和大型数据集相关的术语。关系数据库无法处理大数据,这就是为什么使用特殊的工具和方法对大量数据执行操作的原因。大数据使公司能够更好地了解其业务,并帮助...
2、数仓开发知识技能(1)Java是必问的,不过问的不深,把Javase部分吃透,足以应付Java部分的面试。(2)Hadoop生态,Yarn、Zookeeper、HDFS这些底层原理要懂,面试经常被问。(3)Mapreduce的shuffle过程这个也是面试被常问的。
HDFS,MapReduce,Common,在外围有无数的系统工具方便开发,我个人用过的是Avro作为数据格式,Zookeeper作为选主的高可靠性的组件,Solr作为搜索接口,Pig搭建工作流,Hive数据仓库查询,Oozie管理工作流,HBase作为KV分布式存储,mahout数据...
一面主要还是基础,集中在IO/并发/缓存/Redis/Zookeeper/分布式/JVM/数据库等。其中问到Redis的单线程模型的时候,我这块了解的不是很清楚,只是知道使用NIO的方式,然后以自己的理解去说了,面试官表示这可能是我看过别的框架的...
zookeeper原理netty原理高并发综合策略数据一致性处理策略4)线上问题处理经验5)表达对技术的钻研热情第二次电话面试是交叉面试,同上。第三次是现场技术终面+HR面P6的考察侧重点1、80后。2给人的感觉是上进心...
d)d)Zookeeper9.配置机架感知的下面哪项正确a)如果一个机架出问题,不会影响数据读写b)写入数据的时候会写到不同机架的DataNode中c)MapReduce会根据机架获取离自己比较近的网络数据10.Client端上传文件的时候下列哪...
6.消息消费进度Offset记录在消费者对指定消息分区进行消息消费的过程中,需要定时地将分区消息的消费进度Offset记录到Zookeeper上,以便在该消费者进行重启或者其他消费者重新接管该消息分区的消息消费后,能够从之前的进度开始继续进行消息消...
其次在是考虑应用服务了,对外服务我会采用成熟的开源方案LVS+Keepalived或者Nginx+Keepalived,缓存层可以考虑redis集群及Mongodb集群,中间件等其它服务可以用kafka、zookeeper,图片存储可以用fastDFS或MFS,如果数据量大、又非常多,那么可采用...
14.spring的bean配置的几种方式15.web.xml的配置16.spring的。17.zookeeper的实现机制,有缓存,如何存储注册服务的18.IO会阻塞吗?readLine是不是阻塞的19.用过spring的线程池还是java的线程池?