发布网友 发布时间:2022-04-24 19:40
共1个回答
热心网友 时间:2022-04-14 22:48
目前开源 hadoop 只包括 hdfs,和纱线,纱线是 hadoop 2的新组件。Hdfs 是一个分散式档案系统,它使用多种备份方法来存储文件,并且可以用来连接像 hive 和 hbase 这样的产品和存储相应的数据。Maprece 是一个用于大型数据处理的并行框架。用户可以编写自己的程序来调用框架并行处理大数据,并在调用过程中调整 m 和 r 的数量。然而,总的来说,编程是相对复杂的,所以我诞生了。纱线作为一种新的控件,主要管理 hadoop 模块的任务调度。目前,有两种模式: 公平调度和容量调度。如果需要其他组件,则需要单独下载安装程序。