问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何搭建hadoop集群 桥接

发布网友 发布时间:2022-04-21 07:08

我来回答

2个回答

热心网友 时间:2022-04-11 23:04

本文通过在vmware workstation上建立三台虚拟机来搭建hadoop集群环境,其中一台作为namenode,两台作为datanode。
一、安装vmware workstation(10.0.0)(一路下一步即可)
二、创建3个虚拟机
每个虚拟机安装Ubuntu 桌面版(我用的11.10,但是有点老了,建议用12.04或更高版本)
namenode建议多给写内存,我的是namenode 1G内存,20G硬盘,datanode 800M内存,20G硬盘(我电脑内存8G,若内存不够可以少分点,但是可能有些卡)上网上式可设置为桥接方式:直接连接物理网络。
三、安装vmware tools(便于主机和虚拟机直接可以直接拖拽,复制粘贴)
点击vmware 上 虚拟机-》安装VMware tools,自动打开一个包含vmware安装包的位置,可以拷贝到你有权限的地方,例如/usr/src下用 sudo tar zxvf 软件包名称 解压,之后进入解压后的文件夹,执行
sudo ./vmware-install.sh来安装,过程中遇见yes或no一律enter键,安装后重启生效。
四、配置共享目录(让主机和虚拟机直接方便实时共享)
对每个虚拟机,点击vmware上虚拟机-》设置-》选项,选择共享文件夹,永久共享,添加一个本机的目录所为共享目录,并为这个共享起一个名字,例如叫share。这样在虚拟机上的 /mnt/hgfs下会自动生成share文件夹保持与主机上的目录实时一致。重启生效,有时生效较慢,多重启几次就行了,不知何故。
五,安装ssh,为了一会的免密码登陆
对每台虚拟机运行:sudo apt-get install openssh-server
若不成功,你可能需要更新一下资源列表了:sudo apt-get update
六、配置ssh无密码登录,方便namenode给datanode分配任务和汇总信息
说明:以下生成的秘钥默认保存在用户名空间,所以建议三台虚拟机建立同样的用户名,例如hadoop,也可以都用root用户。
在name node,和datanode都运行:
ssh-keygen –t dsa -P '' –f ~/.ssh/id_dsa (建议手打此命令,复制有时候不行,注意都是英文字符,-P的P是大写)
下面将三台虚拟机的公钥拷贝到共享目录中并重命名以供彼此配置使用
在name node:
scp ~/.ssh/id_dsa.pub /mnt/hgfs/share/ id_dsa0.pub
在data node 1:
scp ~/.ssh/id_dsa.pub /mnt/hgfs/share/ id_dsa1.pub
在data node 2:
scp ~/.ssh/id_dsa.pub /mnt/hgfs/share/ id_dsa2.pub

将共享目录中公钥分别添加到三台虚拟机的授权下,分别在name node,data node 1和data node 2执行:
cat /mnt/hgfs/share/id_dsa0.pub >> ~/.ssh/authorized_keys
cat /mnt/hgfs/share/id_dsa1.pub >> ~/.ssh/authorized_keys
cat /mnt/hgfs/share/id_dsa2.pub >> ~/.ssh/authorized_keys

测试:
ssh localhost
ssh 目标机器地址

七,安装jdk
对每个虚拟机:
下载jdk(jdk1.6.0)并解压,假定目录为/usr/src/jdk1.6.0(如果你的不是,也可以改成是,这样下面的命令直接复制就行了)
设置环境变量。
#vi /etc/profile
在最后面加入
#set java environment
export JAVA_HOME=/usr/src/jdk1.6.0
export CLASSPATH=.:$JAVA_HOME/lib.tools.jar
export PATH=$JAVA_HOME/bin:$PATH
保存退出。
要使JDK在所有的用户中使用,可以这样:
vi /etc/profile.d/java.sh
在新的java.sh中输入以下内容:
#set java environment
export JAVA_HOME=/usr/src/jdk1.6.0
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar
export PATH=$JAVA_HOME/bin:$PATH
保存退出,然后给java.sh分配权限:chmod 755 /etc/profile.d/java.sh
重启虚拟机
八、安装hadoop
在usr/src目录解压: tar zxvf hadoop-0.20.2.tar.gz
把hadoop的安装路径添加到/etc/profile中:
export HADOOP_HOME=/usr/src/hadoop-0.20.2
export PATH=$HADOOP_HOME/bin:$PATH

九、配置hadoop
在hadoop-0.20.1/conf目录:
(1)对3个虚拟机,在conf/hadoop-env.sh中配置java环境
vi hadoop-env.sh
在hadoop-env.sh文件中添加
export JAVA_HOME=/usr/src/jdk1.6.0
(2) 用ifconfig命令查看ip地址,假定name node内部地址为192.168.204.157,data node 1和data node 2分别为192.168.204.162,192.168.204.173
对name node配置conf/masters和conf/slaves:
masters : 192.168.204.157
slaves : 192.168.204.162
192.168.204.173
(3)对name node, data node 1和data node2,配置conf/core-site.xml, conf/hdfs-site.xml及conf/mapred-site.xml,配置文件内的IP地址均配置为name node的IP地址(比如name node IP地址为192.168.204.157。
说明:因为三台上面这三个配置一样,所以配置一份,然后复制粘贴即可。
(又说明:下面之所以上图片是因为,新浪会把字符按html重新编译,无法正常显示,无奈啊)

十、运行hadoop
先把三台虚拟机的防火墙关了: sudo ufw disable
对name node:
进入hadoop-0.20.2/bin,首先格式化文件系统: hadoop namenode –format
对data node1 和data node 2:
进入hadoop-0.20.2/bin,执行: hadoop datanode –format

对name node:,在bin目录下执行:
start-all.sh
hadoop dfsadmin –safemode leave
hadoop dfsadmin –report, 查看节点情况,看到类似界面显示available的Datanodes 。

用jps命令查看进程,NameNode上的结果为:
26745 JobTracker
29398 jps
27664 NameNode

Data Node 1 的结果:
6718 TaskTracker
6042 DataNode
6750 jps

Data Node 2 的结果:
12173 TaskTracker
10760 DataNode
12700 jps
至此,安装成功。

热心网友 时间:2022-04-12 00:22

部署步骤 序号 操作 1 配置SSH无密码登陆 2 配置环境变量JAVA(必须),MAVEN,ANT 3 配置Hadoop环境变量 4 配置core-site.xml文件 5 配置hdfs-site.xml文件 6 配置mapred-site.xml文件 7 配置yarn-site.xml文件 8 配置slaves文件 9 分发到从机上 10...
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
英语第三人称单数一般现在时构成法 如“主+be+动词ing+其他”_百度知... 动词三单的构成规则是什么样的 ...被人发现了,然后我和爷爷分开跑了,我被一群人追? 26岁男,梦见我和爷爷一起去,去世的人家里找宝贝被人发现了,我和爷爷分... 男生乳晕太大怎么办,做手术么 男的乳晕大 男生乳晕有点大是什么原因 我是男生,乳晕有点大,并且成粉红色,怎么办? 为什么乳晕那么大 我是男的 您拨打的号码不存在是什么意思。 hadoop 为什么要与eclipse连接 eclipse远程连接hadoop 不能连接 如何用idea能不能远程连接hadoop notepad++怎么连接hadoop文件 eclipse怎样使用maven连接hadoop集群 linux怎么链接hadoop的集群 现有 java web程序,如何去连接hadoop? 如何在win7下的eclipse中调试Hadoop2.2.0的程序 为什么每次连接hadoop都要格式化才可以连接上 qq情侣黄钻解除了黄钻还在吗 𢁉寮这两个字怎么读? qq黄钻是什么? QQ的情侣黄钻和黄钻功能一样吗? qq情侣黄钻一个是黄钻开了之后另一个是黄钻吗 双方都是黄钻,现在开通了情侣空间,自动点亮了情侣黄钻,那我还用续费情侣黄钻么? 两个人都开了黄钻弄情侣黄钻还用额外收钱吗 对方不是黄钻而我是黄钻对方访问了我的空间对方-可以删除访问记 是否的拼音 开通情侣黄钻是不是黄钻也一并开了 𢁉寮这两个字怎么读? 怎么将eclipse和hadoop集群相连接 如何安装hadoop 你好,你是怎么在本地eclipse连接虚拟机上的hadoop的? 如何配置Hadoop环境 如何在CentOS下安装Hadoop并与Eclipse连接 怎么更改hive连接hadoop的地址 myeclipse 连接hadoop失败 java.io.eofexception 如何使用Hadoop进入大数据库时代 如何在hadoop下连接hive 电脑卸载软件后提示重启? 卸载软件时电脑自动重启,怎么回事? 卸载某些软件后计算机为什么要重启 某些软件卸载后为什么要重启电脑 为什么电脑把软件删除重启后还在后台运行? 为什么一些软件卸载后需要重启才能完全删除呢? 为什么一卸载软件就自动关机重启? 卸载软件时电脑自动重启..怎么回事啊.. 软件安装和卸载时为什么提示电脑需重新启动 软件卸载后在重新启动为什么还在啊 卸载程序后电脑为什么要提示重启啊?