首页 技术 正文
技术 2022年11月19日
0 收藏 400 点赞 2,898 浏览 2734 个字

     Cloudera Certified Associate Administrator案例之Configure篇

                                      作者:尹正杰

版权声明:原创作品,谢绝转载!否则将追究法律责任。

一.下载CDH集群中最新的配置文件

问题描述:
  某个集群的使用者需要通过客户端登陆集群,请使用CM下载HDFS和YARN的配置文件,保存到客户端机器的"/home/yinzhengjie/hadoop/etc/hadoop"目录下,并保持文件名不变。解决方案:
  可以通过登陆CM WebUI界面下载,也可以直接登陆服务器进行下载。

1>.使用正确的用户名密码登录CM界面,点击hdfs服务

Cloudera Certified Associate Administrator案例之Configure篇

2>. 下载HDFS的配置文件

Cloudera Certified Associate Administrator案例之Configure篇

3>.使用正确的用户名密码登录CM界面,点击yarn服务

Cloudera Certified Associate Administrator案例之Configure篇

4>.下载YARN服务的配置文件

Cloudera Certified Associate Administrator案例之Configure篇

5>.查看集群后端存储配置文件的路径

[root@node101.yinzhengjie.org.cn ~]# ll /etc/hadoop/conf.cloudera.hdfs/        #HDFS集群存储路径
total
-rw-r--r-- root root Jun : __cloudera_generation__
-rw-r--r-- root root Jun : __cloudera_metadata__
-rw-r--r-- root root Jun : core-site.xml
-rw-r--r-- root root Jun : hadoop-env.sh
-rw-r--r-- root root Jun : hdfs-site.xml
-rw-r--r-- root root Jun : log4j.properties
-rw-r--r-- root root Jun : ssl-client.xml
-rw-r--r-- root root Jun : topology.map
-rwxr-xr-x root root Jun : topology.py
[root@node101.yinzhengjie.org.cn ~]#
[root@node101.yinzhengjie.org.cn ~]#
[root@node101.yinzhengjie.org.cn ~]#
[root@node101.yinzhengjie.org.cn ~]# ll /etc/hadoop/conf.cloudera.yarn/      #YARN集群存储路径
total
-rw-r--r-- root root Jun : __cloudera_generation__
-rw-r--r-- root root Jun : __cloudera_metadata__
-rw-r--r-- root root Jun : core-site.xml
-rw-r--r-- root root Jun : hadoop-env.sh
-rw-r--r-- root root Jun : hdfs-site.xml
-rw-r--r-- root root Jun : log4j.properties
-rw-r--r-- root root Jun : mapred-site.xml
-rw-r--r-- root root Jun : ssl-client.xml
-rw-r--r-- root hadoop Jun : topology.map
-rwxr-xr-x root hadoop Jun : topology.py
-rw-r--r-- root root Jun : yarn-site.xml
[root@node101.yinzhengjie.org.cn ~]#
[root@node101.yinzhengjie.org.cn ~]#

二.限制HDFS服务的日志大小

问题描述:
  根据管理要求,需要限制HDFS服务的日志大小。其限制为:NameNode服务保留4个日志文件,总量不超过8GB;Secondary NameNode 服务也保留4个日志文件,总量不超过8GB;两个服务总占用的磁盘空间 量不超过16GB。 解决方案:
  单个服务的单个日志只要不超 过2GB,并将日志数设为4个,即可以满足要求。 

1>.使用正确的用户名密码登录CM界面,点击hdfs服务

Cloudera Certified Associate Administrator案例之Configure篇

2>.搜索关键字“NameNode Max Log Size”

Cloudera Certified Associate Administrator案例之Configure篇

3>.修改默认值200MB为2GB并点击保存按钮

Cloudera Certified Associate Administrator案例之Configure篇

4>.搜索关键字“SecondaryNameNode Max Log Size”(中文对应:”SecondaryNameNode 最大日志文件备份”)

Cloudera Certified Associate Administrator案例之Configure篇

5>.修改日志文件的备份数为4

Cloudera Certified Associate Administrator案例之Configure篇

6>.重启HDFS服务 

Cloudera Certified Associate Administrator案例之Configure篇

三.修改Namenode的堆内存

问题描述:
集群承接了日志分析需求,将保存百万、千万数量级的文件,因 此需要扩大NameNode使用的堆内存,使其可以管理尽可能多的文件。物理内存的分配要求为:节点总物理内存为31GB,为系统服务保留的内存为6.2GB;NameNode和Secondary NameNode需设置相等大小的堆内存; 所有服务的堆内存均需要乘以1.3后计入总使用量中。需要为NameNode和相关服务配置尽可能大且满足要求的内存量,且不能触发任何警告。解决方案:
  根据计算(31 - 6.2) / 1.3 = 19,因此 NameNode和Secondary NameNode各可设置9.5GB的堆内存。 

1>.使用正确的用户名密码登录CM界面,点击hdfs服务

Cloudera Certified Associate Administrator案例之Configure篇

2>.点击配置,搜索关键字“Java Heap Size of NameNode in Bytes”(对应中文为:”NameNode 的 Java 堆栈大小(字节)”)

Cloudera Certified Associate Administrator案例之Configure篇

3>.设置NameNode和SencondName的堆内存为9.5GB

Cloudera Certified Associate Administrator案例之Configure篇

4>.重启HDFS集群(需要注意的是,如果我们设置的NameNode或者SecondNamenode的堆内存大小总和大于当前服务器内存时,我们在重启集群时会启动失败!)

Cloudera Certified Associate Administrator案例之Configure篇

 

四.开启回收站功能

问题描述:
  在描述公司的运维策略时,有人提出如果误删了HDFS的文件系统,可能几天都不会出现,尤其时当周末前发生这样的情况时。为了提供足够的保护级别,你决定将HDFS数据删除后永久清除的时间改为7天。解决方案:
  我们直接在Cloudera Manager WebUI界面进行配置即可。除了配置回收站,还可以配置权限,副本书,块大小,balancer等。

1>.点击HDFS服务

Cloudera Certified Associate Administrator案例之Configure篇

2>.点击配置,并搜索关键字”fs.trash.interval”,修改其只为7天,即删除的文件在回收站中被保留的时间周期

Cloudera Certified Associate Administrator案例之Configure篇

3>.搜索关键词”fs.trash.checkpoint.interval”,即定义周期性检查回收站的文件是否过期的时间间隔,改值应该小于上面我们定义”fs.trash.interval“的值

Cloudera Certified Associate Administrator案例之Configure篇

 

 

五.

相关推荐
python开发_常用的python模块及安装方法
adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheeta…
日期:2022-11-24 点赞:878 阅读:9,077
Educational Codeforces Round 11 C. Hard Process 二分
C. Hard Process题目连接:http://www.codeforces.com/contest/660/problem/CDes…
日期:2022-11-24 点赞:807 阅读:5,552
下载Ubuntn 17.04 内核源代码
zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…
日期:2022-11-24 点赞:569 阅读:6,400
可用Active Desktop Calendar V7.86 注册码序列号
可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…
日期:2022-11-24 点赞:733 阅读:6,176
Android调用系统相机、自定义相机、处理大图片
Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式,并且由于涉及到要把拍到的照片显…
日期:2022-11-24 点赞:512 阅读:7,813
Struts的使用
一、Struts2的获取  Struts的官方网站为:http://struts.apache.org/  下载完Struts2的jar包,…
日期:2022-11-24 点赞:671 阅读:4,894