暂无个人介绍
secondaryNameNode辅助nameNode,当镜像及日志文件特别大的时候。估计nameNode启动都是问题。 SecondaryNameNode的作用是定期把fsimages镜像文件和edit日志文件定期(一个小时一次)合并,并生成新的fsimages镜像文件。
NameNode数据存放的地方有2个 1、内存 2、本地磁盘。镜像文件(fsimages)和日志文件(edits) 说明:格式化namenode目的是生成 fsimages文件。
1、在HDFS文件系统中新增目录 新增代码 查看结果 2、删除目录 删除代码 查看结果 3、查看目录 代码 执行结果 代码 package com.
1:创建一个可以上传到hdfs文件系统的文件(wc.input) 2:编写java代码调用api完成附件的上传相当于执行-put命令 3:查看执行结果 全部代码 package com.
第1步:在pom.xml文件中引入hadoop-client及junit包 好处:使用maven进行项目管理,它会自动把需要的包及包依赖的包自动下载。
上传工具elicpse和maven 安装maven 解压命令: unzip apache-maven-3.0.5-bin.zip -d /opt/modules/ 配置maven环境变量 vi /opt/profile ...
文件系统(FS)的shell命令bin/hdfs dfs 对文件进行操作 说明:所有的FS的shell命令都是以url作为参数。格式: URI格式是scheme://authority/path。
HDFS架构图(Hadoop distribute File System) image.png NameNode 介绍 Namenode 是一个中心服务器,单一节点(简化系统的设计和实现),负责管理文件系统的名字空间(namespace)以及客户端对文件的访问。
由于本人是从Java开发通过大概3个月的自学转到大数据开发的。所以我主要分享一下自己的学习路劲。 第一阶段: 01.Linux学习(跟鸟哥学就ok了) 02.
执行命令bin/hdfs dfs -ls报错 image.png 报错原因 运行的代码与natvie中的代码版本不一致造成 image.
HDFS指定服务器运行 修改$hadoop/etc/hadoop/core-site.xml 指定namenode配置服务器 指定datanode配置服务器 修改slaves文件 image.
第一种方式,逐一启动 第二种,分开启动 image.png 第三种,一起启动(不推荐使用) start-all.sh 因为在生产环境中namenode和datanode不可能在一台机器上。
修改yarn-site.xml文件 说明:修改路径$hadoop/etc/hadoop下的yarn-site.xml。新增两个属性并保存上传服务器。 属性1:表示在yanr上开启聚合日志服务。
查看MapReduce历史执行情况报错 查看已经运行完成的MapReduce作业记录,比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。
1、修改$hadoop/etc/hadoop/core-site.xml文件 添加 fs.trash.interval分钟 Number of minutes after which the checkpoint gets deleted.
hadoop的配置文件分为两种,一种是默认类型、一种是自定义配置文件。我们先从默认类型开始。根据自己的实际业务对自定义配置文件进行修改。例如:是否开启hadoop数据存放目录,yarn的聚集日志文件的配置、hadoop垃圾箱的自动清空的天数,hdfs的域名映射等等。
image.png 主机与ip地址的映射,不可以出错配置完后hostname一下 image.png core-site.xml 正确配置 fs.
YARN on Single Node 修改yarn环境配置文件yarn-env.sh image.png 修改yarn配置文件yarn-site.
linux目录 /bin,/sbin,/usr/bin,/usr/sbin区别 image.png /etc etc不是什么缩写,是and so on的意思 来源于 法语的 et cetera 翻译成中文就是 等等 的意思.
一:下载Hadoop image.png 二:安装说明 http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/SingleCluster.html 三:查看是否安装jdk 四:强力卸载已将安装的JDK 空格分开卸载项。
图片1.png
image.png nameNode是主节点,datanodes是子节点。子节点之间双重备份。例如小黄点。一共有七个。看上图右下角rep。 HDFS存储方式 是以块的形式存储的,128M最小单元。
大数据应用发展前景 image.png image.png image.png image.png google image.
字符串是shell编程中最常用最有用的数据类型(除了数字和字符串,也没啥其它类型好用了),字符串可以用单引号,也可以用双引号,也可以不用引号。 单引号 单引号字符串的限制: 单引号里的任何字符都会原样输出,单引号字符串中的变量是无效的; 单引号字串中不能出现单引号(对单引号使用转义符后也不行)。
定义变量 定义变量时,变量名称前不加$号 image.png 注意事项 image.png 使用变量 使用一个定义过的变量,只要在变量名前面加$即可,如: image.png 注意:{}是可选项,加花括号是为了帮助解释器识别变量的边界 定义只读变量 使用 readonly 命令可以将变量定义为只读变量,只读变量的值不能被改变。
数组可以存放多个值,bash shell只支持一维数组,初始化时不需要指定数组大小。下标从0开始。 语法 Shell 数组用括号来表示,元素用"空格"符号分割开 array_name=(value1 .
计划任务分类 image.png at 一次性计划任务 shemme image.png 查看任务 image.
函数语法 image.png 函数样例 image.png 函数调用 image.png 系统文件中的函数 vi /etc/init.
语法 image.png image.png 样例1 vi forsum.sh image.png image.png
语法 image.png if样例1 image.png 赋权并运行 image.png if样例2 说明:if 和中括号之间没有空格 if样例2 说明:if 和中括号之间没有空格 运行 运行 if样例3 说明:else后面没有then image.
语法 image.png 第一种写法:利用for循环创建50个文件夹 image.png image.png 第二种java写法:利用for循环创建50个文件夹 image.
执行方式 image.png 创建sh文件 vi 1.sh 开头固定写法(linux默认解析环境) image.png 除了第一行外所有“#”都是注释 image.
image.png 修改文件名的时候经常用 image.png image.png
date修改时间 image.png 格式化输出 image.png 备份7天前的数据 image.png image.png
image.png -a 与 image.png -o或 image.png image.png
image.png image.png image.png -e 文件或者目录是否存在则为真(0) -e :exit -e 文件或者目录是否存在则为真(0) -d和-f -d:目录。
必须放到[]中 =等于则为真 !=不相等则为真 n not zero 字符段长度不为0 z zero表示字符段长度位0 = 和!=的样例 image.
必须放到[]中 内置测试判断是linux的根基 image.png image.png image.png image.
image.png image.png image.png image.png 关系运算符 image.
环境变量 image.png 用户环境变量(home /.bash_profile) [root@localhost ~]# ls -a image.
image.png image.png image.png 使用正则表达的命令有grep、awk、sed image.
image.png 命令[root@localhost ~]# ifconfig image.png 命令top 资源整体使用情况 image.
列出所有可安装的软件包 [root@localhost Packages]# yum list [root@localhost Packages]#yum list | grep zlib-deve 安装软件包 yum -y install zlib-devel.x86_64 参数说明: -y 表示不用提醒直接下载依赖包。
1、cd配置centos的ISO文件 image.png 2、挂载cdrom [root@localhost Packages]# mount /dev/cdrom /media 3、利用wc统计一下rpm按照包的个数 image.png 查看某文件是否安装 [root@localhost Packages]# rpm -qa | grep yp-tools image.png 参数说明: -q 表示查询 --query -a --all -f,--file FILE 查询结果为空表示此文件没有安装。
首先,我要反驳一种流行的错误观点,就是认为孩子还小,还没有规则意识,所以孩子熊就让他们熊。这是错误的。3岁的孩子已经可以明白,承诺和合作的意义了,已经可以发展出合作精神了。
首先查看磁盘情况使用fdisk -l命令 image.png 目前只有一个硬盘是/dev/sda,linux中所有的设备在/dev/下,在linux中一切皆是文件。
压缩包后缀类型: tar.gz tar.bz2 zip tar.gz image.png 压缩 image.png zcvf 说明 -z表示压缩成gz格式,调用gzip命令 -c表示创建 -v显示解压过程 -f使用文件名,之后立即加文件名 解压 image.png 解压后在varlog.tar.gz上面多了一个var目录。
chmod修改的是文件的读、写、执行。 chown修改的是文件的用户或者组的权限。 chmod例子 image.png 举例:如果某文件权限为7则代表可读、可写、可执行(4+2+1). 若权限为6(4+2)则代表可读、可写。
image.png image.png 我们来看文件.gnome2的权限蓝色表示第一组:表示文件的拥有者权限红色表示第二组:文件拥有组权限黑色表示第三组:其他所有人 image.png -是一个占位符表示没有次权限。
image.png 创建用户 image.png image.png 默认创建组并且组名称与用户名称相同 image.