HDFS基础

基础储存结构

优点

多副本备份与自动恢复机制，保证容错性。

默认文件块128M，只能追加读写等特性保证了数据的高吞吐速率。
缺点

高延迟，不适合毫秒级查询。

文件块大小默认128M，大量的小文件读写容易在NameNode上产生储存瓶颈。

请注意NameNode不会向DataNode主动发送请求，通信严格遵守C/S架构。

客户端，用于管理HDFS。

名称节点，管理文件系统的相关信息。

检查点结点，用于辅助NameNode。

数据结点，储存数据。

使用hadoop fs -help可查看HDFS的帮助信息。cp与mv命令必须在HDFS中使用，不可跨文件系统。

hadoop fs -ls -h -R / #打印指定路径下的目录结构，-h参数格式化打印，-R参数递归打印子目录。
hadoop fs -mkdir -p /hadoop/data #创建目录，-p参数为递归创建。
hadoop fs -put -f -p README.md /hadoop/data/README.md #将本地文件传入HDFS，-f参数为覆盖目标文件，-p参数保留原始修改时间与权限。
hadoop fs -get -p /hadoop/data/README.md . #将HDFS信息传入本地，-p参数保留原始修改时间与权限。
hadoop fs -cp -f -p /hadoop/data/README.md /hadoop/README.md #在HDFS文件系统中复制文件。
hadoop fs -mv /hadoop/data/README.md /hadoop/README.md #在HDFS文件系统中移动文件。
hadoop fs -rm -r -f /hadoop/README.md #删除文件/目录，-r参数为递归删除目录，-f参数为忽略文件不存在。
hadoop fs -rmdir /hadoop/data #删除目录
hadoop fs -cat /hadoop/data/README.md #查看文本内容。
hadoop fs -tail /hadoop/data/README.md #查看文本最后1KB的内容。
hadoop fs -appendToFile 1.txt /hadoop/data/README.md #向README.md后追加1.txt。
hadoop fs -getmerge -nl /hadoop/data/*.txt /root/merge.txt #合并下载多个文件，-nl参数在文件末尾增加换行符。
hadoop fs -chmod -R 766 /hadoop2.7.7 #改变文件/目录权限，-R参数递归更改。
hadoop fs -count -h /tmp #统计目录下的文件情况。
hadoop fs -df -h / #统计文件系统的容量。