大数据学习 - hadoop

什么是hadoop

  1. hadoop是apache旗下的一套开源软件平台
  2. hadoop提供的功能,利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理
  3. hadoop的核心组件有:
  • HDFS(分布式文件系统)
  • YARN(运算资源调度系统)
  • MapReduce(分布式运算编程框架)
  1. 广义上,hadoop通常是指一个更广泛的概念–hadoop生态圈

常用命令参数介绍

  • ls

功能:显示目录信息

示例:hadoop fs -ls /wordcount/input

  • mkdir

功能:创建目录

示例:hadoop fs -mkdir -p /aaa/bbb/cc

  • moveFromLocal

功能:从本地剪切粘贴到hdfs

示例:hadoop fs -moveFromLocal /home/hadoop/a.txt /aaa/bbb/cc

  • moveToLocal

功能:从hdfs剪切粘贴到本地

示例:hadoop fs -moveToLocal /aaa/bbb/cc /home/hadoop/a.txt

  • appendToFile

功能:追加一个文件到已经存在的文件末尾

示例:hadoop fs -appendToFile ./hello.txt /hello.txt

  • cat

功能:查看文件内容

示例:hadoop fs -cat /hello.txt

  • tail

功能:查看文件尾部几行

示例:hadoop fs tailf /hello.txt | more

  • text

功能:以字符形式打印一个文件的内容

示例:hadoop fs -text /hello.txt

  • chgrp chmod chown

功能:与linux文件系统的用法一样,操作文件所属权限

示例:hadoop fs -chmod 666 /hello.txt

  • copyFromLocal copyToLocal

功能:用法与moveToLocal moveFromLocal 用法一致

  • cp

功能:从hdfs的一个路径拷贝到另一个路径

示例:hadoop fs -cp /aaa/from.txt /bbb/to.txt

  • mv

功能:从hdfs的一个路径移动另一个路径

示例:hadoop fs -mv /aaa/from.txt /

  • get

功能:等同于copyToLocal,就是从hdfs下载文件到本地

示例:hadoop fs -get /aaa/from.txt

  • getmerge

功能:合并下载多个文件

示例:hadoop fs -getmerge /aaa/log.*

  • put

功能:等同于copyFromLocal

示例:hadoop fs -put /aaa/from.txt /bbb/to.txt

  • rm

功能:删除文件或文件夹

示例: hadoop fs -rm -r /aaa/bbb/

  • rmdir

功能:删除kongmulu

示例:hadoop fs -rmdir /aaa/bbb

  • df

功能:统计文件系统的可用空间信息

示例:hadoop fs -df -h /

  • du

功能:统计文件夹的大小信息

示例:hadoop fs -du -s -h /

  • count

功能:统计一个指定目录下的文件节点数量

示例:hadoop fs -count /

  • setrep

功能:设置hdfs中文件的副本数量

示例: hadoop fs -setrep 3 /aaa/hello.txt

评论