导航
{{ item.name }}
{{item.name}}
必备技能
开源收录
学习路径
正在研究
关于我
搜索
登录
展开
hadoop
思维导图
Hadoop单机版环境搭建
文件操作
hdfs
hadoop word count
MapReduce工作机制
hadoop集群版本
单节点启动
首页
大数据
hadoop
hdfs
hdfs
最后发布时间 :
2023-10-22 09:06:46
浏览量 :
HDFS集群是由一个Master(NameNode)和多个Slave(DataNode)组成。HDFS内部,一个文件中的数据按照某种固定大小的(如128MB)块(Block)存储,每个块可以
按照用户指定的副本量
存储在不同的机器上。NameNode维护系统的命名空间,包括文件到块的映射关系、访问日志等属性的存储、操作功能等所有的元数据。文件的基础信息存放在NameNode当中,采用集中存储方案。NameNode定期通过心跳消息与每一个DataNode通信,给DataNode传递指令并收集其状态。
HDFS在集群实现中只能有一个NameNode
,但是可以设置一个备份的Secondory NameNode,来保证系统的可靠性、容错性。
单节点启动
Hadoop运行
./start-dfs.sh
时启动以下进程
DataNode
NameNode
SecondaryNameNode
Hadoop运行
./start-yarn.sh
时启动以下进程
NodeManager
ResourceManager
文件操作
hadoop word count
登录评论