目录

大数据面试题百日更新索引目录

大数据面试题百日更新索引目录

我正在参加年度博客之星评选,请大家帮我投票打分,您的每一分都是对我的支持与鼓励。

2021年「博客之星」参赛博主:Maynor大数据

https://i-blog.csdnimg.cn/blog_migrate/cf5a51e7e4030c5345fbca01962ec5e1.png

大数据面试题百日更新索引目录

大数据的学习重在理解,记忆是理解的前提,为了接下来更好的面试,同时方便自己索引,

因此建立此目录.

这是背面试题的 第一遍

[Day02 :

HDFS 在读取文件的时候,如果其中一个块突然损坏了怎么办

HDFS 在上传文件的时候,如果其中一个 DataNode 突然挂掉了怎么办]( )

[Day03 :

NameNode 在启动的时候会做哪些操作]( )

[Day04 :

Secondary NameNode 了解吗,它的工作机制是怎样的]( )

[Day05 :

Secondary NameNode 不能恢复 NameNode 的全部数据,那如何 保证 NameNode 数据存储安全]( )

[Day06 :

在 NameNode HA 中,会出现脑裂问题吗?怎么解决脑裂]( )

[Day07 :

小文件过多会有什么危害,如何避免](%E5%B0%8F%E6%96%87%E4%BB%B6%E8%BF%87%E5%A4%9A%E4%BC%9A%E6%9C%89%E4%BB%80%E4%B9%88%E5%8D%B1%E5%AE%B3,%E5%A6%82%E4%BD%95%E9%81%BF%E5%85%8D)

[Day08 :

请说下 HDFS 的组织架构]( )

[Day09 :

请说下 MR 中 Map Task 的工作机制

请说下 MR 中 Reduce Task 的工作机制]( )

[Day10 :

请说下 MR 中 shuffle 阶段

shuffle 阶段的数据压缩机制了解吗]( )