Hadoop期末考试题

1目前，Hadoop的最高版本是哪个？

（2.0分）2.0 分A、Hadoop3.x

B、Hadoop2.x

C、Hadoop4.x

D、Hadoop1.x

正确答案： A

2大数据的4V特征是指?（2.0分）A、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、技术发展速度快(Velocity)B、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)C、数据量大(Volume)、类型繁多(Variety)、价值密度高(Value)、数据产生速度快(Velocity)D、数据量大(Volume)、类型繁多(Variety)、价值密度低(Value)、数据变化速度快(Velocity)正确答案： B

3HDFS有一个gzip文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为？

（2.0分）0.0 分A、一个map读取64MB，另外一个map读取11MB

B、128MB

C、64MB

D、75MB

正确答案： D4HDFS有一个LZO（with index）文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为？

（2.0分）2.0 分A、一个map读取64MB，另外一个map读取11MB

B、64MB

C、75MB

D、128MB

正确答案： A5关于SecondaryNameNode哪项是正确的?（2.0分）A、它目的是帮助NameNode合并编辑日志,减少NameNode的负担和冷启动时的加载时间B、它对内存没有要求C、它是NameNode的热备D、SecondaryNameNode应与NameNode部署到一个节点正确答案： A

6把本地文件放到集群里,可以使用下面哪个hadoop shell的命令?（2.0分）A、hadoop fs -putB、hadoop fs –push /C、hadoop fs –put /D、hadoop -push /正确答案： C

7如果想要修改集群的备份数量,可以修改下面哪个配置文件?（2.0分）A、mapred-site.xmlB、core-site.xmlC、hdfs-site.xmlD、hadoop-env.sh正确答案： C

8在Centos7中,如果想要查看本机的主机名可以使用下面哪个命令?（2.0分）2.0 分A、rebootB、hostnameC、pwdD、tail正确答案： B

9Hadoop-2.x集群中的HDFS的默认的副本块的个数是?（2.0分）2.0 分A、3B、2C、1D、4正确答案： A

10以下哪个不是HDFS的守护进程（2.0分）2.0 分A、SecondaryNameNodeB、NameNodeC、MrappMaster/YarnChildD、DataNode正确答案： C

11大数据至少为以下哪种存储量级?（2.0分）2.0 分A、EBB、PBC、TBD、ZB正确答案： B

12关于HDFS集群中的DataNode的描述不正确的是?（2.0分）A、一个DataNode上存储的所有数据块可以有相同的B、存储客户端上传的数据的数据块C、DataNode之间可以互相通信D、响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑正确答案： A

13MapReduce的Shuffle过程以下中哪个操作是最后做的？

（2.0分）2.0 分A、排序

B、合并

C、分区

D、溢写

正确答案： B14Hadoop起始于以下哪个阶段？

（2.0分）2.0 分A、2004年，Nutch的开发者开发了NDFS。

B、2004年，Google发表了关于MapReduce的论文。

C、2003年，Google发布了GFS论文。

D、2002年，Apach项目的Nutch。

正确答案： D下列哪项可以作为集群的管理工具？

（2.0分）2.0 分A、Cludera Manager

B、都可以

C、Pdsh

D、Rsync+ssh+scp

正确答案： B

16配置机架感知的下面哪项正确？

A、MapReduce会根据机架获取离自己比较近的网络数据

B、写入数据的时候会写到不同机架的DataNode

C、都正确

D、如果一个机架出问题，不会影响数据读写

正确答案： C17下列关于HDFS的描述正确的是?（2.0分）A、NameNode磁盘元数据不保存Block的位置信息B、DataNode通过长连接与NameNode保持通信C、HDFS集群支持数据的随机读写D、如果NameNode宕机,SecondaryNameNode会接替它使集群继续工作正确答案： A

18一个gzip文件大小75MB，客户端设置Block大小为64MB，请问其占用几个Block？

（2.0分）2.0 分A、3

B、2

C、4

D、1

正确答案： B19按照所处理的数据形式和得到结果的时效性分类,大数据处理框架可以分为三类,以下系统中哪一项不是?（2.0分）2.0 分A、混合处理系统B、分布式键值系统C、批处理系统D、流处理系统正确答案： B

20关于大数据的价值密度描述正确的是以下哪个?（2.0分）2.0 分A、大数据由于其数据量大,所以其价值密度低。B、大数据由于其数据量大,所以其价值也大。C、大数据的价值密度是指其数据类型多且复杂。D、大数据由于其数据量大,所以其价值密度高。正确答案： A

二、多选题（题数：20，共 40.0 分）1下面哪个组件可以在Hadoop集群中代替MR做一些计算?（2.0分）2.0 分A、SparkB、SqoopC、HiveD、Avro正确答案： AC

2大数据的计算模式主要有哪些?（2.0分）2.0 分A、图计算模式B、流计算模式C、查询分析计算模式D、批处理计算模式正确答案： ABCD

3Hadoop MapReduce对外提供了5个可编程组件，以下哪对中的方法或任务不全在这5个编程组件中。

（2.0分）2.0 分A、Partitioner和Combiner

B、Split和Sort

C、InputFormat和OutputFormat

D、Mapper和Reducer

正确答案： AB4YARN主要包含的模块有以下哪些？

（2.0分）2.0 分A、ApplicationMaster

B、ResourceManager

C、NodeManager

D、QuorumJournalManager

正确答案： ABC5下面哪些是Hadoop 2.x的组件?（2.0分）0.0 分A、SparkB、HiveC、HBaseD、GFS正确答案： ABC

6Hadoop的三种安装模式包括以下哪种?

（2.0分）2.0 分A、两分布式模式

B、完全分布式模式

C、伪分布模式

D、单机模式

正确答案： BCD7VMware提供了哪几种工作模式？

（2.0分）0.0 分A、host-only仅主机模式

B、NAT模式

C、自定义除以上3种其他模式

D、桥接（bridged）模式

正确答案： ABD8Hadoop集群具有以下哪个优点?

（2.0分）2.0 分A、高容错性

B、高成本性

C、高可靠性

D、高扩展性

正确答案： ACD9关于数据副本的存放策略正确的有些?（2.0分）

A、第三个副本:与第一个副本相同机架的其他节点上;

B、

云奕文章网

Hadoop期末考试题

相关推荐：