导航菜单
首页 >  hadoop大数据开发实战期末考试题  > 【2023Hadoop大数据技术应用期末复习】选择题题型整理

【2023Hadoop大数据技术应用期末复习】选择题题型整理

Linux 的特点有?

A. 良好的用户界面

B. 可移植性

C. 全面支持网络协议

D. 支持多任务及多用户、免费及源代码开放

答案:ABCD

Linux 操作系统的应用场景有哪些?

A. 高端服务器领域

B. 桌面应用领域

C. 嵌入式应用领域

D. 电影工业

答案:ABCD

Linux 的版本分为?

A. 内核版本

B. 开发版本

C. 测试版本

D. 发行版本

答案:AD

Linux 常见的发行版本有哪些?

A. redHat

B. centos

C. Ubuntu

D. unix

答案:ABC解析:Linux是类unix系统,unix是万物起源

常见的虚拟机软件有哪些?

A. VMware

B. Xen

C. KVM

D. virtualbox

答案:ABCD

Hadoop 是由一系列软件库组成的框架。这些软件库各自负责Hadoop的一部分功能,其中最主要包括哪些?

A. HDFS

B. MapReduce

C. YARN

D. spark

答案:ABC

Hadoop 发展历程经历了哪些过程

A. 第一阶段主要是指前Hadoop时代(2003-2007)

B. 第二阶段为后Hadoop时代(2008-2014)

C. 第三阶段为Hadoop商业发行版时代(2011-2020)

D. 第四阶段为国产化开源发行版时代(2021开始)

答案:ABCD

Hadoop 的优势有哪些

A. 方便

B. 弹性

C. 健壮

D. 简单

答案:ABCD

云计算包含以下哪几种模式?

A. 基础设施即服务

B. 软件即服务

C. 平台即服务

D. 硬件即服务

答案:ABC

关闭 Linux 防火墙防火墙使用哪几个命令?

A. systemctl status firewalld

B. systemctl stop firewalld

C. systemctl disable firewalld

D. systemctl enable firewalld

答案:ABC

关于以下配置代码的描述,正确的是()

fs.defaultFShdfs://hadoop1:9000

A. 配置 hdfs NameNode 的地址

B. 9000是RPC通信的端口

C. 配置hdfs 临时目录

D. 配置hdfs 的端口

答案:AB

与使用 ssh-keygen -t rsa 相关正确的是()

A. ssh-keygen是秘钥生成器

B. rsa 是一种加密算法

C. -t 是一个参数

D. 成秘钥对(即公钥文件id_rsa.pub和私钥文件id_rsa)

答案:ABCD

关于集群脚本下面正确的是?

A. vi deploy.conf 配置脚本,具体内容为:

hadoop1,master,all,hadoop2,slave,all,hadoop3,slave,all,

B. deploy.sh 为集群同步脚本

C. runRemoteCmd.sh 为远程执行脚本

D. 要用 chmod u+x deploy.sh runRemoteCmd.sh 命令给脚本授予可执行权

答案:ABCD

zookeeper有哪些特点?

A. 最终一致性

B. 可靠性、实时性

C. 等待无关、原子性

D. 顺序性

答案:ABCD

Zookeeper 服务有两个角色,是哪两个?

A. 主节点(Leader)

B. 从节点(Follower)

C. 服务节点

D. 客户节点

答案:AB

HDFS核心设计目标有?

A. 支持超大文件存储

B. 流式数据访问

C. 简单的一致性模型

D. 硬件故障的检测和快速应对

答案:ABCD

HDFS系统架构中主要包括哪些角色?

A. Client

B. namenode

C. datanode

D. FSiamge

答案:ABC

HDFS的优点有哪些?

A. 高容错性

B. 适合大数据处理

C. 流式文件处理

D. 可构建在廉价的机器上

答案:ABCD

HDFS的缺点有哪些?

A. 不适合低延时数据访问

B. 不适合大量小文件的存储

C. 不适合大文件的存储

D. 不适合并发写入、文件随机修改

答案:ABD

影响HDFS集群的可用性主要包括哪些情况?

A. NameNode机器宕机,将导致集群不可用,重启NameNode之后才可使用。

B. 计划内的NameNode节点软件或硬件升级,导致集群在短时间内不可用。

C. 停电导致集群关闭

D. 人为设备损坏

答案:AB

MapReduce具体包含以下哪3层含义?

A. MapReduce是一个并行程序的计算模型与方法

B. MapReduce是一个并行程序的思想

C. MapReduce是一个基于集群的高性能并行计算平台

D. MapReduce是一个并行程序运行的软件框架

答案:ACD

MapReduce的优点

A. MapReduce易于编程

B. 良好的扩展性

C. 高容错性

D. 适合PB级以上数据集的离线处理

答案:ABCD

MapReduce的缺点有哪些?

A. 不适合实时计算

B. 不适合离线计算

C. 不适合流式计算

D. 不适合DAG计算

答案:ACD

MapReduce编程模型步骤是什么?

A. 数据分割

B. 数据处理

C. 数据局部合并

D. 数据聚合

答案:ABCD

Hive的优点有哪些?

A. Hive适合数据的批处理,解决了传统关系型数据库在海量数据处理上的瓶颈

B. Hive构建在Hadoop之上,充分利用了集群的存储资源、计算资源

C. Hive学习使用成本低,支持标准的SQL语法,这样就免去了编写MapReduce程序的过程,减少了开发成本

D. 具有良好的扩展性,且能够实现与其他组件的集成开发

答案:ABCD

Hive的缺点有哪些?

A. HQL的表达能力依然有限,不支持迭代计算,有些复杂的运算用 HQL不易表达,还需要单独编写MapReduce来实现

B. Hive的运行效率低、延迟高

C. Hive不适合做离线分析

D. Hive的调优比较困难

答案:ABD

Hive与Hadoop之间的关系总结如下

A. Hive需要构建在Hadoop集群之上

B. Hive中的所有数据都存储在Hadoop分布式文件系统中

C. 对HQL查询语句的解释、优化、生成查询计划等过程均是由 Hive 完成的

D. HQL查询计划被转化为 MapReduce 任务之后需要运行在 Hadoop 集群之上

答案:ABCD

Hive用户接口主要有哪些?

A. CLI 接口

B. JDBC/ODBC客户端

C. Thrift 服务器

D. Web接口

答案:ABD

yarn主要由什么构成?

A. ResourceManager

B. NodeManager

C. ApplicationMaster

D. Container

答案:ABCD

Application在Yarn中的执行过程,整个执行过程可以总结为

A. 客户端向资源管理器提交任务

B. 资源管理器会在一个节点上启动应用的应用程序管理器实例

C. 应用程序管理会在不同节点上启动容器,执行应用任务

D. 各节点会及时将节点资源状况汇报给资源管理器

答案:ABCD

以下关于下列语句的描述,正确的是:

create database if not exists weather comment "天气数据库" location "/user/hive/warehouse/mydb" with dbproperties('creator'='yangjun','date'='2021-12-06');

A. 创建数据库的名字为 weather

B. 存储位置为 /user/hive/warehouse/mydb

C. 数据库的描述信息为 'creator'='yangjun','date'='2021-12-06'

D. 如果数据库存在会删除该数据库

答案:ABC

以下关于下列语句的描述,正确的是:

create table if not exists temperature(id string comment '气象站id',year string comment '年',temperature int comment '气温')comment '天气表'ROW FORMAT DELIMITED FIELDS TERMINATED BY ','STORED AS TEXTFILE ;

A. 创建的表格名为 temperature

B. 表格有3个字段分辨为:id、year、temperature

C. 表格行的分隔符为 “,”

D. 表格保存的格式为 textfile

答案:ABCD

以下关于下列语句的描述,正确的是:

select * from temperature limit 3;

A. 该语句为查询所有字段

B. 该语句为查询*字段

C. 该语句显示所有数据

D. 该语句只显示前3笔数据

答案:AD

下列哪些是HBase的特性

A. 容量巨大、扩展性

B. 无模式、高可靠性

C. 面向列、高性能

D. 稀疏性

答案:ABCD

HBase系统结构包括如下哪几个部分?

A. Client

B. Zookeeper

C. HMaster

D. HRegionServer

答案:ABCD

hbase(main):005:0> put 'course','001','cf:cname','hbase'表示:

A. 该语句为插入数据

B. 数据库为 course

C. 行键为 001

D. 数据为hbase,列簇为cf,字段为cname

答案:ABCD

Sqoop具有以下几个个方面的优势

A. Sqoop可以高效地、可控地利用资源,可以通过调整任务数来控制任务的并发度

B. Sqoop可以自动地完成数据库与Hadoop系统中数据类型的映射与转换

C. Sqoop的架构是比较复杂的

D. Sqoop支持多种数据库,比如,MySQL、Oracle和PostgreSQL等数据库

答案:ABD解析:这什么题啊?C这一看就是在说缺点了吧语气都不一样了

Sqoop的架构是非常简单,它主要由以下几个个部分组成

A. sqoop客户端

B. sqoop服务器

C. Hadoop平台

D. 外部存储系统

答案:ACD

以下关于该代码段的描述中,正确的是:

[hadoop@hadoop1 sqoop]$ bin/sqoop export \ --connect 'jdbc:mysql://hadoop1/weather?useUnicode=true&characterEncoding=utf-8' \ --username hive \ --password hive \ --table mean_temperature \--export-dir /user/hive/warehouse/mydb/mean_temperature \ --input-fields-terminated-by "\001" \-m 1;

A. 该语句为数据导出

B. --table mean_temperature 表示导出的表格为mean_temperature

C. --export-dir /user/hive/warehouse/mydb/mean_temperature表示导出的数据在hdfs上的位置

D. -m 1; 表示并行度为 1

答案:ABCD

以下关于该代码段的描述中,正确的是:

[hadoop@hadoop1 sqoop]$ bin/sqoop import \ --connect 'jdbc:mysql://hadoop1/weather?useUnicode=true&characterEncoding=utf-8' \ --username hive \ --password hive \ --table mean_temperature \--fields-terminated-by ',' \ --delete-target-dir \ -m 1 \ --hive-import \ --hive-database weather \ --hive-table ods_mean_temperature;

A. 该语句为数据导入到hive上

B. --delete-target-dir \ 表示如果有目标目录先删除

C. --delete-target-dir \ 表示如果有目标目录先删除

D. --hive-database weather \表示导入的hive数据库名称

答案:ABCD

agent 的核心组件有哪些

A. source

B. channel

C. flume

D. sink

答案:ABD

Source组件支持采集各种数据源,常见的有

A. Avro Source

B. Exec Source

C. Taildir Source

D. Syslog Source

答案:ABCD

Channel是中转Event(数据的表现形式)的一个临时存储就,保存用Source组件传递过来的Event,目前比较常用的Channel有哪些?

A. Memory Chananel

B. File Channel

C. JDBC Channel

D. Kafka Channel

答案:ABCD

Sink在设置存储数据时,可以向文件系统、数据库、hadoop中存储数据。

Flume Sink支持的常见类型有:

A. HDFS Sink

B. Logger Sink

C. Avro Sink

D. Kafka sink

答案:ABCD

Flume命令行参数解释如下哪些是正确的

A. agent 代表启动 Flume 进程

B. -n指定的是配置文件中 Agent 的名称

C. -c 指定配置文件所在目录

D. -f 指定具体的配置文件

答案:ABCD

Kafka有如下特点:

A. 高吞吐量、低延迟

B. 可扩展性

C. 持久性、可靠性

D. 容错性、高并发

答案:ABCD

一个典型的Kafka集群包括什么

A. 若干生产者(producer)

B. 若干Kafka集群节点(Broker)

C. 若干消费者(Consumer)

D. 一个Zookeeper集群

答案:ABCD [hadoop@hadoop1 kafka]$bin/kafka-topics.sh --zookeeper localhost:2181 --create --topic test --replication-factor 3 --partitions 3

上述命令,下面解释对的有:

A. --zookeeper 指定 Zookeeper 集群

B. --create 是创建 Topic 命令

C. --topic 指定Topic名称

D. --replication-factor 指定副本数量

答案:ABCD

avichi的架构主机要由哪几个模块组成?

A. Source

B. view

C. widget

D. visualization

答案:ABCD

Davinci的应用场景主要有如下几种?

A. 安全多样自助交互式报表

B. 实时运营监控

C. 快速集成

D. 数据实时分析

答案:ABC

安装davichi主要需要哪些组件?

A. jkd1.8或以上

B. mySql5.5

C. phantomjs

D. Davnchi

答案:ABCD

相关推荐: