导航菜单
首页 >  Hadoop期末复习题库  > 《大数据技术原理与应用(第3版)》期末复习题库(含答案)

《大数据技术原理与应用(第3版)》期末复习题库(含答案)

77/77第一章大数据概述单选题第一次信息化浪潮主要解决什么问题?B信息传输信息处理信息爆炸信息转换下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?A利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全把实时采集的数据作为流计算系统的输入,进行实时处理分析在大数据的计算模式中,流计算解决的是什么问题?D针对大规模数据的批量处理针对大规模图结构数据的处理大规模数据的存储管理和查询分析针对流数据的实时计算大数据产业指什么?A一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业提供数据分享平台、数据分析平台、数据租售平台等服务的企业提供分布式计算、数据挖掘、统计分析等服务的各类企业下列哪一个不属于大数据产业的产业链环节?A数据循环层数据源层数据分析层数据应用层下列哪一个不属于第三次信息化浪潮中新兴的技术?A互联网云计算大数据物联网云计算平台层(PaaS)指的是什么?A操作系统和围绕特定应用的必需的服务将基础设施(计算资源和存储)作为服务出租从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务下面关于云计算数据中心的描述正确的是:A数据中心是云计算的重要载体,为各种平台和应用提供运行支撑环境数据中心就是放在企业内部的一台中心服务器每个企业都需要建设一个云计算数据中心数据中心不需要网络带宽的支撑下列哪个不属于物联网的应用?D智能物流智能安防环保监测数据清洗下列哪项不属于大数据的发展历程?D成熟期萌芽期大规模应用期迷茫期多选题第三次信息化浪潮的标志是哪些技术的兴起?BCD个人计算机物联网云计算大数据信息科技为大数据时代提供哪些技术支撑?ABC存储设备容量不断增加网络带宽不断增加CPU处理能力大幅提升数据量不断增大大数据具有哪些特点?ABCD数据的“大量化”数据的“快速化”数据的“多样化”数据的“价值密度比较低”下面哪个属于大数据的应用领域?ABCD智能医疗研发监控身体情况实时掌握交通状况金融交易大数据的两个核心技术是什么?AC分布式存储分布式应用分布式处理集中式存储云计算关键技术包括什么?ABCD分布式存储虚拟化分布式计算多租户云计算的服务模式和类型主要包括哪三类?ABC软件即服务(SaaS)平台即服务(PaaS)基础设施即服务(IaaS)数据采集即服务(DaaS)物联网主要由下列哪些部分组成的?ABCD应用层处理层感知层网络层物联网的关键技术包括哪些?ABC识别和感知技术网络与通信技术数据挖掘与融合技术信息处理一体化技术大数据对社会发展的影响有哪些?ABC(A)大数据成为一种新的决策方式(B)大数据应用促进信息技术与各行业的深度融合(C)大数据开发推动新技术和新应用的不断涌现(D)大数据对社会发展没有产生积极影响第二章大数据处理架构Hadoop单选题下列哪个不属于Hadoop的特性?A成本高高可靠性高容错性运行在Linux平台上Hadoop框架中最核心的设计是什么?A为海量数据提供存储的HDFS和对数据进行计算的MapReduce提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中Hadoop被视为事实上的大数据处理标准在一个基本的Hadoop集群中,DataNode主要负责什么?D负责执行由JobTracker指派的任务协调数据计算任务负责协调集群中的数据存储存储被拆分的数据块Hadoop最初是由谁创建的?BLuceneDougCuttingApacheMapReduce下列哪一个不属于Hadoop的大数据层的功能?C数据挖掘离线分析实时计算BI分析在一个基本的Hadoop集群中,SecondaryNameNode主要负责什么?A帮助NameNode收集文件系统运行的状态信息负责执行由JobTracker指派的任务协调数据计算任务负责协调集群中的数据存储下面哪一项不是Hadoop的特性?B可扩展性高只支持少数几种编程语言成本低能在linux上运行在Hadoop项目结构中,HDFS指的是什么?A分布式文件系统分布式并行编程模型资源管理和调度器Hadoop上的数据仓库在Hadoop项目结构中,MapReduce指的是什么?A分布式并行编程模型流计算框架Hadoop上的工作流管理系统提供分布式协调一致性服务10、下面哪个不是Hadoop1.0的组件:(C)HDFSMapReduceYARNNameNode和DataNode多选题Hadoop的特性包括哪些?ABCD高可扩展性支持多种编程语言成本低运行在Linux平台上下面哪个是Hadoop2.0的组件?ADResourceManagerJobTrackerTaskTrackerNodeManager一个基本的Hadoop集群中的节点主要包括什么?ABCDDataNode:存储被拆分的数据块JobTracker:协调数据计算任务TaskTracker:负责执行由JobTracker指派的任务SecondaryNameNode:帮助NameNode收集文件系统运行的状态信息下列关于Hadoop的描述,哪些是正确的?ABCD为用户提供了系统底层细节透明的分布式基础架构具有很好的跨平台特性可以部署在廉价的计算机集群中曾经被公认为行业大数据标准开源软件Hadoop集群的整体性能主要受到什么因素影响?ABCDCPU性能内存网络存储容量下列关于Hadoop的描述,哪些是错误的?AB只能支持一种编程语言具有较差的跨平台特性可以部署在廉价的计算机集群中曾经被公认为行业大数据标准开源软件下列哪一项不属于Hadoop的特性?AB较低可扩展性只支持java语言成本低运行在Linux平台上第三章分布式文件系统HDFS单选题分布式文件系统指的是什么?A把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群用于在Hadoop与传统数据库之间进行数据传递一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据下面哪一项不属于计算机集群中的节点?B主节点(MasterNode)源节点(SourceNode)名称结点(NameNode)从节点(SlaveNode)在HDFS中,默认一个块多大?A64MB32KB128KB16KB下列哪一项不属于HDFS采用抽象的块概念带来的好处?C简化系统设计支持大规模文件存储强大的跨平台兼容性适合数据备份在HDFS中,NameNode的主要功能是什么?D维护了blockid到datanode本地文件的映射关系存储文件内容文件内存保存在磁盘中存储元数据下面对FsImage的描述,哪个是错误的?DFsImage文件没有记录每个块存储在哪个数据节点FsImage文件包含文件系统中所有目录和文件inode的序列化形式FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据FsImage文件记录了每个块具体被存储在哪个数据节点下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?ASecondaryNameNode一般是并行运行在多台机器上它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下SecondaryNameNode是HDFS架构中的一个组成部分HDFS采用了什么模型?B分层模型主从结构模型管道-过滤器模型点对点模型在Hadoop项目结构中,HDFS指的是什么?A分布式文件系统流数据读写资源管理和调度器Hadoop上的数据仓库下列关于HDFS的描述,哪个不正确?DHDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能HDFS采用了主从(Master/Slave)结构模型HDFS采用了冗余数据存储,增强了数据可靠性HDFS采用块的概念,使得系统的设计变得更加复杂多选题HDFS要实现以下哪几个目标?ABC兼容廉价的硬件设备流数据读写大数据集复杂的文件模型HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应用局限性,主要包括以下哪几个方面?BCD较差的跨平台兼容性无法高效存储大量小文件不支持多用户写入及任意修改文件不适合低延迟数据访问HDFS采用抽象的块概念可以带来以下哪几个明显的好处?ACD支持大规模文件存储支持小规模文件存储适合数据备份简化系统设计在HDFS中,名称节点(NameNode)主要保存了哪些核心的数据结构?ADFsImageDN8BlockEditLog数据节点(DataNode)的主要功能包括哪些?ABC负责数据的存储和读取根据客户端或者是名称节点的调度来进行数据的存储和检索向名称节点定期发送自己所存储的块的列表用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间HDFS的命名空间包含什么?BCD磁盘文件块目录下列对于客服端的描述,哪些是正确的?ABCD客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端HDFS客户端是一个库,暴露了HDFS文件系统接口严格来说,客户端并不算是HDFS的一部分客户端可以支持打开、读取、写入等常见的操作HDFS只设置唯一一个名称节点,这样做虽然大大简化了系统设计,但也带来了哪些明显的局限性?ABCD命名空间的限制性能的瓶颈隔离问题集群的可用性HDFS数据块多副本存储具备以下哪些优点?ABC加快数据传输速度容易检查数据错误保证数据可靠性适合多平台上运行HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?BCD数据源太大数据节点出错数据出错名称节点出错第四章分布式数据库HBase单选题下列关于BigTable的描述,哪个是错误的?A爬虫持续不断地抓取新页面,这些页面每隔一段时间地存储到BigTable里BigTable是一个分布式存储系统BigTable起初用于解决典型的互联网搜索问题网络搜索应用查询建立好的索引,从BigTable得到网页下列选项中,关于HBase和BigTable的底层技术对应关系,哪个是错误的?BGFS与HDFS相对应GFS与Zookeeper相对应MapReduce与HadoopMapReduce相对应Chubby与Zookeeper相对应在HBase中,关于数据操作的描述,下列哪一项是错误的?CHBase采用了更加简单的数据模型,它把数据存储为未经解释的字符串HBase操作不存在复杂的表与表之间的关系HBase不支持修改操作HBase在设计上就避免了复杂的表和表之间的关系在HBase访问接口中,Pig主要用在哪个场合?D适合HadoopMapReduce作业并行批处理HBase表数据适合HBase管理使用适合其他异构系统在线访问HBase表数据适合做数据统计HBase中需要根据某些因素来确定一个单元格,这些因素可以视为一个“四维坐标”,下面哪个不属于“四维坐标”?B行键关键字列族时间戳关于HBase的三层结构中各层次的名称和作用的说法,哪个是错误的?AZookeeper文件记录了用户数据表的Region位置信息-ROOT-表记录了.META.表的Region位置信息.META.表保存了HBase中所有用户数据表的Region位置信息Zookeeper文件记录了-ROOT-表的位置信息下面关于主服务器Master主要负责表和Region的管理工作的描述,哪个是错误的?D在Region分裂或合并后,负责重新调整Region的分布对发生故障失效的Region服务器上的Region进行迁移管理用户对表的增加、删除、修改、查询等操作不支持不同Region服务器之间的负载均衡HBase只有一个针对行健的索引,如果要访问HBase表中的行,下面哪种方式是不可行的?B通过单个行健访问通过时间戳访问通过一个行健的区间来访问全表扫描下面关于Region的说法,哪个是错误的?C同一个Region不会被分拆到多个Region服务器为了加快访问速度,.META.表的全部Region都会被保存在内存中一个-ROOT-表可以有多个Region为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题多选题关系数据库已经流行很多年,并且Hadoop已经有了HDFS和MapReduce,为什么需要HBase?ABCDHadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求上HDFS面向批量访问模式,不是随机访问模式传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间HBase与传统的关系数据库的区别主要体现在以下哪几个方面?ABCD数据类型数据操作存储模式数据维护HBase访问接口类型包括哪些?ABCDNativeJavaAPIHBaseShellThriftGatewayRESTGateway下列关于数据模型的描述,哪些是正确的?ABCDHBase采用表来组织数据,表由行和列组成,列划分为若干个列族每个HBase表都由若干行组成,每个行由行键(rowkey)来标识列族里的数据通过列限定符(或列)来定位每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引HBase的实现包括哪三个主要的功能组件?ABC库函数:

相关推荐: