导航菜单
首页 >  大数据与云计算期末考试题答案  > 云计算期末复习(2024HENU)

云计算期末复习(2024HENU)

题型分值

选择15×2 30 填空5×2 10 名词解释5×4 20 简答3×5 15 综合应用1×25 25  

第一章:云计算概述

1、云计算的定义

云计算是一种模型,这个模型可以方便地通过网络访问一个可配置的计算资源(例如网络、服务器、存储设备、应用程序以及服务等)的公共集。这些资源可以被快速提供并发布,同时最小化管理成本以及服务供应商的干预。

2、云计算的优势

按需供应的无限计算资源;无须事先花钱就能使用的IT架构;基于短期的按需付费的资源使用;单机难以提供的事务处理环境。

3、云计算的公共特征

①弹性伸缩②快速部署③资源抽象④按用量收费⑤宽带访问

4、云计算的分类

按照部署方式分为:①公共云②私有云③社区云④混合云⑤行业云⑥其他云类型。

按照服务类型分为:①基础设施即服务②平台即服务③软件即服务

5、虚拟化

虚拟化(Virtualization)是为某些事物创造的虚拟版本,例如硬件平台、计算机系统、存储设备和网络资源等。其目的是为了摆脱现实情况下物理资源所具有的各种限制,即“虚拟化是资源的逻辑表示,它不受物理限制的约束。”

云计算所涉及的虚拟化,是经过发展之后的更高层次的虚拟化,是指所有的资源——计算、存储、应用和网络设备等连接在一起,由云计算平台进行管理调度。

第二章:分布式计算

1、分布式计算的定义及优势

中科院定义:分布式计算就是在两个或多个软件互相共享信息,这些软件既可以在同一台计算机上运行,也可以在通过网络连接起来的多台计算机上运行。

分布式计算比起其它算法具有以下几个优点:

①稀有资源可以共享。

②通过分布式计算可以在多台计算机上平衡计算负载。

③可以把程序放在最适合运行它的计算机上。

其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之一。

2、ACID原则

ACDI是数据库事务正常执行的四个原则,分别指原子性、一致性、独立性及持久性。

原子性:原子性很容易理解,也就是说事务里的所有操作要么全部做完,要么都不做,事务成功的条件是事务里的所有操作都成功,只要有一个操作失败,整个事务就失败,需要回滚。

一致性:一致性也比较容易理解,也就是说数据库要一直处于一致的状态,事务的运行不会改变数据库原本的一致性约束。

独立性:独立性是指并发的事务之间不会互相影响,如果一个事务要访问的数据正在被另外一个事务修改,只要另外一个事务未提交,它所访问的数据就不受未提交事务的影响。

持久性:持久性是指一旦事务提交后,它所做的修改将会永久保存在数据库上,即使出现宕机也不会丢失。

ACID原则解决了数据的一致性、系统的可靠性等关键问题,为关系数据库技术的成熟以及在不同领域的大规模应用创造了必要的条件。

3、CAP理论

CAP理论是指一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项。

一致性:更新操作成功并返回客户端完成后,所有节点在同一时间的数据完全一致

可用性:服务一直可用,而且是在正常的响应时间内。

分区容错性:指分布式系统在遇到某节点或网络分区故障的时候,仍然能够对外提供满足一致性和可用性的服务。

CA without P以及CP without A可以,AP without C不可以。

4、BASE理论

BASE理论是对CAP理论的延伸,核心思想是即使无法做到强一致性,但应用可以采用适合的方式达到最终一致性。BASE是指基本可用(Basically Available)、软状态(Soft State)、最终一致性(Eventual Consistency)。

基本可用:指分布式系统在出现故障的时候,允许损失部分可用性,即保证核心可用。

软状态:指允许系统存在中间状态,而该中间状态不会影响系统整体可用性。

最终一致性:指系统中的所有数据副本经过一定时间后,最终能够达到一致的状态。

最终一致性的变体:Causal consistency(因果一致性)、Read-your-writes consistency、Session consistency、Monotonic read consistency、Monotonic write consistency。

5、如何理解最终一致性?

最终一致性可概括为:过程松,结果紧,最终结果必须保持一致性即可。最终一致性就是“等会儿就一致”,早晚会一致的。使用最终一致性的关键就是想方设法让用户“等会儿”。

6、分布式系统的特性

容错性、高可扩展性、开放性、并发处理能力、透明性。

7、分布式存储系统

分布式存储系统大致可分为5个子方向:结构化存储、非结构化存储、半结构化存储、In-memory 存储及NewSQL。

结构化存储强调:结构化的数据(例如关系表);强一致性(例如银行系统,电商系统等场景);随机访问(索引、增删查改、SQL)

非结构化存储强调:高可扩展性,典型的系统就是分布式文件系统

半结构化存储:为了解决结非结构化存储系统随机访问性能差的问题

8、并行计算和分布式计算的比较

几种典型的分布式计算系统:传统基于消息的系统、 MapReduce家族系统、图计算系统、基于状态的系统、实时流处理系统

9、分布式资源管理系统

资源统一管理和调度平台具有以下特点:支持多种计算框架、扩展性、容错性、高资源利用率、细粒度的资源分配。

10、典型的分布式系统

网格系统、P2P系统、透明计算、区块链系统。

第三章:云计算架构

1、云数据中心的两种模式

传统模式、基于集装箱的数据中心。

2、云的工作负载模式

模式1:时开时停模式。模式2:用量迅速增长模式。模式3:瞬时暴涨模式。模式4:周期性增减模式。

3、云计算的架构

中央集权架构、客户机/服务器(C/S)架构、中间层架构、浏览器/服务器(B/S)架构、C/S与B/S混合架构、面向服务的架构。

4、云栈和云体

云栈:云栈又称云平台,是在云上面建造的运行环境。它能够支持应用程序的发布、运行、监控、调度、伸缩,并为应用程序提供辅助服务的机制,如访问控制和权限管理等。

三层云栈架构:IaaS、PaaS、SaaS,分别对应基础设施即服务、平台服务、软件服务。其中基础设施即服务可以称为效用计算,平台即服务可称为弹性计算,软件即服务可称为随需应用。

四层、五层云栈架构:

云体:云体是云计算的物质基础,是云计算所用到的资源集合。云体就是数据中心。

如果用一个短语来描述云计算,那就是:IT即服务。云计算的本质就是IT作为服务涵盖了基础设施即服务、平台即服务、软件即服务或任何X即服务。

5、软件定义的数据中心

数据中心(Data Center)是数据集中存储、计算、交换的中心。

传统模式的数据中心存在的问题:过多的机器、机器的利用率过低、应用迁移太困难、存储需求增长得太快。

软件定义计算,软件定义存储,软件定义网络。

6、OpenStack

*OpenStack提供了一个通用的平台来控制云计算里面的计算(服务器)、存储和网络,甚至应用资源。

*openstack作用:①充分利用物理服务器、虚拟服务器、网络和存储系统资源;②通过租户、配额和用户角色高效管理云资源;③提供一个对底层实现透明的通用的资源控制接口。

*OpenStack组件功能

①计算(Compute):Nova。管理虚拟机资源,包括CPU、内存、磁盘和网络接口。

②网络:Neutron。提供虚拟机网络接口资源,包括IP寻址、路由和软件定义网络(SDN)。

③对象存储(Object Storage):Swift。提供可通过RESTful API访问的对象存储。

④块存储(Block Storage):Cinder。为虚拟机提供块(传统磁盘)存储。

⑤身份认证服务:Keystone。为OpenStack组件提供基于角色的访问控制,提供授权服务。

⑥镜像服务:Glance。管理虚拟机磁盘镜像,为虚拟机和快照(备份)服务提供镜像。

⑦仪表盘(Dashboard):Horizon。为OpenStack提供基于Web的图形界面。

⑧计量服务(Telemetry):Ceilometer。集中为OpenStack各个组件收集计量和监控数据。

⑨编排服务(Orchestration):Heat。为OpenStack环境提供基于模板的云应用编排服务。

第四章:虚拟化技术

1、虚拟化

*定义:在计算机科学领域中,虚拟化代表着对计算资源的抽象,而不仅仅局限于虚拟机的概念。

*分类:服务器虚拟化、网络虚拟化、桌面虚拟化、软件定义的存储

2、服务器虚拟化

*服务器虚拟化需具有的特性:多实例、隔离性、封装性、高性能

*分类:全虚拟化、半虚拟化、硬件辅助虚拟化。

*需要虚拟化的物理资源可以分为三大类:计算资源(CPU、内存)、存储资源和网络资源。

*全虚拟化:虚拟化软件层将操作系统的指令翻译并将结果缓存供之后使用,而用户级指令无须修改就可以运行,具有和物理机一样的执行速度。

*半虚拟化:半虚拟化指的是虚拟机系统和虚拟化软件层通过交互来改善性能和效率。

半虚拟化涉及修改操作系统内核来将不可虚拟化的指令替换为可直接与虚拟化层交互的超级调用(hypercalls)。

*全虚拟化和半虚拟化的比较:①全虚拟化时未经修改的虚拟机系统不知道自身被虚拟化,系统敏感的调用陷入虚拟化层后再进行二进制翻译。

②半虚拟化的价值在于更低的虚拟化代价,但是性能优势根据不同的工作负载有很大差别。

③半虚拟化不支持未经修改的操作系统(如Windows),因此它的兼容性和可移植性较差。由于半虚拟化需要系统内核的深度修改,在生产环境中,技术支持和维护上会有很大的问题。

*硬件辅助虚拟化:使用CPU相应状态位捕获客户操作系统的请求。第一代技术包括Intel的VT-x和AMD的AMD-V,两者都针对特权指令为CPU添加了一个执行模式,即VMM运行在一个新增的根模式下。

3、商用虚拟机技术(KVM:内核虚拟机)

Xen虚拟机技术、KVM虚拟机技术、Hyper-V虚拟化技术、VMware Workstation

第五章:分布式存储

1、分布式存储

*分布式存储系统定义:分布式存储系统是将为数众多的普通计算机或服务器通过网络进行连接,同时对外提供一个整体的存储服务。

*分布式存储系统的特性:高性能、可扩展、低成本、易用性

*数据类型的分类:非结构化数据、结构化数据、半结构化数据。

*分布式存储系统的分类:分布式文件系统(存储非结构化数据)、分布式键值系统(简单的半结构化数据)、分布式表系统(半结构化数据)、分布式数据库(大规模的结构化数据)。

*分布式存储20世纪末的代表: SAN(Storage Area Network)、NAS(Network Attached Storage)、GPFS (General Parallel File System)、GFS (Google File System)、HDFS

2、SAN和NAS的区别

①SAN存储设备通过光纤连接,而NAS存储设备通过TCP/IP连接。

②SAN存储设备访问数据块,而NAS存储设备访问单个文件。

③SAN存储设备连接多个存储设备,而NAS存储设备作为单个专用设备运行。

3、ChunckServer如何应对热点?(补充)

4、文件存储

单机文件系统、网络文件系统、并行文件系统、分布式文件系统、高通量文件系统

5、单机存储系统

存储系统的数据模型:文件、关系以及键值模型

6、分布式存储系统

*基本概念:异常,超时,一致性,衡量指标:性能、可用性、一致性、可扩展性

*性能分析,数据分布,复制,容错,可扩展性,分布式协议

第六章:云计算网络

1、基本概念

*计算机网络:通俗地讲,计算机网络指的是为多个计算设备提供信息交换支持的系统。

*覆盖网络:覆盖网络是一种在原有网络基础上构建网络连接抽象及管理的技术。覆盖网络中的节点可以被认为是通过虚拟或逻辑

相关推荐: