1.(多选)MaxCompute在每一个项目空间在创建时,会自动创建admin的角色, 并且为该角色授予了确定的权限。以下权限中不属于admin的有哪些(ABC)。A:设定项目空间的安全配置B:修改项目空间的鉴权模型C:将admin权限指派给其他用户D:以package方式授权E:对其他用户或角色进行授权
解析:MaxCompute创建项目成功后,除了项目所有者(Project Owner)外还内置了两个默认的管理角色Super_Administrator和Admin,Admin角色不具有设定项目空间的安全配置的权限,Admin角色不能修改项目空间的鉴权模型,不能Admin权限指派给其他用户。
2.(多选)MaxCompute中支持多种表连接 (join) 的方式,包括哪些(CD)。A:semi outer joinB:anti outer joinC:full outer joinD:mapjoin
解析:semi outer和anti outer支持left join。full outer join和map join是dataworks支持的join方式 。
3.(多选)Google在大数据发展的过程中做出了非常大的贡献,其中有三篇非常具有影响力的论文,论述了文件系统、非关系型数据库、并行计算框架,分别为(ABC)。A:GFSB:BigTableC:MapReduceD:HDFSE:HbaseF:Spark
解析:google 分别在 2003 年、2004 年以及 2006 年发布了大数据发展影响重大的三篇论文:1、The Google File System,简称 GFS;2、MapReduce;3、Bigtable。分别论述文件系统、非关系型数据库、并行计算框架 。
4.阿里云机器学习PAI支持多种常见的算法,以下属于分类算法的有(AB )。A:KNNB:RandomForestC:K-MeansD:DBSCAN
解析:KNN是近邻分类算法,是通过测量不同特征值之间的距离进行分类的算法;RandomForest算法是随机森林算法,可以用作分类算法;K-Means算法是k均值聚类算法,用作聚类分析算法;DBSCAN算法是密度聚类算法,用作聚类分析。
5.采用分布式的方式存储数据时,要考虑数据复制时一致性的问题,关于一致性如何保证可以采取多种基本原则和设计理念,不包括哪项。(A)A:LRUB:CAPC:ACIDD:BASE
解析:数据复制与一致性基本原则和设计理念包括:CAP、ACID、BASE等,不包括LRU。
6.大数据计算服务MaxCompute是阿里巴巴自主研发的海量数据处理平台,主要服务于批量结构化数据的存储和计算。以下不适合使用大数据计算服务实现的场景是?(A)A:订单办理B:数据仓库C:社交网络分析D:用户画像
解析:MaxCompute是阿里云大数据离线计算服务组件,适合批量数据开发调度,订单办理属于实时业务,不适合有maxcompute完成。同时maxcompute适用于日志分析,用户画像,数据化运营,数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘
7.使用odpscmd连接到MaxCompute中的某个project后,执行什么命令可以查看表table_b占用空间的大小。(A)A:desc table_b;B:size table_b;C:select size from table_b;D:show table table_b;
解析:desc是查看表或者视图信息
8.MaxCompute项目空间A设置了项目空间保护: set ProjectProtection=true;并且将项目空间B设置为可信空间: add trustedproject B;无其他任何设置。以下说法中正确的是哪项?(A)A:项目空间A中的数据可以流至项目空间BB:项目空间B中的数据可以流至项目空间AC:项目空间A和项目空间B中的数据可双向流动D:项目空间B中的数据只可以流至项目空间A
解析:如果当前项目空间处于受保护状态,如果将数据流出的目标空间设置为当前空间的TrustedProject,那么目标项目空间的数据流向将不会被视为触犯ProjectProtection规则。如果多个项目空间之间两两互相设置为TrustedProject,那么这些项目空间就形成了一个TrustedProject Group,数据可以在这个Project Group内流动,但禁止流出到Project Group之外。
9.MaxCompute SQL采用的是类似于SQL的语法,适用于海量数据,实时性要求不高的场合。关于MaxCompute SQL,以下说法正确的包括哪些选项?(BCD)A:MaxCompute可以等价成一个数据库,可以完成事务及回滚的功能B:MaxCompute的每个作业准备以及提交都需要花费较长时间,因此不适用对于要求响应时间较短的准实时查询C:MaxCompute SQL支持多种操作,如含join, where, order by, group by等D:MaxCompute SQL包括的数据类型有BigInt, Float, Double, String, Date Time, Boolean
解析:MaxCompute并不具备数据库的常见特性,如事务、回滚等。
10.MaxCompute可通过ACL授权来协调多用户操作同一个项目,下列选项中,可以进行ACL授权的对象包括哪些?(ABC)A:ProjectB:TableC:ResourceD:Procedure
解析:ACL授权对象包括:project table function resource instance