导航菜单
首页 >  浙江省计算机三级真题  > 2022年下半年浙江省高校计算机等级考试三级数据管理与分析技术

2022年下半年浙江省高校计算机等级考试三级数据管理与分析技术

2022年下半年浙江省高校计算机等级考试

考试语种:三级 数据管理与分析技术

考试方式:上机考试

没错,我去年考三级网络安全技术时是纸质考试,今年我去考试时是在机房,有个专门的软件考试,好像从今年考试所有级别科目均实行上机考试

考试时间:120分钟

这个时间是妥妥够的,我做完所有题目然后检查了一遍,顺便无聊把程序填空题的另外一中编程语言写完也差不多花费了四十分钟左右,不用担心时间

考试类型:判断题+单选题+综合应用题--归根到底,在软件上答题后都变成了选择题哈哈

具体的题目因为每年都不一样,我只能列举几个,然后每种题型我都大致说一下数据库和大数据题型数量的比例

一、判断题(1*10=10)

目前这块题目比较基础,比如候选码,约束,大数据相关专有名词的组成与特征

数据库:大数据=3:7

二、单选题(2*30=60)

目前这块题目也比较基础。定义/特征/组成/f分类

涉及大数据相关一般都是考哪一项不属于其特征或哪一项不是其组成,或者说明一种情况然后让我们判断类型,比如故障分类,毕竟四选一嘛

数据库:大数据≈1:2(+4题左右的Linux和Hadoop指令操作)

三、综合应用(8+12+10=30)

综合应用(一)【大概4-5题】--已知E-R图,选关系(1对m,n对m,主键)

综合应用(二)【大概5-6题】--已知关系模型,选SQL语句(select,update,sum(),count())

综合应用(三)【5题】--程序填空题,用python/java填空MapReduce程序

备考建议:

1.判断开考时间和自我水平

如果啥都不懂的,建议给自己一个月的时间简单学习一下数据库和SQL语句

如果有一定的基础的,建议花费一两周的时间复习数据库和学习大数据

2.一定要下载对应的考试大纲

所有的考点都在上面,不会出超纲的题目

在大纲上有考点提示,在掌握基础知识后自己可以查阅具体某一方面的知识

以下是本次考试涉及到的知识点,仅供参考

也可以直接去官网下载完整版

一、关系数据库应用

1、数据库的基本概念:数据库三级模式结构的概念、数据逻辑独立性与物理独立性的含义

2、数据库系统的数据模型类别:层次、网状、关系(这次考到了关系数据库)

3、关系数据库的完整性约束类别:主键约束、外键约束、数据类型约束;掌握关系数据理论的函数依赖、1NF、2NF、3NF、BCNF的定义和判断方法

4、结构化查询语言SQL的基本应用:数据库对象定义语言(DDL)(数据类型、库的创建与删除、表的创建、修改与删除)、分组统计查询、查询结果排序)

5、MySQL用户及权限基本管理:table对象的授权(update权限)。

6.简单数据库应用的数据库设计:ER图设计、ER图向关系模型的转换方法;ER图包括实体、属性、联系(1对1、1对多、多对多)

二、大数据管理与分析技术

1、大数据基本概念:大数据的4V特征(价值密度最容易混淆,也是最容易考的点)、核心技术(分布式存储和分布式处理)。

2、Hadoop框架基础理论: Hadoop特性、核心模块与相应的主要功能(HDFS分布式文件系统、MapReduce计算模型)。

(1)HDFS文件系统基本内容:体系结构、HDFS实现的目标与局限性HDFS的NameNode和DataNode的功能与模块(NameNode:FsImage与EditLog;DataNode:数据存储与检索)。

(2)MapReduce计算模型基本内容:体系结构(Client、JobTracker、TaskTracker以及Task)、优势(容错性好、硬件要求低、编程难度低、使用场景多等)、设计策略(分而治之、计算向数据靠拢、Master/Slave架构)。

3、常用的Linux命令行工具和Hadoop操作:

(1)Linux常用操作:cd、mkdir、rmdir、cp、mv、rm、cat、more、head、tail、touch、chown、chmod、find、tar、grep;

(2)Hadoop常用操作:Hadoop启动(所有进程启动、单进程启动)、查看目录(hdfs dfs –ls)、打开文件(hdfs dfs –cat)、本地文件或目录上传到Hadoop(hdfs dfs –put)、从Hadoop下载至本地目录(hadoop dfs -get)、删除Hadoop上文件夹或文件(hdfs dfs –rm||-rmr)、在Hadoop指定目录内创建新目录(hdfs dfs –mkdir)、将Hadoop某个文件重命名(hdfs dfs –mv)、将Hadoop指定目录下所有内容保存为一个文件,同时download至本地(hdfs dfs –getmerge)、kill正在运行的Hadoop作业(hadoop job –kill)、查看PATH目录信息(hdfs dfs –count)、显示文件的内容(hdfs dfs –text)、查看帮助(hdfs dfs -help)。

4、经典统计算法(去重、计数、排序、TopK排序、求最大最小值)与关系运算(选择、投影、分组)的MapReduce实现【程序填空题】。关系运算也有可能考笛卡尔积,可能出1道选择题

5、Spark基本概念:Spark核心技术(RDD:弹性分布式数据集RDD的两类操作:Transformation和Action,有向无环图 DAG、内存计算技术、惰性计算)、Spark特性(速度快、丰富的API、高容错性、部署方式多样化)、Spark的架构(驱动器程序、SparkContext对象、集群管理器(Cluster Manager)、工作节点)。

6、Spark应用程序的运行架构与运行流程(集群管理器(Cluster Manager),多个工作节点(Worker Node),每个应用的任务控制节点(Driver)和每个工作结点上负责具体任务执行进程(Executor))。

我有看到别人分享数据库方面刷全国计算机等级题库,我觉得还是看个人和运气

我自己是在考前两周刷了未来教育刷题软件中关于三级数据库技术的真题,大概刷了十几套,但发现与本次考试相关的大概也只有5、6道题目

本身这个考试考数据库方面的题目就少,主要考大数据方面的,有这时间不如多写写或背背大数据相关的题目

相关推荐: