导航菜单
首页 >  数据分析与实践期末考试  > 【数据分析与挖掘】期末复习笔记(不挂科)

【数据分析与挖掘】期末复习笔记(不挂科)

【数据挖掘】期末复习笔记 1. 数据挖掘概论 1.1 参考资料1.2 简介1.3 数据、信息、知识1.4 数据分析与数据挖掘1.5 主要任务1.6 数据库系统与数据仓库1.7 数据挖掘常用工具2. python数据分析与挖掘基础2.1 Matplotlib图表绘制基础 3. 认识数据 3.1 属性及其类型3.2 数据的基本统计描述3.3 数据可视化3.4 数据对象的相似性度量3.5 小结 4. 数据预处理 4.1 数据清洗4.2 数据集成4.3 相关分析4.4 相关系数4.5 数据规约4.6 数据转换和离散化 5. 分类 5.1 朴素贝叶斯分类5.2 决策树 6. 聚类 6.1 划分方法 7. 回归 7.1 逻辑回归正则化 8. 关联分析 8.1 频繁项集8.2 关联规则8.3 先验原理8.4 FP-tree挖掘频繁集 笔记 KDD聚类数据的属性类型四分位数极差(IQR)

1. 数据挖掘概论 1.1 参考资料

在这里插入图片描述 视频资料:魏伟一老师;MOOC官网,国防科大:丁兆云老师,北理:嵩天老师

1.2 简介知识是人类对客观世界的观察和了解,是人类对客观世界是什么、为什么、应该怎么做的认知,知识推动人类的进步和发展。人类所作出的正确判断和决策,以及采取正确的行动都是基于智慧和知识。 数据是反映客观事物的数字、词语、声音和图像等,是可以进行计算加工的“原料”。数据是对客观事物的数量、属性、位置及其相互关系的抽象表示,适合于保存、传递和处理。

数据挖掘(Data Mining)是人工智能和数据库领域研究的热点问题,是指从大量有噪声的、不完全的、模糊和随机的数据中,提取出隐含在其中的、事先不知道但具有潜在利用价值的信息的过程。

这个定义包括几层含义:数据必须是真实的、大量的并且含有噪声的

相关推荐: