【数据挖掘】《数据分析与数据挖掘》

天津大学《数据分析与数据挖掘》公开课--学习笔记 1.1 数据分析与数据挖掘 1.1.3 知识发现（KDD）的过程1.1.4 区别1.1.5 联系 1.2 分析和挖掘的数据类型 1.2.1 数据库数据1.2.2 数据仓库数据1.2.3 事务数据1.2.4 数据矩阵1.2.5 图和网状结构数据 1.3 数据分析与数据挖掘方法 1.3.1 频繁模式1.3.2 分类与回归1.3.3 聚类分析1.3.4 离群点分析 1.4 数据分析与数据挖掘使用技术 1.4.1 统计学方法1.4.2 机器学习1.4.3 数据库与数据仓库 1.5 应用场景及存在的问题 2.1 数据的属性 2.1.1 数据对象2.1.2 属性2.1.3 属性类型 2.2 数据的基本统计描述 2.2.1 中心趋势度量2.2.2 数据的分散度量2.2.3 数据的图形显示 2.3 数据的相似性和相异性 2.3.1 数据矩阵和相异矩阵2.3.2 数值属性的相异性2.3.3 序数属性的近邻性度量2.3.4 余弦相似性 3.1 数据存在的问题 3.2 数据清理 3.2.1 空缺值处理3.2.2 噪声处理 3.3 数据集成 3.4 数据规约 3.5 数据变换与数据离散化 3.5.1 数据泛化3.5.2 数据规范化3.5.3 数据变换：属性构造3.5.4 离散化 4.1 数据仓库的基本概念 4.1.1 数据仓库定义和特征4.1.2 数据仓库体系结构4.1.3 数据模型4.1.4 粒度 4.2 数据仓库设计 4.2.1 概念模型设计4.2.2 逻辑模型设计 4.3 数据仓库实现 4.4 联机分析处理 4.4.1 OLAP简介4.4.2 OLAP与OLTP区别4.4.3 典型OLAP操作 4.5 元数据模型 4.5.1 元数据内容4.5.2 元数据类型4.5.3 元数据的作用 5.1 回归分析 5.1.1 回归分析的步骤 5.2 一元线性回归 5.2.1 回归方程5.2.2 求解及模型检验 5.3 多元线性回归 5.3.1 回归方程 5.4 多项式回归 5.4.1 回归方程5.4.2 最小二乘法5.4.3 拟合优度检验5.4.4 显著性检验 6.1 频繁模式概述 6.1.1 相关概念6.1.2 关联规则6.1.3 先验原理 6.2 Apriori算法 6.2.1 关联规则挖掘的方法6.2.2 Apriori算法 6.3 FP-growth算法 6.3.1 FP-growth算法步骤6.3.2 FP-growth算法代码 6.4 压缩频繁项集 6.4.1 挖掘闭模式6.4.2 枝剪的策略 6.5 关联模式评估 6.5.1 支持度与置信度框架6.5.2 相关性分析6.5.3 模式评估度量 7.1 分类概述 7.2 决策树 7.2.1 决策树上7.2.2 决策树中7.2.3 决策树下 7.3 朴素贝叶斯分类 7.4 惰性学习法 7.4.1 惰性学习法的概念7.4.2 K近邻算法 7.5 神经网络 7.5.1 神经网络基本概念7.5.2 BP神经网络算法 7.6 分类模型的评估 7.6.1 准确率7.6.2 召回率7.6.3 灵敏度、特效率7.6.4 F值7.6.5 交叉验证 8.1 聚类概述 8.2 基于划分的聚类 8.2.1 K均值算法8.2.2 K-中心点（PAM）算法 8.3 基于层次的聚类 8.4 基于网格的聚类 9.1 离群点定义和类型 9.2 离群点检测 9.2.1 离群点的类型9.2.2 离群点检测方法

网址：《数据分析与数据挖掘》–天津大学公开课

云奕文章网

【数据挖掘】《数据分析与数据挖掘》

相关推荐：