更新时间:2025-02-10 15:56:21
封面
版权信息
内容简介
前言
基础篇
第1章 数据挖掘基础
1.1 某知名连锁餐饮企业的困惑
1.2 从餐饮服务到数据挖掘
1.3 数据挖掘的基本任务
1.4 数据挖掘的建模过程
1.4.1 目标定义
1.4.2 数据采集
1.4.3 数据探索
1.4.4 数据预处理
1.4.5 挖掘建模
1.4.6 模型评价
1.5 常用的数据挖掘建模工具
1.6 小结
第2章 Python数据分析简介
2.1 搭建Python开发平台
2.1.1 需要考虑的问题
2.1.2 基础平台的搭建
2.2 Python使用入门
2.2.1 运行方式
2.2.2 基本命令
2.2.3 数据结构
2.2.4 库的导入与添加
2.3 Python数据分析工具
2.3.1 NumPy
2.3.2 SciPy
2.3.3 Matplotlib
2.3.4 pandas
2.3.5 StatsModels
2.3.6 scikit-learn
2.3.7 Keras
2.3.8 Gensim
2.3.9 TensorFlow
2.3.10 PyTorch
2.3.11 PaddlePaddle
2.3.12 XGBoost
2.4 配套附件使用设置
2.5 小结
第3章 数据探索
3.1 数据质量分析
3.1.1 缺失值分析
3.1.2 异常值分析
3.1.3 一致性分析
3.2 数据特征分析
3.2.1 分布分析
3.2.2 对比分析
3.2.3 统计量分析
3.2.4 周期性分析
3.2.5 贡献度分析
3.2.6 相关性分析
3.3 Python的主要数据探索函数
3.3.1 基本统计特征函数
3.3.2 拓展统计特征函数
3.3.3 统计绘图函数
3.4 小结
第4章 数据预处理
4.1 数据清洗
4.1.1 缺失值处理
4.1.2 异常值处理
4.1.3 重复值处理
4.2 数据集成
4.2.1 实体识别
4.2.2 冗余属性识别
4.3 数据变换
4.3.1 简单函数变换
4.3.2 数据规范化
4.3.3 连续属性离散化
4.3.4 属性构造
4.3.5 小波变换
4.4 数据归约
4.4.1 属性归约
4.4.2 数值归约
4.5 Python的主要数据预处理函数
4.6 小结
第5章 挖掘建模
5.1 分类与预测
5.1.1 实现过程
5.1.2 常用的分类与预测算法
5.1.3 回归分析
5.1.4 决策树
5.1.5 人工神经网络
5.1.6 分类与预测算法评价
5.1.7 Python的分类预测模型
5.2 聚类分析
5.2.1 常用的聚类分析算法
5.2.2 k均值聚类算法
5.2.3 聚类分析算法评价
5.2.4 Python的主要聚类分析算法
5.3 关联规则
5.3.1 常用的关联规则算法
5.3.2 Apriori算法
5.4 时序模式
5.4.1 时间序列算法
5.4.2 时间序列的预处理
5.4.3 平稳时间序列分析
5.4.4 非平稳时间序列分析