更新时间:2019-12-06 14:15:09
封面
版权信息
作者简介
内容简介
前言
为什么写这本书
本书的内容
勘误和支持
致谢
第1章 数据分析与挖掘概述
1.1 什么是数据分析和挖掘
1.2 数据分析与挖掘的应用领域
1.3 数据分析与挖掘的区别
1.4 数据挖掘的流程
1.5 常用的数据分析与挖掘工具
1.6 本章小结
第2章 从收入的预测分析开始
2.1 下载与安装Anoconda
2.2 基于Python的案例实战
2.3 本章小结
第3章 Python快速入门
3.1 数据结构及方法
3.2 控制流
3.3 字符串处理方法
3.4 自定义函数
3.5 一个爬虫案例
3.6 本章小结
第4章 Python数值计算工具——Numpy
4.1 数组的创建与操作
4.2 数组的基本运算符
4.3 常用的数学和统计函数
4.4 线性代数的相关计算
4.5 伪随机数的生成
4.6 本章小结
第5章 Python数据处理工具——Pandas
5.1 序列与数据框的构造
5.2 外部数据的读取
5.3 数据类型转换及描述统计
5.4 字符与日期数据的处理
5.5 常用的数据清洗方法
5.6 数据子集的获取
5.7 透视表功能
5.8 表之间的合并与连接
5.9 分组聚合操作
5.10 本章小结
第6章 Python数据可视化
6.1 离散型变量的可视化
6.2 数值型变量的可视化
6.3 关系型数据的可视化
6.4 多个图形的合并
6.5 本章小结
第7章 线性回归预测模型
7.1 一元线性回归模型
7.2 多元线性回归模型
7.3 回归模型的假设检验
7.4 回归模型的诊断
7.5 本章小结
第8章 岭回归与LASSO回归模型
8.1 岭回归模型
8.2 岭回归模型的应用
8.3 LASSO回归模型
8.4 LASSO回归模型的应用
8.5 本章小结
第9章 Logistic回归分类模型
9.1 Logistic模型的构建
9.2 分类模型的评估方法
9.3 Logistic回归模型的应用
9.4 本章小结
第10章 决策树与随机森林
10.1 节点字段的选择
10.2 决策树的剪枝
10.3 随机森林
10.4 决策树与随机森林的应用
10.5 本章小结
第11章 KNN模型的应用
11.1 KNN算法的思想
11.2 最佳k值的选择
11.3 相似度的度量方法
11.4 近邻样本的搜寻方法
11.5 KNN模型的应用
11.6 本章小结
第12章 朴素贝叶斯模型
12.1 朴素贝叶斯理论基础
12.2 几种贝叶斯模型
12.3 本章小结
第13章 SVM模型的应用
13.1 SVM简介
13.2 几种常见的SVM模型
13.3 分类问题的解决
13.4 预测问题的解决
13.5 本章小结
第14章 GBDT模型的应用
14.1 提升树算法
14.2 梯度提升树算法
14.3 非平衡数据的处理
14.4 XGBoost算法
14.5 本章小结
第15章 Kmeans聚类分析
15.1 Kmeans聚类
15.2 最佳k值的确定