Python大数据分析与应用实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1 准备工作

1.编程环境

(1)操作系统:Windows 10 64位操作系统。

(2)运行环境:Python 3.8.5,Anaconda下的Spyder编辑器。

2.涉及的依赖库

本节对涉及的依赖库Pandas、NumPy、Matplotlib、Seaborn等不做介绍,读者可以查找相关资料作为参考,下面简要介绍以下几个库。

1)BeautifulSoup库

BeautifulSoup是使用Python编写的HTML和XML解析库,语法简练,简单易学,对初学者比较友好。在Anaconda Prompt中输入“pip install bs4”即可安装BeautifulSoup库。

2)Requests库

Requests是一个用于向网页发送请求的第三方HTTP库。在Anaconda Prompt中输入“pip install requests”即可安装Requests库。

3)scikit-learn库

scikit-learn不仅是基于Python的机器学习工具包,还是简单高效的数据挖掘和数据分析工具。其包含回归、分类、聚类、降维等传统机器学习模块,可供用户在各种环境中调用。在Anaconda Prompt中输入“pip install scikit-learn”即可安装scikit-learn库。

4)statsmodels库

statsmodels是一个统计分析包,不仅包含经典统计学、经济学算法,还包含多种统计模型。在Anaconda Prompt中输入“pip install statsmodels”即可安装statsmodels库。

5)windrose库

windrose是一个用于绘制风向、风力等级的Python库,风玫瑰图可以形象地展示风向、风力的分布。在Anaconda Prompt中输入“pip install windrose”即可安装windrose库,如图2-1所示。

图2-1 windrose库的安装示意图