
2.1 准备工作
1.编程环境
(1)操作系统:Windows 10 64位操作系统。
(2)运行环境:Python 3.8.5,Anaconda下的Spyder编辑器。
2.涉及的依赖库
本节对涉及的依赖库Pandas、NumPy、Matplotlib、Seaborn等不做介绍,读者可以查找相关资料作为参考,下面简要介绍以下几个库。
1)BeautifulSoup库
BeautifulSoup是使用Python编写的HTML和XML解析库,语法简练,简单易学,对初学者比较友好。在Anaconda Prompt中输入“pip install bs4”即可安装BeautifulSoup库。
2)Requests库
Requests是一个用于向网页发送请求的第三方HTTP库。在Anaconda Prompt中输入“pip install requests”即可安装Requests库。
3)scikit-learn库
scikit-learn不仅是基于Python的机器学习工具包,还是简单高效的数据挖掘和数据分析工具。其包含回归、分类、聚类、降维等传统机器学习模块,可供用户在各种环境中调用。在Anaconda Prompt中输入“pip install scikit-learn”即可安装scikit-learn库。
4)statsmodels库
statsmodels是一个统计分析包,不仅包含经典统计学、经济学算法,还包含多种统计模型。在Anaconda Prompt中输入“pip install statsmodels”即可安装statsmodels库。
5)windrose库
windrose是一个用于绘制风向、风力等级的Python库,风玫瑰图可以形象地展示风向、风力的分布。在Anaconda Prompt中输入“pip install windrose”即可安装windrose库,如图2-1所示。

图2-1 windrose库的安装示意图