![Python数据分析入门:从数据获取到可视化](https://wfqqreader-1252317822.image.myqcloud.com/cover/536/23914536/b_23914536.jpg)
1.1.1 在Ubuntu系统下搭建Python集成开发环境
1.Anaconda(Spyder)安装与配置
Ubuntu是自带Python环境的(Python 2),按下快捷键[Ctrl + Alt + T](或者在桌面空白处单击右键,在弹出的快捷菜单中选择“open terminal”命令)打开终端,输入python即可,如图1-1所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0011_0001.jpg?sign=1739439168-VRKbBF8sdctjQEkGay1AyWVoojoF6esb-0-faa712fb3b5c86eb8cd16569f7454247)
图1-1
由于我们学习的是Python 3,所以将使用Anaconda完成Python 3的环境配置。
“Anaconda是用于大规模数据处理、预测分析和科学计算的Python和R编程语言的免费平台,旨在简化包管理和部署”。第三方库的安装对于初学者来说可能是一件比较头疼的事,但是它集成了很多用于数据处理和科学计算的第三方库,使得我们不用额外再去安装。同时,Anaconda提供了强大的安装包管理功能,这点会在后面详细介绍。Anaconda还自带一款十分优秀的编辑器——Spyder,它的界面和使用方法与MATLAB和RStudio十分相像,其特点在于中间变量的储存。下面介绍具体的安装步骤。
注意:下面的命令均是在终端执行的,并且要根据需要切换到特定目录后再执行对应的命令。此外随着版本的更新,下载文件的文件名可能会改变,请读者仔细查看并在必要时对命令做出修改。
首先,进入Anaconda官网(https://www.anaconda.com/download)下载对应版本的安装文件,这里选择Python 3.6 version 64-BIT(X86)INSTALLER(499M),默认下载到Downloads文件夹。之后,通过快捷键[Ctrl + Alt + T](或者在桌面空白处单击鼠标右键,在弹出的快捷菜单中选择“open terminal”命令)打开终端,输入命令cd Downloads/后切换到包含下载文件的目录下,运行命令bash Anaconda3-4.4.0-Linux-x86_64.sh,开始安装(Anaconda3-4.4.0-Linux-x86_64.sh是下载的文件名),如图1-2所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0012_0001.jpg?sign=1739439168-bEOfa33MKilujf1x3AHbzvszMsFh9TxC-0-fe1a6161137396e0216276d2de327478)
图1-2
然后按回车键确认,继续运行安装程序。接着会出现与协议相关的确认信息,如图1-3所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0013_0001.jpg?sign=1739439168-oRS7uJovG4Mf1GmJxHwopBeKgClITH0g-0-c6d69940f3dd876cad21ecd75f44a044)
图1-3
输入yes并按回车键继续安装,接下来选择安装路径,这里直接按回车键选择默认的路径,如图1-4所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0013_0002.jpg?sign=1739439168-hxrYoMQYPsTwwFyRNmpYEWRr1Xpqpuhq-0-c78b32d9506fad69b54e18e69da56654)
图1-4
接着会进行一系列的配置,稍后询问是否将Anaconda加入环境变量,这里选择加入,如图1-5所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0014_0001.jpg?sign=1739439168-JelUszSZvcW1LOft1kJCYLcAWn5wCm1w-0-1b812d2405c8dfe4f2e0ff9f4cd8ee7c)
图1-5
按照提示,打开一个新的终端测试是否成功安装,如图1-6所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0014_0002.jpg?sign=1739439168-05zsnAgqjndeoCQKs3RJtgYIzG4rmu73-0-277f9e2a4bbf30773c22287b08c74e6c)
图1-6
从图1-6中可以看出,conda list命令给出了已经安装的第三方库的列表,表示安装成功。
由于已经将其加入环境变量,所以此时默认的Python版本即为Python 3.6,由Anaconda提供,而原来的Python 2也可以正常使用,调用方法如图1-7所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0014_0003.jpg?sign=1739439168-dmkZmlVd0zI8u2XrgrTNS5fRagfwiCtc-0-cbef5e40804d92ea8a40a415b103a942)
图1-7
我们也可以在终端通过ipython命令来使用IPython这一优秀的交互式环境,如图1-8所示。本书大部分的代码便是在此进行测试。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0015_0001.jpg?sign=1739439168-MuRUR3XNtjbMOygXLGD9AtvnTsoa7739-0-a838315b02205d442db43a29174df8cc)
图1-8
此外,可以通过spyder命令启动自带的编辑器Spyder,如图1-9所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0015_0002.jpg?sign=1739439168-LLmtnBXWMd610PYpD6NUjtPcfzFny9tC-0-db58bfbc188ffefa88046ddd57f1a693)
图1-9
其界面与MATLAB和RStudio十分类似,主要分为三部分:左侧的编辑区,右上方的变量查看和文件管理区,以及右侧下方的IPython交互式命令行区。可以通过选中左侧部分代码,再按快捷键[Ctrl+Enter]测试部分代码,十分方便。
作为专注于数据的开源工具,新版Anaconda提供导航器(navigator),其包含更加丰富的内容,可以通过命令anaconda-navigator启动,界面如图1-10所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0016_0001.jpg?sign=1739439168-eN72RnTBt4TVe27SEhRn5GUNhcU0iubq-0-42a8d2ab6490d7ce5d0556bd25d48b1f)
图1-10
这里可以便捷地启动一系列的工具,此外,还包含其他有用的内容,读者可自行探索。
至此,完成了对Anaconda安装和基本使用方法的介绍。接下来就可以使用Spyder编辑器开发了,不过在此之前先为大家介绍另一款更加优秀的编辑器——PyCharm。不过PyCharm需要Java环境,所以接下来首先介绍Java环境的搭建。
2.Java环境搭建
Ubuntu默认是没有Java环境的,可以通过命令java-version查看,如图1-11所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0017_0001.jpg?sign=1739439168-GkvOwzsUlWZDesPpZNL695AVk6gvgE8p-0-4c6f273a338788b76b5d2631bcb86077)
图1-11
首先到Oracle官网(http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html)找到对应的下载文件,这里选择jdk-8u131-linux-x64.tar.gz。默认下载到Downloads文件夹。之后通过命令sudo su,输入密码,切换到管理员身份进行下面的配置;然后输入命令cd '/usr',切换到usr文件夹下,再通过tar -zxvf '/home/shen/Downloads/jdk-8u131-linux-x64.tar.gz’将压缩包解压(注意:这里的路径是压缩包的绝对路径)。运行mv jdk1.8.0_131 jdk-8,将文件重命名为jdk-8。
接下来修改系统配置文件,运行gedit /etc/profile,打开文件,在文件最后加入以下代码。
export JAVA_HOME=/usr/jdk-8 export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
最后运行source /etc/profile,使配置文件生效。再次查看Java环境版本,可以看到安装成功,如图1-12所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0018_0001.jpg?sign=1739439168-J7aA0bBpolh7wxHqb5TKz7DITOt3am7Y-0-794b2d958bc1cd6875129ffaec50cd12)
图1-12
至此,完成了对Java环境的搭建,接下来就可以安装PyCharm了。
3.PyCharm安装
PyCharm是由JetBrains公司提供的一款专门用于Python的编辑器。它是一款十分优秀的软件,本书很多程序也是在PyCharm中运行测试的。PyCharm分为社区版(免费)和专业版,一般社区版就足够用了。当然有需要的读者可以购买专业版,学生或者老师可以用学校的教育邮箱免费申请使用权限,一般很快就能审核通过。这里以社区版安装为例,专业版也是一样的。
首先进入PyCharm官网(https://www.jetbrains.com/pycharm/)下载安装文件,默认下载到Downloads文件夹下。之后运行命令切换到此文件夹,并进行解压,代码如下。
cd Downloads/ tar -xzf pycharm-community-2017.1.4.tar.gz
然后通过cd pycharm-community-2017.1.4/bin/切换目录到包含PyCharm安装文件的文件夹下。运行./pycharm.sh,开始安装。安装开始后,会询问是否引入之前的设置,如图1-13所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0018_0002.jpg?sign=1739439168-ItOZKdDpDLnQeDUEq3KzUpT2K7CilGk9-0-8155b2fd8dfd1cdab6ad7d9070524611)
图1-13
由于是首次安装,所以选择不引入,单击“OK”按钮即可。弹出主题等配置信息,可先选择默认配置,单击“OK”按钮,有需要时再改即可,如图1-14所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0019_0001.jpg?sign=1739439168-Wc0PZlERSlRM7h0qrEocxWnDF70RKkM6-0-40753f029933029d0fe44707df42d60a)
图1-14
安装完成后,新建项目,如图1-15所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0019_0002.jpg?sign=1739439168-bBtBze3IfX45yzOq76mwisH3TWeUGkLf-0-ab3db97fecd9dc9d39c668e908e58337)
图1-15
PyCharm检测到系统有多个Python环境,所以在创建项目的时候,可以根据需要选择对应的Python版本,这里选用Anaconda提供的Python环境,如图1-16所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0020_0001.jpg?sign=1739439168-hQqe51zJYaJZCNcpkslkG0ESyN6HmFo8-0-4cf3746871da0acaace58c12c71818ac)
图1-16
项目创建后,就能创建.py文件进行运行测试了,如图1-17所示。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0020_0002.jpg?sign=1739439168-myxDNhoCs84FuyoJbqRt9fEOpyVdazmB-0-ce4955c9bfb998c9ffa5862146ad5a53)
图1-17
这里创建了Hello.py,接下来编辑文件。在首次打开时,一般会弹出如图1-18所示的提示框,意为没有为项目指定Python解释器。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0021_0001.jpg?sign=1739439168-FKqyp6xwSK8jTx5CpefI2JUwgRkVcJ2z-0-6d0a3cefa90443fed35884781c9756d0)
图1-18
直接单击提示栏右侧的链接,进行配置即可(也可以在开始页面选择“File”命令,然后选择“Settings”命令)。
选择“Project Python DA”选项下的“Project Interpreter”子项,在右侧选择Anaconda对应的解释器,然后依次单击“Apply”、“OK”按钮即可,如图1-19所示(这里可能需要一段时间进行配置)。最后单击鼠标右键,选择“运行”命令或者按下快捷键[Shift+F10]。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0021_0002.jpg?sign=1739439168-hnM66DHE3ePMkoVEKQHCBAPPjdpAvzRN-0-313fe035f4bc1804c3d307ab40e12a14)
图1-19
也可以单击右上角的绿色三角形运行,成功打印输出结果,如图1-20所示。exit code为0,表示一切正常。
![](https://epubservercos.yuewen.com/A69311/12741017004676906/epubprivate/OEBPS/Images/figure_0022_0001.jpg?sign=1739439168-a0gL3jMZItYdbrI2TLJJooomblADISD9-0-24b3c375e95b92b658d5543f2c965240)
图1-20
至此完成了PyCharm的安装和配置。