2.2 Python数据分析环境
前面已经介绍了如何搭建Python环境,但若想用Python进行数据分析,还需要搭建Python数据分析环境。这就需要借助很多其他的模块与库,除了Python内置的标准库及读者自定义的库,许多与数据分析相关的第三方库往往并没有集成到Python中,如科学计算库NumPy、图形库Matplotlib、数值计算库SciPy、数据挖掘分析库Pandas等都需要单独安装。搭建Python数据分析环境的方法有很多种,这里给大家推荐其中的2种安装方式。
2.2.1 使用pip安装数据分析相关库
在完成Python环境的搭建后,在使用第三方库之前,需要先下载并安装该库,然后才能像使用标准库和自定义库那样将其导入并使用。使用Python提供的pip命令可以完成这一步骤。
pip是Python包管理工具,该工具提供了对Python包的查找、下载、安装、卸载功能。目前,如果通过Python官方网站下载了最新版本的安装包进行安装,那么Python环境中已经自带了该工具。可以在Python的安装目录下找到scripts文件夹,确认其中是否已有pip.exe,或者通过以下命令来判断是否已安装。
如果还未安装pip,可以在Python官方网站上下载、安装并手动添加环境变量,之后使用Python提供的pip命令安装数据分析相关库。此处以安装NumPy库为例进行讲解,其他库的安装方法基本与此类似。
在命令行窗口中输入以下命令。
执行此命令后会在线自动安装NumPy库。pip命令会将下载的第三方库默认安装在Python安装目录的\Lib\site-packages目录下。打开此目录就会发现NumPy库,也就是NumPy文件夹。
2.2.2 安装Anaconda
除了使用pip安装Python数据分析相关库,还可以使用Anaconda将相关库与库和Python打包下载,并且安装到计算机上。安装和使用方式在Windows、Linux和Mac OS X操作系统上都是相似的。
Anaconda是一个开源的Python发行版本,除了包含Python和Conda,还同时绑定了四五百个科学计算程序包。因此,可通过安装Anaconda搭建Python数据分析环境,但要注意的是,Anaconda的安装文件较大。
Anaconda对于Python初学者而言非常友好,相比单独安装Python主程序,选择安装Anaconda可以省去很多麻烦。Anaconda中添加了许多Python数据分析相关库,相较于pip安装库需要通过一条条命令才能自行安装,Anaconda不需要考虑这些。同时,Anaconda还捆绑了2个非常好用的交互式代码编辑器(Spyder、Jupyter Notebook)。读者可通过Anaconda官网自行下载并安装。