Python数据科学环境设置


为了在本教程中成功创建并运行示例代码,我们需要一个设置环境,它将包含通用Python以及Data Science所需的特殊包。我们先看看安装可以是python 2或python 3的通用python。但是我们更喜欢python 2,因为它的成熟度和对外部软件包的更广泛的支持。

获取Python

Python的官方网站https://www.python.org/上提供了最新的和最新的源代码,二进制文件,文档,新闻等。

您可以从https://www.python.org/doc/下载Python文档。该文档以HTML,PDF和PostScript格式提供。

安装Python

Python发行版适用于各种平台。您只需下载适用于您的平台的二进制代码并安装Python。

如果您的平台的二进制代码不可用,则需要使用C编译器手动编译源代码。编译源代码为您选择安装时需要的功能提供了更多的灵活性。

以下是在各种平台上安装Python的简要概述 -

Unix和Linux安装

以下是在Unix / Linux机器上安装Python的简单步骤。

  • 打开Web浏览器并转到https://www.python.org/downloads/

  • 按照链接下载适用于Unix / Linux的压缩源代码。

  • 下载并提取文件。

  • 如果您想自定义某些选项,请编辑 模块/设置 文件。

  • 运行./configure脚本

  • 使

  • 进行安装

这将Python安装在标准位置 / usr / local / bin 及其库位于 / usr / local / lib / pythonXX ,其中XX是Python的版本。

Windows安装

以下是在Windows机器上安装Python的步骤。

  • 打开Web浏览器并转到https://www.python.org/downloads/

  • 按照Windows安装程序 python-XYZ.msi 文件的链接进行操作,其中XYZ是您需要安装的版本。

  • 要使用此安装程序 python-XYZ.msi ,Windows系统必须支持Microsoft Installer 2.0。将安装程序文件保存到本地计算机,然后运行它以查明您的计算机是否支持MSI。

  • 运行下载的文件。这将启动Python安装向导,它非常易于使用。只需接受默认设置,等待安装完成,然后完成。

Macintosh安装

最近的Mac安装了Python,但可能会过几年。请参阅http://www.python.org/download/mac/以获取有关获取当前版本以及用于支持Mac上的开发的额外工具的说明。对于Mac OS X 10.3(2003年发布)之前的旧版Mac OS,MacPython可用。

杰克詹森维护它,您可以在他的网站上完全访问整个文档 - http://www.cwi.nl/~jack/macpython.html。您可以找到Mac OS安装的完整安装细节。

设置PATH

程序和其他可执行文件可以位于许多目录中,因此操作系统提供了一个搜索路径,该路径列出了操作系统搜索可执行文件的目录。

该路径存储在环境变量中,该变量是操作系统维护的命名字符串。此变量包含可用于命令外壳程序和其他程序的信息。

路径 变量命名为UNIX路径或路径在Windows(Unix的区分大小写; Windows不是)。

在Mac OS中,安装程序处理路径详细信息。要从任何特定目录调用Python解释器,必须将Python目录添加到路径中。

在Unix / Linux上设置路径

在Python中添加Python目录到特定会话的路径 -

  • 在csh shell中 键入setenv PATH“$ PATH:/ usr / local / bin / python”并按Enter键。

  • 在bash shell(Linux)中 - 输入export ATH =“$ PATH:/ usr / local / bin / python”,然后按Enter键。

  • 在sh或ksh shell中 - 键入PATH =“$ PATH:/ usr / local / bin / python”并按Enter键。

  • - / usr / local / bin / python是Python目录的路径

在Windows上设置路径

将Python目录添加到Windows中特定会话的路径 -

在命令提示符处 - 键入路径%path%; C:\ Python并按Enter键。

- C:\ Python是Python目录的路径

Python环境变量

这里有一些重要的环境变量,可以被Python识别 -

Sr.No. 变量和说明
1 **PYTHONPATH** 它的作用类似于PATH。这个变量告诉Python解释器在哪里定位导入到程序中的模块文件。它应该包含Python源代码库目录和包含Python源代码的目录。PYTHONPATH有时由Python安装程序预设。
2 **PYTHONSTARTUP** 它包含包含Python源代码的初始化文件的路径。它每次启动解释器都会执行。它在Unix中被命名为.pythonrc.py,它包含加载实用程序或修改PYTHONPATH的命令。
3 **PYTHONCASEOK** 它在Windows中用于指示Python在导入语句中查找第一个不区分大小写的匹配项。将此变量设置为任何值以激活它。
4 **PYTHONHOME** 它是一个替代模块搜索路径。它通常嵌入在PYTHONSTARTUP或PYTHONPATH目录中,以便使切换模块库变得容易。

运行Python

有三种不同的方法来启动Python -

互动式口译员

您可以从Unix,DOS或任何其他为您提供命令行解释器或shell窗口的系统启动Python。

输入 python 命令行。

在交互式解释器中立即开始编码。

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

以下是所有可用命令行选项的列表 -

Sr.No. 选项和说明
1 **-d** 它提供调试输出。
2 **-O** 它会生成优化的字节码(生成.pyo文件)。
3 **-S** 不要运行导入站点以在启动时查找Python路径。
4 **-v** 详细输出(关于导入语句的详细跟踪)。
**-X** 禁用基于类的内置异常(只使用字符串); 从版本1.6开始已过时。
6 **-c cmd** 运行以cmd字符串形式发送的Python脚本
7 **文件** 从给定文件运行Python脚本

来自命令行的脚本

Python脚本可以通过在应用程序上调用解释器在命令行执行,如下所示 -

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or

C: >python script.py # Windows/DOS

- 确保文件权限模式允许执行。

集成开发环境

如果您的系统上有一个支持Python的GUI应用程序,您也可以从图形用户界面(GUI)环境运行Python。

  • Unix - IDLE是Python的第一个Unix IDE。

  • Windows - PythonWin是第一个用于Python的Windows界面,并且是一个带GUI的IDE。

  • Macintosh - Macintosh版本的Python以及IDLE IDE可从主网站获得,可以作为MacBinary或BinHex'd文件下载。

安装SciPy Pack

启用所需包的最佳方式是使用特定于您的操作系统的可安装二进制包。这些二进制文件包含完整的SciPy堆栈(包括NumPy,SciPy,matplotlib,IPython,SymPy和nose包以及核心Python)。

视窗

Anaconda(来自www.continuum.io)是SciPy堆栈的免费Python发行版。它也适用于Linux和Mac。

Canopy(www.enthought.com/products/canopy/)免费提供,并提供完整的用于Windows,Linux和Mac的SciPy堆栈的商业分发。

Python(x,y):这是一个免费的Python发行版,其中包含用于Windows操作系统的SciPy堆栈和Spyder IDE。(可从www.python-xy.github.io/下载)

Linux的

各个Linux发行版的软件包管理器用于在SciPy堆栈中安装一个或多个软件包。

对于Ubuntu

sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose

对于Fedora

sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel

从源代码构建

核心Python(2.6.x,2.7.x和3.2.x以上)必须与distutils一起安装,并且应启用zlib模块。

GNU gcc(4.2及更高版本)C编译器必须可用。

要安装NumPy,请运行以下命令。

Python setup.py install

让我们来测试NumPy模块是否正确安装,尝试从Python提示符导入它。

如果未安装,则会显示以下错误消息。

Traceback (most recent call last):
   File "<pyshell#0>", line 1, in <module>
      import numpy
ImportError: No module named 'numpy'

同样,我们可以检查下一章中所示的所有必需的数据科学软件包的安装。