Python - 文本处理环境 Python - 文本处理简介 Python - 字符串不变性 要在本教程中成功创建和运行示例代码,我们需要一个环境设置,它既包含通用python,也包含Data Science所需的特殊包。我们首先看一下安装python 2或python 3的通用python。但我们更喜欢本教程的python2,主要是因为它的成熟度和对外部包的更广泛的支持。 获取Python 最新和最新的源代码,二进制文件,文档,新闻等,可在Python官方网站https://www.python.org/上找到。 您可以从https://www.python.org/doc/下载Python文档。该文档以HTML,PDF和PostScript格式提供。 安装Python Python发行版适用于各种平台。您只需下载适用于您的平台的二进制代码并安装Python。 如果您的平台的二进制代码不可用,则需要C编译器手动编译源代码。编译源代码在选择安装所需的功能方面提供了更大的灵活性。 以下是在各种平台上安装Python的快速概述 - Unix和Linux安装 以下是在Unix / Linux机器上安装Python的简单步骤。 打开浏览器下载 https://www.python.org/downloads/. 下载 Unix/Linux 源码 解压缩文件. 运行 ./configure script make make install 这将在标准位置 / usr / local / bin 及其库中安装Python,位于 / usr / local / lib / pythonXX ,其中XX是Python的版本。 Windows安装 以下是在Windows机器上安装Python的步骤。 打开Web浏览器并转到https://www.python.org/downloads/。 按照Windows安装程序 python-XYZ.msi 文件的链接进行操作,其中XYZ是您需要安装的版本。 要使用此安装程序 python-XYZ.msi ,Windows系统必须支持Microsoft Installer 2.0。将安装程序文件保存到本地计算机,然后运行它以查明您的计算机是否支持MSI。 运行下载的文件。这将打开Python安装向导,它非常易于使用。只需接受默认设置,等到安装完成,然后就完成了。 Macintosh安装 最近的Mac安装了Python,但它可能已经过时了几年。有关获取当前版本以及支持Mac上开发的其他工具的说明,请访问http://www.python.org/download/mac/。对于Mac OS X 10.3(2003年发布)之前的旧Mac OS,可以使用MacPython。 Jack Jansen维护它,您可以在他的网站http://www.cwi.nl/~jack/macpython.html上完全访问整个文档。您可以找到Mac OS安装的完整安装详细信息。 设置PATH 程序和其他可执行文件可以位于许多目录中,因此操作系统提供了一个搜索路径,列出了OS搜索可执行文件的目录。 该路径存储在环境变量中,该变量是由操作系统维护的命名字符串。此变量包含命令shell和其他程序可用的信息。 该 路径 变量命名为UNIX路径或路径在Windows(Unix的区分大小写; Windows不是)。 在Mac OS中,安装程序会处理路径详细信息。要从任何特定目录调用Python解释器,必须将Python目录添加到路径中。 在Unix / Linux上设置路径 要将Python目录添加到Unix中特定会话的路径 - 在csh shell中 - 键入setenv PATH“$ PATH:/ usr / local / bin / python”并按Enter键。 在bash shell(Linux)中 - 键入export ATH =“$ PATH:/ usr / local / bin / python”并按Enter键。 在sh或ksh shell中 - 键入PATH =“$ PATH:/ usr / local / bin / python”并按Enter键。 注 - / usr / local / bin / python是Python目录的路径 在Windows上设置路径 要将Python目录添加到Windows中特定会话的路径中 - 在命令提示符下 - 键入path%path%; C:\ Python并按Enter键。 注 - C:\ Python是Python目录的路径 Python环境变量 以下是重要的环境变量,可以被Python识别 - Sr.No. 变量和描述 1 PYTHONPATH 它的作用类似于PATH。此变量告诉Python解释器在何处找到导入程序的模块文件。它应该包括Python源库目录和包含Python源代码的目录。PYTHONPATH有时由Python安装程序预设。 2 PYTHONSTARTUP 它包含包含Python源代码的初始化文件的路径。每次启动解释器时都会执行它。它在Unix中命名为.pythonrc.py,它包含加载实用程序或修改PYTHONPATH的命令。 3 PYTHONCASEOK 它在Windows中用于指示Python在import语句中找到第一个不区分大小写的匹配项。将此变量设置为任何值以激活它。 4 PYTHONHOME 它是另一种模块搜索路径。它通常嵌入在PYTHONSTARTUP或PYTHONPATH目录中,以便于切换模块库。 运行Python 启动Python有三种不同的方法 shell 您可以从Unix,DOS或任何其他为您提供命令行解释器或shell窗口的系统启动Python。 输入 python 命令行。 立即在交互式解释器中开始编码。 $python # Unix/Linux or python% # Unix/Linux or C:> python # Windows/DOS 以下是所有可用命令行选项的列表 - Sr.No. 选项和说明 1 -d 它提供调试输出。 2 -O 它生成优化的字节码(产生.pyo文件)。 3 -S 不要运行导入站点以在启动时查找Python路径。 4 -v 详细输出(导入语句的详细跟踪)。 5 -X 禁用基于类的内置异常(只使用字符串); 从版本1.6开始过时。 6 -c cmd 运行以cmd字符串形式发送的Python脚本 7 file 从给定文件运行Python脚本 来自命令行的脚本 可以通过在应用程序上调用解释器在命令行执行Python脚本,如下所示 - $python script.py # Unix/Linux or python% script.py # Unix/Linux or C: >python script.py # Windows/DOS 注 - 确保文件权限模式允许执行。 综合发展环境 如果您的系统上有支持Python的GUI应用程序,您也可以从图形用户界面(GUI)环境运行Python。 Unix - IDLE是第一个用于Python的Unix IDE。 Windows - PythonWin是第一个用于Python的Windows界面,是一个带有GUI的IDE。 Macintosh - 可以从主网站获得Macintosh版本的Python以及IDLE IDE,可以下载为MacBinary或BinHex'd文件。 安装NLTK Pack NLTK很容易融入python环境。使用以下命令将NLTK添加到环境中。 sudo pip install -U nltk 当我们需要在python程序中使用时,将在每章中讨论添加其他库。 Python - 文本处理简介 Python - 字符串不变性