目前,我通过一堆不记得的AWK,sed,Bash和一小部分Perl对文本文件进行操作。
我见过提到python可以胜任此类事情的地方。如何使用Python替换Shell脚本,AWK,sed和朋友?
任何外壳程序都有几套功能。
还有-奖金! - 更快速。外壳程序中的每个单独的Linux命令(有一些例外)都会派生一个子进程。通过使用Pythonshutil和os模块,您无需派生子进程。
shutil
os
外壳环境功能。这包括设置命令环境的内容(当前目录和环境变量以及诸如此类)。您可以直接从Python轻松地对此进行管理。
Shell编程功能。这是所有过程状态代码检查,各种逻辑命令(如果有,为……等),测试命令及其所有亲属。函数定义的东西。在Python中,这一切都非常容易。这是摆脱bash并在Python中完成的巨大胜利之一。
互动功能。这包括命令历史记录和“不”记录。编写shell脚本不需要此。这仅用于人类交互,而不用于脚本编写。
Shell文件管理功能。这包括重定向和管道。这比较棘手。其中大部分可以通过子流程来完成。但是一些容易在shell中执行的操作在Python中是令人不快的。具体来说就是这样的东西(a | b; c ) | something >result。这将并行运行两个进程(输出a作为的输入b),然后是第三个进程。该序列的输出与并行运行,something并将输出收集到名为的文件中result。用任何其他语言表达都是很复杂的。
(a | b; c ) | something >result
a
b
something
result
特定程序(awk,sed,grep等)通常可以重写为Python模块。不要太过分。替换您需要的内容并发展您的“ grep”模块。不要开始编写替换“grep”的Python模块。
最好的事情是您可以分步执行此操作。
os.walk