在Linux上,命令ps aux输出每个统计信息具有多个列的进程列表。例如
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND ... postfix 22611 0.0 0.2 54136 2544 ? S 15:26 0:00 pickup -l -t fifo -u apache 22920 0.0 1.5 198340 16588 ? S 09:58 0:05 /usr/sbin/httpd
我希望能够使用Python进行阅读,然后将每一行然后每一列分开,以便可以将它们用作值。
在大多数情况下,这不是问题:
ps = subprocess.Popen(['ps', 'aux'], stdout=subprocess.PIPE).communicate()[0] processes = ps.split('\n')
我现在可以遍历流程以获取每一行并将其按空格分开,例如
sep = re.compile('[\s]+') for row in processes: print sep.split(row)
但是,问题在于命令的最后一列有时在其中有空格。在上面的示例中,可以在命令中看到
pickup -l -t fifo -u
将被拆分为
['postfix', '22611', '0.0', '0.2', '54136', '2544', '?', 'S', '15:26', '0:00', 'pickup', '-l', '-t', 'fifo', '-u']
但我真的希望它是:
['postfix', '22611', '0.0', '0.2', '54136', '2544', '?', 'S', '15:26', '0:00', 'pickup -l -t fifo -u']
所以我的问题是,我该如何拆分列,但是当涉及到命令列时,将整个字符串保留为一个列表元素,而不是按空格拆分?
使用第二个参数split指定将字符串拆分为的最大字段数。我想您可以通过计算第一行中的字段数(即列标题)来找到数字。
split
ps = subprocess.Popen(['ps', 'aux'], stdout=subprocess.PIPE).communicate()[0] processes = ps.split('\n') # this specifies the number of splits, so the splitted lines # will have (nfields+1) elements nfields = len(processes[0].split()) - 1 for row in processes[1:]: print row.split(None, nfields)