小编典典

awk模式可以匹配多行吗?

linux

我有一些复杂的日志文件,需要编写一些工具来处理它们。我一直在玩awk,但不确定awk是否适合此工具。

我的日志文件是OSPF协议解码的打印输出,其中包含各种协议pkts及其内容的文本日志,以及用值标识的各种协议字段。我想处理这些文件并仅打印出与特定pkts有关的日志的某些行。每个pkt日志可以包含该pkt条目的不同行数。

awk似乎能够处理与模式匹配的一行。我可以找到所需的pkt,但是接下来我需要在后面的行中匹配模式,以确定它是否是我要打印的pkt。

另一种看待这种情况的方式是,我想隔离日志文件中的几行,并根据几行上的模式匹配来打印出这些行,这些行是特定pkt的详细信息。

由于awk似乎是基于行的,因此我不确定这是否是最好的工具。

如果awk可以做到这一点,怎么做?如果没有,关于使用哪种工具的任何建议?


阅读 647

收藏
2020-06-02

共1个答案

小编典典

Awk可以轻松检测模式的多行组合,但是您需要在代码中创建所谓的
状态机 以识别序列。

考虑以下输入:

how
second half #1
now
first half
second half #2
brown
second half #3
cow

如您所见,很容易识别单个模式。现在,我们可以编写一个awk程序,该程序仅 在前一半 行直接位于后 一半 时才识别 后一半
。(使用更复杂的状态机,您可以检测到任意序列的模式。) __

/second half/ {
  if(lastLine == "first half") {
    print
  }
}

{ lastLine = $0 }

如果运行此命令,您将看到:

second half #2

现在,这个例子非常简单,几乎没有状态机。有趣的状态仅在 if 语句的持续时间内持续,而前一个状态是隐式的,具体取决于 lastLine 的值
在更规范的状态机中,您将保留一个显式状态变量,并根据现有状态和当前输入从一个状态转换到另一个状态。但是您可能不需要那么多的控制机制。

2020-06-02