awk模式可以匹配多行吗？

小编典典

linux

我有一些复杂的日志文件，需要编写一些工具来处理它们。我一直在玩awk，但不确定awk是否适合此工具。

我的日志文件是OSPF协议解码的打印输出，其中包含各种协议pkts及其内容的文本日志，以及用值标识的各种协议字段。我想处理这些文件并仅打印出与特定pkts有关的日志的某些行。每个pkt日志可以包含该pkt条目的不同行数。

awk似乎能够处理与模式匹配的一行。我可以找到所需的pkt，但是接下来我需要在后面的行中匹配模式，以确定它是否是我要打印的pkt。

另一种看待这种情况的方式是，我想隔离日志文件中的几行，并根据几行上的模式匹配来打印出这些行，这些行是特定pkt的详细信息。

由于awk似乎是基于行的，因此我不确定这是否是最好的工具。

如果awk可以做到这一点，怎么做？如果没有，关于使用哪种工具的任何建议？

阅读 647

2020-06-02

共1个答案

小编典典

Awk可以轻松检测模式的多行组合，但是您需要在代码中创建所谓的
状态机 以识别序列。

考虑以下输入：

how
second half #1
now
first half
second half #2
brown
second half #3
cow

如您所见，很容易识别单个模式。现在，我们可以编写一个awk程序，该程序仅 在前一半 行直接位于后一半时才识别 后一半
。（使用更复杂的状态机，您可以检测到任意序列的模式。） __

/second half/ {
  if(lastLine == "first half") {
    print
  }
}

{ lastLine = $0 }

如果运行此命令，您将看到：

second half #2

现在，这个例子非常简单，几乎没有状态机。有趣的状态仅在 if 语句的持续时间内持续，而前一个状态是隐式的，具体取决于 lastLine 的值。
在更规范的状态机中，您将保留一个显式状态变量，并根据现有状态和当前输入从一个状态转换到另一个状态。但是您可能不需要那么多的控制机制。

2020-06-02