我有一些复杂的日志文件,需要编写一些工具来处理它们。我一直在玩awk,但不确定awk是否适合此工具。
我的日志文件是OSPF协议解码的打印输出,其中包含各种协议pkts及其内容的文本日志,以及用值标识的各种协议字段。我想处理这些文件并仅打印出与特定pkts有关的日志的某些行。每个pkt日志可以包含该pkt条目的不同行数。
awk似乎能够处理与模式匹配的一行。我可以找到所需的pkt,但是接下来我需要在后面的行中匹配模式,以确定它是否是我要打印的pkt。
另一种看待这种情况的方式是,我想隔离日志文件中的几行,并根据几行上的模式匹配来打印出这些行,这些行是特定pkt的详细信息。
由于awk似乎是基于行的,因此我不确定这是否是最好的工具。
如果awk可以做到这一点,怎么做?如果没有,关于使用哪种工具的任何建议?
Awk可以轻松检测模式的多行组合,但是您需要在代码中创建所谓的 状态机 以识别序列。
考虑以下输入:
how second half #1 now first half second half #2 brown second half #3 cow
如您所见,很容易识别单个模式。现在,我们可以编写一个awk程序,该程序仅 在前一半 行直接位于后 一半 时才识别 后一半 。(使用更复杂的状态机,您可以检测到任意序列的模式。) __
/second half/ { if(lastLine == "first half") { print } } { lastLine = $0 }
如果运行此命令,您将看到:
second half #2
现在,这个例子非常简单,几乎没有状态机。有趣的状态仅在 if 语句的持续时间内持续,而前一个状态是隐式的,具体取决于 lastLine 的值 。 在更规范的状态机中,您将保留一个显式状态变量,并根据现有状态和当前输入从一个状态转换到另一个状态。但是您可能不需要那么多的控制机制。