使用Java在DOM解析中进行规范化-它是如何工作的？

小编典典

java

我在DOM解析器的代码中看到以下行。

doc.getDocumentElement().normalize();

我们为什么要进行这种归一化？
我阅读了文档，但我听不懂一个字。

将所有Text节点置于此节点下子树的完整深度

好吧，那么有人可以告诉我（最好是附照片）这棵树是什么样的吗？

谁能解释我为什么需要规范化？
如果我们不规范会怎样？

阅读 509

2020-02-28

共1个答案

小编典典

句子的其余部分是：

其中只有结构（例如元素，注释，处理指令，CDATA节和实体引用）将文本节点分开，即，既没有相邻的文本节点，也没有空的文本节点。

这基本上意味着以下XML元素

<foo>hello 
wor
ld</foo>

可以在非规范化节点中这样表示：

Element foo
    Text node: ""
    Text node: "Hello "
    Text node: "wor"
    Text node: "ld"

标准化后，该节点将如下所示

Element foo
    Text node: "Hello world"

对于属性：<foo bar="Hello world"/>，注释等也是如此。

2020-02-28