小编典典

为什么org.apache.xerces.parsers.SAXParser不跳过utf8编码的xml中的BOM?

java

我有一个utf8编码的xml。并且此文件包含BOM表文件的开头。因此,在解析期间,我面临org.xml.sax.SAXParseException:序言中不允许内容。我无法从文件中删除这3个字节。我无法将文件加载到内存中并在此处删除它们(文件很大)。因此,出于性能原因,我正在使用SAX解析器,并且只想跳过这3个字节(如果它们位于“”标记之前)。我应该为此继承InputStreamReader吗?

我是Java的新手-请向我展示正确的方法。


阅读 223

收藏
2020-09-28

共1个答案

小编典典

这是以前发生的,当我想到堆栈溢出时,我就找到了答案。链接的答案使用a
PushbackInputStream来测试BOM。

2020-09-28