为什么org.apache.xerces.parsers.SAXParser不跳过utf8编码的xml中的BOM？

小编典典

为什么org.apache.xerces.parsers.SAXParser不跳过utf8编码的xml中的BOM？

java

我有一个utf8编码的xml。并且此文件包含BOM表文件的开头。因此，在解析期间，我面临org.xml.sax.SAXParseException：序言中不允许内容。我无法从文件中删除这3个字节。我无法将文件加载到内存中并在此处删除它们（文件很大）。因此，出于性能原因，我正在使用SAX解析器，并且只想跳过这3个字节（如果它们位于“”标记之前）。我应该为此继承InputStreamReader吗？

我是Java的新手-请向我展示正确的方法。

阅读 223

2020-09-28

共1个答案

小编典典

这是以前发生的，当我想到堆栈溢出时，我就找到了答案。链接的答案使用a
PushbackInputStream来测试BOM。

2020-09-28