我有一个HTML文档集合,我需要为其解析
我试图使用JDom提供的XPath支持来解析这些值。但是,这不能很好地解决,因为
有人对我可能如何处理格式错误的HTML解析这些标记值有任何建议吗?
干杯,唐
您可能会使用Jericho HTML Parser。特别是,请查看此内容以了解如何查找特定标签。