我想将jsoup解析为utf -8,但我不能。我尝试了我所知道的一切,然后在Google上进行了搜索。
我的目标是:
String tmp_html_content ="Öç"; InputStream is = new ByteArrayInputStream(tmp_html_content.getBytes()); Document doc_tbl = Jsoup.parse(is, "UTF-8", ""); doc_tbl.outputSettings().charset().forName("UTF-8"); doc_tbl.outputSettings().escapeMode(EscapeMode.xhtml);
但是doc_tbl 不是UTF-8。
doc_tbl
UTF-8
请帮忙
public static void main(String []args){ System.out.println("Hello World"); String tmp_html_content ="Öçasasa"; InputStream is = new ByteArrayInputStream(tmp_html_content.getBytes()); org.jsoup.nodes.Document doc_tbl; try { doc_tbl = Jsoup.parse(is, "ISO-8859-9", ""); ((org.jsoup.nodes.Document) doc_tbl).outputSettings().charset().forName("UTF-8"); ((org.jsoup.nodes.Document) doc_tbl).outputSettings().escapeMode(EscapeMode.xhtml); String htmlString = doc_tbl.toString(); System.out.println(htmlString); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } }
你好世界Öçasasa