小编典典

为什么JSOUP不读为UTF-8?

java

我想将jsoup解析为utf -8,但我不能。我尝试了我所知道的一切,然后在Google上进行了搜索。

我的目标是:

String tmp_html_content ="Öç";

InputStream is = new ByteArrayInputStream(tmp_html_content.getBytes());            
Document doc_tbl  =  Jsoup.parse(is, "UTF-8", ""); 
doc_tbl.outputSettings().charset().forName("UTF-8");
doc_tbl.outputSettings().escapeMode(EscapeMode.xhtml);

但是doc_tbl 不是UTF-8

请帮忙


阅读 432

收藏
2020-11-26

共1个答案

小编典典

public static void main(String []args){
        System.out.println("Hello World");

        String tmp_html_content ="Öçasasa";

        InputStream is = new ByteArrayInputStream(tmp_html_content.getBytes());            
        org.jsoup.nodes.Document doc_tbl;
        try {
            doc_tbl = Jsoup.parse(is, "ISO-8859-9", "");
              ((org.jsoup.nodes.Document) doc_tbl).outputSettings().charset().forName("UTF-8");
                ((org.jsoup.nodes.Document) doc_tbl).outputSettings().escapeMode(EscapeMode.xhtml);
                String htmlString = doc_tbl.toString();
                System.out.println(htmlString);
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();

        }

     }

淘汰

你好世界Öçasasa

2020-11-26