小编典典

URLConnection没有获取字符集

javascript java

我正在URL.openConnection()从服务器上下载某些内容。服务器说

Content-Type: text/plain; charset=utf-8

但是connection.getContentEncoding()回报null。怎么了?


阅读 364

收藏
2020-09-09

共2个答案

小编典典

这是记录在案的行为,因为getContentEncoding()指定了该方法以返回Content-EncodingHTTP标头的内容,该示例中未设置。您可以使用该getContentType()方法自行解析生成的String,或者可以使用更高级的HTTP客户端库,例如Apache 的库。

2020-09-09
小编典典

URLConnection.getContentEncoding()返回的值返回标头中的值Content-Encoding

来自的代码URLConnection.getContentEncoding()

/**
     * Returns the value of the <code>content-encoding</code> header field.
     *
     * @return  the content encoding of the resource that the URL references,
     *          or <code>null</code> if not known.
     * @see     java.net.URLConnection#getHeaderField(java.lang.String)
     */
    public String getContentEncoding() {
       return getHeaderField("content-encoding");
    }

取而代之的是a connection.getContentType()来检索Content-Type并从Content-Type中检索字符集。我已经提供了有关如何执行此操作的示例代码。

String contentType = connection.getContentType();
String[] values = contentType.split(";"); // values.length should be 2
String charset = "";

for (String value : values) {
    value = value.trim();

    if (value.toLowerCase().startsWith("charset=")) {
        charset = value.substring("charset=".length());
    }
}

if ("".equals(charset)) {
    charset = "UTF-8"; //Assumption
}
2020-09-09