说我有一个网址
http://example.com/query?q=
我有一个用户输入的查询,例如:
随机单词 500 英镑银行 $
我希望结果是正确编码的 URL:
http://example.com/query?q=random%20word%20%A3500%20bank%20%24
实现这一目标的最佳方法是什么?我尝试URLEncoder创建 URI/URL 对象,但没有一个是完全正确的。
URLEncoder
URLEncoder是要走的路。您只需要记住 仅对 单个查询字符串参数名称和/或值进行编码,而不是对整个 URL 进行编码,当然不是查询字符串参数分隔符&,也不是参数名称-值分隔符=。
&
=
String q = "random word 拢500 bank $"; String url = "https://example.com?q=" + URLEncoder.encode(q, StandardCharsets.UTF_8);
当您仍然不在 Java 10 或更高版本上时,请使用StandardCharsets.UTF_8.toString()charset 参数,或者当您仍然不在 Java 7 或更高版本上时,请使用"UTF-8".
StandardCharsets.UTF_8.toString()
"UTF-8"
请注意,查询参数中的空格由+, not表示%20,这是合法有效的。%20通常用于表示 URI 本身中的空格(URI 查询字符串分隔符之前的部分)?,而不是查询字符串中的空格(之后的部分?)。
+
%20
?
另请注意,共有三种encode()方法。一个没有Charset作为第二个参数,另一个String作为第二个参数引发检查异常。不推荐使用没有Charset参数的。永远不要使用它并始终指定Charset参数。javadoc甚至明确建议使用RFC3986和W3C规定的 UTF-8编码。
encode()
Charset
String
所有其他字符都是不安全的,并且首先使用某种编码方案将其转换为一个或多个字节。然后每个字节由 3 个字符的字符串“%xy”表示,其中 xy 是字节的两位十六进制表示。 推荐使用的编码方案是 UTF-8 。但是,出于兼容性原因,如果未指定编码,则使用平台的默认编码。