【发布时间】:2013-07-23 18:20:01
【问题描述】:
我正在尝试使用 Java 和 Eclipse 通过 http 帖子发送一些 utf8 数据。 无论我尝试什么,脚本都会发送错误的 utf8 代码! 例如,我尝试发送希腊字符: “κ”,在 utf8 中是 %CE%BA,对方收到 %C2%BA,即“º”。 我已经尝试了一切都无济于事,搜索了所有相同的结果,有人可以帮助我吗?
这是我的代码的最新版本:
//trans = URLEncoder.encode(trans,"UTF8");
String urlParameters = "reply=1&message=" + trans + "%CE%BA%CE%B1%CE%BB%CE%AD%CF%83%CF%84%CE%B5%20%CF%83%CF%84%CE%BF%20%CE%A0%CE%B1%CF%81%CE%AF%CF%83%CE%B9%CF%80%CE%BF%CE%B4%CE%B9%CE%B1";
System.out.println(urlParameters);
URL url = new URL("https://posttestserver.com/post.php");
//URLConnection conn = url.openConnection();
//conn.setDoOutput(true);
//////////////////////////
HttpURLConnection connection = (HttpURLConnection) url.openConnection();
connection.setDoOutput(true);
connection.setDoInput(true);
connection.setInstanceFollowRedirects(false);
connection.setRequestMethod("POST");
connection.setRequestProperty("Content-Type", "application/x-www-form-urlencoded");
//connection.setRequestProperty("charset", "ascii");
connection.setRequestProperty("Content-Length", "" + Integer.toString(urlParameters.getBytes().length));
connection.setUseCaches (false);
DataOutputStream wr = new DataOutputStream(connection.getOutputStream ());
wr.write(urlParameters.getBytes("UTF8"));
wr.flush();
wr.close();
connection.disconnect();
我在很多情况下都尝试过编码,因此注释掉了部分...
我不知道发生了什么:(如果我对我的字符串执行以下操作:
byte[] transc = trans.getBytes("UTF-8");
for(int i=0;i < trans.length(); i=i+1){
System.out.println(trans.codePointAt(i));
System.out.println(transc[i]);
}
我在 Eclipse 控制台上得到以下输出: 954 -50 945 -70 955 -50 941 -79 963 -50 964 -69 949 -50 32 -83 963 -49 964 -125 959 -49 32 -124 928 -50 945 -75 961 32 943 -49 963 -125 953 -49
情节变厚了!如果我将字符串作为 POST 正文的一部分发送,则一切正常。如果我将它作为 POST 的参数发送,它就会变得一团糟。我问我的客户是否可以将其更改为在体内接受它,但如果他们不这样做……这里发生了什么??? 请帮忙,这已经困扰我 2 周了...
【问题讨论】:
-
你能告诉我们你的代码吗?
-
将字符集设置为 charset=utf-8 会给你带来什么快乐吗?
connection.setRequestProperty("charset", "utf-8"); -
不 :( 原来是这样的……
-
如果它甚至可以帮助我发送的字符,我手动编码 utf8: String urlParameters = "reply=1&message=" + trans + "%CE%BA%CE%B1, get changed into different characters :(
标签: java eclipse encoding utf-8