手动创建JSON数据时,我该如何转义字符串字段?我是否应该使用Apache Commons Lang的StringEscapeUtilities.escapeHtml
,StringEscapeUtilities.escapeXml
之类的东西,还是应该使用java.net.URLEncoder
?我应该如何在JSON中转义字符串?
问题是,当我使用SEU.escapeHtml
时,它不会引用引号,并且当我将整个字符串包装在一对'
中时,会生成格式错误的JSON。
手动创建JSON数据时,我该如何转义字符串字段?我是否应该使用Apache Commons Lang的StringEscapeUtilities.escapeHtml
,StringEscapeUtilities.escapeXml
之类的东西,还是应该使用java.net.URLEncoder
?我应该如何在JSON中转义字符串?
问题是,当我使用SEU.escapeHtml
时,它不会引用引号,并且当我将整个字符串包装在一对'
中时,会生成格式错误的JSON。
理想的情况下,发现在你的语言一个JSON库,你可以喂一些合适的数据结构,并让它担心如何逃脱的事情。它会让你更加安心。如果因为某种原因你没有使用你的语言库,你不想使用它(我不会建议这个1),或者你正在编写一个JSON库,请继续阅读。
根据RFC转义它。 JSON非常自由:只有必须转义的字符是\
,"
和控制代码(任何小于U + 0020的)。
这种转义结构特定于JSON。你需要一个JSON特定的功能。所有的转义符都可以写为\uXXXX
,其中XXXX
是该字符的UTF-16编码单元1。有几个捷径,如\\
,也可以。 (并且它们导致更小和更清晰的输出。)
有关全部细节,请参阅the RFC。
¹JSON的转义是建立在JS上的,所以它使用\uXXXX
,其中XXXX
是一个UTF-16编码单元。对于BMP之外的代码点,这意味着编码代理对,这可能会有点多毛。 (或者,您可以直接输出字符,因为JSON的编码为Unicode文本,并且允许这些特定字符。)
不确定您的意思是“手动创建json”,但您可以使用像gson http://code.google.com/p/google-gson/),这会将你的HashMap,数组,字符串等转换为JSON值。我建议为此使用一个框架。
试试这个org.codehaus.jettison.json.JSONObject.quote("your string")
。
在这里下载:http://mvnrepository.com/artifact/org.codehaus.jettison/jettison
我没有花时间,使100%肯定,但它的工作对我的投入,足以通过网上JSON验证被接受:
org.apache.velocity.tools.generic.EscapeTool.EscapeTool().java("input")
虽然它不看任何比org.codehaus.jettison.json.JSONObject.quote("your string")
我简单地使用速度的工具在我的项目已经 - 我的“手动JSON”建设是一个Velocity模板中
org.json.simple.JSONObject.escape()转义引号,\,/,\ r,\ n,\ b,\ f,\ t和其他控制字符。它可以用来逃避JavaScript代码。
import org.json.simple.JSONObject;
String test = JSONObject.escape("your string");
它取决于你正在使用的json库(JSONObject.escape,JSONObject.quote,..),但它总是一个静态方法做引用工作并且简单地应该重用 – amine 2014-04-03 11:12:09
哪个库是org.json的一部分?我的班级路径上没有它。 – 2018-02-22 12:08:19
https://github.com/fangyidong/json-simple/tree/master/src/main/java/org/json/simple请参阅https://code.google.com/archive/p/json-simple/ – 2018-02-22 12:53:37
提液Jettison:
public static String quote(String string) {
if (string == null || string.length() == 0) {
return "\"\"";
}
char c = 0;
int i;
int len = string.length();
StringBuilder sb = new StringBuilder(len + 4);
String t;
sb.append('"');
for (i = 0; i < len; i += 1) {
c = string.charAt(i);
switch (c) {
case '\\':
case '"':
sb.append('\\');
sb.append(c);
break;
case '/':
// if (b == '<') {
sb.append('\\');
// }
sb.append(c);
break;
case '\b':
sb.append("\\b");
break;
case '\t':
sb.append("\\t");
break;
case '\n':
sb.append("\\n");
break;
case '\f':
sb.append("\\f");
break;
case '\r':
sb.append("\\r");
break;
default:
if (c < ' ') {
t = "000" + Integer.toHexString(c);
sb.append("\\u" + t.substring(t.length() - 4));
} else {
sb.append(c);
}
}
}
sb.append('"');
return sb.toString();
}
注意:这是Java – 2016-01-16 07:28:11
嗯,这是OP标签 – MonoThreaded 2016-06-19 01:21:11
只有当c <''时才理解,改为\ u。在我的情况下,有字符\ ud38D,这是55357和以上'',所以不会改变\ u ... – Stony 2016-11-30 06:38:58
StringEscapeUtils.escapeJavaScript
/StringEscapeUtils.escapeEcmaScript
应该做的伎俩。
'escapeJavaScript'将单引号转义为'\'',这是不正确的。 – laurt 2014-05-27 11:59:44
Apache commons lang现在支持此功能。只要确保你的类路径中有最新版本的Apache commons lang。你需要的版本3.2+
发行说明版本3.2
LANG-797:增加逃生/ unescapeJson到StringEscapeUtils。
对于那些谁来到这里寻找一个命令行的解决方案,像我这样的,卷曲的--data-进行urlencode正常工作:
curl -G -v -s --data-urlencode 'query={"type" : "/music/artist"}' 'https://www.googleapis.com/freebase/v1/mqlread'
发送
GET /freebase/v1/mqlread?query=%7B%22type%22%20%3A%20%22%2Fmusic%2Fartist%22%7D HTTP/1.1
,例如。较大的JSON数据可以放在一个文件中,您可以使用@语法来指定一个文件来唾弃来自要转义的数据。例如,如果
$ cat 1.json
{
"type": "/music/artist",
"name": "The Police",
"album": []
}
你会使用
curl -G -v -s --data-urlencode [email protected] 'https://www.googleapis.com/freebase/v1/mqlread'
而现在,这也是关于如何通过命令行查询的游离碱:-)在
使用EscapeUtils类的教程commons lang API。
EscapeUtils.escapeJavaScript("Your JSON string");
JavaScript!== JSON – 2016-01-20 13:25:40
请注意,例如单引号在转义为javascript或json时处理方式不同。在commons.lang 3.4中StringEscapeUtils(https://commons.apache.org/proper/commons-lang/javadocs/api-3.4/org/apache/commons/lang3/StringEscapeUtils.html#escapeJson(java.lang.String))有一个escapeJSON方法,它与commons中的escapeJavaScript方法不同。lang 2:https://commons.apache.org/proper/commons-lang/javadocs/api-2.6/org/apache/commons/lang/StringEscapeUtils.html#escapeJavaScript(java.lang.String) – GlennV 2016-03-23 15:42:15
考虑Moshi的JsonWriter类。它有一个美好的API,并且减少复制到最低限度,一切都可以很好地传输到一个提交的OutputStream等
OutputStream os = ...;
JsonWriter json = new JsonWriter(Okio.buffer(Okio.sink(os)));
json.beginObject();
json.name("id").value(getId());
json.name("scores");
json.beginArray();
for (Double score : getScores()) {
json.value(score);
}
json.endArray();
json.endObject();
如果你想在手串:
Buffer b = new Buffer(); // okio.Buffer
JsonWriter writer = new JsonWriter(b);
//...
String jsonString = b.readUtf8();
的方法这里显示实际的实现都是错误的。
我没有Java代码,而只是备案,你可以很容易地转换这个C#-code:
单项目的礼貌@ https://github.com/mono/mono/blob/master/mcs/class/System.Web/System.Web/HttpUtility.cs
public static string JavaScriptStringEncode(string value, bool addDoubleQuotes)
{
if (string.IsNullOrEmpty(value))
return addDoubleQuotes ? "\"\"" : string.Empty;
int len = value.Length;
bool needEncode = false;
char c;
for (int i = 0; i < len; i++)
{
c = value[i];
if (c >= 0 && c <= 31 || c == 34 || c == 39 || c == 60 || c == 62 || c == 92)
{
needEncode = true;
break;
}
}
if (!needEncode)
return addDoubleQuotes ? "\"" + value + "\"" : value;
var sb = new System.Text.StringBuilder();
if (addDoubleQuotes)
sb.Append('"');
for (int i = 0; i < len; i++)
{
c = value[i];
if (c >= 0 && c <= 7 || c == 11 || c >= 14 && c <= 31 || c == 39 || c == 60 || c == 62)
sb.AppendFormat("\\u{0:x4}", (int)c);
else switch ((int)c)
{
case 8:
sb.Append("\\b");
break;
case 9:
sb.Append("\\t");
break;
case 10:
sb.Append("\\n");
break;
case 12:
sb.Append("\\f");
break;
case 13:
sb.Append("\\r");
break;
case 34:
sb.Append("\\\"");
break;
case 92:
sb.Append("\\\\");
break;
default:
sb.Append(c);
break;
}
}
if (addDoubleQuotes)
sb.Append('"');
return sb.ToString();
}
这可以被压缩成
// https://github.com/mono/mono/blob/master/mcs/class/System.Json/System.Json/JsonValue.cs
public class SimpleJSON
{
private static bool NeedEscape(string src, int i)
{
char c = src[i];
return c < 32 || c == '"' || c == '\\'
// Broken lead surrogate
|| (c >= '\uD800' && c <= '\uDBFF' &&
(i == src.Length - 1 || src[i + 1] < '\uDC00' || src[i + 1] > '\uDFFF'))
// Broken tail surrogate
|| (c >= '\uDC00' && c <= '\uDFFF' &&
(i == 0 || src[i - 1] < '\uD800' || src[i - 1] > '\uDBFF'))
// To produce valid JavaScript
|| c == '\u2028' || c == '\u2029'
// Escape "</" for <script> tags
|| (c == '/' && i > 0 && src[i - 1] == '<');
}
public static string EscapeString(string src)
{
System.Text.StringBuilder sb = new System.Text.StringBuilder();
int start = 0;
for (int i = 0; i < src.Length; i++)
if (NeedEscape(src, i))
{
sb.Append(src, start, i - start);
switch (src[i])
{
case '\b': sb.Append("\\b"); break;
case '\f': sb.Append("\\f"); break;
case '\n': sb.Append("\\n"); break;
case '\r': sb.Append("\\r"); break;
case '\t': sb.Append("\\t"); break;
case '\"': sb.Append("\\\""); break;
case '\\': sb.Append("\\\\"); break;
case '/': sb.Append("\\/"); break;
default:
sb.Append("\\u");
sb.Append(((int)src[i]).ToString("x04"));
break;
}
start = i + 1;
}
sb.Append(src, start, src.Length - start);
return sb.ToString();
}
}
“ quote()'方法在其他答案中描述错误? – Sandy 2017-04-12 19:46:02
org.json.JSONObject
quote(String data)
方法做这项工作
import org.json.JSONObject;
String jsonEncodedString = JSONObject.quote(data);
提取物:
编码数据作为JSON字符串。 这适用于引号和任何必要的字符转义。 [...]空将
'org.apache.sling.commons.json.JSONObject'也有同样的事情 – 2016-10-25 18:55:25
如果您正在使用fastexml杰克逊解释为空字符串,可以使用以下命令: com.fasterxml.jackson.core.io.JsonStringEncoder.getInstance().quoteAsString(input)
如果使用Codehaus的杰克逊,你可以使用下面的: org.codehaus.jackson.io.JsonStringEncoder.getInstance().quoteAsString(input)
如果您需要逃避JSON JSON字符串内,使用org.json.JSONObject.quote(“需要进行转义你的JSON字符串”),似乎可以用工作以及
的为\ uXXXX语法CA ñ解决这个问题,谷歌UTF-16的名称的标志,你可以找出XXXX,例如:utf-16双引号
我认为在2017年的最佳答案是使用javax.json API。使用javax.json.JsonBuilderFactory创建您的json对象,然后使用javax.json.JsonWriterFactory编写对象。非常好的建设者/作家组合。
如果你将整个字符串包装在一对'''中,你就注定要从头开始:JSON字符串只能用''''围绕,见http://www.ietf.org/rfc /rfc4627.txt。 – Thanatos 2010-06-11 04:01:17
对于'StringEscapeUtilities'大纲的+1。它非常有用。 – 2012-11-05 13:33:47