我有获取XML文本摆脱控制字符这个辅助功能:的Unicode类别逗号和引号
def remove_control_characters(s): #Remove control characters in XML text
t = ""
for ch in s:
if unicodedata.category(ch)[0] == "C":
t += " "
if ch == "," or ch == "\"":
t += ""
else:
t += ch
return "".join(ch for ch in t if unicodedata.category(ch)[0]!="C")
我想知道是否有一个Unicode类别不包括引号和逗号。
这个问题是不完整的打印出来。一般来说,您可以在JSON数据中使用问号和逗号。我定期将XML文档作为JSON数据结构的一部分传递。所以在这里你应该向你的函数显示输入,并且显示你如何使用输出来获得无效的JSON。 – Louis
添加一个有问题的xml样本和期望的输出 –
该函数接受一个字符串,并且输出结果是我期望的结果。但是我想知道的是,是否有逗号和引号的unicode类别。 –