2017-08-01 57 views
0

我想做一些python代码来检测一个字符串是否包含'组合字符',我相信它是Unicode的一部分。现在,不仅仅是简单的人物,而且更像这样:S̶̶̸̡̝̤͚͉͖͔̳̞ͦͮͨͫͣ̽͋̉̐̔̉̄̇S̶̶̸̡̝̤͚͉͖͔̳̞ͦͮͨͫͣ̽͋̉̐̔̉̄̇S̶̶̸̡̝̤͚͉͖͔̳̞ͦͮͨͫͣ̽͋̉̐̔̉̄̇它真的很烦人。无论如何,任何帮助都很好,谢谢!哦,当我说'检测'的代码应该返回一个'真'如果它的存在。万分感谢!我知道我问了很多Python如何检测'组合字符'?

+0

你有什么迄今所做的,什么是你所面临的问题? – araknoid

+0

说实话,我真的不知道从哪里开始......我在这里查看了一些帖子,并说我应该能够区分Unicode和普通字符串..不太确定这是否会有所帮助。 @araknoid – jumbodrawn

+0

这个问题有点广泛..在一次抛出,我会建议使用正则表达式(例如'\ w'来检测“单词字符”.. –

回答

2

Wikipedia,这些字符是从U + 0300(768)U + 036F(879)Unicode码点,这样的人物可以在Python像这样得到:

combining_marks = set(map(unichr, range(768, 879))) 

找哪家这样的人物在你的字符串:

combining_marks.intersection(my_string) 
+0

谢谢!实际上工作 – jumbodrawn