我在Objective-C中没有太多经验,如果这真的很明显,对不起。Tokenize NSString在Objective-C中出现两次
我需要的是将NSString拆分为令牌。令牌由空格或另一个符号(不是字母)分隔。问题是我想保留分隔符,除非它们是空格。
示例短语:“a b c,d's,e f。”从这个我想获得:
"a"
"b"
"c"
","
"d"
"'"
"s"
","
"e"
"f"
"."
有了这个代码:
NSMutableCharacterSet *separators = [NSMutableCharacterSet punctuationCharacterSet];
[separators formUnionWithCharacterSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];
NSArray *parse_array = [intext componentsSeparatedByCharactersInSet:separators];
我只得到信件。如果我只是过滤空白区域和NL,我会将字母和符号连在一起。我需要的是按顺序执行两个解析(首先是空格和Nl,然后是标点符号),但我真的不知道如何在objective-c中执行解析。任何人都可以给我一个提示吗?
谢谢!
对不起,误导你,但我的例句只有字母,但目的是要用它来解析单词。我将添加一些缓冲区并调整解决方案。谢谢! –