得到的话,空格和标点基本上我想通过所有句子重复,例如:正则表达式:如何从字符串
string sentence = "How was your day - Andrew, Jane?";
string[] separated = SeparateSentence(sentence);
separated
输出如下:
[1] =“如何”
[2] = “”
[3] = “是”
[4] = “”
[5] = “您的”
[6] = “”
[7] = “天”
[8] = “”
[9] = “ - ”
[10] = “”
[11] = “安德鲁”
[12] = “”
[13] = “”
[14] = “Jane” 的
[15] = “?”
截至目前我只能用"\w(?<!\d)[\w'-]*"
来抢词,正则表达式。 根据输出示例,如何将句子分成更小的部分?
编辑:字符串没有任何操作:
即
固体形式
8日,第1,第2
标点,如'安德鲁,'和'简',将是一个问题?如果你有一个字符串,如'7 pm'。你愿意把它分成“7”还是“下”还是根本不分割? – 2013-05-14 14:07:05
这里不会出现“8th”,“7pm”,“2nd”等词语,所以这不是问题 – Alex 2013-05-14 14:08:51
这是一个糟糕的假设,你应该为它做好准备。 – 2013-05-14 14:10:28