我需要将句子拆分为单词和标点符号,并将em放入列表中,保存它们的顺序。如何使用拆分或匹配将句子拆分为单词和标点符号?
例如:"Some text here!"
。结果应该是:List(Some, ,text, , here,!)
我正在使用String.split("regex");
对于“分割”,我只能通过单词或仅通过标点符号来分割文本。
那么我应该用什么来同时分词和标点符号? 预先感谢您。
我需要将句子拆分为单词和标点符号,并将em放入列表中,保存它们的顺序。如何使用拆分或匹配将句子拆分为单词和标点符号?
例如:"Some text here!"
。结果应该是:List(Some, ,text, , here,!)
我正在使用String.split("regex");
对于“分割”,我只能通过单词或仅通过标点符号来分割文本。
那么我应该用什么来同时分词和标点符号? 预先感谢您。
基于
而且结果应该是:列表(
Some, ,text, , here,!)
它看起来像你想拆就word boundariessplit("\\b")
String data = "Some text here!";
for (String s : data.split("\\b")){
System.out.println("'"+s+"'");
}
输出:
如果有一些数字呢?这里有一些text2! 4你? – TheLostMind 2015-03-25 12:37:31
数字属于单词。这就像分割非单词字符的单词。 – 2015-03-25 12:40:23
现在我只能将字符串拆分为单词并将它们添加到列表中。 Like String [] words = sentenseToParse.split(regex);但是我还需要从相同的字符串(包括空格)中获取非@WORD字符。并将em放置到String [] sentenseParts。这应该是像{字,空间,另一个字,点} – 2015-03-25 12:44:40