2015-03-25 78 views
-2

我需要将句子拆分为单词和标点符号,并将em放入列表中,保存它们的顺序。如何使用拆分或匹配将句子拆分为单词和标点符号?

例如:"Some text here!"。结果应该是:List(Some, ,text, , here,!)

我正在使用String.split("regex");对于“分割”,我只能通过单词或仅通过标点符号来分割文本。

那么我应该用什么来同时分词和标点符号? 预先感谢您。

+0

如果有一些数字呢?这里有一些text2! 4你? – TheLostMind 2015-03-25 12:37:31

+0

数字属于单词。这就像分割非单词字符的单词。 – 2015-03-25 12:40:23

+0

现在我只能将字符串拆分为单词并将它们添加到列表中。 Like String [] words = sentenseToParse.split(regex);但是我还需要从相同的字符串(包括空格)中获取非@WORD字符。并将em放置到String [] sentenseParts。这应该是像{字,空间,另一个字,点} – 2015-03-25 12:44:40

回答

0

基于

而且结果应该是:列表(Some, ,text, , here,!)

它看起来像你想拆就word boundariessplit("\\b")

String data = "Some text here!"; 
for (String s : data.split("\\b")){ 
    System.out.println("'"+s+"'"); 
} 

输出:

+0

是的,这就是我需要的。我现在试试看。谢谢!对于我这个愚蠢的问题抱歉) – 2015-03-25 12:47:57

+0

这种问题在这个问题上太复杂了。考虑[发布另一个问题](http://stackoverflow.com/questions/ask),您将在其中准确描述您想实现的目标。 – Pshemo 2015-03-25 13:02:04

+0

也尝试避免[XY问题](http://meta.stackexchange.com/questions/66377/what-is-the-xy-problem)。 – Pshemo 2015-03-25 13:05:24

相关问题