我试图从一个字符串中解析单词并将它们放入数组中。我试过以下东西:Ruby:从字符串中提取单词
@string1 = "oriented design, decomposition, encapsulation, and testing. Uses "
puts @string1.scan(/\s([^\,\.\s]*)/)
它似乎是做的伎俩,但它有点不稳定(我应该包括更多的特殊字符为例)。在ruby中有更好的方法吗?
可选:我有一个cs课程描述。我打算从中提取所有单词并将它们放入一个字符串数组中,从生成的数组中删除英语中最常见的单词,然后将其余单词用作用户可用于搜索cs的标签培训班。
英文很难用正则表达式来解析。你有没有考虑过自然语言解析器?它会更准确地认识到句子“史密斯在这里“,并将”Mr.“作为单个单词返回,包括点,但是”here“没有点。 –
@MarkByers,非常好,我没有在这一点上。我会仔细看看的。谢谢! – sybohy