我有一个关于Scala部分字符串匹配的快速问题。请看例子:如何剪切从句子集合中匹配的单词?
val s1 = "game of thrones"
val s2 = Array("thrones videos", "watch game", "game of thrones stuff")
,我想做一些类型的正则表达式或匹配或contains
这样的,在结果应该是一些事情,如:
Array("videos", "watch", "stuff")
在字符串中的任何字,它在s1
中重复被删除。什么是最有效的方式?
我目前正在通过将s1
转换为一个正则表达式并将其应用于s2
的每一行,但我在使它正常工作时遇到了问题。
这可能适合OP的需求,但值得一提的是,由于'Sets'没有排序,你可能会失去's2'中单词的顺序。例如,'(Set(1,2,3,4,5) - Set(1,2))。toList'返回'List(5,3,4)'(并且可以随不同版本的Scala或更新后!) –