1
我有一个基于文本的字符串,并且只想保留特定的单词。非匹配词在python中删除
sample = "This is a test text. Test text should pass the test"
approved_list = ["test", "text"]
预期输出:
"test text Test text test"
我已经经历了很多的regex
基于阅读的答案,可惜的是他们没有解决这个具体问题。
解决方案是否也可以扩展到熊猫系列?
由于使用正则表达式模块
re
,这是有帮助的。我之所以提到熊猫,是因为'approved_list'需要应用到'pd.Series'的每个值上。你有什么建议吗? – Drj
@Drj更新了我的文章。 – piRSquared