我在哪里可以找到停用词的详尽列表?我拥有的这本书很短,似乎不适用于科学文献。 我正在创建词汇链以从科学论文中提取关键主题。问题在于,像based
,regarding
等词语也应该被视为停用词,因为它们没有太多意义。在哪里可以找到停用词的详尽列表?
1
A
回答
1
您还可以轻松添加到现有的停止词列表。例如。使用一个在NLTK工具箱:
from nltk.corpus import stopwords
,然后添加任何你认为丢失:描述here
stopwords = stopwords.words('english')+["based", "regarding"]
原来NLTK列表。
1
很难找到停用词的详尽列表,因为给定的词可以被视为给定域中的停用词,但它是另一个域中的重要词。
,你可以看看的停止词的一些列表:
http://blog.adlegant.com/how-to-install-nltk-corporastopwords/
相关问题
- 1. 哪里可以找到LangOptions方法的详尽列表
- 2. 我在哪里可以找到web攻击字符串的详尽列表
- 3. 我在哪里可以找到希伯来语停用词的列表?
- 4. 我在哪里可以找到Mac OS软件词汇表?
- 5. 我在哪里可以找到一个很好的单词列表
- 6. 我在哪里可以找到详细的Apple App Store政策?
- 7. 我在哪里可以找到Uber Eats的详细API?
- 8. 哪里可以找到Drupal的图表?
- 9. 我在哪里可以找到时间表列表?
- 10. Qt-我在哪里可以找到我可以使用的字体列表?
- 11. 哪里可以找到hadoop中Context的API的详细信息?
- 12. Google的UrlShortener,我在哪里可以找到列表
- 13. 在哪里可以找到所有jQuery事件的列表?
- 14. 我在哪里可以找到Transformer.setOutputProperty的属性列表?
- 15. 我在哪里可以找到默认VB按钮的列表?
- 16. 我在哪里可以找到所有PHP函数的列表?
- 17. 我在哪里可以找到不含.NET的COM库列表?
- 18. 我在哪里可以找到完整的devstack服务列表?
- 19. 我在哪里可以找到Facebook的网络列表?
- 20. 哪里可以找到几乎所有英语单词的列表?
- 21. 哪里可以找到org.eclipse.jface.nl_de?
- 22. 哪里可以找到CabWiz.exe
- 23. 哪里可以找到MyGeneration.dOOdads.dll
- 24. 哪里可以找到ipseccmd.exe?
- 25. 哪里可以找到
- 26. 哪里可以找到fillPatternId?
- 27. 哪里可以找到tcadsdll.dll?
- 28. 哪里可以找到VBSQL.VBX?
- 29. 哪里可以找到NestedScrollView?
- 30. 哪里可以找到Instapaper API的详细文档?
也许在这种情况下,检查某些域特定字典更重要? (我使用WordNet)...我是NLP的新手 – Klue