我的任务是为Rails应用程序实施基于黑名单的亵渎语言过滤。我知道基于黑名单的过滤存在很多问题,但是这个决定高于我的头脑。挑战:我正在寻找一个很好的西班牙语亵渎名单来进入过滤器。对于英语,我们正在建立一个列表,其中详尽列出了共轭/复数/等,每行文本文件一个。在西班牙的公共领域是否存在这样的清单?西班牙语亵渎黑名单
0
A
回答
1
找到好的清单并让它们调整很困难。这听起来像是你正在做大量可以自动化的手动工作(即共轭)。我为我公司的profanity filter named CleanSpeak做了很多这样的工作,其中大部分工作都可以使用词汇的POS标识符自动进行自动处理,并且在很多情况下,您可以手动进行POS标记或找到POS源。
您还需要考虑清单的质量以及过滤器的维护和管理。许多人认为这很简单,然后意识到防止误报非常困难。所有这一切说,我们发现大多数其他语言的列表很难通过在线方式获得,最终付出了许多建造或从其他公司购买的许多清单。我们在网上找到的名单最终在我们翻译后几乎毫无价值。我们也试图拿出黑名单并进行翻译,这是完全失败的,因为大多数英语亵渎语言在其他语言中没有等同物。我会建议您购买清单或与当地大学的学生合作生成清单。我们的许多客户发现这种方法相对较好,而且价格也不贵。
我还建议你看看那里的一些资源,它们定义了管理用户生成内容的最佳方法。这些将有助于指导您完成任何构建与购买决策。
相关问题
- 1. 西班牙语和巴西葡萄牙语的子域名称
- 2. 西班牙语单词记号器
- 3. RpDesignerVCL西班牙语(reportmanager)
- 4. 黑莓中SQlite的西班牙语文本检索不正确
- 5. 黑莓应用程序的提交(西班牙语)
- 6. 亵渎筛选的Lua
- 7. 西班牙语的形态学实现
- 8. 西班牙语窗口字符集
- 9. 带lucene的西班牙语分析器
- 10. Fles SDK西班牙语本地化
- 11. 以复数和singularize为西班牙语
- 12. 秘鲁西班牙语本地化Android
- 13. Word宏查找亵渎,并创建一个出现名单
- 14. 支持尼泊尔语的实际i18n与西班牙语和西班牙语es的支持一样
- 15. 字体和编码西班牙语和拉丁美洲西班牙语与iText的creatFont
- 16. 西班牙语口音标记在表单提交
- 17. 如何使用nltk来阻止西班牙语单词列表?
- 18. 在oracle db中插入西班牙语单词的问题db
- 19. Phonegap不显示口音西班牙语单词
- 20. 如何用图案来模拟西班牙语单词?
- 21. 西班牙charecters得到
- 22. jsPDF的葡萄牙/西班牙语口音
- 23. PHP亵渎滤波器的实现
- 24. 为亵渎过滤器优化代码
- 25. 如何防止用户输入亵渎?
- 26. 促销代码的亵渎检查
- 27. 不止一个躯体亵渎?
- 28. 没有定义语言(英语,西班牙语等)的“代码”?
- 29. 如何过滤base36 ID中的亵渎语言?
- 30. 从谷歌语音识别中删除亵渎审查
POS =销售点? – Zabba 2010-10-21 16:36:23
POS =言语的一部分。感谢Brian的反馈,这里有很多美食。 – Alterscape 2010-10-21 23:15:35