我已经使用这个site的一些指南在java中为Nutch 2.3.1写了一个简单的插件。现在我必须对它进行测试,以确保它在将它集成到Nutch之前正常工作。如果我只是通过java命令运行,那么它的类没有找到错误。我如何测试我的插件。如何通过一些使用案例测试Apache Nutch插件
回答
所以你写了一个IndexingFilter
插件对不对?我通常的建议是看看插件莫名其妙地“相似”你写的一个,比如让我们的插件和结帐这个插件的测试如何写,看看https://github.com/apache/nutch/blob/2.x/src/plugin/index-anchor/src/test/org/apache/nutch/indexer/anchor/TestAnchorIndexingFilter.java。如果您的插件从配置中读取了一些值(配置选项,文件路径等),您应该仔细查看36-39行(https://github.com/apache/nutch/blob/2.x/src/plugin/index-anchor/src/test/org/apache/nutch/indexer/anchor/TestAnchorIndexingFilter.java#L36-L39)。
总体思路ES实例,你刚刚编写的过滤器,给它一些假数据,并断言在过滤器的执行结果。尽管关于https://wiki.apache.org/nutch/WritingPluginExample-0.9的信息仅针对Nutch的1.x分支,但其中包含的一般准则可以帮助您达到目标。
一些插件也实现了main()
方法允许直接使用bin/nutch
脚本从终端调用,当你想无需运行抓取用户“玩” /测试的配置值,这是有帮助的。一旦你实现了main()
方法,你可以使用bin/nutch plugin <plugin name> <plugin class> [some additional parameters]
命令来调用你的插件。请记住,该插件必须在conf/nutch-site.xml
文件中激活。看看https://github.com/apache/nutch/blob/a3e7420494304bc4de7ee1a0b25a5158108856f5/src/plugin/urlfilter-regex/src/java/org/apache/nutch/urlfilter/regex/RegexURLFilter.java,这个插件是为Nutch的1.x版本实现的,但它可以帮助你更详细地看到我所谈论的内容。
有了这个,你1)测试在一个孤立的环境中您的实现; 2)为用户提供了一个测试环境/如果你比如你的插件有许多不同的选择一个额外的配置文件。而我的最后建议:总是在部署之前执行的Nutch的整个测试套件,并运行一个小的测试爬行,以确保一切正常。
- 1. 如何通过命令行运行测试套件的一些测试用例?
- 2. Jest循环通过daynamic测试案例
- 3. 通参数测试案例
- 4. 如何修复代码以通过JUnit和POI测试案例?
- 5. Apache Nutch的性能基准测试
- 6. 硒测试案例与测试套件对比一般用法
- 7. 如何通过编写测试用例来测试指令?
- 8. 一个特定的测试用例不会通过测试
- 9. JUnit - 如何在测试用例超时的情况下通过测试用例?
- 10. 调用自测试案例不会增加通过测试的次数?
- 11. 使用eclipse创建一个Nutch插件
- 12. Apache Nutch 2.3.1插件不工作
- 13. 如何编写动态测试案例
- 14. 如何使用Google测试测试一些代码?
- 15. 使用Apache Nutch解析PDF问题 - 提取器插件
- 16. 曼哈顿天际线覆盖失败一些测试案例
- 17. 如何为测试用例生成一些报告导致单元测试?
- 18. 在IE-Verion 8上通过Windows XP运行测试案例
- 19. 无法通过codewar的测试用例
- 20. 测试案例准备
- 21. Nunit TestCaseSource跳过一些案例
- 22. 重复测试案例
- 23. 如何通过升级自动功能测试WordPress插件
- 24. 如何改变测试仪的测试案例(TFS API)
- 25. 如何导出测试案例与测试步骤从集会?
- 26. 我该如何使用Apache Spark和Apache Nutch
- 27. Android的Robotium测试案例
- 28. ARB_vertex_attrib_binding测试案例了解
- 29. 从Android的测试案例
- 30. 记录TestNG测试案例