我们正在构建用于从网上挖掘信息的工具。我们有几件,从网络如在软件中管理复杂性/可视化组件的最佳实践?
- 抓取数据基于模板&业务规则
- 解析结果到数据库
- 应用规范化&过滤规则
- 等,等
- 提取信息
问题是排除故障问题&对每个阶段发生的事情都有很好的“高层次图片”。
什么技术帮助您理解和管理复杂的过程?
- 使用的工作流程工具,如Windows工作流基础
- 封装功能分割为命令行工具&使用脚本工具将它们连接在一起
- 写域特定语言(DSL)来指定什么样的顺序东西应该发生在更高层次上。
只是好奇你如何得到一个系统与许多交互组件的句柄。我们希望文档/了解系统如何在比追溯源代码更高的层次上工作。
如果你想给的答案你,如果你投他们的话就不会受伤。 ;) – Till 2008-11-23 17:58:58
完成并完成:) – Kalid 2008-11-24 22:16:54