我需要将HTML文档(从DocBook XML文档生成)转换为Wiki标记语言,特别是标记为PM Wiki的语言。目标是在我们新创建的wiki中包含公司的应用操作指南。这意味着,我其实有两个选择:将XML或HTML转换为Wiki标记 - 您会选择哪种方法?
- 转换(从DocBook个XML生成)到维基
- 转换DocBook的个XML直接到维基
的HTMLS由于HTMLS由一个DocBook产生到HTML转换器,标签在HTML文档中定义的方式差别不大,只有文档的内容。
我正在寻找可以由我自己快速实施的解决方案。我将不得不一次完成此转换,然后每次创建应用程序操作指南的新版本时。我已经想到了到目前为止
解决方案:
- 转换HTML用Perl或PHP脚本,维基,基于正则表达式。
- 将Docbook XML直接转换为wiki。由于它是XML,所以我可以使用Java进行XML解析。这里面的风险是我不熟悉DocBooks XML格式(就像我使用HTML),所以这需要一些时间来学习。
你会选择什么方法进行这项工作?
更新:
我只是尝试了PmWiki的扩展名为ConvertHTML。它没有正常工作,因为它不转换HTML标签(例如没有像在wiki中那样转换),如其文档所述:
PmWiki标记不支持所有的HTML标记,所以100 %转换是不可能的。但是,PmWiki可以在编辑或保存文本时替换文本。 ConvertHTML实现了一套相对全面的将HTML标签转换为wiki标记的规则。
XML是为交换数据 - 因此将XML转换为HTML,然后解析HTML是一种无感。 因此,对于直接XML解析来说,+1会容易得多。 – user181750 2009-10-29 12:13:40
@rebugger,它不一定会更容易,因为XML到HTML转换器是我们已经拥有的东西。 – 2009-10-30 09:04:39