2010-09-17 41 views
0

任何可用于将Wikitext转换为纯文本的脚本?我更喜欢用Java实现它。将Wikitext转换为Java中的纯文本

谢谢!

+1

看一看[这个问题](HTTP:/ /stackoverflow.com/questions/2863272/wikipedia-java-library-to-remove-wikipedia-text-markup-removal)。 – 2010-09-17 09:02:47

+0

谢谢。它只是复制和粘贴而已。大! – 2010-09-17 09:21:14

回答

1

我想有必须是涉及到两个步骤:

  1. 首先,转换的Wiki文本的两种 例如HTML使用Textile
  2. 然后,要么通过正则表达式(可能不是 一个好主意)或专用HTML 解析器的HTML转换为纯 文本像HTMLParser
+0

完美!非常感谢! – 2010-09-17 09:19:04