我正在寻找一个脚本,可以在符合MySQL的SQL中转换XML wikipedia DUMP。我已经找到了一个准备好的英文版SQL转储,但没有简单的方法来导入其他语言。在MySQL中导入非英文维基百科XML转储?
感谢,
皮耶罗
我正在寻找一个脚本,可以在符合MySQL的SQL中转换XML wikipedia DUMP。我已经找到了一个准备好的英文版SQL转储,但没有简单的方法来导入其他语言。在MySQL中导入非英文维基百科XML转储?
感谢,
皮耶罗
维基百科有一个API
您可以使用此API遍历文章并下载每个页面。
每wikipedia's own page on the subject(非常值得研究),在this mediawiki page找到帮助导入维基百科xml转储到MySQL。
感谢您的指针,但据我了解,它将导入Mediawiki格式,而我intrested的Html内容,所以我需要一些与结果一起工作的东西... – PieroP 2009-05-25 20:58:44
这是我最初的想法infact我正在寻找一个“准备好”的脚本,可以做到这一点.. – PieroP 2009-05-25 20:59:41