我实现了从例如:Mediawiki and Python解析维基百科存根使用python wikitools
我读Get wikipedia abstract using python和How to parse/extract data from a mediawiki marked-up article via python和其他几个人。
我试图获得与类别关联的某些维基百科存根的转储,并将它们插入到内部语义mediawiki网站中。为了这个例子的目的,我使用了“Somali_Region”类别。该脚本使用mediawiki API获取数据,然后解析数据,删除所需的所有模板信息。如果我尝试做从维基百科转储和执行插入,
from wikitools import wiki
from wikitools import category
import mwparserfromhell
wikisite = "http://en.wikipedia.org/w/api.php"
parse_category = "Somali_Region"
wikiObject = wiki.Wiki(wikisite)
wikiCategory = category.Category(wikiObject, parse_category)
articles = wikiCategory.getAllMembersGen(namespaces=[0])
for article in articles:
wikiraw = article.getWikiText()
parsedWikiText = mwparserfromhell.parse(wikiraw)
for template in parsedWikiText.filter_templates():
parsedWikiText.remove(template)
print parsedWikiText
内部语义的MediaWiki站点发生故障,这样是不是一种选择。是否可以使用API将数据插入语义mediawiki网站?我读了mediawiki API edit page,但我找不到python示例。
你试过了'pywikipediabot'吗?我还没有尝试'wikitools',但它看起来不错,我很快就会试用它。我有'pywikipediabot'的良好体验。 – guaka 2014-01-04 19:07:17