2016-11-21 35 views
0

enter image description here如何从MediaWiki的一个特定部分得到数据的支持维基

我解析一个Wikia文章,并试图从右侧突出块获取数据,我已经得到了使用以下左边一个URL

http://hetalia.wikia.com/api.php?action=parse&prop=revisions&prop=sections&page=America&format=json 

但是不知道有关正确的参考。什么将是参数?

原始URL是,

http://hetalia.wikia.com/wiki/America 

回答

0

我相信从InfoBoxes到获取信息的唯一方法是让网页源代码,可以用此查询完成

http://hetalia.wikia.com/api.php?action=query&prop=revisions&rvprop=content&titles=America&format=json 

而且然后解析文本以获取信息,因为该框的来源是此格式

{{Character 
|name = America 
|jname = アメリカ 
|image = America0.png 
|country = [[wikipedia:United States|The United States of America]] 
|human = Alfred F.Jones (アルフレッド・F・ジョーンズ, ''Arufureddo F. Joonzu'') 
|age = 19 
... 
|japanese = [[Katsuyuki Konishi]], Ryoko Shimizu (Young America, drama CD "Prologue"), [[Ai Iwamura]] (Young America, anime), [[Axis Powers Hetalia: The CD|Osamu Ikeda]] (''Flower Of Iris'') 
|english = [[Eric Vale]], Stephanie Young (young America)}} 

您可以使用Regex从文本中提取数据,例如使用\|age\s*=\s*(\d*)来获取年龄属性。

相关问题