2009-11-30 60 views

回答

5

您可能需要考虑使用API:您可以获取任何文章的“文本”版本。之后,由您来提取摘要。

另一种选择是只请求页面原料格式:

Raw (Wikitext) page processing: sending a action=raw or a action=raw&templates=expand GET request to index.php will give the unprocessed wikitext source code of a page.

例如

http://en.wikipedia.org/wiki/Main_Page?action=raw

当然,你需要做一点一刮。浏览API可能会更有效,因为您可以直接从数据库中将拉到(如果您愿意,可以使用wiki文本),您可以更好地控制它。

+0

仅供参考 - 断开链接 – Greg 2009-11-30 18:18:10

+0

已修复...复制并粘贴错误。 – jldupont 2009-11-30 18:21:04

+0

我希望有一个神奇的关键字(如可打印)......但谢谢。 – koops 2009-11-30 18:30:58

0

使用mediawiki API用行动=查询和道具记录了功能丰富,灵活的API =修订获取给定修订,删除wiki文字(图片,InfoBoxes到)并提取第一句的内容。