2009-02-07 59 views
1

有没有人知道是否有一些参数可用于yahoo上的程序化搜索,从而限制结果,因此只返回特定类型文件的链接(例如PDF)? 在GUI中可以这样做,但是如何通过API来实现呢?如何使用雅虎搜索API搜索特定的文件类型?

我非常感谢Python中的示例代码,但任何其他解决方案也可能会有所帮助。

回答

0

谢谢。 我发现自己是这样的工作确定(文件类型是第一个参数,和查询是第二个):

格式= sys.argv中[1]

查询=“”。加入(SYS。的argv [2:])

-RCH = create_search( “网络”,APP_ID,查询=查询,格式=格式)

0

这就是我对这样的事情做。它暴露了更多的参数,因此您可以根据需要调整它。这应该从查询“resume”中打印出前10个PDF URL [我不是其中之一;]]。无论你喜欢,你都可以下载这些网址。

从查询返回的json字典有点粗糙,但这应该让你开始。请注意,在实际代码中,您需要检查字典中是否存在某些键。当没有结果时,这段代码可能会抛出异常。

Tiago提供的链接非常适合了解“type”参数支持哪些值。

from yos.crawl import rest 
APPID="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX" 
base_url = "http://boss.yahooapis.com/ysearch/%s/v%d/%s?start=%d&count=%d&type=%s" + "&appid=" + APPID 
querystr="resume" 
start=0 
count=10 
type="pdf" 
search_url = base_url % ("web", 1, querystr, start, count, type) 
json_result = rest.load_json(search_url) 
for url in [recs['url'] for recs in json_result['ysearchresponse']['resultset_web']]: 
    print url 
相关问题