我使用pytrends
自动从google趋势下载csv
中的数据。我使用的代码如下。在这种情况下,我正在下载每月谷歌趋势数据从2008年到现在。Pytrends趋势结果与手动下载数据不相似
from pytrends.request import TrendReq
from urllib.parse import unquote
from dateutil.relativedelta import relativedelta
import datetime
import pytrends
google_username = "[email protected]"
google_password = "xxxxx"
search_term = unquote('%2Fm%2F07gyp7')
google_trend = TrendReq(google_username, google_password, custom_useragent='Pytrends' )
google_trend_payload = {'gprop' : 'news' , 'q': search_term}
trendresult = TrendReq.trend(google_trend_payload, return_type = 'dataframe')
print(trendresult)
从谷歌网站前5个月,结果从pytrends结果相比:
Date Pytrends data Manual csv data
2008-01 21.0 28.0
2008-02 16.0 19.0
2008-03 16.0 21.0
2008-04 15.0 18.0
2008-05 22.0 31.0
任何人都知道的原因是什么?谢谢。
我已经找到了使用Selenium测试框架完成此操作的最有效方法。我还没有完成这项工作,但基本思想可以在这里找到http://www.yseam.com/blog/TR.html。由于google改变了页面上的规范,我们还需要更改链接中提供的一些代码。 – DManh