2017-10-09 160 views
-2

我想在Instagram中提取随机网页的追随者。我试图将python与Beautiful Soup结合使用。Instagram Web抓取追随者

不过我还没有收到在网页的任何信息,在那里我可以访问

def get_user_info(user_name): 
    url = "https://www.instagram.com/" + user_name + "/?__a=1" 
    try: 
     r = requests.get(url) 
    except requests.exceptions.ConnectionError: 
     print ('Seems like dns lookup failed..') 
     time.sleep(60) 
     return None 
    if r.status_code != 200: 
     print ('User: ' + user_name + ' status code: ' + str(r.status_code)) 
     print (r) 
     return None 
    info = json.loads(r.text) 
    return info['user'] 

get_user_info("wernergruener")  

如前所述我不明白的页面的追随者。我怎么能这样做?

干杯, 安迪

+0

我试过在'wernergruener'中搜索instagram,然后空着。那是确切的名字吗? –

回答

0

随着API/JSON:

我不熟悉Instagram的API,但它并不像它返回一个人的追随者的详细信息,只追随者的数量。

您应该能够使用info["user"]["followed_by"]["count"]获取该信息。

随着原材料页/美丽的汤:

假设非API页面显示你想了解一个人的追随者的信息,你要下载的原始的HTML(而不是JSON),并对其进行解析使用美丽的汤。

def get_user_info(user_name): 
    url = "https://www.instagram.com/" + user_name 
    try: 
     r = requests.get(url) 
    except requests.exceptions.ConnectionError: 
     print ('Seems like dns lookup failed..') 
     time.sleep(60) 
     return None 
    if r.status_code != 200: 
     print ('User: ' + user_name + ' status code: ' + str(r.status_code)) 
     print (r) 
     return None 
    soup = BeautifulSoup(r.text, 'html.parser') 
    # find things using Beautiful Soup 

get_user_info("wernergruener")  

美丽的汤有一些我读过的最直观的文档。我想从那里开始: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

随着API /蟒蛇,Instagram的:

其他人已经做了很多繁重的你的。我认为python-instagram应该为您提供更容易访问您想要的信息。