2012-03-25 52 views
0

我已经HTML的peice的,我从我的Twitter时间线的源了,如下图所示:的Python,BeautifulSoup - 解析出鸣叫

http://pastebin.com/deefvbYw

这是一个分享Tweet我会用一个例子。 我不能为我的生活得到合作。 我想让它显示:

德米特里@TheFPShow “我做这一切的时候...... youtube.com/watch?v=DF9WP8...”

如果任何人都可以提供一些建议,会是大。

+6

你真的应该使用(https://dev.twitter.com/)的[Twitter的API]而不是解析HTML。 – phihag 2012-03-25 03:11:32

+1

你的代码在哪里?你有什么尝试? – Mig 2012-03-25 03:30:07

回答

1
soup = BeautifulSoup(twit) 

name_tag = soup('strong', {'class': 'fullname js-action-profile-name show-popup-with-id'}) 
user = name_tag[0].contents[0] 

action_tag = soup('span', {'class': 'username js-action-profile-name'}) 
at_sign = action_tag[0].contents[0].contents[0] 
show_name = action_tag[0].contents[1].contents[0] 

twit_text = soup('p', {'class': 'js-tweet-text'}) 
message = twit_text[0].contents[0] 
url = twit_text[0].contents[1]['data-expanded-url'] 

print user, at_sign, show_name, message, url 

输出:

Dmitri @ TheFPShow I do this all the time... http://www.youtube.com/watch?v=DF9WP87KNPk