1
运行Python脚本刮新闻故事
import requests
from lxml import html
page = requests.get('http://www.cnn.com')
html_content = html.fromstring(page.content)
for i in html_content.iterchildren():
print i
news_stories = html_content.xpath('//h2[@data-analytics]/a/span/text()')
news_links = html_content.xpath('//h2[@data-analytics]/a/@href')
我试图运行此代码来了解网络中的蟒蛇是如何工作的拼抢。没有得到输出,而从CNN
我想从美国有线电视新闻网去掉最新的新闻报道和链接。
当我在Python程序中运行这个,输出为news_stories和news_links我得到的是:
[]
我的问题是我在哪里这个脚麻有没有更好的方式来实现我是什么试图比这一个?
啊......美丽的汤要简单得多...谢谢... –
享受编码... –