title = str(Soup.find('td', {'id': 'bxgy_x_img'}))
title_re = re.compile('alt="(.*)"')
title_pat = re.findall(title_re, title)
由于某种原因,这不只是抓标题,我如何让它抓标题?python正则表达式提取之间的引号
这是正在运行的HTML如下:
<td id="bxgy_x_img">
<alt="Title" id="bxgy_img_a" height="75" border="0" />
</td>
你在做什么? – kindall 2012-01-13 18:34:55
您使用的是BeautifulSoup吗?如果这样的属性可用,就像它们是字典的键一样,例如td ['alt'] – Peter 2012-01-13 18:36:05
对于HTML,['alt'](http://en.wikipedia.org/wiki/Alt_attribute)元素看起来很不寻常。如果它会在'img'前面,这会给你一个答案:'soup.find('td',{'id':'bxgy_x_img'})。findChild('img')['alt']',这将简单地打印*标题*。 – miku 2012-01-13 18:37:24