beautifulsoup

0热度

1回答

我想使它所以这个脚本 from BeautifulSoup import BeautifulSoup import sys, re, urllib2 import codecs html_str = urllib2.urlopen(URL).read() soup = BeautifulSoup(html_str) for row in soup.findAll("tr"):

4热度

1回答

我如何从美丽的表格中删除一列（Python）

我有一个html表格，我想删除一列。使用BeautifulSoup或任何其他Python库做到这一点的最简单方法是什么？

-1热度

4回答

如何使这个变量的结果？

现在它设置为写入文件，但我希望它将值输出到一个变量。不知道如何。 from BeautifulSoup import BeautifulSoup import sys, re, urllib2 import codecs woof1 = urllib2.urlopen('someurl').read() woof_1 = BeautifulSoup(woof1) woof2 = ur

0热度

1回答

py2app没有找到BeautifulSoup

我有一个脚本，使用BeautifulSoup，我想使用py2app作为独立的应用程序。当我运行由py2app制作的应用程序时，我收到一个错误消息，说无法找到模块BeautifulSoup。我的sys.path有'/Library/Python/2.6/site-packages/BeautifulSoup-3.1.0.1-py2.6.egg'，所以它似乎应该在那里，有什么建议吗？

3热度

1回答

我如何停止美丽的汤从解析时跳过行？

同时使用beautifulsoup解析HTML中的表每隔一行开始与 <tr class="row_k"> 而不是tr标签无类样本HTML <tr class="row_k"> <td><img src="some picture url" alt="Item A"></td> <td><a href="some url"> Item A</a></td> <td>14.8k</td>

0热度

2回答

无法获取网站与Python了urllib.urlopen（）或任何Web浏览器要比知床

其它这里是我想获取 https://salami.parc.com/spartag/GetRepository?friend=jmankoff&keywords=antibiotic&option=jmankoff%27s+tags 当我与抓取网站的网站的网址下面的代码与下面的代码显示的内容： sock = urllib.urlopen("https://salami.parc.com/spart

-2热度

1回答

我想找到LI标签和它的属性之间的span标签，但没有运气

我想要找到LI标签及其属性之间的span标签。试着用漂亮的肥皂，但没有运气。我的代码细节。任何一个点我的权利methodlogy 在这个验证码，我的getId函数应该返回我的id =“0_False-2” 任何一个知道正确的方法是什么？ from BeautifulSoup import BeautifulSoup as bs import re html = '<ul>\ <li cla

4热度

2回答

从转义的html - >转换为常规的html？ - Python

我使用BeautifulSoup来处理通过REST API收集的XML文件。响应包含HTML代码，但BeautifulSoup转义所有HTML标记，因此可以很好地显示。不幸的是我需要HTML代码。我该如何继续将转义的HTML转换为适当的标记？帮助将非常感谢！

7热度

3回答

用BeautifulSoup获取文档DOCTYPE

我刚刚开始修补scrapy与BeautifulSoup一起，我想知道如果我失去了一些非常明显的东西，但我似乎无法弄清楚如何获得返回的文档类型来自所得到的汤对象的html文档。考虑下面的HTML： <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html lan

9热度

5回答

使用BeautifulSoup解析由 标签分隔的行吗？

我有一个页面，看起来像这样： Company A 123 Main St. Suite 101 Someplace, NY 1234 Company B 456 Main St. Someplace, NY 1234 <b