beautifulsoup

8热度

3回答

我想使用BeautfulSoup来搜索并用<\a> 替换<\a>。我知道如何用urllib2打开，然后解析以提取所有<a>标签。我想要做的是搜索并用结束标记加上中断替换结束标记。任何帮助，非常感谢。编辑我会以为这将是类似于： soup.findAll('a'). 在本文档中，有一个： find(text="ahh").replaceWith('Hooray') 所以我认为这将是沿

0热度

2回答

在BeautifulSoup中进行内联语法分析

我正在用BeautifulSoup编写HTML文档，我希望它不要将内嵌文本（如标记内的文本）拆分为多行。我得到的问题是，解析abc与美化给我的输出 a b c 现在的HTML显示A，B，C，这是我不希望之间的空格。我如何避免这种情况？

4热度

1回答

如何使用BeautifulSoup查找指向特定域的页面中的所有链接？

4热度

2回答

selfClosingTags在BeautifulSoup

使用BeautifulSoup解析我的XML import BeautifulSoup soup = BeautifulSoup.BeautifulStoneSoup("""<alan x="y" /><anne>hello</anne>""") # selfClosingTags=['alan']) print soup.prettify() 这将输出： <alan x="y">

0热度

1回答

解析XML与BeautifulSoup和处理丢失的元素

我使用BeautifulSoup解析XML： xml = """<person> <first_name>Matt</first_name> </person>""" soup = BeautifulStoneSoup(xml) first_name = soup.find('first_name').string last_name = soup.find('last_name').

7热度

2回答

解析表BeautifulSoup和文本文件写

我以这种形式需要从表中的数据在文本文件（output.txt中）：数据1，数据2，数据3，数据4; ..... Celkova podlahova plocha bytu;33米; Vytah;肛; Nadzemne podlazie; Prizemne podlazie; ......;备考vlastnictva; Osobne 所有 “一行”，分隔符为 “;”（后来在csv-出口文件）。我

4热度

1回答

“html敏捷包”像perl的模块

任何人都可以推荐一个像“html敏捷包”（。净）或“美丽的汤”为Perl的好模块？在此先感谢！

3热度

4回答

Python：将HTML片段分隔为

我有一段包含段落的HTML代码片段。（我的意思是p标签。）我想将字符串拆分成不同的段落。例如： ''' Hello! What's up? Goodbye! ''' 应该改为： ['Hello!', '<

3热度

2回答

将文本添加到美丽的汤中的p标签

我想知道是否有人知道如何将文本添加到标签（p，b - 您可能希望包含字符数据的任何标签）。该文件没有提到你如何做到这一点。

1热度

1回答

如何使用Python和美味汤有条件地获取一些数据

对不起，如果您觉得已经有人问这个问题，但我已经阅读了相关的问题，并且对Python来说很新，我找不到如何以干净的方式编写此请求。现在我有这个最小的Python代码： from mechanize import Browser from BeautifulSoup import BeautifulSoup import re import urllib2 br = Browser(