beautifulsoup

    8热度

    3回答

    我想使用BeautfulSoup来搜索并用<\a><br>替换<\a>。我知道如何用urllib2打开,然后解析以提取所有<a>标签。我想要做的是搜索并用结束标记加上中断替换结束标记。任何帮助,非常感谢。 编辑 我会以为这将是类似于: soup.findAll('a'). 在本文档中,有一个: find(text="ahh").replaceWith('Hooray') 所以我认为这将是沿

    0热度

    2回答

    我正在用BeautifulSoup编写HTML文档,我希望它不要将内嵌文本(如<p>标记内的文本)拆分为多行。我得到的问题是,解析<p>a<span>b</span>c</p>与美化给我的输出 <p> a <span> b </span> c </p> 现在的HTML显示A,B,C,这是我不希望之间的空格。我如何避免这种情况?

    4热度

    1回答

    如何使用BeautifulSoup查找指向特定域的页面中的所有链接?

    4热度

    2回答

    使用BeautifulSoup解析我的XML import BeautifulSoup soup = BeautifulSoup.BeautifulStoneSoup("""<alan x="y" /><anne>hello</anne>""") # selfClosingTags=['alan']) print soup.prettify() 这将输出: <alan x="y">

    0热度

    1回答

    我使用BeautifulSoup解析XML: xml = """<person> <first_name>Matt</first_name> </person>""" soup = BeautifulStoneSoup(xml) first_name = soup.find('first_name').string last_name = soup.find('last_name').

    7热度

    2回答

    我以这种形式需要从表中的数据在文本文件(output.txt中): 数据1,数据2,数据3,数据4; ..... Celkova podlahova plocha bytu;33米; Vytah;肛; Nadzemne podlazie; Prizemne podlazie; ......;备考vlastnictva; Osobne 所有 “一行”,分隔符为 “;”(后来在csv-出口文件)。 我

    4热度

    1回答

    任何人都可以推荐一个像“html敏捷包”(。净)或“美丽的汤”为Perl的好模块? 在此先感谢!

    3热度

    4回答

    我有一段包含段落的HTML代码片段。 (我的意思是p标签。)我想将字符串拆分成不同的段落。例如: ''' <p class="my_class">Hello!</p> <p>What's up?</p> <p style="whatever: whatever;">Goodbye!</p> ''' 应该改为: ['<p class="my_class">Hello!</p>', '<

    3热度

    2回答

    我想知道是否有人知道如何将文本添加到标签(p,b - 您可能希望包含字符数据的任何标签)。该文件没有提到你如何做到这一点。

    1热度

    1回答

    对不起,如果您觉得已经有人问这个问题,但我已经阅读了相关的问题,并且对Python来说很新,我找不到如何以干净的方式编写此请求。 现在我有这个最小的Python代码: from mechanize import Browser from BeautifulSoup import BeautifulSoup import re import urllib2 br = Browser(