lxml

    -1热度

    1回答

    如何使用lxml创建具有属性的新元素? XML结构如下, </lo> <lo n="h" add="b" l="D"> <myconf conf="rf"/> <myconf conf="st"/> <myconf conf="new"/> <!--- create new element with attribute --> </lo>

    1热度

    1回答

    我想获得“tracked_by”id到“buzz_off”id之间的电影名称。我已经创建了一个可以在“tracked_by”id之后抓取名字的选择器。但是,我的意图是让脚本进行解析,直到找到“buzz_off”标识。元件在其内的名称是: html = ''' <div class="list"> <a id="allow" name="allow"></a> <h4 class="c

    0热度

    2回答

    我想将整个标记添加到xml,下面是我的XML格式。 <?xml version="1.0" encoding="UTF-8"?> <ca st="true" name="XMLConfig"> <app> <!--- I want to add entire commneted tag to XML . ! <ar ty="co" name="st">

    0热度

    3回答

    我有一个像 <report> <table> <detail name="John" surname="Smith"> <detail name="Michael" surname="Smith"> <detail name="Nick" surname="Smith"> ... {a lot of <detail> elements}

    0热度

    1回答

    我有xml与命名空间,在那里我能够得到元素的值。 我想用不同的文本更新值。但是我想根据<vlid>标记值更新XML。如果此vlid值不匹配,则只有程序应迭代下一个vlink标记并查找匹配的文本。我可以匹配vlid。我能够更新XML,但在我的情况下,值全部更新为link标签,而不考虑vlid的值。 我的问题是我有两个标签,其中link里面有相同的元素列表,并且使用xpath进行递归搜索,因此在标签中

    0热度

    1回答

    我使用lxml 这是一个职位 <article id="post-4855" class="post-4855 post type-post status-publish format-standard hentry category-uncategorized"> <header class="entry-header"> <h1 class="entry-title"><a h

    1热度

    1回答

    我安装了BeautifulSoup4 v4.6.0和lxml v3.8.0。我正试图解析以下xhtml。 我的代码来解析: from bs4 import BeautifulSoup xhtml_string = """ <?xml version="1.0" encoding="utf-8" standalone="no"?> <!DOCTYPE html PUBLIC "-//W3C/

    0热度

    2回答

    我想读下面的XML文件中的XML文本阅读它具有以下内容: <tu creationdate="20100624T160543Z" creationid="SYSTEM" usagecount="0"> <prop type="x-source-tags">1=A,2=B</prop> <prop type="x-target-tags">1=A,2=B</prop>

    0热度

    1回答

    我经常需要从互联网网页解析/抓取信息。我正在使用lxml和requests。几乎在所有情况下,信息都是连续的,如股票相关信息或日期明智信息。目前,我运行一个列表理解来运行循环。我想知道是否有一种方法可以在同一时间解析多个页面?我知道多处理/分叉,但我会感谢一些更简单的解决方案。这里是我的示例代码 [lxml.html.fromstring(requests.get(i).content).xpat

    0热度

    1回答

    from lxml import etree from xml.etree import cElementTree as ET tree = ET.parse(r"D:\General\Python_Preference_validation\sample.xml") root = tree.getroot() root[0][1].text 这里获取元素的值是XML文件: <?xml