lxml

-1热度

1回答

如何使用lxml创建具有属性的新元素？ XML结构如下， </lo> <lo n="h" add="b" l="D"> <myconf conf="rf"/> <myconf conf="st"/> <myconf conf="new"/>  </lo>

1热度

1回答

任何与CSS选择器中的“until”相似的东西？

我想获得“tracked_by”id到“buzz_off”id之间的电影名称。我已经创建了一个可以在“tracked_by”id之后抓取名字的选择器。但是，我的意图是让脚本进行解析，直到找到“buzz_off”标识。元件在其内的名称是： html = ''' <div class="list"> <a id="allow" name="allow"></a> <h4 class="c

0热度

2回答

python：在xml中添加新数据会覆盖现有数据

我想将整个标记添加到xml，下面是我的XML格式。 <?xml version="1.0" encoding="UTF-8"?> <ca st="true" name="XMLConfig"> <app> <!--- I want to add entire commneted tag to XML . ! <ar ty="co" name="st">

0热度

3回答

Python的：如何处理与很多孩子的大型XML文件中的1根

我有一个像 <report> <table> <detail name="John" surname="Smith"> <detail name="Michael" surname="Smith"> <detail name="Nick" surname="Smith"> ... {a lot of <detail> elements}

0热度

1回答

更新xml元素值和更新某些标签

我有xml与命名空间，在那里我能够得到元素的值。我想用不同的文本更新值。但是我想根据<vlid>标记值更新XML。如果此vlid值不匹配，则只有程序应迭代下一个vlink标记并查找匹配的文本。我可以匹配vlid。我能够更新XML，但在我的情况下，值全部更新为link标签，而不考虑vlid的值。我的问题是我有两个标签，其中link里面有相同的元素列表，并且使用xpath进行递归搜索，因此在标签中

0热度

1回答

HTML刮使用LXML

我使用lxml 这是一个职位 <article id="post-4855" class="post-4855 post type-post status-publish format-standard hentry category-uncategorized"> <header class="entry-header"> <h1 class="entry-title"><a h

1热度

1回答

带有lxml xml解析器的BeautifulSoup4从xhtml文件中的内联svg中删除xmlns属性

我安装了BeautifulSoup4 v4.6.0和lxml v3.8.0。我正试图解析以下xhtml。我的代码来解析： from bs4 import BeautifulSoup xhtml_string = """ <?xml version="1.0" encoding="utf-8" standalone="no"?> <!DOCTYPE html PUBLIC "-//W3C/

0热度

2回答

问题在使用python

我想读下面的XML文件中的XML文本阅读它具有以下内容： <tu creationdate="20100624T160543Z" creationid="SYSTEM" usagecount="0"> <prop type="x-source-tags">1=A,2=B</prop> <prop type="x-target-tags">1=A,2=B</prop>

0热度

1回答

同时解析多个网页

我经常需要从互联网网页解析/抓取信息。我正在使用lxml和requests。几乎在所有情况下，信息都是连续的，如股票相关信息或日期明智信息。目前，我运行一个列表理解来运行循环。我想知道是否有一种方法可以在同一时间解析多个页面？我知道多处理/分叉，但我会感谢一些更简单的解决方案。这里是我的示例代码 [lxml.html.fromstring(requests.get(i).content).xpat

0热度

1回答

试图通过与ElementTree的功能指数LXML没有输出

from lxml import etree from xml.etree import cElementTree as ET tree = ET.parse(r"D:\General\Python_Preference_validation\sample.xml") root = tree.getroot() root[0][1].text 这里获取元素的值是XML文件： <?xml