我需要从互联网上读取一个XML文件并重新塑造它。 这是XML文件和我到目前为止的代码。如何读取XML输入文件,操作某些节点(删除并重命名某些文件)并将输出写入新的XML输出文件?
library(XML)
url='http://ClinicalTrials.gov/show/NCT00001400?displayxml=true'
doc = xmlParse(url,useInternalNode=TRUE)
我能够在XML封装中使用某些功能sucess(例如,getNodeSet),但我不是专家,也有在互联网上的一些例子,但我没能破解这个问题我自己。我也知道一些XPath,但这是4年前的事情,我不是熟练使用Sapply和类似功能的专家。
但我的目标是:
我需要删除了一整套关于位置XML孩子分支机构。
<location> ... anything </location>
可存在与位置数据的多个节点。我只是不需要输出中的细节。
上面的XML文件始终符合XSD架构。根节点是。
2. 所得简化文件应该被写入一个新的XML文件名为数据changed.xml
3. 我还需要重命名和老嵌套的地方
<eligibility>
<criteria>
<textblock>
Inclusion criteria are xyz
</textblock/>...
移动一个分支
在新的输出(data-changed.xml)中,结构应该表示不同的XML节点并且直接位于根节点下。
入选标准是XYZ
所以我需要 - 读取XML到内存 - 操作树(修剪它的地方) - 移动某些XML节点到一个新的地方,并以新名称和 - 编写生成的XML输出文件。
任何想法非常感激?另外,如果你知道关于R中XML解析的一个很好的(最近的!)教程(或者解决它的书籍章节,请分享参考资料)。 (我读过邓肯的小插曲,这些插图太过先进(太简明))。
确定。我过去写过一些XSLT。但它并没有完全解决我的问题。我搜索了R的原生XSLT库,但无法找到它。只有通过系统命令我可能会调用一些外部XSLT分析器。它仍然需要很多我无法编写的R代码。 你知道如何在R中实现这样的事情: outputXML < - 过程(XMLfile,withTHISxsltFile) – userJT 2012-01-05 22:34:34