XML数据 其中R解析XML文件获取到的数据帧
<HealthData locale="en_US">
<ExportDate value="2016-06-02 14:05:23 -0400"/>
<Me HKCharacteristicTypeIdentifierDateOfBirth="" HKCharacteristicTypeIdentifierBiologicalSex="HKBiologicalSexNotSet" HKCharacteristicTypeIdentifierBloodType="HKBloodTypeNotSet" HKCharacteristicTypeIdentifierFitzpatrickSkinType="HKFitzpatrickSkinTypeNotSet"/>
<Record type="HKQuantityTypeIdentifierStepCount" sourceName="Ryan Praskievicz iPhone" unit="count" creationDate="2014-10-02 08:30:17 -0400" startDate="2014-09-24 15:07:06 -0400" endDate="2014-09-24 15:07:11 -0400" value="7"/>
<Record type="HKQuantityTypeIdentifierStepCount" sourceName="Ryan Praskievicz iPhone" unit="count" creationDate="2014-10-02 08:30:17 -0400" startDate="2014-09-24 15:12:13 -0400" endDate="2014-09-24 15:12:18 -0400" value="15"/>
<Record type="HKQuantityTypeIdentifierStepCount" sourceName="Ryan Praskievicz iPhone" unit="count" creationDate="2014-10-02 08:30:17 -0400" startDate="2014-09-24 15:17:16 -0400" endDate="2014-09-24 15:17:21 -0400" value="20"/>
</HealthData>
> library(XML)
> doc="\\pathtoXMLfile"
> list <-xpathApply(doc, "//HealthData/Record", xmlAttrs)
> df <- do.call(rbind.data.frame, list)
> str(df)
我试图采取上面所示的XML数据样本并将其加载到一个数据帧R代码R与每个记录的名称即类型,sourceName,单位,endDate,值作为列标题和每个记录值即计数,2014-09-24 15:07:11 -0400,7作为每行的值在数据帧。
当df <- do.call(rbind.data.frame, list)
这个关闭,但它也看起来像它绑定列标题的所有值也。如果你View(df)
或str(df)
你会明白我的意思。如何使用Record变量名称作为列标题名称?
感谢, 瑞安
感谢它为我提供的测试数据完美地工作。当我回去试图将其应用到完整的数据集时,我意识到有一些记录中有9列不是7,即 '不起作用。有任何想法吗? –
你知不知道要保持共同的属性还是全部?您是否事先知道要保留哪些属性? – Parfait
是的,我想保留矢量中的所有9行,并只有NAs为7行的向量。 –