我一直试图进入R,并认为最好的方法是想出一个我喜欢的项目,并深入其中。所以我想分析我的短信习惯。我设法我的文本导出为以下格式的XML文件:使用R解析属性的XML
<all>
<message date="1423813836987" number="+15555555" type="1" read="1" locked="1" seen="1">content of text</message>
<message date="1423813836987" number="+15555555" type="1" read="1" locked="1" seen="1">another content of text</message>
</all>
现在,我想要做的是提取属性“日期”和“数量”和每封邮件的内容和创建一个数据框。我的最终目标是为每个“数字”创建一个图表,并查看我多久发短信的次数。
环顾四周后,我发现R的XML package。我可以提取邮件的内容,但无法从单个message
标签获取属性。一切,我发现关于属性谈到像嵌套的标签:
<message>
<date>1423813836987</date>
<number>555-555</number>
</message>
会有人点我的方向是正确的?有没有更好的方法来做这样的事情?我到目前为止是这样的:
doc = xmlRoot(xmlTreeParse("~/Desktop/data.xml"))
xml_data <- xmlToList(doc)
但它使属性看起来很时髦。
在此先感谢您。