首先,我不是程序员。基于字长的插入
我有如此描述方面具有巨大的XML文件:
<term>
<termId>MANUAL000399</termId>
<termUpdate>Add</termUpdate>
<termName>care</termName>
<termType>Pt</termType>
<termStatus>Active</termStatus>
<termApproval>Approved</termApproval>
<termCreatedDate>20120618T14:38:20</termCreatedDate>
<termCreatedBy>admin</termCreatedBy>
<termModifiedDate>20120618T14:40:41</termModifiedDate>
<termModifiedBy>admin</termModifiedBy>
</term>
在该文件中,术语要么
<termType>
Pt或ND
我想解决申请二者皆是。 什么,我想要做的是能穿过去,看看字长 termName ,如果里面还有超过5个字符,添加另一个属性,一个
<termNote>
在
后
<termModifiedBy>
属性:
<term>
<termId>MANUAL000399</termId>
<termUpdate>Add</termUpdate>
<termName>care</termName>
<termType>Pt</termType>
<termStatus>Active</termStatus>
<termApproval>Approved</termApproval>
<termCreatedDate>20120618T14:38:20</termCreatedDate>
<termCreatedBy>admin</termCreatedBy>
<termModifiedDate>20120618T14:40:41</termModifiedDate>
<termModifiedBy>admin</termModifiedBy>
<termNote label="Short">Short</termNote>
</term>
谁能指教一下这样做的最好的方法?我在这里发现了正则表达式,但问题在于它们的应用,我发现有人建议/ \ b [a-zA-Z] {5,} \ b /但我不知道如何编写一个脚本,然后插入术语笔记,如果它匹配。
很难不提供到这里的链接:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –
什么应该我使用而不是正则表达式?正如我所说我不是程序员,也不知道这些事情。谢谢 – lobe
我很抱歉,我不会回答你的问题。但我可以提出一些意见。首先,如果作为一个非程序员,你只需要做你在这里展示的东西,那么你就需要成为一名程序员。选择Python或Ruby并学习它。其次,你的问题并不清楚。你需要改进你的文本构成,我确信那里的XML人会回答。第三,不要用regexen解析XML,除非你有一组特定的,已知的文档,这些文档碰巧能够被正则表达式解析。正则表达式不是金锤子。 –