我已经搜索了一些Q &作为和找不到具体的解决方案足以帮助。条件删除变量字符串正则表达式
我有一个很大的xml文件,需要根据另一个字段中的值在一个字段中执行条件“删除”。
例如:
<vehicle>...<manufacturer>JCB</manufacturer>....<item_category>JCB Tractors</item_category>...</vehicle><vehicle>...<manufacturer>Caterpillar</manufacturer>....<item_category>Digger</item_category>...</vehicle><vehicle>...<manufacturer>Caterpillar</manufacturer>....<item_category>Caterpillar Digger</item_category>...</vehicle>
需求,成为
<vehicle>...<manufacturer>JCB</manufacturer>...<item_category>Tractors</item_category>...</vehicle><vehicle>...<manufacturer>Caterpillar</manufacturer>...<item_category>Digger</item_category>...</vehicle><vehicle>...<manufacturer>Caterpillar</manufacturer>....<item_category>Digger</item_category>...</vehicle>
理想的解决办法是什么我可以申请使用find和textpad设置为POSIX替换功能扩展的正则表达式。
真的很感谢帮助,因为我一直在抨击我的头一阵子!
如果我使用的解析器,我可以隔离变量字符串我想“删除”使用
(?<=<manufacturer>)(.*?)(?=<\/manufacturer>)
是否有可能使用该模式其实我是想删除
串隔离例如,
(?<=<item_category>)(?<=<manufacturer>)(.*?)(?=<\/manufacturer>)(\s)
使用XML解析器而不是正则表达式是我的建议。你能解释更多你想实现什么 –
感谢您的回复 - 我试图保持大(1GB)的XML文件完好无损,并修复了偶尔填充制造商字符串以及类别的“损坏”类别字段 – Eric
是的。你的例子并不明确。 –