我有一个XML输出如下所示正则表达式来结合标签
<B-company> The British </B-company> <I-company> Broadcasting Corporation is a </I-company> <B-Type> public </B-Type> <I-Type> service broadcaster </I-Type> <HQ> headquartered </HQ> <B-company> at </B-company> <I-company> Broadcasting </I-company> <B-Type> House </B-Type> <I-Type> in </I-Type> <HQ> London </HQ>
这里B-tag为开始标签和I-标签显示延续标签/结束标记(如果没有进一步的I-标签被找到)。
我期待这样的事情作为一个输出
<company> The British Broadcasting Corporation is a </company> <Type> public service broadcaster </Type> <HQ> headquartered </HQ> <company> at Broadcasting </company> <Type> House in </Type> <HQ> London </HQ>
即字符“B-”需要从这样的第一标签形成和所有的标签被删除,直到我们有“/ I-”标记并添加到最后。我们如何在java正则表达式中实现这一点。
[使用XML解析器代替?](https://stackoverflow.com/a/1732454/2773311)关于使用正则表达式解析XML/HTML ... – Arc676
@ Arc676它很难被称为“解析”,如果输出是xml。这些看起来像基本的字符串操作,只是字符串恰好是xml。 –
@Rawing,你是对的。它只是用一些标签编码的基本字符串。它不遵循正常的XML约定。对我来说,使用XML解析器似乎对此有点矫枉过正。因此,正则表达式的方法 – Betafish