2012-01-16 116 views
1

有没有人知道如何解析下面的字符串来获取这两个字符串:[Test1][Test2][Test3][Test4]如何解析正则表达式

STRING:

Hello [Test1][Test2] world] [Test3][Test4] this is test].

+1

更普遍的怎么样? kdzwinel的答案适用于上述示例。如果你需要解决更复杂的输入数据,你应该改善这个问题,用户不是大写的。请帮助我们帮助你。 – 2012-01-16 16:29:50

回答

1

你将不得不做一个循环来获得动态数量的匹配(我想你想得到)。

我使用了.*?((?:\[.*?\])+)(.*)的模式。第一个匹配组将找到所需的字符串,第二个匹配组将始终找到“其余”,您将不得不再次解析。

构造“(?:...)”是一个非捕获组,它不会产生匹配组(在Java正则表达式语法中)。

这里是一个简短的Java样本:

public static void main(String[] args) { 

    // define regular expression 
    Pattern pattern = Pattern.compile(".*?((?:\\[.*?\\])+)(.*)"); 

    // iterate for each match 
    Matcher matcher = pattern.matcher("Hello [Test1][Test2] world] [Test3][Test4] this is test]."); 
    while (matcher.matches()) { 
     String text = matcher.replaceFirst(matcher.group(2)); 
     System.out.println("Found " + matcher.group(1)); 
     matcher = pattern.matcher(text); 
    } 
} 

这将输出:

Found [Test1][Test2] 
Found [Test3][Test4] 

很抱歉,如果这是一种复杂的,请让我/我们知道,如果你需要一个简单的例子。 ..

1

试试这个:(\[[a-zA-Z0-9]+\]){2}

+0

感谢您的回复。只是在这种情况下,你的变体就完美了但我想获得更多通用的方法。 – Radislav 2012-01-16 16:12:54

0

使用perl味正则表达式:

m/\[\S+/g 

测试:

script.pl内容:

use warnings; 
use strict; 

## Read all data after __DATA__ filehandle. 
while (<DATA>) { 

    ## Save in array '@matches' any characters from an opening 
    ## square bracket until a blank found. 
    ## 'g' flag means to do it many times in same line. 
    my @matches = m/\[\S+/g; 

    ## Print to output. Each match in a line. 
    printf qq[%s\n], join qq[\n], @matches; 
} 

__DATA__ 
Hello [Test1][Test2] world] [Test3][Test4] this is test]. 

运行脚本:

perl script.pl 

结果:

[Test1][Test2] 
[Test3][Test4]