2011-04-28 98 views
5

我有一个文本,其日期可以像这样:2011-02-02或者像这样:02/02/2011,这是我迄今为止写的,我的问题是,如果有一个很好的将这两个正则表达式合并为一个的方法?结合两个正则表达式C++ 0x

std::regex reg1("(\\d{4})-(\\d{2})-(\\d{2})"); 

std::regex reg2("(\\d{2})/(\\d{2})/(\\d{4})"); 

smatch match; 
if(std::regex_search(item, match, reg1)) 
{ 
     Date.wYear = atoi(match[1].str().c_str()); 
     Date.wMonth = atoi(match[2].str().c_str()); 
     Date.wDay = atoi(match[3].str().c_str()); 
} 
else if(std::regex_search(item, match, reg2)) 
{ 
     Date.wYear = atoi(match[3].str().c_str()); 
     Date.wMonth = atoi(match[2].str().c_str()); 
     Date.wDay = atoi(match[1].str().c_str()); 
} 
+0

一些正则表达式的语法已命名组。 PCRE可以,但我认为它不支持重名。也许问题是:C++ 0x上的任何正则表达式变体是否支持重复的命名组? – 2011-04-28 08:14:57

+5

我没有看到好处。这比组合的正则表达式更容易阅读。这有利于维护,这是不容低估的一个因素。这个代码甚至可以在没有文档的情况下阅读 - 结合它,你需要记录“怪物 - 正则表达式”。 – 2011-04-28 08:25:41

回答

5

您可以通过|将两个正则表达式组合在一起。由于只有一个|可以匹配,因此我们可以连接不同部分的捕获组并将其视为一个整体。

std::regex reg1("(\\d{4})-(\\d{2})-(\\d{2})|(\\d{2})/(\\d{2})/(\\d{4})"); 
std::smatch match; 

if(std::regex_search(item, match, reg1)) { 
    std::cout << "Year=" << atoi(match.format("$1$6").c_str()) << std::endl; 
    std::cout << "Month=" << atoi(match.format("$2$5").c_str()) << std::endl; 
    std::cout << "Day=" << atoi(match.format("$3$4").c_str()) << std::endl; 
} 

(可惜的C++ 0x的正则表达式不支持命名捕获组,否则我建议你在使用命名捕获,而不是正则表达式的数组循环。)

+0

Arg。没有命名的捕获?为什么他们遗漏了这个功能呢? – 2011-04-28 09:12:20

+0

@Jörgen:询问ECMA。 C++的正则表达式基于ECAMScript(Javascript)的正则表达式。 – kennytm 2011-04-28 12:10:05