所以最后(经过几天的调试)我发现了一个问题。它根本不在正则表达式中:/。它接缝,我修剪ekstra空白与正则表达式无法识别“ n”?
intput= Regex.Replace(input, "\\s+", " ");
所以所有新的行被替换为“”。笨!主持人,请删除这个如果不需要!
我有正则表达式的标化一些文本,它看起来像这样:
"(?<html>Ç)|
(?<number>\\d+(?:[.]\\d+)?(?=[][ \f\n\r\t\v!?.,():;\"'„Ç]|$))|
(?<other>(?:[^][Ç \f\n\r\t\v!?.,():;\"'„A-Za-zčćšđžČĆŠĐŽäöÖü][^ Ç\f\n\r\t\vA-Za-zčćšđžČĆŠĐŽäöÖü]*)?[^][ Ç\f\n\r\t\v!?.,():;\"'„A-Za-zčćšđžČĆŠĐŽäöÖü](?=[][!?.,():;\"'„]*(?:$|[ Ç\f\n\r\t\v])))|
(?<word>(?:[^][ Ç\f\n\r\t\v!?.,():;\"'„][^ Ç\f\n\r\t\v]*)?[^][ Ç\f\n\r\t\v!?.,():;\"'„])|
(?<punctuation>[][ \f\n\r\t\v!?.,():;\"'„])"
问题是这一部分:(?<punctuation>[][ \f\n\r\t\v!?.,():;\"'„])
。所以当我用输入"\n\n"
来解析文本时,它是按照标点符号进行分组的:" "," "
- 换言之,空间和空间......我不知道为什么?
不是您的行级别的正则表达式,例如,在Perl中? – bertolami 2009-12-14 11:08:21
对不起......这不是很清楚......它将换行变成空格吗?你想要它分组标点符号吗?而当我在这个时候,你一直在写什么? – Kobi 2009-12-14 11:27:56
这是否也发生在RegexOptions.Multiline选项打开和关闭? – 2009-12-14 11:33:47