2014-02-19 51 views

回答

0

这很大程度上取决于您对“段落”的定义 - 它是由空行分隔的行序列吗?大多数正则表达式处理工具都是面向行的,它们逐行处理文本,所以它们可能无法像您期望的那样工作。这也适用于Python re库,但它提供了一些方法 - 在你的情况下,re.sub('^Lorem ipsum.*?\n\n', '', text, flags=(re.S | re.M))应该完成这项工作(请注意text.replace根本不适用于正则表达式)。

这工作,如果文本是足够短,但对于长文,你应该使用一些不同的方法 - 我自己会用awk,别人可能会建议perlpython可太习惯;更简单的正则表达式工具,如grepsed可能在这里没有出现。

+0

问题是'text.replace()'不能与正则表达式一起工作。 – 4m1nh4j1

0

如果段落中有换行符(它仅适用于单行段落),则您的正则表达式将不起作用。尝试以下正则表达式:^Lorem ipsum[\s\S]*\n\n。请参阅http://regex101.com/r/fF9uZ6

+0

您应该添加'?'懒惰匹配而不是贪婪。 –