我试图在Python中编写正则表达式来提取段落的一部分。正则表达式来提取段落
在下面的段落中,我希望提取的部分是粗体。
建议将提升救助资金,注入资金,银行和削减 希腊债务说报告。
我正则表达式和输出如下,
>>> text = 'Proposal will boost bailout fund, inject cash into banks and cut Greek debt says reports.'
>>> pattern = re.compile(r'(boost bailout)+?([\s\S]*?)(debt)+?')
>>> print re.findall(pattern, text)
[('boost bailout', ' fund, inject cash into banks and cut Greek ', 'debt')]
虽然它提取正确的部分,是不是该萃取被分离成3份在一个元组,而不是只是一个单一的线如下面?
[('boost bailout fund, inject cash into banks and cut Greek debt')]
再次感谢!很多要学习,很多要学习。 :) – Ted
不客气,再一次,特德! :) –