1
我需要在python中编写一个正则表达式,它可以从首字母大写的文本中找到单词,这些单词可以是单个或连续的。要找到首字母大写的单词(一个或多个连续)?
例如,对于句子
Dallas Buyer Club is a great American biographical drama film,co-written by Craig Borten and Melisa Wallack, and Directed by Jean-Marc Vallee.
expexted输出应该
'Dallas Buyer Club', 'American', 'Craig Borten', 'Melisa Wallack', 'Directed', 'Jean-Marc Vallee'
我写这个正则表达式,
([A-Z][a-z]+(?=\s[A-Z])(?:\s[A-Z][a-z]+)+)
但这个输出是
'Dallas Buyer Club', 'Craig Borten, 'Melisa Wallack', 'Jean-Marc Valee'
它只能打印连续第一个大写单词,而不是单一的话就像
'American', 'Directed'
也正则表达式,
[A-Z][a-z]+
打印所有的话,但个别,
'Dallas', 'Buyers', 'Club' and so on.
请帮助我解决这个问题。 。
感谢您的答复先生,现在还没有给单个大写单词“美国”和“导演”(仅适用于连续字),我想要两个 –
@ SejwalVineet:我已经编辑了答案。 –
现在它正在工作,先生如果文本包含像艾滋病毒或艾滋病的所有大写单词,那么如何在上面写一个正则表达式,我已经写了正则表达式为'[AZ] + [\ s-]',这可以如何整合 –