正则表达式的公式来找到其他两个字符串或字符

我试图从另一个字符串的一些子串，我已经确定模式，应该得到正确的结果之间的字符串，但我觉得有我在执行一些小瑕疵。正则表达式的公式来找到其他两个字符串或字符

s = 'Arkansas BaseballMiami (Ohio) at ArkansasFeb 17, 2017 at Fayetteville, Ark. (Baum Stadium)Score by Innings123456789RHEMiami (Ohio)000000000061Arkansas60000010X781Miami (Ohio) starters: 1/lf HALL, D.; 23/3b YACEK; 36/1b HAFFEY; 40/c SENGER; 7/dh HARRIS; 8/rf STEPHENS; 11/ss TEXIDOR; 2/2b VOGELGESANG; 5/cf SADA; 32/p GNETZ;Arkansas starters: 8/dh E. Cole; 9/ss J. Biggers; 17/lf L. Bonfield; 33/c G. Koch; 28/cf D. Fletcher; 20/2b C. Shaddy; 24/1b C Spanberger; 15/rf J. Arledge; 6/3b H. Wilson; 16/p B. Knight;Miami (Ohio) 1st - HALL, D. struck out swinging.'

这是我尝试在正则表达式的公式来达到我期望的产出：

teams = re.findall(r'(;|[0-9])(.*?) starters', s) 
pitchers = re.findall('/p(.*?);', s)

投手搜索似乎工作，但该团队输出以下：

[('1', '7, 2017 at Fayetteville, Ark. (Baum Stadium)Score by Innings123456789RHEMiami (Ohio)000000000061Arkansas60000010X781Miami (Ohio)'), ('1', '/lf HALL, D.; 23/3b YACEK; 36/1b HAFFEY; 40/c SENGER; 7/dh HARRIS; 8/rf STEPHENS; 11/ss TEXIDOR; 2/2b VOGELGESANG; 5/cf SADA; 32/p GNETZ;Arkansas')]

预期的产出：

['Miami (Ohio)', 'Arkansas'] 
[' GNETZ', ' B. Knight']

我可以不用担心以后的投手名字剥出前导空格。

来源

2017-08-04 rahlf23

(;|[0-9])可以[;0-9]更换。那么我想你想表达的是“给我把字符串starters之前，最后一个数字/分号starters之前出现后，立即”，以便您可以说：“必须有没有其他的数字/分号之间” ，即

teams = re.findall(r'[;0-9]([^;0-9]*) starters', s)

来源

2017-08-05 00:09:57

太棒了，正是我所需要的。谢谢你的详尽的解释，以及！ – rahlf23

正则表达式的公式来找到其他两个字符串或字符

回答

相关问题