2010-08-13 60 views
8

给定一个正则表达式,我想生成随机数据x的时间来测试一些东西。是否有根据正则表达式生成数据的库? (Python或其他)

例如

>>> print generate_date('\d{2,3}') 
13 
>>> print generate_date('\d{2,3}') 
422 

当然,目标是做一些比电话号码和电子邮件地址更复杂的事情。

是否存在这样的事情?如果有,它是否存在Python?如果没有,我可以使用任何线索/理论来做到这一点?

回答

7

Pyparsing包括this regex inverter,返回简单的正则表达式所有排列的发电机。下面是一些从该模块的测试案例:

[A-C]{2}\d{2} 
@|TH[12] 
@(@|TH[12])? 
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9]))? 
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9])|OH(1[0-9]?|2[0-9]?|30?|[4-9]))? 
(([ECMP]|HA|AK)[SD]|HS)T 
[A-CV]{2} 
A[cglmrstu]|B[aehikr]?|C[adeflmorsu]?|D[bsy]|E[rsu]|F[emr]?|G[ade]|H[efgos]?|I[nr]?|Kr?|L[airu]|M[dgnot]|N[abdeiop]?|Os?|P[abdmortu]?|R[abefghnu]|S[bcegimnr]?|T[abcehilm]|Uu[bhopqst]|U|V|W|Xe|Yb?|Z[nr] 
(a|b)|(x|y) 

编辑:

做你的随机选择,创建一个列表的排列(一次!),然后调用random.choice名单因为你寻找它

class RandomString(object): 
    def __init__(self, regex): 
     self.possible_strings = list(invRegex.invert(regex)) 
    def random_string(self): 
     return random.choice(self.possible_strings) 
+0

+1太棒了! – katrielalex 2010-08-13 14:18:50

+0

几乎我在找什么。 +1 – 2010-08-15 14:44:02

+0

我还在UtilityMill上将此模块打包为一个实用程序:http://utilitymill.com/utility/Regex_inverter。所有UM实用程序都公开XML和JSON API,因此您可以从您自己的代码远程调用它,并且UtilityMill执行正则表达式反转处理。 – PaulMcG 2010-08-26 12:48:04

2

There is a post关于生成正则表达式所有排列的模块的Python邮件列表。我不太确定你怎么去做随机化。我会继续检查。

+0

+1:每次你想匹配的正则表达式,像这样(未经测试)一个随机字符串。 – 2010-08-15 14:44:18

+0

@ e-satis - 实际上我发现它在其他地方:) – detly 2010-08-15 15:06:15

1

我可能会因为提示这个而被抨击,但是perl有一个模块来完成这个工作。你可能想看看代码是如何实现它在python:

http://p3rl.org/String::Random

+0

SO没有[鞭]按钮,所以你很安全。 – detly 2010-08-13 13:47:49

+0

有趣的是知道它存在,至少perl。 +1 – 2010-08-15 14:42:37