2017-07-26 89 views
1

我一直在寻找相当长一段时间,但它似乎答案似乎总是使用eval(parse(text="1+1"))如何计算“1 + 1”不使用eval(解析(......?

我有一列在我的数据框中,它有一个字符串列表,例如“1 + 1 * 6”,“1 * 4/3”等。我希望将这些字段计算为新列,而不使用eval(parse(函数,因为我期望这样做它超过800万行

它基本上是一个试图回答这样一个问题:鉴于数字1:9找到所有的解决方案,其中(A_B_C)/(D_E_F) = GHI,其中A:I是数字1:9(不重复)和日下划线是四个运营商之一*, /, +,-,也没有重复。

我创建了一个所有排列为1:9的数据框,并且我为每个排列都计算了四个运算符的排列组合。

require(gtools) 
x <- permutations(n = 9, r = 9, v = 1:9) 
y <- permutations(n = 4, r = 4, v = c("*", "/", "+", "-")) 

for(i in 1:nrow(x)){ 
    for(j in 1:nrow(y)){ 
    math <- paste("(", x[i,1], y[j,1], x[i,2],y[j,2], x[i,3],")", "/", "(", x[i,4] ,y[j,3], x[i,5] ,y[j,4], x[i,6],")") 
    equals <- eval(parse(text=math)) 
    sum <- as.numeric(paste0(x[i,7], x[i,8], x[i,9])) 
    if(sum==equals) { 
     print(c(i,j)) 
    } 
    } 
} 

但是这需要的时间太长了,所以我试图消除消费eval(parse(..

任何帮助的时间将非常感激。谢谢!

房地美

+0

请更新您的问题,使其更易于阅读。 –

+0

将所有数字保留在9列中,然后使用类似“+(2,3)”的方式播放。无法正确格式化,用backtics包装+符号。 – zx8754

+0

我同意@ zx8754,当你构造你的字符串时,你基本上是解析。避免这种情况,无需解析。如果你需要更多的帮助,你应该创建一个更小的例子。运行你的代码需要很长时间。 – Roland

回答

1

矢量化是关键

math <- apply(
    y, 
    1, 
    function(j){ 
    paste("(", x[, 1], j[1], x[, 2], j[2], x[, 3],")/(", x[, 4], j[3], x[, 5], j[4], x[, 6], ")") 
    } 
) 
math <- apply(math, 2, paste, collapse = ",") 
math <- paste("c(", math, ")") 
equals <- sapply(parse(text = math), eval) 
sum <-matrix(x[, 7] * 100 + x[, 8] * 10 + x[, 9], nrow = nrow(x), ncol = nrow(y)) 
abs(sum - equals) < 1e-8 

让我们来看看在速度上的差异是什么

要求(gtools) X < - 排列(N = 9,R = 9,V = 1:9) y < - 置换(n = 4,r = 4,v = c(“*”,“/”,“+”,“ - ”))

x <- x[sample(nrow(x), 40), ] 
y <- y[sample(nrow(y), 20), ] 

library(microbenchmark) 
microbenchmark(
    loop = for(i in 1:nrow(x)){ 
    for(j in 1:nrow(y)){ 
     math <- paste("(", x[i,1], y[j,1], x[i,2],y[j,2], x[i,3],")", "/", "(", x[i,4] ,y[j,3], x[i,5] ,y[j,4], x[i,6],")") 
     equals <- eval(parse(text=math)) 
     sum <- as.numeric(paste0(x[i,7], x[i,8], x[i,9])) 
     if(sum==equals) { 
     print(c(i,j)) 
     } 
    } 
    }, 
    vectorised = { 
    math <- apply(
     y, 
     1, 
     function(j){ 
     paste("(", x[, 1], j[1], x[, 2], j[2], x[, 3],")/(", x[, 4], j[3], x[, 5], j[4], x[, 6], ")") 
     } 
    ) 
    math <- apply(math, 2, paste, collapse = ",") 
    math <- paste("c(", math, ")") 
    equals <- sapply(parse(text = math), eval) 
    sum <-matrix(x[, 7] * 100 + x[, 8] * 10 + x[, 9], nrow = nrow(x), ncol = nrow(y)) 
    abs(sum - equals) < 1e-8 
    } 
) 

结果:

Unit: milliseconds 
     expr  min   lq  mean  median   uq  max neval cld 
     loop 158.666383 162.084918 167.477490 165.880665 170.258076 240.43746 100 b 
vectorised 8.540623 8.966214 9.613615 9.142515 9.413117 17.88282 100 a 
+0

嗨蒂埃里,谢谢你的评论。我试着运行你的向量化代码'equals < - sapply(parse(text = math),eval)'但是我得到了错误'解析错误(文本=数学):负向长度向量不允许' - 不完全确定原因。谢谢! –