2011-09-22 124 views
7

我想用最简单的方法删除字符串中的所有字符。 例如 从"a,sd3 31ds""asdds" 我CAD做这样的事情:删除所有非单词字符的简单方法

"a,sd3 31ds".gsub(/\W/, "").gsub(/\d/,"") 
# => "asdds" 

,但它看起来有点别扭。也许有可能将这些rexegs合并为一个?

回答

17
"a,sd3 31ds".gsub(/(\W|\d)/, "") 
4

什么

"a,sd3 31ds".gsub(/\W|\d/,"") 

您可以随时加入|正则表达式来表达 “或”。

5

你可以用正则表达式“OR”来做到这一点。

"205h2n0bn r0".gsub(/\W|\d/, "") 

会做的伎俩:)

4

你可以试试这个正则表达式:

\P{L} 

不是Unicode信,但我不知道,不Ruby支持这一类。

+0

Ruby 1.9的一样。 [链接](https://github.com/ruby/ruby/blob/trunk/doc/re.rdoc) – steenslag

+0

@steenslag,太好了。所以提供的正则表达式是正确的。 –

4

非正则表达式的解决方案:

"a,sd3 31ds".delete('^A-Za-z') 
+0

''a,sd3 [] 31ds“.delete('^ A-z')'=>''asd [] ds”' –

+0

@undur_gongor:啊是的。我会解决它。 – steenslag

12

我会去的正则表达式/[\W\d]+/。它可能比例如/(\W|\d)/

require 'benchmark' 

N = 500_000 
Regexps = [ "(\\W|\\d)", "(\\W|\\d)+", "(?:\\W|\\d)", "(?:\\W|\\d)+", 
      "\\W|\\d", "[\\W\\d]", "[\\W\\d]+" ] 

Benchmark.bm(15) do |x| 
    Regexps.each do | re_str | 
    re = Regexp.new(re_str) 
    x.report("/#{re_str}/:") { N.times { "a,sd3 31ds".gsub(re, "") }} 
    end 
end 

给出(红宝石2.0.0p195 [x64的的mingw32])

     user  system  total  real 
/(\W|\d)/:  1.950000 0.000000 1.950000 ( 1.951437) 
/(\W|\d)+/:  1.794000 0.000000 1.794000 ( 1.787569) 
/(?:\W|\d)/:  1.857000 0.000000 1.857000 ( 1.855515) 
/(?:\W|\d)+/:  1.638000 0.000000 1.638000 ( 1.626698) 
/\W|\d/:   1.856000 0.000000 1.856000 ( 1.865506) 
/[\W\d]/:   1.732000 0.000000 1.732000 ( 1.754596) 
/[\W\d]+/:  1.622000 0.000000 1.622000 ( 1.617705) 
相关问题