删除所有非单词字符的简单方法

我想用最简单的方法删除字符串中的所有字符。例如从"a,sd3 31ds"到"asdds" 我CAD做这样的事情：删除所有非单词字符的简单方法

"a,sd3 31ds".gsub(/\W/, "").gsub(/\d/,"") 
# => "asdds"

，但它看起来有点别扭。也许有可能将这些rexegs合并为一个？

来源

2011-09-22 evfwcqcg

"a,sd3 31ds".gsub(/(\W|\d)/, "")

来源

2011-09-22 09:00:26

什么

"a,sd3 31ds".gsub(/\W|\d/,"")

您可以随时加入|正则表达式来表达 “或”。

来源

2011-09-22 09:00:50 Howard

你可以用正则表达式“OR”来做到这一点。

"205h2n0bn r0".gsub(/\W|\d/, "")

会做的伎俩:)

来源

2011-09-22 09:01:27 Snicksie

你可以试试这个正则表达式：

\P{L}

不是Unicode信，但我不知道，不Ruby支持这一类。

来源

2011-09-22 09:13:05

Ruby 1.9的一样。 [链接]（https://github.com/ruby/ruby/blob/trunk/doc/re.rdoc） – steenslag

@steenslag，太好了。所以提供的正则表达式是正确的。 –

非正则表达式的解决方案：

"a,sd3 31ds".delete('^A-Za-z')

来源

2011-09-22 11:11:19 steenslag

''a，sd3 [] 31ds“.delete（'^ A-z'）'=>''asd [] ds”' –

@undur_gongor：啊是的。我会解决它。 – steenslag

我会去的正则表达式/[\W\d]+/。它可能比例如/(\W|\d)/。

require 'benchmark' 

N = 500_000 
Regexps = [ "(\\W|\\d)", "(\\W|\\d)+", "(?:\\W|\\d)", "(?:\\W|\\d)+", 
      "\\W|\\d", "[\\W\\d]", "[\\W\\d]+" ] 

Benchmark.bm(15) do |x| 
    Regexps.each do | re_str | 
    re = Regexp.new(re_str) 
    x.report("/#{re_str}/:") { N.times { "a,sd3 31ds".gsub(re, "") }} 
    end 
end

给出（红宝石2.0.0p195 [x64的的mingw32]）

     user  system  total  real 
/(\W|\d)/:  1.950000 0.000000 1.950000 ( 1.951437) 
/(\W|\d)+/:  1.794000 0.000000 1.794000 ( 1.787569) 
/(?:\W|\d)/:  1.857000 0.000000 1.857000 ( 1.855515) 
/(?:\W|\d)+/:  1.638000 0.000000 1.638000 ( 1.626698) 
/\W|\d/:   1.856000 0.000000 1.856000 ( 1.865506) 
/[\W\d]/:   1.732000 0.000000 1.732000 ( 1.754596) 
/[\W\d]+/:  1.622000 0.000000 1.622000 ( 1.617705)

来源

2011-09-22 11:41:35

删除所有非单词字符的简单方法

回答

相关问题