我想用最简单的方法删除字符串中的所有字符。 例如 从"a,sd3 31ds"
到"asdds"
我CAD做这样的事情:删除所有非单词字符的简单方法
"a,sd3 31ds".gsub(/\W/, "").gsub(/\d/,"")
# => "asdds"
,但它看起来有点别扭。也许有可能将这些rexegs合并为一个?
我想用最简单的方法删除字符串中的所有字符。 例如 从"a,sd3 31ds"
到"asdds"
我CAD做这样的事情:删除所有非单词字符的简单方法
"a,sd3 31ds".gsub(/\W/, "").gsub(/\d/,"")
# => "asdds"
,但它看起来有点别扭。也许有可能将这些rexegs合并为一个?
"a,sd3 31ds".gsub(/(\W|\d)/, "")
什么
"a,sd3 31ds".gsub(/\W|\d/,"")
您可以随时加入|
正则表达式来表达 “或”。
你可以用正则表达式“OR”来做到这一点。
"205h2n0bn r0".gsub(/\W|\d/, "")
会做的伎俩:)
你可以试试这个正则表达式:
\P{L}
不是Unicode信,但我不知道,不Ruby支持这一类。
非正则表达式的解决方案:
"a,sd3 31ds".delete('^A-Za-z')
''a,sd3 [] 31ds“.delete('^ A-z')'=>''asd [] ds”' –
@undur_gongor:啊是的。我会解决它。 – steenslag
我会去的正则表达式/[\W\d]+/
。它可能比例如/(\W|\d)/
。
require 'benchmark'
N = 500_000
Regexps = [ "(\\W|\\d)", "(\\W|\\d)+", "(?:\\W|\\d)", "(?:\\W|\\d)+",
"\\W|\\d", "[\\W\\d]", "[\\W\\d]+" ]
Benchmark.bm(15) do |x|
Regexps.each do | re_str |
re = Regexp.new(re_str)
x.report("/#{re_str}/:") { N.times { "a,sd3 31ds".gsub(re, "") }}
end
end
给出(红宝石2.0.0p195 [x64的的mingw32])
user system total real
/(\W|\d)/: 1.950000 0.000000 1.950000 ( 1.951437)
/(\W|\d)+/: 1.794000 0.000000 1.794000 ( 1.787569)
/(?:\W|\d)/: 1.857000 0.000000 1.857000 ( 1.855515)
/(?:\W|\d)+/: 1.638000 0.000000 1.638000 ( 1.626698)
/\W|\d/: 1.856000 0.000000 1.856000 ( 1.865506)
/[\W\d]/: 1.732000 0.000000 1.732000 ( 1.754596)
/[\W\d]+/: 1.622000 0.000000 1.622000 ( 1.617705)
Ruby 1.9的一样。 [链接](https://github.com/ruby/ruby/blob/trunk/doc/re.rdoc) – steenslag
@steenslag,太好了。所以提供的正则表达式是正确的。 –