2010-10-15 91 views
121

什么是最好,最优雅/有效的方式来测试一个数组是否包含第二个数组中的元素?下面数组包含来自另一个数组的任何值?

两个例子,试图回答的问题是 '食物' 包含的任何元素,从 '奶酪':

cheeses = %w(chedder stilton brie mozzarella feta haloumi) 
foods = %w(pizza feta foods bread biscuits yoghurt bacon) 

puts cheeses.collect{|c| foods.include?(c)}.include?(true) 

puts (cheeses - foods).size < cheeses.size 

回答

211
(cheeses & foods).empty? 

它做同样的,有什么公布injekt,但它已经编译的语言行动。

至于马克 - 安德烈·Lafortune在评论中说,&作品线性时间,而any? + include?将二次。对于更大的数据集,线性时间会更快。对于小数据集,如Lee Jarvis的答案所示,any? + include?可能会更快。

+12

Ruby通过构建一个散列来完成交集,所以它绝对不会与'any?{... include?}'不一样,它将遍历每一个潜在的元素对。交点'&'因此是线性时间,而'any?'将是二次的。如果“奶酪”是一个“集合”而不是“阵列”,这将是等价的。 – 2010-10-15 15:21:00

+1

当检查一个数组是否包含另一个数组中的元素时,做它(奶酪和食物)是否更有意义?因为如果数组实际上包含任何相同的元素,它会返回一个真值。 – 2014-07-15 21:46:31

+0

@RyanFrancis,docs:'any?':*如果块返回的值不是false或nil,则该方法返回true *:* empty *:如果self不包含任何元素,则返回true * – Nakilon 2014-07-15 22:40:12

18

如何Enumerable#any?

>> cheeses = %w(chedder stilton brie mozzarella feta haloumi) 
=> ["chedder", "stilton", "brie", "mozzarella", "feta", "haloumi"] 
>> foods = %w(pizza feta foods bread biscuits yoghurt bacon) 
=> ["pizza", "feta", "foods", "bread", "biscuits", "yoghurt", "bacon"] 
>> foods.any? {|food| cheeses.include?(food) } 
=> true 

基准脚本:

require "benchmark" 
N = 1_000_000 
puts "ruby version: #{RUBY_VERSION}" 

CHEESES = %w(chedder stilton brie mozzarella feta haloumi).freeze 
FOODS = %w(pizza feta foods bread biscuits yoghurt bacon).freeze 

Benchmark.bm(15) do |b| 
    b.report("&, empty?") { N.times { (FOODS & CHEESES).empty? } } 
    b.report("any?, include?") { N.times { FOODS.any? {|food| CHEESES.include?(food) } } } 
end 

结果:

ruby version: 2.1.9 
         user  system  total  real 
&, empty?   1.170000 0.000000 1.170000 ( 1.172507) 
any?, include? 0.660000 0.000000 0.660000 ( 0.666015) 
+0

这应该是正确的答案。甚至认为另一个更具可读性。这是一个更快的解决方案 – 2016-10-25 15:24:46

+0

您可以通过将“奶酪”变成一套来改善这一点。 – akuhn 2016-12-26 01:00:35

+1

在ruby 2.2.7和2.3.4以及'any ?,包括?'上跑我自己的基准,这是最快的,设置不相交最慢:https://gist.github.com/jaredmoody/d2a1e83de2f91fd6865920cd01a8b497 – Jared 2017-05-03 17:25:54

19

您可以检查交叉点是否为空。

cheeses = %w(chedder stilton brie mozzarella feta haloumi) 
foods = %w(pizza feta foods bread biscuits yoghurt bacon) 
foods & cheeses 
=> ["feta"] 
(foods & cheeses).empty? 
=> false 
1
Set.new(cheeses).disjoint? Set.new(foods) 
+0

这看起来不像有效的2.0语法 - “Set.new(CHEESES).disjoint? Set.new(FOODS)'也许? – Jared 2017-05-03 17:18:11

+0

同样在我的(不科学的)基准测试中,设置不相交显着比其他方法慢:https://gist.github.com/jaredmoody/d2a1e83de2f91fd6865920cd01a8b497 – Jared 2017-05-03 17:24:43

+1

感谢您的意见。我不确定为什么它不是Set.new,但我只是编辑它。我在2.4.1中试过了你的性能基准。我做得更好,但仍然不是最好使用含有更多单词的不连贯的集合。我把我的版本放在对你的要点的评论中。我也认为'脱节?'非常优雅,特别是与“任何?”相比,包括?“。原来的问题确实问到优雅和高效。 – davidkovsky 2017-05-04 18:24:57

相关问题