2017-08-25 84 views
0

一个给数学家。测试一个立方体 - 每个维度的切片又是否足够?

说我有两个立方体或维度建模的数据集A和B.

为了证明他们是相同的,是它足以通过依次每个维度切片他们每个人,并确认汇总每个成员都是一样的?

一个简单的例子:尺寸国家(英格兰和苏格兰),性别(男性和女性)和已婚(是或否)。衡量CountPeople。

如果我切片按国家CountPeople,从比较A和B的结果,然后按性别,然后结婚,并找到相同的结果,我已证明,在A和B的每一个细胞都相同?

认为我有,但我不知道。

回答

1

不,反过来每个维度切片不足以证明立方体是在细胞水平上是相同的。它可能会在大部分时间足够接近,但它没有数学保证。

我们可以用一个相当简单的例子来证明这一点,只是性别和国家维度。试想一下,我们在细胞水平以下数据:

  • (男,英格兰):100,(女,苏格兰):100

如果我们按性别或国家分别切片,我们得到:

  • 男:100,女:100
  • 英格兰:100,苏格兰:100

现在,如果所有的男性移动到苏格兰和所有的女性搬到英国,我们将不得不在小区层面上不同的数据:

  • (男,苏格兰):100,(女,英格兰):100

但是,无论是单维报告的数据将是相同的:

  • 男:100,女:100
  • 英格兰:100,苏格兰:100

这是一个相当平凡的例子,但对于非平凡数据存在相同的可能性,所以为了100%确定两个立方体是相同的,您需要在单元级别验证。

+0

谢谢!你的例子说得很清楚。 “没有数学保证”就是我的问题。 – SebTHU