结构如下考虑一个数据库:[R寻找模式
<Age> <Gender> <Field1> <Field2> <Field3> <Field4> <Field#>
其中的每一行,一些领域可能为零,另一些则不会,代表的时间从个体量使用这样的字段 - 可以为每一行使用多个字段。
例如,考虑DB的存在:
10 M 10 0 5 0 1
5 M 7 1 6 0 2
10 M 6 1 4 1 0
....
所以我们可以说,对于10岁和男性个体的模式,将是第一个和第三个领域是最具代表性的。
我不确定我的解释是否有意义。这是可以实现的吗?有这种问题的算法/ R包吗?
岂不' Field1'和'Field3'是最常用的? – herbaman
是的,我会错过它哈哈谢谢 – JDoe