2015-10-20 111 views
2

我使用orange来建立关于医学稀疏数据集的关联规则。但是我找不到在规则生成中插入语法约束的方法?如何在Orange中的先验约束中引入synstactic约束

似乎在Orange中我只能选择:最小支持,最小信心和最大规则数量,但我有兴趣在影响的右侧或左侧有一组特定的事件。例如,我只对具有特定项目I(x)出现在结果中的规则感兴趣,或者具有出现在先行项中的特定项目I(y)的规则或上述约束的组合。

回答

0

规则通常不会作为规则生成,但会作为频繁项目集

要推导关联规则,您还需要知道每个可能的子集的支持。计算和存储这些子集是挑战。从FIM中提取规则并不是非常困难或昂贵。

因此,您可以将约束仅应用于输入数据或生成后的输出规则。如果您在规则上过早或错误地应用了规则,您可能违反了获得正确结果所需的单调性要求。

+0

因此,如果我有一个包含20个属性的数据集,并且我有兴趣探索从包含特定属性的FIM派生的规则,则建议我从数据集中移除所有不包含特定属性的事务, FIMs?这是正确的? – Claudia

+0

当你可以做到这一点时,你需要仔细检查确切的条件。我相信这只适用于先前的一面。确保了解数学和monotinicity属性。 –

0

您可以尝试最新的Orange 3。似乎有更新的Orange3-Associate add-on可用(可通过菜单安装:选项>附加组件),这似乎完全符合您的要求,即您可以按项目数量和/或正则表达式过滤诱导项目集/规则。