我有一套F功能,例如实验室色彩空间,熵。通过将所有特征连接在一起,我得到了一个尺寸为d的特征矢量(取值在12到50之间,取决于选择哪些特征)。针对2类分类建议的无监督特征选择/提取方法?
我通常会得到1000到5000个新样本,记为x,然后训练高斯混合模型但是我不知道哪些类的特征来自于我所知道的是,只有两类,基于GMM预测,我得到属于类1或2的特征向量的概率。
我现在的问题是:我如何获得最佳子集的功能,例如只有熵和归一化的rgb,这将给我最好的分类准确性?我想这是实现的,如果类可分性增加,到期到特征子集选择
也许我可以利用Fisher的线性判别分析?因为我已经有了从GMM获得的均值和协方差矩阵。但是,我不需要计算每个功能组合的分数吗?
如果这是一种没有前瞻性的方法,并且我处于错误的轨道和/或任何其他建议中,那么获得一些帮助会很好吗?