我有一个具有2个特征和10000个样本的数据集。我想将这两个功能转换(集成)为一个功能,以供进一步分析。所以我想使用特征提取方法。由于两个特征之间的关系不是线性的,我想使用传统PCA以外的方法。具有少量特征的autoencoder中的隐藏节点的数量
由于样本数量远远大于特征的数量,我认为autoencoder是特征提取的好方法。但输入特征仅为2,那么自动编码器的形状将仅为2-1-2,这是一种线性提取。
是否有可能设置隐藏节点超过输入的数量,并使堆栈自动编码器,如2-16-8-1-8-16-2节点?
此外,使用autoencoder进行这种数据集成是一个很好的选择吗?如果没有,有没有更好的解决方案?
要求指导设计和培训神经网络的问题对Stack Overflow来说是无关紧要的,除非在解决实现细节时似乎并非如此。另外请注意,要求示例代码也不是一个好问题。如果您在自动编码器背后的理论背景中需要帮助,请参阅[交叉验证](https://stats.stackexchange)。如果您在用TensorFlow实现模型时遇到了具体问题,那么编写一个[MCVE]对于我们理解这个问题非常重要。 –
感谢您的评论。我同意这是交叉验证的恰当问题,因为autoencoder的设计是主要问题。我会移动这个交叉验证。 – ToBeSpecific