我想重新创建自动编码olivetti face dataset的Reducing the dimensionality of data with neural networks中报告的结果,并修改了MNIST数字matlab code的版本,但我有一些困难。似乎无论我对时代,速度或动量的数量做了多少调整,叠加的RBM都进入微调阶段,出现大量误差,因此在微调阶段未能大幅提高。我在另一个实数数据集上也
我想知道哪些可以帮助我从文本中提取语义特征的开放源代码工具(用于java/python)&。语义特征的例子是形容词 - 名词比率,特定的词性标签序列(形容词后面跟着名词:adj | nn)等等。文体特征的例子是独特词语的数量,代词数量等。目前,我只知道Word to Web Tools,它将文本块转换为基本向量空间模型。 我知道一些文本挖掘包,比如GATE,NLTK,Rapid Miner, Ma