feature-extraction

1热度

1回答

我想从短距离检测物体（飞机门）。该算法应该非常强大，因此可以通过任何平面（具有许多不同的绘画，标识）以及任何天气条件（日光，雨水，白天和黑夜）来实施。我在OpenCV中搜索并实现了其中一些特征提取算法，如SURF，SIFT和ORB，但结果并不好。这里使用代码ORB特征检测器 #include "opencv2/opencv_modules.hpp" #include <stdio.h>

2热度

1回答

级联特征词在输入层中嵌入

假设我获得输入矩阵嵌入查找它看起来像后： [[[0.5, 0.25, 0.47, 0.86]，[0.8. 0.12, 0.63, 0.97]，[0.7, 0.47, 0.32, 0.01]]，... ，[[...]]] i，e每个嵌入的dim = 4，句子长度为3，如上述情况中给出的。如何使用Tensorflow/TFLearn或Theano中的占位符动态地（即在运行时）对句子中的每个单词追加一

-2热度

1回答

如何分析三机器学习模型的输出，以便我只获得一个结果？

我正在尝试对歌曲进行基于流派的分类。我已经提取了一首歌曲的音频特征（MFCC，Pitch和Rhythm）。我通过每个特征训练了三种模型（ANN，SVM，SVM）。三种模式给出三种输出（歌曲的流派）。如何分析三个模型的输出以便我只能得到一个结果？

1热度

1回答

sklearn中的矢量化似乎非常昂贵。为什么？

我需要处理超过1,000,000条文本记录。我正在使用CountVectorizer来转换我的数据。我有以下代码。 TEXT = [data[i].values()[3] for i in range(len(data))] #these are the text records from sklearn.feature_extraction.text import CountVectoriz

1热度

4回答

如何在另一列上按组条件执行连续的列计数

我试图从由PatientID列分组的Noshow列中获取连续计数。我使用的下面的代码非常接近我希望获得的结果。但是，使用sum函数将返回整个组的总和。我希望求和函数只求和当前行和只有其上面有'1'的行。基本上，我试图计算一个病人不遵守每行的预约时间，然后在他们确实显示时重置为0。似乎只需要对我的下面的代码进行一些调整。但是，我似乎无法在本网站的任何地方找到答案。 transform(df, Con

1热度

1回答

PCA后提取哪些特征？

我正在尝试使用PCA提取功能。现在我得到了来自StackExchange的MATLAB代码，如下所示，它选择PCA之后最相关的前100个功能。现在，当我执行代码时，我发现特征值已经在第一条语句中排序。为什么我们需要再次按降序排序？ [eigenvectors, projected_data, eigenvalues] = princomp(proteingene); [foo, feature_

1热度

1回答

ORB特征描述信息官方给出解释

我只是从伊森Rublee Official Paper读ORB的官方文件，有点我觉得很难理解的部分“4.3学习的好二进制功能” 我是冲浪在互联网上深入挖掘并找到下面的段落。我还没有得到这个实际的解释。你们中的任何一个人都可以用简单的语言来解释这一点“给定一个大小为m×m的局部图像块，并且假设用于强度测试的本地窗口（即，在BRIEF中使用的箱式滤波器）的大小为r×r，则存在N =（m - r）2个

0热度

1回答

逻辑回归中混合二进制和非二进制功能

我有一些二进制功能（0或1）和一些非二进制功能，其值在0和1之间（如0.24）。我使用Weka逻辑回归来对具有所有这些特征的实例进行分类。它工作正常吗？谢谢

0热度

1回答

特征工程的Ngram顺序选择

我正在研究文本分类的特征工程。我被困在选择功能的一点上。大多数文献表示将文本标记为文本并将它们用作特征（删除停用词，标点符号），但是却错过了像（肺癌）或短语这样的多词词。所以问题是如何决定ngram顺序并把它们当作特征？

0热度

1回答

BrokenPipeError：[WinError 109]管道在数据提取过程中结束

我是python中的多处理新手。我从70,000个URL中提取一些功能。我有他们从2个不同的文件。在特征提取过程之后，我将结果传递给一个列表，然后传递给一个CSV文件。该代码运行，但随后停止与错误。我试图捕捉错误，但它产生了另一个。 Python版本= 3.5 from feature_extractor import Feature_extraction import pandas as