feature-extraction

    1热度

    2回答

    我是初学者到python和机器学习。我试图使用多线程重现countvectorizer()的代码。我正在使用yelp数据集来使用LogisticRegression进行情感分析。这是我到目前为止已经写的: 代码片段: from multiprocessing.dummy import Pool as ThreadPool from threading import Thread, current

    2热度

    1回答

    假设我有位置功能。在火车数据集中,其独特的值是'纽约','芝加哥'。但在测试中它有'纽约','芝加哥','伦敦'。 因此,当创建一个热门编码如何忽略'伦敦'? 换句话说,如何不编码仅出现在测试集中的类别?

    0热度

    1回答

    我想从包装标签Sample Nutrient label中识别营养信息。这是一个包装图像,不同的品牌可能会以不同的方式标记/布置标签。但我知道一些事情是肯定的,布局会有些表格,标题中的某些关键词如“营养素”,以及表格的内容将具有某些常见词语,例如能量/脂肪等。我想提取这些值文本形式并将其保存到我的数据库。 示例图像是一个更大问题的一部分,找到可能包含此部分'营养素标签'的轮廓/框。 据我所知,他们

    1热度

    2回答

    我在功能工程中查看了Kaggle的fill null方法。有些玩家用另一个对象值填充NA。 例如,性别栏中有'男','女'和NA值。该方法用另一个对象值填充NA,例如'中间'。之后,它将没有null的性属性对待,熊猫不会找到null。 我想知道该方法对机器学习模型的性能或良好的特征工程有非常好的影响吗? 除此之外,在数据集中没有知识的发现之后,还有没有其他的好方法来填充NA?

    0热度

    1回答

    我已经完成了使用GLCM和k-nn进行分类的特征提取。我现在需要做的是解决问题,分析为什么图像被错误地分类。我想显示的测试数据的近邻,但不只是点象下面这样: 我想显示最接近该图像(测试),所以,很容易知道为什么图片是最接近彼此的图像(视觉上)。但是,这是我的问题,我不知道如何回调之前提取的图像,因为这些图像仅以数组的形式呈现。 我该怎么办?

    2热度

    1回答

    我有通过DStream从Kafka到达的数据。我想要执行特征提取以获得一些关键字。 我不想等待所有数据的到来(因为它打算是连续的流,可能永远不会结束),所以我希望能够以大块的方式执行提取 - 如果精度将会忍受一点。 到目前为止,我放在一起类似的东西: def extractKeywords(stream: DStream[Data]): Unit = { val spark: Spar

    -1热度

    1回答

    我想要一个像素化的图像,并使其看起来更像一个cad绘图/蓝图。 这里是源图像: 我使用python和OpenCV 2.到目前为止,我能够找到使用Harris角检测一些角落,但我打我的OpenCV的知识限制。 这里是什么输出会是什么样子的例子: 主要目标: 90°角 的行是唯一的垂直或水平(源图像稍微偏斜) 到目前为止,这里是一个什么似乎是工作ISH(蟒蛇)概述: points = cv2.corn

    3热度

    1回答

    我遇到了TSfresh库,以此来构建时间序列数据。这些文档非常棒,它看起来非常适合我正在开发的项目。 我想实现在TFresh文档的快速入门部分中共享的以下代码。这似乎很简单。 from tsfresh import extract_relevant_features feature_filtered_direct=extract_relevant_features(result,y,column

    0热度

    1回答

    我想在数据库中的数据项目中使用scikit-learn Pipelines的FeatureUnion功能。我在如何构建我正在做的事情方面遇到了一些基本问题。 我从数据库中的两个不同表创建两个功能。我有一个fetch_x1,fetch_x2方法来从数据库表中获取感兴趣的数据作为pandas DataFrames。我将这两个DataFrames打包成一个数据框字典。在每个变压器中,我解压缩感兴趣的Da

    1热度

    1回答

    我得到VGG改变网络的输出(这里是3个浮点数的向量),每件事情都可以,但是当我只想得到其他层的输出时(例如最后的卷积层conv5_4)而不是最后一层,输出矢量全部为零。 这是Python代码来获取输出: import sys import cv2 import numpy as np sys.path.insert(0, '/home/deep/rahim/caffe-master/pyth