text-classification

    -1热度

    1回答

    我正在尝试为特定类别构建我自己的语料库,如工程,商业,数学,科学等......这将用于自动网页分类。比方说,我手动收集100个与数学相关的网站。这100个网站可以被认为是数学的语料库吗? 另一个相关的问题。这与一个词汇有什么区别呢,而不是一个网站列表,它显示了一个带有权重的单词列表,例如0或1到特定的类别?例如,情感词典中包含正面和负面权重的词汇。但不是正面和负面,而是使用诸如数学,科学等类别。

    0热度

    1回答

    我正在使用sklearn进行一些文本分类。 作为第一步,我显然需要使用vectorizer - CountVectorizer或TfIdfVectorizer。我想解决的问题是,在我的文件中,经常有单词和复数形式的单词。在执行矢量化时,我想“合并”单数和复数形式,并将它们视为相同的文本特征。 很明显,我可以手动预处理文本,只需用单数形式的单词替换所有复数形式的单词,当我知道哪些单词有这个问题时。但

    1热度

    2回答

    我是机器学习的新手,我正在尝试分析我的一个项目的分类算法。我遇到SGDClassifier在sklearn图书馆。但许多论文都将SGD称为优化技术。有人可以请解释如何实施SGDClassifier?

    0热度

    1回答

    我在机器学习是一个新手,我建立一个投诉分类,我想提供一个反馈模型,以便它可以改善随着时间的推移 import numpy from sklearn.feature_extraction.text import CountVectorizer from sklearn.naive_bayes import MultinomialNB value=[ 'drought', 'robber',

    3热度

    2回答

    我尝试在最近三年之间加载数据。我想在当前日期时间和最近3年之间获取数据。 如: - 从2009年1月19日在目前的时间(2012年1月19日) 我得到如下的当前时间。 String date= DateFormat.getDateInstance().format(new Date()); 请问有人可以告诉我怎么做?如果你有任何经验的例子,这将是一个真正的帮助!

    1热度

    3回答

    有没有可用的服务让我可以在离线设置中操作地图?我正在制作一个项目,要求我拍摄地图并根据地图上的功能创建游戏世界。我已经查看了一些针对不同提供者的API:Google,ms等。我看起来的API似乎严格向用户显示地图。我正在寻找一些能够让我创建地图的衍生物(游戏世界),这是公众永远不会看到的,并且只能由游戏引擎使用。但有一点需要注意的是,我希望能够将为游戏引擎创建的派生链接与我可以向用户展示的内容链接

    0热度

    1回答

    是否有任何方法将ruby数组/哈希结构转换为JSON并指定元素的输出顺序? 具有元素的实际顺序变化在功能上并不重要,但它只是使调试变得困难......如果我能以某种方式指定json输出的标签顺序,那么会更好,因此人们可以阅读json轻松找到他们正在寻找的标签。

    2热度

    3回答

    我想以编程方式在我的代码中插入行注释。我正在访问一个方法声明,并且我想使用该方法的AST在它上面插入一行注释(或更多)。任何人都可以请给我一个如何做到这一点的代码示例?我一直在寻找很长时间,但没有成功。

    0热度

    1回答

    基于这篇文章:http://nadbordrozd.github.io/blog/2016/05/20/text-classification-with-word2vec/我试图在文本分类任务中实现带GloVe预训练矢量的gensim word2vec模型。不过,我想在我的文本数据中也做FeatureSelection。我在管道中尝试了多个序列,但是我得到了一个指向TfidfEmbeddingVe

    0热度

    1回答

    ...很抱歉,但我有一个类似的问题无解: 我使用此代码从一个iframe中打开的fancybox。 这里头部分: <!-- Add jQuery library --> <script type="text/javascript" src="http://code.jquery.com/jquery-latest.min.js"></script> <!-- Add fancyBox -->