information-theory

    0热度

    2回答

    一个包包含16个以下颜色的球:8红色,4蓝色,2绿色,1黑色和1白色。 Anisha从包里随机挑选一个球,并使用一串零和一个字符串给Babu发送它的颜色。她将袋子中的球取代并多次重复该实验。每个实验必须传达给巴布的最短预期长度是多少? 的(a)3/2 (b)中记录5 (c)中15/8 (d)31/16 (E)2 据我,由于球取出与更换。在任何时候,袋子里都有16个不同颜色的球。为了编码5种颜色,应

    4热度

    1回答

    我使用pandas和numpy实施python中mutual information公式 def mutual_info(p): p_x=p.sum(axis=1) p_y=p.sum(axis=0) I=0.0 for i_y in p.index: for i_x in p.columns: I+=(p.ix[i_y,i_x]*

    3热度

    1回答

    我想了解R中AIC/BIC的结果。出于某种原因,R将1加到要估计的参数数量上。因此,R使用与2 * p - 2 * logLik不同的公式(在高斯情况下,logLik是残差平方和)。实际上它使用:2 * (p + 1) - 2 * logLik。 经过研究,我发现问题与stats:::logLik.lm()有关。 > stats:::logLik.lm ## truncated R functio

    0热度

    1回答

    我想计算R中的条件互信息,并使用名为infotheo的包。我用两种方法计算I(X; Y1,Y2 | Z)。第一种是使用下面的代码, condinformation(X$industry,cbind(X$ethnicity,X$education),S=X$gender, method="emp") [1] -1.523344 正如我认为互信息可以被分解两个熵:I(X; Y1,Y2 | Z)=

    2热度

    2回答

    假设对于给定的ML问题,我们有一个人拥有的汽车的特征。我们可以通过以下方式之一编码此信息: 为每辆车分配一个id。创建一个'CAR_POSSESSED'列并将功能ID作为值。 为每辆汽车制作专栏,并根据该汽车是否被考虑过的样本拥有0或1。列将如“BMW_POSSESSED”,“AUDI_POSSESSED”。 在我的实验2号方式进行多比一日一,与SVM试图更好。 编码方式如何影响模型学习,是否有一

    0热度

    1回答

    我得到了一个数据集D = {X,y},它有800个输入特征和单个连续输出。我要寻找满足两个条件任何特征提取方法 (1)Matlab的代码可供下载 (2)。该方法应该以某种方式将输入x映射到经变换的输入z,其中z是d向量,使得z_i和y之间的互信息尽可能高。 我认为这些方法应该与CCA相关,但是当执行CCA(X,y)时,我将获得只有一个维度的向量z。我希望这些方法应该可以选择像PCA那样的顶级功能。

    2热度

    1回答

    我使用Weka,我需要分析具有信息增益和增益比的数据集,但是,我无法从中找到设置这些数据的位置。我知道id3使用信息增益和J48使用增益比,但是,我可以设置J48使用信息增益还是id3使用增益比?

    2热度

    1回答

    鉴于infinite time,我们可以接近字符串的确切Kolmogorov complexity。如果我们没有无限的时间,我们仍然可以计算一个字符串的柯尔莫哥洛夫复杂的上限: ...只要压缩字符串s的一些方法,实现所选择的语言相应的解压,级联解压缩器到压缩串,并测量所得到的字符串的长度... (Wikipedia) 是否有一个算法 - 保证有限的时间量内终止 - 提供一个更紧的上限Kolmogo

    0热度

    1回答

    我不学习计算机科学,但我有兴趣了解信息内容的概念。 我看到这两个例句: a) On July 5th, it was over 100°F b) On July 5th, it was 98°F 它说的那句话二)具有较高的信息含量,因为句子一)有只比高于和句子b减少/可能性比较大)的是无限的可能性。 我会同意b)有更高的信息含量,但我不明白解释。 我会说b)有更高的信息量,因为它告诉你究竟是

    0热度

    1回答

    我正在使用python获取facebook状态,告诉状态是什么以及情绪。从本质上讲,我需要告诉情绪是指什么,我已经成功编写了一个情绪分析器,所以麻烦在于让一个POS标记器来计算情绪所指的是什么。 如果您有任何经验建议,我将不胜感激。我已经从主客体,NP-PP和NP-NP关系中读了一些关于计算关系性的论文,但没有看到任何好的例子,也没有发现许多论文。 最后,如果你曾经与POS-taggers合作过,