data-science

    5热度

    1回答

    假设我有一个模式描述根元素类Root,其中包含List<Entry>,其中Entry类具有必需的字段名称。 这里是如何看起来代码: @XmlRootElement class Root{ @XmlElement(name="entry") public List<Entry> entries = Lists.newArrayList(); } @XmlRootEleme

    0热度

    1回答

    我有一个构建配置,调用两个配方。这两个配方必须以确定的顺序执行。 最后执行的配方是由mr.developer扩展从git存储库中提取的。但是,当mr.developer引入配方时,它将此视为一个蛋,并首先执行此操作。这扰乱了正确的顺序,并且构建失败。 我试过设置egg=false所以配方不会先执行,但是这样可以防止配方被全部执行,因为它不是一个蛋。 为了让一个想法是什么我buildout.cfg样

    0热度

    1回答

    我正在构建一个预测系统,以预测在给定时间点将断开连接的有线用户数量。我正在使用Python,并且尝试使用不同的模型,XGBoost表现最好。 我有一个以移动窗口方式工作的自我引用系统,例如,当我用完了实际情况,我开始在我的滞后时间使用预测数字。 要构建预测系统,我使用了先前800天的滞后(断开一天),移动平均值,比率,季节性,年,月,日,星期等指标。但是,节假日,是在哪里得到一点点搞砸了。最初我只

    0热度

    1回答

    我有一个for循环,我写道它从XML文件返回这样的多元组。它看起来是这样的: (a, b, c) (a, b, c) (a, b, c) (a, b, c) ........ 的XML文件是这样的:A,B & c相同子标签下。并且,所有as,bs和cs中的每一个都是相同的数据类型。我试图让每一个加入到空单Z = [],在同一个嵌套的for循环z.append(YYY),我一直得到这样的

    -1热度

    2回答

    我正在阅读一本关于Python的Data Science的书,并且作者应用'sigma-clipping操作'来删除由于拼写错误而导致的异常。然而这个过程根本没有解释。 什么是西格玛剪辑?它仅适用于某些数据(例如,在美国用于出生率的书中)? 按文本: quartiles = np.percentile(births['births'], [25, 50, 75]) #so we find the

    -4热度

    1回答

    有人可以帮助我理解用于在Python中对视频和音频文件进行群集的算法。

    -1热度

    1回答

    这是我的数据帧 Id_Student English History Mathmatic 1 66.0 NaN 80.0 2 NaN 66.0 NaN 3 NaN NaN NaN 4 55.0 94.0 94.0 我想用这个梅索德修复缺失值 mdf1 = mdf.fillna(method='ffill') 但它看起来像,如果第一个值是NaN它没有帮助很大。根据历

    1热度

    2回答

    我想使用vincent包在jupyter笔记本中可视化我的数据(熊猫),但在初次尝试时遇到问题,这里是我使用的代码(从http://wrobstory.github.io/2013/10/mapping-data-python.html复制): import vincent import pandas world_topo=r'world-countries.topo.json' geo

    0热度

    1回答

    我有一个名为'train'的数据框,它有多个变量。其中一个变量就是'工业'。列“工业”的前10种元素如下: train['industry'][:10] 0 Office supplies 1 Unknown 2 Misc services 3 Social services 4 Unknown 5 Manufacturing 6 Social services

    4热度

    1回答

    我需要构建一个Git服务器,它允许来自Window和* nix的客户端读取和写入。 有许多教程显示如何通过ssh构建gitolite服务器,这需要客户端发送其公钥。但是每次我想把我的信息源推送到别人的电脑或者从别人的电脑上传送信息来源时,生成密钥和重新配置gitolite都很烦人。 无论如何只是使用用户/密码来构建一个git服务器? 感谢 杰克