data-science

    2热度

    1回答

    我试图从IOS Swift 3上传一个Sqlite数据库到我的服务器,使用Alamofire 4.0,但是在将sqlite文件转换为上传所需的数据类型时出现问题。 大部分职位/问题的例子似乎默认上传图片,但我在努力寻找例如上传sqlite的或其他类型的文件(用于备份目的) 的...我已经寻找的基本代码,发现这个至今看起来很合理(感谢下面的帖子:Alamofire 4 upload with par

    0热度

    1回答

    我有一个列名称的付款总额数据集,其中包括从$ 100到$ 1000的付款,有一些付款是$ 100.05,$ 102或104.05,这使得它更加困难。如果该行例如说97美元,那么我想创建一个具有低于100美元或在100和200之间的类别的列。 我编写了类似这样的代码; 但输出是以下,所有的行的说之间800和900; 请在这个人的支持。

    -1热度

    2回答

    这是一个数据缠绕问题,涉及查询问题。我有一个数据集,每行不代表1个样本,但包含一列有ID列表。例如,您有3列:年龄,性别& ID。你可以有一行:28, M, 'ID209,ID208'。 是否有简单的方法来扩展这个数据集,使得每个ID号有一行?我正在与R或Python合作。

    1热度

    1回答

    我是Python新手,试图首先按行总计和列总计评估用户电影评级的数据框。按列总计筛选需要数小时才能完成,因此我想知道是否可以为我提供一些指示以优化代码。 data_cols = ['user_id','movie_id','rating'] data = pd.read_csv('netflix_data/TrainingRatings.txt', sep=',', names=data

    1热度

    1回答

    我正在处理一个涉及不得不使用以下形式的预处理数据的项目。 数据说明上面已经给出过。目标是预测书面数字是否与所述数字的音频相匹配。首先,我变换形式的所说阵列(N,13)的装置在时间轴这样: 这创建的(1,13),用于每一阵列的一致长度内发言。为了在一个简单的vanilla算法中测试它,我将这两个数组压缩在一起,以便我们创建一个形式数组(45000,2),当我将它插入到LogisticRegressi

    2热度

    1回答

    我正在阅读由Joel Grus从头开始的“数据科学”一书。我的问题特别涉及第6章,作者使用二项式随机变量来模拟定理。 结果将是一个图表,其中包含二项试验的概率分布和使用正态分布的近似图。这两个地块应该非常相似。书示出像这样的图表: Author's Chart 他提供的代码为: import random from matplotlib import pyplot as plt from co

    1热度

    1回答

    在准备用于神经网络训练的训练集时,我找到两种可能的方法。 的传统方法:计算上整个训练的平均发送到网络之前设置,再减去每幅图像此固定平均值。以类似的方式处理标准偏差。 我发现tensorflow提供的功能tf.image.per_image_standardization做单一图像正常化。 我不知道哪种方式更合适?

    1热度

    1回答

    我想转换Localizable.strings文件,以JSON: "Key" = "Localized Str"; 要 "Key" : "Localized Str", 有没有现成的解决方案?或者更好地写自己的脚本?

    -2热度

    1回答

    语言:Python。 我创建了一个模型并将其与joblib一起保存。现在我想加载它来预测新数据---但是数据是以字符串的形式表示的(数值在数值中,但是特征是用“,”分隔的一行代替,而不是作为一个大数据框在列中)我这样做?我知道我可以发送单个输入并获得单个预测,但我不知道如何执行此操作。 我用 https://machinelearningmastery.com/save-load-machine-

    0热度

    1回答

    所以弹性网应该是岭回归(L2正则化)和套索(L1正则化)之间的混合。但是,即使l1_ratio是0,我也没有得到和脊一样的结果。我知道山脊使用梯度下降和弹性网使用坐标下降,但最优方法应该是相同的,不是吗?此外,我发现弹性网通常会引发ConvergenceWarnings,原因不明,而套索和脊线则不会。这里有一个片段: from sklearn.datasets import load_boston