data-analysis

    1热度

    1回答

    这是我的代码看起来像 library(plumber) data(mtcars) test=mtcars #' @get /graph #' @png makePlot <- function(){ par(mfrow=c(2,1)) hist(test$mpg) hist(test$wt) }

    0热度

    2回答

    我需要匹配来自多个CSV文件的数据。我编写了一个简单数据的脚本,但分析4000行的速度很慢。 我已经使用set(a) & set(b)进行了尝试,但无法从每个文件中返回匹配数据。 输出文件必须具有来自所有文件的匹配数据。 脚本: for file_1 in files: with open(file_1, 'rt') as f1,open(saved_file, 'w') as f3:

    5热度

    6回答

    我有不同的数据文件,需要根据日期列将它们合并在一起。如果我只有两个文件,我可以使用df1.merge(df2, on='date'),如果我尝试使用三个文件,我使用df1.merge(df2.merge(df3, on='date'), on='date'),但有多个文件要合并。 数据帧有一个共同的列 - “日期”,但没有相同数量的行和列,我只需要每个数据帧通用的日期。 所以,我试图编写一个递归函

    0热度

    1回答

    我有一个棒球球员数据文件。我想创建一个名为“象限”的计算列,它将玩家类型分为4类。 我的代码是: CASE WHEN ([OBP]<=PERCENTILE([OBP],50)) AND ([BB/K]<=PERCENTILE([BB/K],50)) THEN "Banjo Hitter" WHEN ([OBP]<=PERCENTILE([OBP],50)) AND ([BB/K]>PERC

    0热度

    3回答

    我的Python熊猫数据帧是这样的: 我想绘制在X轴和值在Y轴 日期我能得到它一次一个。 X轴或Y轴。我希望他们在一个图中。 我已经试过这样的事情: import pandas as pd from pandas import Series, DataFrame, Panel from mysql.connector import MySQLConnection, Error from py

    0热度

    1回答

    我真的很陌生,我一直试图模拟从Python的“pandas.read_table”代码,用于数据分析的书(关于MovieLens 1M数据集的章节, pg.23ish)。下面是用于数据库的文件的链接以及我输入代码的jupyter笔记本的图像。正如你将会看到的那样,我遇到了数据值不正确的问题,因为它应该这样,我似乎无法弄清楚为什么。您的帮助将非常感谢! Trouble screen Database

    1热度

    1回答

    如何在散点图中包围不同的数据集? 我正在寻找的是这样的: 而且,我怎么填写后与(阴影)颜色的圈?

    0热度

    2回答

    假设数据绘制我有一个数据帧 Product | Price ------------------ A | 20 B | 10 A | 10 B | 15 A | 我应该如何获得聚合平均值(不包括空值),并绘制图表。 A | 15 B | 12.5 所以我会为这张表绘制一张图。我虽然使用groupby,但不知道它如何适用于这种情况。

    0热度

    1回答

    这是我与工作数据框: (仅前两年没有对全国69我会解决这个问题的数据)。 nkill是从原始长表格数据框中总结的当年遇害人数。 我试图做类似这样的情节的东西: 然而,随着国家代码的色调。我知道有类似的帖子,但没有人帮助我解决这个问题,提前谢谢。 通过Hue我的意思是在seaborn句法使用As pictured in this third picture。在这个例子中看到Hue为该列中的每种类型的

    0热度

    2回答

    对不起,对于新手问题,我是Elastic产品的新手。我从Elastic的Tutorials学习X-Pack。因此,在观看this video关于使用Kibana和X-Pack调查数据集异常的教程时,我在回答这两个问题时感到困惑(尽管我的回答是正确的)。 我明白,可以有无限的异常的水桶,但有人可以解释我为什么桶跨度只产生一个异常,我无法理解由弹性提供的解释。