dataframe

0热度

1回答

我有一个熊猫数据帧，看起来像这样每一行里面包含一些整数，列表和零字符串我试图取代列表中的0与另一个值一样，如 [2,0]。我想将它转换为[2,7]。我试图train['finally'] = train['finally'].map({0:7}) 这是怎么train['finally']看起来像 0 [zero, zero, zero, zero, 2, zero, zero, zer

0热度

1回答

将R中的表转换为单行

我想将具有n行和n列的数据帧转换为单行，并添加了列名和行名称例如，我想将下表转换为单行 Country Percentage United States 97.89% United Kingdom 0.65% Switzerland 0.50% Ireland 0.48% Singapore 0.45% Hong Kong

0热度

1回答

不能从回路R

我已经创建了一个循环取的所有值从人物A保存的值： [1] "Arsenal" "Aston Villa" "Cardiff City" "Chelsea" "Crystal Palace" [6] "Everton" ... ，并通过数据帧england运行，并且找到其他变量的所有的对应值。 for (i in 1:length(teams)) { print(sum(england

0热度

1回答

如何使用NA识别和替换数据框中的超范围数据？

如何使用NA识别和替换数据框中的超范围数据？我目前使用下面的代码来识别使用盒图的异常值，然后手动确定哪些异常值超出范围（例如，比例是1-4，数据点是负值）并删除它们。 >boxplot(data$scale1, data = data) >outliers <- boxplot(cw$N, plot=FALSE)$out >outliers >data$scale1[data$scale1

0热度

1回答

作出具体列只新的数据帧熊猫

让说，我有 sim_users critic critic Claudia Puig Gene Seymour Jack Matthews Lisa Rose Mick LaSalle Toby 0 Claudia Puig 1.000000 0.314970 0.028571 0.566947 0.566947 0.893405 1 Gene Seymour 0.314970 1.00000

1热度

2回答

地图上2列大熊猫

我有一个数据帧，看起来像： Col1 Col2 0 A PY 1 B PA 2 C PB 3 B PB 而这一系列： Value Col1 Col2 A PY 20 B PB 30 我愿做一个映射，如果该系列产品具有一个索引（例如它只是相当简单： df['Value'] = df

1热度

3回答

熊猫：由范围

分类列值我有一个数据帧，DF这样 a b c 1 0 2 5 7 8 4 1 3 3 4 6 5 2 5 ....... 现在我想用以下范围 0-3 = 1 4-6 = 2 7-9 = 3 列值小于10，以代替那些在数据，所以范围在0-9之内。我想和范围内的类别，以取代上述的数据帧的值和输出应该是这样的 a b c 1 1 1 2 3 3 2 1 1 1 2 2

-1热度

1回答

使用熊猫和随机模块创建数据帧

我想用pandas创建一个数据框，其中1列是'EmployeeID'，第二个是'技能'集，他具有1到5的范围。'EmployeeID'列应该有唯一值，而“技能”列可以具有重复值。 1.我试图产生“雇员”使用下面的代码： df = pd.DataFrame({'EmployeeID':[random.sample(range(123456,135000),100)]}) 但结果不是我所期待。它产

0热度

1回答

JSONDecodeError：期望值：第1行第1列（char 0）在Panda的For循环中

通过迭代遍历熊猫中的for循环，我为行和列创建了具有相同信息的矩阵。这里是我当前的代码： for i in range(60): eachMatrix = pd.DataFrame(index=df.WordTeams[i],columns=df.WordTeams[i]) eachMatrixcols = eachMatrix.columns.values eachMatrixInde

2热度

1回答

如何从熊猫数据框中动态选择一个子集？

我是新来的python，我想做这个特殊的任务，这对我来说似乎并不明显。我甚至不知道要搜索什么才能找到它。首先这里是代码片段，我会解释我的目标在它下面： import pandas as pd mycolumns = ['col1', 'col2', 'col3'] df = pd.DataFrame(data=[[**1**,2,3,**1**,5,6],[1,2,3,4,5,6]],