dataframe

    0热度

    1回答

    我有一个熊猫数据帧,看起来像这样 ​​ 每一行里面包含一些整数,列表和零字符串 我试图取代列表中的0与另一个值一样,如 [2,0]。我想将它转换为[2,7]。 我试图train['finally'] = train['finally'].map({0:7}) 这是怎么train['finally']看起来像 0 [zero, zero, zero, zero, 2, zero, zero, zer

    0热度

    1回答

    我想将具有n行和n列的数据帧转换为单行,并添加了列名和行名称 例如,我想将下表转换为单行 Country Percentage United States 97.89% United Kingdom 0.65% Switzerland 0.50% Ireland 0.48% Singapore 0.45% Hong Kong

    0热度

    1回答

    我已经创建了一个循环取的所有值从人物A保存的值: [1] "Arsenal" "Aston Villa" "Cardiff City" "Chelsea" "Crystal Palace" [6] "Everton" ... ,并通过数据帧england运行,并且找到其他变量的所有的对应值。 for (i in 1:length(teams)) { print(sum(england

    0热度

    1回答

    如何使用NA识别和替换数据框中的超范围数据? 我目前使用下面的代码来识别使用盒图的异常值,然后手动确定哪些异常值超出范围(例如,比例是1-4,数据点是负值)并删除它们。 >boxplot(data$scale1, data = data) >outliers <- boxplot(cw$N, plot=FALSE)$out >outliers >data$scale1[data$scale1

    0热度

    1回答

    让说,我有 sim_users critic critic Claudia Puig Gene Seymour Jack Matthews Lisa Rose Mick LaSalle Toby 0 Claudia Puig 1.000000 0.314970 0.028571 0.566947 0.566947 0.893405 1 Gene Seymour 0.314970 1.00000

    1热度

    2回答

    我有一个数据帧,看起来像: Col1 Col2 0 A PY 1 B PA 2 C PB 3 B PB 而这一系列: Value Col1 Col2 A PY 20 B PB 30 我愿做一个映射,如果该系列产品具有一个索引(例如它只是相当简单: df['Value'] = df

    1热度

    3回答

    分类列值我有一个数据帧,DF这样 a b c 1 0 2 5 7 8 4 1 3 3 4 6 5 2 5 ....... 现在我想用以下范围 0-3 = 1 4-6 = 2 7-9 = 3 列值小于10,以代替那些在数据,所以范围在0-9之内。 我想和范围内的类别,以取代上述的数据帧的值和输出应该是这样的 a b c 1 1 1 2 3 3 2 1 1 1 2 2

    -1热度

    1回答

    我想用pandas创建一个数据框,其中1列是'EmployeeID',第二个是'技能'集,他具有1到5的范围。'EmployeeID'列应该有唯一值,而“技能”列可以具有重复值。 1.我试图产生“雇员”使用下面的代码: df = pd.DataFrame({'EmployeeID':[random.sample(range(123456,135000),100)]}) 但结果不是我所期待。它产

    0热度

    1回答

    通过迭代遍历熊猫中的for循环,我为行和列创建了具有相同信息的矩阵。 这里是我当前的代码: for i in range(60): eachMatrix = pd.DataFrame(index=df.WordTeams[i],columns=df.WordTeams[i]) eachMatrixcols = eachMatrix.columns.values eachMatrixInde

    2热度

    1回答

    我是新来的python,我想做这个特殊的任务,这对我来说似乎并不明显。我甚至不知道要搜索什么才能找到它。首先这里是代码片段,我会解释我的目标在它下面: import pandas as pd mycolumns = ['col1', 'col2', 'col3'] df = pd.DataFrame(data=[[**1**,2,3,**1**,5,6],[1,2,3,4,5,6]],