dataframe

    1热度

    1回答

    我试图执行基于http://tidytextmining.com/sentiment.html#the-sentiments-dataset情感分析。在执行情感分析之前,我需要将我的数据集转换为整洁的格式。 我的数据集的形式: x <- c("test1" , "test2") y <- c("this is test text1" , "this is test text2") res <-

    1热度

    2回答

    我有一个数据框,其中的列看起来像一个日期,但实际上是一个对象(type 'O')。该列中的某些值的值为9999-12-31 00:00:00.000。它们在某种意义上是一个指标,表明一行是“无限期”有效的。 pd.to_datetime()不符合这些值,并给出“日期超出范围”错误。我试图编写一个函数将值转换为一个字符串,然后检查第一个字符以查看它是否为9,但这也不起作用。 只要你相信,我已经试过的

    1热度

    2回答

    这应该很简单,但我无法弄清楚最简单的方法。我想将列减少到更简单的范围。看看下面的数据集: white black 2000 2100 2050 2000 2100 2200 2150 2300 2240 2240 2300 2550 2400 2450 2500 2150 2850 2000 我想创建一个新的列白色$秩和黑色$排名在数值范围2000-2100

    -2热度

    3回答

    年 合并两只大熊猫DataFrames我想两个dataframes合并在一起,但每次我试图合并我收到以下消息时: 类型错误:合并()失踪1个人需要的位置参数:“右” d = {'year': [2001, 2002], 'wsp': [0.51, 0.42]} df = pd.DataFrame(data=d) d2 = {'year': [2001, 2002], 'age': [50, 6

    0热度

    2回答

    我有一个名为'quality'的数字值为1到9的pandas数据框,我想按如下方式转换这些值: 将5或更少的值转换为0,并且大于或等于6被转换为1。 这行代码的工作原理:5被映射为0,和6被映射到1。 酒[ 'quality_target'] = wine.quality.map({5- :0,6:1}) 但是,这行代码会引发错误。 酒[ 'quality_target'] = wine.qual

    -3热度

    1回答

    我已经编写了以下代码来比较两个市场,如果我们单独提供数据框名称,代码正在工作。 enter image description here for(i in 1:nrow(Market_SystemA)) { A <- Market_SystemA[i,2] B <- Market_SystemB[i,3] MarketA <- data.frame(A)

    -1热度

    2回答

    检查数据框中某列的格式是什么命令,即数字,字符,阶乘等。 我已经在网上搜索了;显然我使用了错误的搜索条件。

    1热度

    1回答

    我正在寻找相当于R的mutate,它允许您在创建它们之后立即引用已定义的变量在相同的mutate调用内。 new_df <- old_df %>% mutate(new_col = ifelse(something, 0, 1), newer_col = ifelse(new_col == 0, 'yay', 'nay')) 在python熊猫中寻找等价物。 如果我创建

    1热度

    2回答

    我有一个数据帧寻找这样的: SubjectID Activity V1 V2 V3 1 2 S 0.2571778 -0.02328523 -0.01465376 2 2 W 0.2860267 -0.01316336 -0.11908252 3 3 R 0.2754848 -0.02605042 -0.11815167 4 3 W 0.2702982 -

    1热度

    1回答

    我有从CSV文件导入多个时间序列数据。 这些数据都有时间戳,但时间戳并不总是一致的: 时间系列1: UUT Data DateTime 2017-11-21 18:54:31 uut1 1 2017-11-22 02:26:48 uut1 2 2017-11-22 10:19:44 uut1 3 2017-11-22 15:11:28 uut1 6 201