dataframe

1热度

1回答

我试图执行基于http://tidytextmining.com/sentiment.html#the-sentiments-dataset情感分析。在执行情感分析之前，我需要将我的数据集转换为整洁的格式。我的数据集的形式： x <- c("test1" , "test2") y <- c("this is test text1" , "this is test text2") res <-

1热度

2回答

根据条件改变熊猫的日期值并转换为日期时间

我有一个数据框，其中的列看起来像一个日期，但实际上是一个对象（type 'O'）。该列中的某些值的值为9999-12-31 00:00:00.000。它们在某种意义上是一个指标，表明一行是“无限期”有效的。 pd.to_datetime()不符合这些值，并给出“日期超出范围”错误。我试图编写一个函数将值转换为一个字符串，然后检查第一个字符以查看它是否为9，但这也不起作用。只要你相信，我已经试过的

1热度

2回答

根据截止值创建列

这应该很简单，但我无法弄清楚最简单的方法。我想将列减少到更简单的范围。看看下面的数据集： white black 2000 2100 2050 2000 2100 2200 2150 2300 2240 2240 2300 2550 2400 2450 2500 2150 2850 2000 我想创建一个新的列白色$秩和黑色$排名在数值范围2000-2100

-2热度

3回答

上

年合并两只大熊猫DataFrames我想两个dataframes合并在一起，但每次我试图合并我收到以下消息时：类型错误：合并（）失踪1个人需要的位置参数：“右” d = {'year': [2001, 2002], 'wsp': [0.51, 0.42]} df = pd.DataFrame(data=d) d2 = {'year': [2001, 2002], 'age': [50, 6

0热度

2回答

将新值映射到DataFrame列

我有一个名为'quality'的数字值为1到9的pandas数据框，我想按如下方式转换这些值：将5或更少的值转换为0，并且大于或等于6被转换为1。这行代码的工作原理：5被映射为0，和6被映射到1。酒[ 'quality_target'] = wine.quality.map（{5- ：0，6：1}）但是，这行代码会引发错误。酒[ 'quality_target'] = wine.qual

-3热度

1回答

如何使用变量值在R中调用数据帧

我已经编写了以下代码来比较两个市场，如果我们单独提供数据框名称，代码正在工作。 enter image description here for(i in 1:nrow(Market_SystemA)) { A <- Market_SystemA[i,2] B <- Market_SystemB[i,3] MarketA <- data.frame(A)

-1热度

2回答

如何检查我的数据所在的格式？

检查数据框中某列的格式是什么命令，即数字，字符，阶乘等。我已经在网上搜索了;显然我使用了错误的搜索条件。

1热度

1回答

在熊猫数据框中使用最近创建的属性来创建新属性

我正在寻找相当于R的mutate，它允许您在创建它们之后立即引用已定义的变量在相同的mutate调用内。 new_df <- old_df %>% mutate(new_col = ifelse(something, 0, 1), newer_col = ifelse(new_col == 0, 'yay', 'nay')) 在python熊猫中寻找等价物。如果我创建

1热度

2回答

如何跨越制表（XTABS）多瓦尔，但相同的击穿

我有一个数据帧寻找这样的： SubjectID Activity V1 V2 V3 1 2 S 0.2571778 -0.02328523 -0.01465376 2 2 W 0.2860267 -0.01316336 -0.11908252 3 3 R 0.2754848 -0.02605042 -0.11815167 4 3 W 0.2702982 -

1热度

1回答

熊猫concat多个时间序列与分组和延长缺失数据

我有从CSV文件导入多个时间序列数据。这些数据都有时间戳，但时间戳并不总是一致的：时间系列1： UUT Data DateTime 2017-11-21 18:54:31 uut1 1 2017-11-22 02:26:48 uut1 2 2017-11-22 10:19:44 uut1 3 2017-11-22 15:11:28 uut1 6 201