tidyr

1热度

1回答

我有一个看起来像这样的数据： fakedata<-data.frame( experiment=c(1,2), reading1 = c("[1,2,3]","[4,5,6]"), reading2 = c("[a,b,c]","[d,e,f]") ) 那就是： experiment reading1 reading2 1 1 [1,2,3] [a,b,c]

0热度

2回答

如何利用独特的和tidyR

我工作的一个data.table像这样一列分割我的专栏： A <- c("a;b;c","a;a;b","d;a;b","f;f;f") df <- data.frame(A) 我想这列分为3列是这样的： seg1 seg2 seg3 1 a b c 2 a b <NA> 3 d a b 4 f <NA> <NA> 这里的事情是，当我分裂每行";"我需要保持行unique。

1热度

3回答

重塑重复行的列标题

我试图重塑使用tidyR。下面一个数据帧是数据帧： data <- data.frame(class_name=c("date","date","educational","qualif","date","date", "educational","qualif"), text_val=c("2000","2003","ILLINOIS INSTITUTE OF TECHNOLO

2热度

4回答

创建与我的ID相关的不同月份的矢量

我是R新手，现在我知道dplyr。我需要在我的数据框中的每个Id中关联不同的月份（列YM）。我很困扰它，因为我甚至不知道把它们正确地与id相关联的时候把它放在哪里，可能是我可以通过我的id访问的列表？对于协会id月，我想到了spread函数tidyr，但我无法做到这一点。这里的数据集的示例： Id YM 103285 201401 103285 201402 103285 201410

0热度

1回答

在使用聚合函数tidyverse后无法用mutate创建新变量。

嗨，每一个这是我面临的麻烦。我有一个数据帧，它是在一个错误的格式。这样。 id | 1/3/2017| 1/4/2017 | a | 4 | 4 | b | 5 | 5 | c | 6 | 6 | d | 7 | 7 | 显然，我想这样的整齐格式，具有00：00小时的附加列 id | date | hour |data| a | 1/3/2017 |00:00:00 |4 | b | 1/3/

1热度

1回答

如何在R tm_map gsub中从列表中进行大规模替换/标记？

有没有人设法创建一个大型的查找/替换函数/工作代码片段，在数据框中交换出已知的bigrams？下面是一个例子。我能够不用onesie-twosie替换，但我真的想利用我想找到的大约800个术语的已知词典 - 替换，以便在DTM生成之前将它们转换为单词单元。例如，我想将“Google Analytics”转换为“google-analytics”。我知道这在理论上是可行的;从本质上讲，自定义停用

-2热度

1回答

是否存在与SELECT ... COUNT（*）... GROUP BY ...等价的等价物？

我想了解如何完成“group by”和“count”功能。我看了好几篇文章，没有找到我想要的东西;如果有已经发布的答案，我会很感激链接。例如，我正在查找数据中的异常值;我想知道哪些地方收到的最“坏”的措施： place = rep(c('AL','AK','AZ','AR','CA','CO','CT','DE','FL','GA','HI'), times=4) measure = rep(

-1热度

2回答

获得类似对之和乘以结果以获得相同的数据帧中的新列

df1 <- data.frame(first_pair1_1=c(1,2,3,1,2,3,4),second_pair1_1=c(1,3,3,1,4,3,4),third_pair1_1=c(1,3,3,1,4,3,4),first_pair1_2=c(7,4,3,1,4,3,4),second_pair1_2=c(7,4,3,1,4,3,4),third_pair1_2=c(1,3,3,1,4

0热度

1回答

“'到'缺少'在单独的列（tidyr）

我构建了10篇论文的元数据。该dput()结果介绍如下： > dput(itemlist) structure(list(title = c("钱学森工程科学思想的实践者 [科普文章]", "超高周疲劳裂纹萌生与初始扩展的特征尺度 [科普文章]", "Proceedings of International conference on Airworthiness & Fatigue – 7th

1热度

1回答

在嵌套数据帧列上使用mutate_at（）生成多个未发生列

我正在使用dplyr,tidyr和purrr进行实验。我的数据是这样的： library(tidyverse) set.seed(123) df <- data_frame(X1 = rep(LETTERS[1:4], 6), X2 = sort(rep(1:6, 4)), ref = sample(1:50, 24), sampl1 = sa