tidyr

    1热度

    1回答

    我有一个看起来像这样的数据: fakedata<-data.frame( experiment=c(1,2), reading1 = c("[1,2,3]","[4,5,6]"), reading2 = c("[a,b,c]","[d,e,f]") ) 那就是: experiment reading1 reading2 1 1 [1,2,3] [a,b,c]

    0热度

    2回答

    我工作的一个data.table像这样一列分割我的专栏: A <- c("a;b;c","a;a;b","d;a;b","f;f;f") df <- data.frame(A) 我想这列分为3列是这样的: seg1 seg2 seg3 1 a b c 2 a b <NA> 3 d a b 4 f <NA> <NA> 这里的事情是,当我分裂每行";"我需要保持行unique。

    1热度

    3回答

    我试图重塑使用tidyR。下面一个数据帧是数据帧: data <- data.frame(class_name=c("date","date","educational","qualif","date","date", "educational","qualif"), text_val=c("2000","2003","ILLINOIS INSTITUTE OF TECHNOLO

    2热度

    4回答

    我是R新手,现在我知道dplyr。我需要在我的数据框中的每个Id中关联不同的月份(列YM)。我很困扰它,因为我甚至不知道把它们正确地与id相关联的时候把它放在哪里,可能是我可以通过我的id访问的列表? 对于协会id月,我想到了spread函数tidyr,但我无法做到这一点。这里的数据集的示例: Id YM 103285 201401 103285 201402 103285 201410

    0热度

    1回答

    嗨,每一个这是我面临的麻烦。 我有一个数据帧,它是在一个错误的格式。 这样。 id | 1/3/2017| 1/4/2017 | a | 4 | 4 | b | 5 | 5 | c | 6 | 6 | d | 7 | 7 | 显然,我想这样的整齐格式,具有00:00小时的附加列 id | date | hour |data| a | 1/3/2017 |00:00:00 |4 | b | 1/3/

    1热度

    1回答

    有没有人设法创建一个大型的查找/替换函数/工作代码片段,在数据框中交换出已知的bigrams? 下面是一个例子。我能够不用onesie-twosie替换,但我真的想利用我想找到的大约800个术语的已知词典 - 替换,以便在DTM生成之前将它们转换为单词单元。例如,我想将“Google Analytics”转换为“google-analytics”。 我知道这在理论上是可行的;从本质上讲,自定义停用

    -2热度

    1回答

    我想了解如何完成“group by”和“count”功能。我看了好几篇文章,没有找到我想要的东西;如果有已经发布的答案,我会很感激链接。 例如,我正在查找数据中的异常值;我想知道哪些地方收到的最“坏”的措施: place = rep(c('AL','AK','AZ','AR','CA','CO','CT','DE','FL','GA','HI'), times=4) measure = rep(

    -1热度

    2回答

    df1 <- data.frame(first_pair1_1=c(1,2,3,1,2,3,4),second_pair1_1=c(1,3,3,1,4,3,4),third_pair1_1=c(1,3,3,1,4,3,4),first_pair1_2=c(7,4,3,1,4,3,4),second_pair1_2=c(7,4,3,1,4,3,4),third_pair1_2=c(1,3,3,1,4

    0热度

    1回答

    我构建了10篇论文的元数据。该dput()结果介绍如下: > dput(itemlist) structure(list(title = c("钱学森工程科学思想的实践者 [科普文章]", "超高周疲劳裂纹萌生与初始扩展的特征尺度 [科普文章]", "Proceedings of International conference on Airworthiness & Fatigue – 7th

    1热度

    1回答

    我正在使用dplyr,tidyr和purrr进行实验。我的数据是这样的: library(tidyverse) set.seed(123) df <- data_frame(X1 = rep(LETTERS[1:4], 6), X2 = sort(rep(1:6, 4)), ref = sample(1:50, 24), sampl1 = sa