stringr

    -1热度

    2回答

    示例数据帧: name <- c("Smith John Michael","Smith, John Michael","Smith John, Michael","Smith-John Michael","Smith-John, Michael") df <- data.frame(name) df name 1 Smith John Michael 2 Smith,

    0热度

    1回答

    我想在R中的stringr中使用str_view来查找以“y”开头的所有单词以及以“x”结尾的所有单词。我有一个由Corpora生成的单词列表,但每当我启动代码时,它都会返回一个空白视图。 Common_words<-corpora("words/common") #start with y start_with_y <- str_view(Common_words, "^[y]", mat

    0热度

    2回答

    我试图创建一个代码,可以在最后(或字符串的开头)找到“$^$”。 这里是我的代码有 library(stringr) literalstring <- c("$$^dfgerg$^$", "$^$sgsgr", "gheugberhu$^$fgdbrbe") 在这里,我创建一个随机字符串后($^$)来测试我的代码 str_view_all(literalstring, "($^$)$" ,

    2热度

    2回答

    嘿,我有一个数据集,我手工采摘以下7项为例: mydf <- data.frame(transmission = c('Auto(L3)','Auto(L4)','Auto (S4)','Automatic (6-spd)','Automatic (L3)', 'Automatic (variable gear ratios)', 'Manual 4-spd')) 这是 trans

    -2热度

    1回答

    我有一个Tibble,我想从中删除前四个字母。我无法做到。我试过substr()和substring(),但它们倾向于合并所有行。 这里是我的数据: dput(a) structure(list(value = c("ABC-EFGH-1234IJK-45K", "IJK-LOKK-TIU" )), .Names = "value", row.names = c(NA, -2L), class

    0热度

    4回答

    使用下面的示例,我想按CaseWorker分组数据帧,然后客户端,然后为每个客户端组确定是否在“任务”与“任务2”中的任务列表相同。 如果每个处于“任务2”但不是“任务”的任务都可以提取并显示在新的列或数据框中,我会很高兴有一个简单的真或假,或更好。 所以基本上我需要确保“任务”和“任务2”为每个客户端包含相同的条目。 如果可能的话,我想坚持使用Dplyr和Stringr,或者至少留在Tidyve

    1热度

    1回答

    我正在寻找一种方式,每个以下字符 x <- c('test_(match)','test_xMatchToo','test_a','test_b') ,当且仅当全部更换_(由比如说'') _之后是(或x。所以输出想要的是: x <- c('test(match)','testxMatchToo','test_a','test_b') 这是怎么做到的(使用任何包是好的)?

    0热度

    1回答

    因此,我有下面的基本数据框,其中包含用逗号分隔的长字符串。我使用Tidyr的“单独”来创建新列。 如何添加另一个新列,并计算每个包含答案的人有多少个新列? (没有NA)。 我想通过计算有多少个由逗号分隔的字符串元素,可以在分离之后或之前统计这些列? 任何帮助,将不胜感激。我想留在Tidyverse和dplyr。 Name<-c("John","Chris","Andy") Goal<-c("G

    1热度

    2回答

    尝试重现http://tidytextmining.com/twitter.html中的示例时出现问题。 基本上我想,以保持stop_Word代码 library(tidytext) library(stringr) reg <- "([^A-Za-z_\\d#@']|'(?![A-Za-z_\\d#@]))" tidy_tweets <- tweets %>% mutate(

    0热度

    1回答

    之间的差异创建组,我想如果可能使用dplyr和stringr,或Tidyverse内至少留下来实现以下目标: 我需要通过CaseWorker和Client对数据进行分组,并比较“任务”和“任务2”以查找“任务2”中不在“任务”中的所有类别以及“任务2”类别的相关总时间。 “任务”可以包含不属于“任务2”的类别,所以我只对在“任务2”中找到不属于“任务”的类别感兴趣。能够创建新列以显示“任务2”中而