stringr

-1热度

2回答

示例数据帧： name <- c("Smith John Michael","Smith, John Michael","Smith John, Michael","Smith-John Michael","Smith-John, Michael") df <- data.frame(name) df name 1 Smith John Michael 2 Smith,

0热度

1回答

将str_view与R中的单词列表一起使用

我想在R中的stringr中使用str_view来查找以“y”开头的所有单词以及以“x”结尾的所有单词。我有一个由Corpora生成的单词列表，但每当我启动代码时，它都会返回一个空白视图。 Common_words<-corpora("words/common") #start with y start_with_y <- str_view(Common_words, "^[y]", mat

0热度

2回答

如何使用str_view在R中的字符串中匹配“$^$”

我试图创建一个代码，可以在最后（或字符串的开头）找到“$^$”。这里是我的代码有 library(stringr) literalstring <- c("$$^dfgerg$^$", "$^$sgsgr", "gheugberhu$^$fgdbrbe") 在这里，我创建一个随机字符串后（$^$）来测试我的代码 str_view_all(literalstring, "($^$)$" ,

2热度

2回答

如何使用stringr和正则表达式来转换字符串（更改，保留，提取）与一些例外？

嘿，我有一个数据集，我手工采摘以下7项为例： mydf <- data.frame(transmission = c('Auto(L3)','Auto(L4)','Auto (S4)','Automatic (6-spd)','Automatic (L3)', 'Automatic (variable gear ratios)', 'Manual 4-spd')) 这是 trans

-2热度

1回答

忽略R中的前四个字符

我有一个Tibble，我想从中删除前四个字母。我无法做到。我试过substr()和substring()，但它们倾向于合并所有行。这里是我的数据： dput(a) structure(list(value = c("ABC-EFGH-1234IJK-45K", "IJK-LOKK-TIU" )), .Names = "value", row.names = c(NA, -2L), class

0热度

4回答

使用Dplyr的“group_by”创建组，然后使用Stringr查找组之间的差异

使用下面的示例，我想按CaseWorker分组数据帧，然后客户端，然后为每个客户端组确定是否在“任务”与“任务2”中的任务列表相同。如果每个处于“任务2”但不是“任务”的任务都可以提取并显示在新的列或数据框中，我会很高兴有一个简单的真或假，或更好。所以基本上我需要确保“任务”和“任务2”为每个客户端包含相同的条目。如果可能的话，我想坚持使用Dplyr和Stringr，或者至少留在Tidyve

1热度

1回答

我如何替换字符串的一部分，如果它被包含在一个模式

我正在寻找一种方式，每个以下字符 x <- c('test_(match)','test_xMatchToo','test_a','test_b') ，当且仅当全部更换_（由比如说''） _之后是(或x。所以输出想要的是： x <- c('test(match)','testxMatchToo','test_a','test_b') 这是怎么做到的（使用任何包是好的）？

0热度

1回答

使用Tidyr的“分离”将字符串分隔成多个列，然后使用Counts创建新列

因此，我有下面的基本数据框，其中包含用逗号分隔的长字符串。我使用Tidyr的“单独”来创建新列。如何添加另一个新列，并计算每个包含答案的人有多少个新列？（没有NA）。我想通过计算有多少个由逗号分隔的字符串元素，可以在分离之后或之前统计这些列？任何帮助，将不胜感激。我想留在Tidyverse和dplyr。 Name<-c("John","Chris","Andy") Goal<-c("G

1热度

2回答

tidytext示例使用管道过滤器错误

尝试重现http://tidytextmining.com/twitter.html中的示例时出现问题。基本上我想，以保持stop_Word代码 library(tidytext) library(stringr) reg <- "([^A-Za-z_\\d#@']|'(?![A-Za-z_\\d#@]))" tidy_tweets <- tweets %>% mutate(

0热度

1回答

与Dplyr的“GROUP_BY”，然后使用Stringr或一组操作查找组

之间的差异创建组，我想如果可能使用dplyr和stringr，或Tidyverse内至少留下来实现以下目标：我需要通过CaseWorker和Client对数据进行分组，并比较“任务”和“任务2”以查找“任务2”中不在“任务”中的所有类别以及“任务2”类别的相关总时间。 “任务”可以包含不属于“任务2”的类别，所以我只对在“任务2”中找到不属于“任务”的类别感兴趣。能够创建新列以显示“任务2”中而