stringr

    1热度

    1回答

    我有一些麻烦,在R的正则表达式字符串我试图使用正则表达式从字符串(从网上刮)提取标签如下: str <- "\n\n\n \n\n\n “Don't cry because it's over, smile because it happened.”\n ―\n Dr. Seuss\n\n\n\n\n \n tags:\n attributed-no-source,\n cry,\n c

    -1热度

    1回答

    我有一个数据框,看起来像下面的示例df,它包含一个字符变量VAR。 df<-data.frame(ID = 1:2, VAR = c("VAL1\r\nVAL2\r\nVAL8","VAL2\r\nVAL5"), stringsAsFactors = FALSE) # ID VAR # 1 1 VAL1\r\nVAL2\r\nVAL8 # 2 2

    3热度

    1回答

    我在这里搜索了很多正则表达式的答案,但找不到解决这类问题的方法。 我的数据集是维基百科链接tibble: library(tidytext) library(stringr) text.raw <- "Berthold Speer was een [[Duitsland (hoofdbetekenis)|Duits]] [[architect]]." 我试图清理从链接我的文字。 此: st

    0热度

    1回答

    我需要搜索关键字的文本字符串,然后在R数据框中指定一个类别。这会产生一个问题,我有来自多个类别的关键字。我想要轻松地提取多个类别所代表的行,以便我可以手动评估它们并分配正确的类别。 为此,我尝试添加一个计数列以显示每个字符串中表示了多少个类别。 使用下面链接的两种解决方案的组合,我已经成功地得到一部分的方式,但我仍然没有得到正确的输出 Partial animal string matching

    0热度

    1回答

    我有一个关键字列表: library(stringr) words <- as.character(c("decomposed", "no diagnosis","decomposition","autolysed","maggots", "poor body", "poor","not suitable", "not possible")) 我想匹配这些关键字的数据帧列文本(DF $文本)

    0热度

    2回答

    功能是否与正则表达式匹配,我想使用匹配值填充新功能,否则NA。 我发现this后,试图用我的问题的答案。 library(dplyr) library(stringr) dat.p <- dat.p %>% mutate( cad = ifelse(str_locate(text_field, "\\[[^]]*\\]"), str_extract(text

    1热度

    3回答

    请看下面的例子匹配 > data_text <- data.frame(text = c('where', 'are', 'you'), blob = c('little', 'nice', 'text')) > data_text # A tibble: 3 x 2 text blob <chr> <chr> 1 where little 2 ar

    -2热度

    1回答

    我试图从向量提取年龄(数值),tryied以下,但凭着努力 例子: - a <- "age-32 agge32 age 45 aage 56 agee 34" b <- gsub("[Aa]g.e?"," age ",a) sa <- strsplit(x=b, split="\\s") age <- stringr::str_extract(sa, "(age?)(

    0热度

    2回答

    在我的数据(这是文本)中,有缩写。 是否有任何函数或代码在文本中搜索缩写?例如,检测3-4-5大写字母缩写并让我计算它们发生的频率。 非常感谢!

    2热度

    2回答

    stringr包提供了很好的字符串函数。 要搜索的字符串(不区分大小写) 一个可以使用 stringr::str_detect('TOYOTA subaru',ignore.case('toyota')) 这工作,但在警告 请使用(固定|科尔|正则表达式)(X, ignore_case = TRUE)而不是ignore.case(x) 什么是right wa重写它?