stringr

1热度

1回答

我有一些麻烦，在R的正则表达式字符串我试图使用正则表达式从字符串（从网上刮）提取标签如下： str <- "\n\n\n \n\n\n “Don't cry because it's over, smile because it happened.”\n ―\n Dr. Seuss\n\n\n\n\n \n tags:\n attributed-no-source,\n cry,\n c

-1热度

1回答

将字符串拆分为长数据帧格式的值

我有一个数据框，看起来像下面的示例df，它包含一个字符变量VAR。 df<-data.frame(ID = 1:2, VAR = c("VAL1\r\nVAL2\r\nVAL8","VAL2\r\nVAL5"), stringsAsFactors = FALSE) # ID VAR # 1 1 VAL1\r\nVAL2\r\nVAL8 # 2 2

3热度

1回答

从字符串替换字符串的部分字符串

我在这里搜索了很多正则表达式的答案，但找不到解决这类问题的方法。我的数据集是维基百科链接tibble： library(tidytext) library(stringr) text.raw <- "Berthold Speer was een [[Duitsland (hoofdbetekenis)|Duits]] [[architect]]." 我试图清理从链接我的文字。此： st

0热度

1回答

根据R中的类别计算字符串中单词的出现次数

我需要搜索关键字的文本字符串，然后在R数据框中指定一个类别。这会产生一个问题，我有来自多个类别的关键字。我想要轻松地提取多个类别所代表的行，以便我可以手动评估它们并分配正确的类别。为此，我尝试添加一个计数列以显示每个字符串中表示了多少个类别。使用下面链接的两种解决方案的组合，我已经成功地得到一部分的方式，但我仍然没有得到正确的输出 Partial animal string matching

0热度

1回答

伯爵一号实例与R中没有重复计数

我有一个关键字列表： library(stringr) words <- as.character(c("decomposed", "no diagnosis","decomposition","autolysed","maggots", "poor body", "poor","not suitable", "not possible")) 我想匹配这些关键字的数据帧列文本（DF $文本）

0热度

2回答

基于正则表达式和正则表达式值改变数据框

功能是否与正则表达式匹配，我想使用匹配值填充新功能，否则NA。我发现this后，试图用我的问题的答案。 library(dplyr) library(stringr) dat.p <- dat.p %>% mutate( cad = ifelse(str_locate(text_field, "\\[[^]]*\\]"), str_extract(text

1热度

3回答

stringr：找到行，其中任何一列内容的正则表达式

请看下面的例子匹配 > data_text <- data.frame(text = c('where', 'are', 'you'), blob = c('little', 'nice', 'text')) > data_text # A tibble: 3 x 2 text blob <chr> <chr> 1 where little 2 ar

-2热度

1回答

R中提取数字值（从自由文本）

我试图从向量提取年龄（数值），tryied以下，但凭着努力例子： - a <- "age-32 agge32 age 45 aage 56 agee 34" b <- gsub("[Aa]g.e?"," age ",a) sa <- strsplit(x=b, split="\\s") age <- stringr::str_extract(sa, "(age?)(

0热度

2回答

在R中查找数据中的缩写

在我的数据（这是文本）中，有缩写。是否有任何函数或代码在文本中搜索缩写？例如，检测3-4-5大写字母缩写并让我计算它们发生的频率。非常感谢！

2热度

2回答

R：如何在使用str_detect时忽略大小写？

stringr包提供了很好的字符串函数。要搜索的字符串（不区分大小写）一个可以使用 stringr::str_detect('TOYOTA subaru',ignore.case('toyota')) 这工作，但在警告请使用（固定|科尔|正则表达式）（X， ignore_case = TRUE）而不是ignore.case（x）什么是right wa重写它？