stringr

-1热度

1回答

我想拆分此字符串中的几个子： BAA33520.2 | /基因= “vpf402”/产品= “Vpf402” | GI：8272373 | AB012574 |加入{7347：7965， 0 ：591} 分隔符是| （ascii 124）。它适用于所有其他分隔符，但不适用于此分隔符。

3热度

1回答

检测字符串变量中的单词列表并将匹配的单词提取到数据框中的新变量

我有一个两个变量的数据框，其中一个是字符矢量。 “MyVector”中的每一行都包含一个只有一个名字的字符串（即“Pete”）。该名称在字符串中的位置可能有所不同。我想创建一个代码，它将使用字符串中的名称与列表中的名称匹配，并将该名称提取到数据框中的新变量中。如果名称总是在向量“MyVector”中的相同位置，我会创建一个新变量作为MyVector的子字符串，将名称拉出到新列中。我试过从Str

0热度

1回答

通过数据框应用

我有一个简单的数据框，有两列和两行。我试图遍历每一行以找出第二列中不在第一列的单词。样本数据： testdata <- data.frame(rbind(one = c("mango rasberry","mango rasberry blueberry"), two = c("kiwi strawberry","kiwi strawberry passionfruit")))

3热度

4回答

R中

我知道有对堆栈溢出有关正则表达式的许多问题，除了删除一切时期和数字从字符串的正则表达式，但我不能与现有的帮助下，我已经看到了完成这个一个简单的任务。这是我的数据： a<-c("Los Angeles, CA","New York, NY", "San Jose, CA") b<-c("c(34.0522, 118.2437)","c(40.7128, 74.0059)","c(37.3382,

1热度

2回答

字符向量列表的混合数据帧到统一的数据帧

我想分解字符串作为列使用stringr包。 > df <- dput(head(facs,3)) structure(list(geo_accession = structure(1:3, .Names = c("V2", "V3", "V4"), .Label = c("GSM1494875", "GSM1494877", "GSM1494879", "GSM1494881", "GSM1

2热度

1回答

R：如何删除包含特定字符模式的字符串？

我试图删除包含特定字符模式的字符串。我的数据看起来somethink这样的： places <- c("copenhagen", "copenhagens", "Berlin", "Hamburg") 我想删除包含“哥本哈根协议”的所有元素，即"copenhagen"和"copenhagens"。但我只能想出下面的代码： library(stringr) replacement.vector

10热度

1回答

提取R中的其他两个字符串之间的字符串

我想找到一种简单的方法来提取出现在两个已知子字符串之间的未知子字符串（可能是任何东西）。例如，我有一个字符串： a<-" anything goes here, STR1 GET_ME STR2, anything goes here" 我需要提取该字符串GET_ME这是STR1和STR2之间（没有空格）。我想str_extract(a, "STR1 (.+) STR2")，但我得到了整场比赛

1热度

3回答

连续两场比赛

我想写一个正则表达式表达（R下）匹配所有包含在本文中3个字母的单词： tex= "As you are now so once were we" 我第一次尝试是选择包含单词3个字母用空格包围： matches=str_match_all(tex," [a-z]{3} ") 它应该匹配“你”，“是”和“现在”。但是，因为一些这些空间都匹配的字符串之间共享，我只得到“你”和“现在”。有没有办

0热度

2回答

如何有效R中

我只是在学习科学数据提取[R在data.table列从文本的数字，并用几行从数据中提取号码（使用data.table）： library(stringr) library(data.table) prods[, weights := str_extract(NombreProducto, "([0-9]+)[kgKG]+")] prods[, weights := str_extract(w

2热度

2回答

的R - 查找包含所有字符串/图案所有矢量元素 - str_detect的grep

样本数据 files.in.path = c("a.4.0. name 2015 - NY.RDS", "b.4.0. name 2016 - CA.RDS", "c.4.0. name 2015 - PA.RDS") strings.to.find = c("4.0", "PA") 欲表示包含所有strings.to.find所有元素的逻辑向量。结果想：