stringr

    -1热度

    1回答

    我想拆分此字符串中的几个子: BAA33520.2 | /基因= “vpf402”/产品= “Vpf402” | GI:8272373 | AB012574 |加入{7347:7965, 0 :591} 分隔符是| (ascii 124)。 它适用于所有其他分隔符,但不适用于此分隔符。

    3热度

    1回答

    我有一个两个变量的数据框,其中一个是字符矢量。 “MyVector”中的每一行都包含一个只有一个名字的字符串(即“Pete”)。该名称在字符串中的位置可能有所不同。我想创建一个代码,它将使用字符串中的名称与列表中的名称匹配,并将该名称提取到数据框中的新变量中。 如果名称总是在向量“MyVector”中的相同位置,我会创建一个新变量作为MyVector的子字符串,将名称拉出到新列中。 我试过从Str

    0热度

    1回答

    我有一个简单的数据框,有两列和两行。我试图遍历每一行以找出第二列中不在第一列的单词。样本数据: testdata <- data.frame(rbind(one = c("mango rasberry","mango rasberry blueberry"), two = c("kiwi strawberry","kiwi strawberry passionfruit")))

    3热度

    4回答

    我知道有对堆栈溢出有关正则表达式的许多问题,除了删除一切时期和数字从字符串的正则表达式,但我不能与现有的帮助下,我已经看到了完成这个一个简单的任务。这是我的数据: a<-c("Los Angeles, CA","New York, NY", "San Jose, CA") b<-c("c(34.0522, 118.2437)","c(40.7128, 74.0059)","c(37.3382,

    1热度

    2回答

    我想分解字符串作为列使用stringr包。 > df <- dput(head(facs,3)) structure(list(geo_accession = structure(1:3, .Names = c("V2", "V3", "V4"), .Label = c("GSM1494875", "GSM1494877", "GSM1494879", "GSM1494881", "GSM1

    2热度

    1回答

    我试图删除包含特定字符模式的字符串。我的数据看起来somethink这样的: places <- c("copenhagen", "copenhagens", "Berlin", "Hamburg") 我想删除包含“哥本哈根协议”的所有元素,即"copenhagen"和"copenhagens"。 但我只能想出下面的代码: library(stringr) replacement.vector

    10热度

    1回答

    我想找到一种简单的方法来提取出现在两个已知子字符串之间的未知子字符串(可能是任何东西)。例如,我有一个字符串: a<-" anything goes here, STR1 GET_ME STR2, anything goes here" 我需要提取该字符串GET_ME这是STR1和STR2之间(没有空格)。 我想str_extract(a, "STR1 (.+) STR2"),但我得到了整场比赛

    1热度

    3回答

    我想写一个正则表达式表达(R下)匹配所有包含在本文中3个字母的单词: tex= "As you are now so once were we" 我第一次尝试是选择包含单词3个字母用空格包围: matches=str_match_all(tex," [a-z]{3} ") 它应该匹配“你”,“是”和“现在”。但是,因为一些这些空间都匹配的字符串之间共享,我只得到“你”和“现在”。 有没有办

    0热度

    2回答

    我只是在学习科学数据提取[R在data.table列从文本的数字,并用几行从数据中提取号码(使用data.table): library(stringr) library(data.table) prods[, weights := str_extract(NombreProducto, "([0-9]+)[kgKG]+")] prods[, weights := str_extract(w

    2热度

    2回答

    样本数据 files.in.path = c("a.4.0. name 2015 - NY.RDS", "b.4.0. name 2016 - CA.RDS", "c.4.0. name 2015 - PA.RDS") strings.to.find = c("4.0", "PA") 欲表示包含所有strings.to.find所有元素的逻辑向量。结果想: