stringr

    1热度

    1回答

    我想用零垫字符串(左侧),如果字符数为2 让数据框如下: df<-data.frame(a=c("352","35","54","1"),stringsAsFactors=FALSE) 我想获得 df a 1 352 2 035 3 054 4 1 我尝试使用mutate_if如下: df %>% mutate_if(nchar(a)==2,str_pad(a,width=3

    1热度

    1回答

    第一个匹配的文本词典术语我有条款 terms <- c("hello world", "great job") terms <- as.data.frame(terms) 一本字典,我想寻找额外data.frame第一场比赛包含文件 doc <- c("i would like to say hello worlds", "hey friends hello world everyone",

    1热度

    2回答

    我有两个数据集称为A和B. library(data.table) Farm.Type <- c("Fruits","Vegetables","Livestock") Produce.All <- c("Apple, Orange, Pears, Strawberries","Broccoli, Cabbage, Spinach","Cow, Pig, Chicken") Store <-

    0热度

    2回答

    这是一个关于学校的问题,但我一直在努力一段时间,只需要一个正确的方向。我不是要求完整的答案。 我被给了一个数据框与学生成绩进行各种评估。我必须编写一个函数,这个函数会导致提供名称的评估的重量(作为总分100%的一部分)。该功能需要至少包含一个辅助功能。 我首先提供有以下几行代码来运行,这类()定义为一个功能: assessmentTypeWeights <- c(5,15,5,3,2,10,10,

    3热度

    1回答

    我想从url中获取连接文本文件,但我不知道如何做到这一点与HTML和不同的文件夹? 这是我试过的代码,但它只列出了文本文件并且有很多html代码,如this我该如何解决这个问题,以便我可以将文本文件合并到一个csv文件中? library(RCurl) url <- "http://weather.ggy.uga.edu/data/daily/" dir <- getURL(url, dirl

    1热度

    2回答

    我有一个大数据表,我要检查103a_foo是否存在。但是,大表格中的文件名会以不同的方式写入,所以我必须使用正则表达式。 dt = structure(list(myID = c("86577", "34005","34005", "194000", "30252", "71067"), filename = c("/scratch/tmpdir/12a_foo.mzXML.gz", "/s

    0热度

    1回答

    我试图从字符串中提取一些单词(国家名称)。该字符串列表中的元素,例如, myList <- list(associations = c("Madeup speciesone: \r\n\t\t\t\t", "Foobarae foobar: Russia - 123,", "Foobarus foobar France - 7007,Italy - 7007,Portuga

    0热度

    1回答

    我想提取给定字符串中的最后4位数字,但无法弄清楚。最后4位数字可以是“XXXX”或“XXXX-”。最终,我有一份包括单年(即2001年或2001年),年份列表(即2001年,2004年),年份范围(即2001年至2010年)或这些组合在结尾处有或没有破折号(“ - ”)。 我意识到'$'是标识END的标记,'^'用于标识正则表达式中的START。我能够轻松提取FIRST 4。下面是什么我可以做一个

    0热度

    1回答

    我想提取Twitter的前两个单词@Handle x <- c("this is a @handle", "My name is @handle", "this string has @more than one @handle") 执行以下操作提取所有最后 @Handle只有前面的文字,我需要它的所有@处理 (ext <- stringr::str_extract_all(x, "^.*@"

    1热度

    1回答

    我试过这个命令 df<-read.csv("filename.csv",stringsAsFactors=FALSE) 对于这两种,num和int变量,缺失值读为NA。但是,对于chr,缺少的值读取为""。当我使用命令is.na("")时,它返回一个FALSE。我该如何纠正这一点?我试过了: str(replace,"",NA"),但它不起作用。