gsub

    2热度

    1回答

    我在R. 有问题的代码我有一个数据集(问题)与4列和超过600K的观察,其中的一列被命名为' V3' 。 本专栏有类似'今日是什么?'的问题。 我有第二个数据集(voc)有2列,其中一列名称“单词”和其他列名称“同义词”。如果在我的第一个数据集(问题)中存在来自列“同义词”的第二个数据集(voc)的单词,那么我想从“单词”列中替换它的单词。 questions = cbind(V3=c("What

    1热度

    1回答

    我R中的新文件,我学习机学习上做EDX的分析边缘MIT课程。还有就是我们被称为从这里读出的数据集的练习:http://files.grouplens.org/datasets/movielens/ml-100k/u.item 这些来自用户的电影评级。我给你的数据的样本,虽然这是很简单的查看他们的网站上: 1|Toy Story (1995)|01-Jan-1995||http://us.imdb.

    0热度

    1回答

    我觉得冠军是有点混乱删除向量元素,但在这里我的问题: 我有2个载体,一个包含一些文本含有一些短语 text <- c("this is some text","some elements should be removed", "i hope you can help me with this text element problem") pattern <- c("text", "some",

    -2热度

    3回答

    我有一个数组 arr = ['10kg','5kg','7','15kg','25'] 所以我要删除所有kg如果存在的话,返回的字符串 "'10kg','5kg','7kg','15kg','25kg'" 我已经试过 kgs = arr.split(',').gsub('kg','')+'kg' 但是不好的解决办法

    0热度

    2回答

    我有一列字符串,例如, strings <- c("SometextPO0001moretext", "SometextPO0008moretext") 'sometext'和'moretext'部分的长度是可变的。我想删除PO000 *部分的字符串,其中*是通配符。我试过 gsub("PO000*", "", strings) 和谷歌搜索了很多,但令人惊讶的是还没有找到这个看似简单的问题

    -2热度

    1回答

    我有一个类似的格式的字符串: A <- c("date: 27/08/2016","name: AAA","Question 4: yes") 我想删除引号。 我已经试过 A1 <- noquote(A) class(A1) [1] "noquote" 但是,这不会导致一个字符类,这是我需要什么。 我也试过 sub(" \" ", "", A) [1] "date: 27/08/20

    1热度

    1回答

    我有两个数据框具有相同的列名。我想在多个数据框的2列中替换某个表达式。所以我写了下面的代码: dat <- data.frame(n = 1:19, des = c("Some very long text", "Some very lang test", "Some vary long text", "Some veri long text", "Another very long text",

    1热度

    1回答

    我有一个要求,我正在处理韩文文本中具有双字节字符的大数据。我想寻找一个角色并取代它。为了在浏览器中正确显示韩文文本,我改变了R中的语言环境设置。但不知道它是否更新了代码。下面是我的代码来改变区域韩国和朝鲜文字变得可见正确的阅读器,但在控制台它提供了有关印刷 -垃圾字符 Sys.setlocale(category = "LC_ALL", locale = "korean") 我的数据是包含一个da

    1热度

    2回答

    替换值的字符串值我有了像 string<-c('lib1_Rstudio_case1','lib2_Rstudio_case1and2','lib5_python_notthe correct_language','lib3_Jupyter_really_good','lib1_spyder_nice','lib1_R_the_core') replacement<-c('Rstudio

    2热度

    4回答

    在我的Rails 4.2.6/Ruby 2.2.4应用程序中,我有一个生成字符串的db查询方法;例如: "Chest - pectoralis, Quads - quadriceps, Hamstrings - biceps femoris" 但是,结果我想是: "Chest, Quads, Hamstrings" 域跟踪21个的肌肉群,这意味着所生成的串可以有很多不同的组合。然而,字符串