我有一个结构化的纯种名的数据库,如下所示:如何使用链式ifelse和grepl?
HorseName <- c("Grey emperor", "Smokey grey", "Gaining greys", "chestnut", "Glowing Chestnuts", "Ruby red", "My fair lady", "Man of war")
Number <- seq(1:8)
df <- data.frame(HorseName, Number)
我现在想搜索的每匹马的名字中的颜色出现次数。具体而言,我希望选择“灰色”和“栗色”的所有实例,创建一个标识这些颜色的新列。任何其他名称都可以简单地称为“其他”。不幸的是,名称不一致,包含复数形式和不同的格式。我会如何去做R?
我的预期产出将是:
df$Type <- c("Grey", "Grey", "Grey", "Chestnut", "Chestnut", "Other", "Other", "Other")
我熟悉链ifelse声明,但不知道该如何处理多OCCURENCES和敏感的情况下!
简单,将您输入的所有文本小写和你的模式为grepl应该是下壳的。 – amrrs