0
我已经找遍了这个,但没有找到答案。我有一个数据框,其中包含沿着“未知”“无响应”或“拒绝回答”之类的多个级别的列。所有这些对我来说都是无用的分析,所以我想用NA来代替它们。替换R中的特定数据帧列中的多个字符串
请注意,我不想在整个数据框中只替换它们,只有特定的列!还有其他一些列包含的值与我实际有用的名称相同,我想让它们保持独立。
我已经成功使用,以取代他们一次一个:
data$col1 <- factor(gsub("Unknown", "NA", data$col1))
但每次只适用于一个字符串。如果我尝试添加多个字符串,R会引发错误。有没有更有效的方法来做到这一点?
我是比较新的编码,请温柔!
在read.csv中使用'na.strings',即在读取数据集时,可以指定哪些值可以更改为NA,'dat < - read.csv (“yourfile.csv”,na.strings = c(“Unknown”,“No response”,“拒绝回答”))' – akrun
尝试'data $ col1 < - factor(gsub(“Unknown | No response | Refused to答案“,”不适用“,数据$ col1))'。 –