我遇到了一个与this one非常相似的问题,但涉及程度稍高。如何利用文件名信息作为R中的一个因子
我有一堆csv文件,每个文件记录特定品种的特定复制品的50个观测值。
这些文件被命名为Genotype_Rep.csv,并且我已经能够弄清楚如何从文件名中提取“Genotype”和“Rep”,这要感谢上面提到的解决方案。
但是因为每个csv文件都有50条记录,所以我需要将Genotype添加到每行,这在上述解决方案中不起作用。
例子:
#Assume that the names of the files in the wd has been assigned to 'filenames'.
#Here's a dummy version:
filenames <- c("A_1.csv", "A_2.csv", "B_1.csv", "B_2.csv")
# extract ID from filename
ids <- gsub("([A-Z])_[0-9].csv", "\\1", filenames)
import <- mdply(filenames, read.csv)
import$ID <- IDs[import$Var1]
import$Var1 <- NULL
这工作真的很好,当每个文件都有一个观察,而不是当我需要将其添加到几行。我毫不怀疑这很简单,但如果有人能够帮助我,那会很棒。
你能澄清一下吗?是“行”==“行”? “......我需要将它添加到几行......”中的“它”究竟是什么? – 2012-02-12 22:17:20