我在正则表达式中很糟糕。 我试图根据文件名找到文件夹中的文件。大多数文件名格式为GSE1234_series_matrix.txt
,因此我一直在使用os.path.join("files", GSE_num + "_series_matrix.txt")
。但是,一些文件的名称如GSE1234-GPL22_series_matrix.txt
。我不知道如何处理所有以GSE编号开始并以_series_matrix.txt结尾的文件,可能只有一个声明。我非常感谢任何帮助。Python中的正则表达式匹配文件夹中的所有文件
编辑 - 我有这些系列矩阵文本文件在一个文件夹中,为此我提到使用路径连接的路径。我还输入了一个文本文件,其中包含所有GSE编号。这样它仅对选定的GSE号码运行脚本。因此,不是文件夹中的所有内容都位于GSE编号列表中,而列表中只有GSE编号而不是GPL。例如,文件GSE1234-GPL22_series_matrix.txt在列表中是GSE1234。
谢谢!我有个问题。这给了我一个清单。我需要单独的文件名或换句话说,我如何将它合并到os.path.join语句中? – abn 2014-12-04 19:33:24
我猜如果name.startswith(“GSE”)和name.endswith(“_ series_matrix.txt”))''你可以在文件名中为'name_filenames = [os.path.join(“files”,name)我不是100%确定你想要做什么。 – Kevin 2014-12-04 19:35:49
它给了我'TypeError:胁迫Unicode:需要字符串或缓冲区,找到列表' – abn 2014-12-04 19:38:02