2011-12-13 47 views
0

我正在尝试创建一个通过目录的walker。这是我部分工作的输入和输出。我正在使用一个测试目录,但是我希望在导致某些问题的任何目录上完成此操作。在python中分配os.walk中的实例

[IN]: print testdir #name of the directory 
[OUT]: ['j','k','l'] #directories under testdir 

[IN]: print testdir.j 
[OUT]: ['m','n'] # Files under testdir.j 

这是迄今为止代码:

class directory_lister: 
    """Lists directories under root""" 
    def __init__(self,path): 
     self.path = path 
     self.ex = [] 
     for item in os.listdir(path): 
      self.ex.append(item) 
    def __repr__(self): 
     return repr(self.ex) 

这将返回目录和文件,但我必须手动指定目录的名称。

testdir = directory_lister(path/to/testdir) 
j = directory_lister(path/to/j) 
etc 

是否有办法来自动实例这样的:

for root,dirs,files in os.walk(/path/to/testdir/): 
    for x in dirs: 
     x = directory_lister(root) #I want j = directory_lister(path/to/j), k = directory_lister(path/to/k) and l = directory_lister(path/to/l) here. 

才会有:

class directory_lister: 
    def __init__(self,path): 
     self.path = path 
     self.j = directory_lister(path + os.sep + j) # how to automate this attribute of the class when assigned to an instance?? 

上面的代码是错误的,因为对象x只有成为一个实例,但j,k,l必须手动定义。我是否需要使用其他课程或字典getattr但我总是遇到同样的问题。如果需要任何额外的信息,请问,我希望我明确说明。

更新2

有没有办法通过下面阿努拉格添加其他复杂功能的DirLister?所以当它到达一个文件时会说testdir/j/p,它会打印出文件p的第一行。

[IN] print testdir.j.p 
[OUT] First Line of p 

我已经做了类打印出来的文件的第一行:

class File: 
    def __init__(self, path): 
     """Read the first line in desired path""" 
     self.path = path 
     f = open(path, 'r') 
     self.first_line = f.readline() 
     f.close() 

    def __repr__(self): 
     """Display the first line""" 
     return self.first_line 

只需要知道如何将它下面的类。谢谢。

+0

到底是什么`directory_lister`的期望的接口和功能? – 2011-12-13 17:49:13

+0

`os.walk`已经列出了所有的目录和文件,那么`directory_lister`的含义是什么? – ekhumoro 2011-12-13 18:04:02

+0

@KarlKnechtel,功能是方便地列出根目录下的目录。所以你只需指定根目录,其余的就很容易查看。 – Neeran 2011-12-14 09:22:11

回答

1

我想,你希望子目录要像一个属性的访问,则可以实现两个方面

  • 我们将向您文件的列表,并创建变量动态
  • 挂接到属性的访问和根据需要

我更喜欢第二种方法,因为它是懒惰的,更好,更容易实现

正确返回大腕3210
import os 

class DirLister(object): 
    def __init__(self, root): 
     self.root = root 
     self._list = None 

    def __getattr__(self, name): 
     try: 
      var = super(DirLister).__getattr__(self, name) 
      return var 
     except AttributeError: 
      return DirLister(os.path.join(self.root, name)) 

    def __str__(self): 
     self._load() 
     return str(self._list) 

    def _load(self): 
     """ 
     load once when needed 
     """ 
     if self._list is not None: 
      return 
     self._list = os.listdir(self.root) # list root someway 

root = DirLister("/") 
print root.etc.apache2 

输出:

['mods-enabled', 'sites-80', 'mods-available', 'ports.conf', 'envvars', 'httpd.conf', 'sites-available', 'conf.d', 'magic', 'apache2.conf', 'sites-enabled'] 

您可以改善这种有更好的错误检查等

代码解释:这是基本目录的递归上市,所以DirLister对象列表下的文件给定的根,如果某些变量是用虚线符号访问的,它会返回一个DirLister,假定该属性是根目录下的一个文件夹。因此,如果我们试图创造DirLister类步步将更加清晰

1-简单DirLister仅列出其下

class DirLister(object): 
    def __init__(self, root): 
     self.root = root 
     self._list = os.listdir(self.root) 

2 - 我们简单的李斯特文件/文件夹只列出文件中的一个水平深,如果我们想要获取子文件夹下的文件管理器,我们可以使用obj.varname来挂接到使用varname调用的__getattr__。所以,如果我们的DIR-利斯特没有属性命名VARNAME我们假设用户试图访问给定根目录下该目录中,所以我们创建另一个DirLister根为root+subdirname

def __getattr__(self, name): 
    try: 
     var = super(DirLister).__getattr__(self, name) 
     return var 
    except AttributeError: 
     return DirLister(os.path.join(self.root, name)) 

注意:首先,我们检查的基类因为我们不想将所有变量访问视为子目录访问,所以如果没有这样的属性,那么我们为子文件夹创建一个新的DirLister。

3-为了提高代码,使我们没有列出所有文件夹,即使当用户需要用户没有要求他们,我们只列出,因此一个load方法

def _load(self): 
    if self._list is not None: 
     return 
    self._list = os.listdir(self.root) # list root someway 

所以这种方法列出目录如果还没有列出,那么应该在我们最终需要时调用它在打印列表

编辑:如要求由OP这里是递归的另一种方法列出整棵树,虽然我会强烈建议反对

import os 

class RecursiveDirLister(object): 
    def __init__(self, root): 
     self._sublist = [] 
     for folder in os.listdir(root): 
      self._sublist.append(folder) 
      path = os.path.join(root, folder) 
      if not os.path.isdir(path): 
       continue 
      # add it as attribute, assuming that dir-name is valid python varname 
      try: 
       sublister = RecursiveDirLister(path) 
      except OSError: 
       continue#ignore permission errors etc 
      setattr(self, folder, sublister) 

    def __str__(self): 
     return str(self._sublist) 

etc = RecursiveDirLister("/etc") 
print etc.fonts 

输出:

['conf.avail', 'conf.d', 'fonts.conf', 'fonts.dtd'] 
0

不知道你在问什么,但这会工作吗?

for root,dirs,files in os.walk(/path/to/testdir/): 
    listers = dict((dir, directory_lister(dir)) for dir in dirs) 
    #now you can use: 
    listers['j'] 
    listers['k'] 
    listers['l']