Python遍历目录下的文件(os.walk 、os.listdir的用法)

Python遍历目录下的文件(os.walk 、os.listdir的用法)

最近想从一个目录转移一些文件到另外一个目录,因为文件有指定的后缀,所以想着用python来转移,不做cv工程师,那就涉及到如何遍历目录(子目录)?

下面主要介绍两种方式,os.walk() 与 os.listdir() ,使用的时候根据下面的需求查看使用

1、os.walk()

定义:

os.walk(top, topdown=True, onerror=None, followlinks=False)

说明:

  • top:指定遍历目录的地址
  • topdown:默认为真,含义是优先遍历指定的目录地址,否则优先遍历目录下的子目录
  • onerror:指定一个 callable 对象,这个是当发生异常的时候,会调用
  • followlinke:默认为假,含义是不遍历目录下的快捷方式
  • 返回:

    os.walk 的返回值是一个可遍历的对象,每次遍历返回的是一个三元元组,可用root,dirs,files接收

  • root:遍历到某目录的地址
  • dirs:list 对象,存储遍历到该目录下的子目录名称
  • files:list 格式,存储遍历到该目录下的文件
  • 需求:

    ​ 现在有一个test目录,我想把test下面的(包含其子目录)所有txt文件移动到一个文件去

    # tree (test目录的情况如下)
    ├─test
    	├─A
            ├─r
                |─r_1.txt
                |─r_2.txt
            ├─t
            	|─t_1.txt
            	|─t_1.txt
        ├─B
            ├─r
                |─b_r_1.txt
                |─b_r_2.txt
            ├─t
            	|─b_t_1.txt
            	|─b_t_1.txt
        ├─C
            ├─r
                |─c_r_1.txt
                |─c_r_2.txt
            ├─t
            	|─c_t_1.txt
            	|─c_t_1.txt
    

    代码:

    import os
    
    path = "C:\\Users\\Administrator\\Desktop\\test"
    
    for root, dirs, files in os.walk(path):
        print("root:", root)
        print("dirs:", dirs)
        print("files", files)
    

    可以看到输出:(对照着上面的字段说明)

    root: C:\Users\Administrator\Desktop\test
    dirs: ['A', 'B', 'C']
    files []
    
    root: C:\Users\Administrator\Desktop\test\A
    dirs: ['r', 't']
    files []
    
    root: C:\Users\Administrator\Desktop\test\A\r
    dirs: []
    files ['r_1.txt', 'r_2.txt']
    
    root: C:\Users\Administrator\Desktop\test\A\t
    dirs: []
    files ['t_1.txt', 't_2.txt']
    
    root: C:\Users\Administrator\Desktop\test\B
    dirs: ['r', 't']
    files []
    
    root: C:\Users\Administrator\Desktop\test\B\r
    dirs: []
    files ['b_r_1.txt', 'b_r_2.txt']
    
    root: C:\Users\Administrator\Desktop\test\B\t
    dirs: []
    files ['b_t_1.txt', 'b_t_2.txt']
    
    root: C:\Users\Administrator\Desktop\test\C
    dirs: ['r', 't']
    files []
    
    root: C:\Users\Administrator\Desktop\test\C\r
    dirs: []
    files ['c_r_1.txt', 'c_r_2.txt']
    
    root: C:\Users\Administrator\Desktop\test\C\t
    dirs: []
    files ['c_t_1.txt', 'c_t_2.txt']
    

    2、os.listdir()

    定义:

    os.listdir(path)
    

    说明:

  • path:要打开的文件目录路径
  • 返回:

    os.listdir的返回值是一个列表,列表里面存储该path下面的子目录的名称

    代码:

    import os
    
    path = "C:\\Users\\Administrator\\Desktop\\test"
    
    for dir in os.listdir(path):
        print(dir)
    

    输出:

    A
    B
    C
    

    如果想得到最后的文件,可以通过os.path.join来连接字符串,然后不停的遍历,获取到最后的文件

    import os
    
    path = "C:\\Users\\Administrator\\Desktop\\test"
    
    for dir in os.listdir(path):
        # child_dir : A B C
        child_dir = os.path.join(path, dir)
        for d in os.listdir(child_dir):
            # 目录 : r  t
            ddd= os.path.join(path, dir ,d)
            for file in os.listdir(ddd):
                # 文件名称
                print(file)
    

    总结

    个人觉得os.walk会好用,简单很多,代码编写量也少

    来源:pan_mlpan

    物联沃分享整理
    物联沃-IOTWORD物联网 » Python遍历目录下的文件(os.walk 、os.listdir的用法)

    发表评论