数据分析的过程中,我们难免会遇到需要处理某个文件夹内的大量数据文件的情况,这时我们就要先获得每个文件的路径,而这就可以用到我们今天所讲的两个python模块。
今天讲得内容是python的 os 模块和 glob 模块。只需初步的掌握这两个模块的基本操作,我们就可以在用python处理大量文件和路径时如鱼得水。
首先还是加载模块
import os
import glob
首先来说os模块,这里只介绍我常用到的几个功能:
# 如果 my_dir 不存在,就创建该目录
my_dir = '/home/wang/my_data'
if not os.path.exists(my_dir):
os.makedirs(my_dir)
img_path = '/home/wang/my_data/imgs/a.png'
img_name = os.path.basename(img_path)
img_dir = os.path.dirname(img_path)
# img_name = 'a.png'
# img_dir = '/home/wang/my_data/imgs'
# 若所传入地址为文件夹地址,例如 img_path = '/home/wang/my_data/imgs'
# 则 img_name = 'imgs' , img_dir = '/home/wang/my_data'
my_dir = '/home/wang/my_data'
img_path = 'imgs/a.png'
new_path = os.path.join(my_dir, img_path)
# new_path = '/home/wang/my_data/imgs/a.png'
# 此处如果用 new_path = my_dir + img_path,则 new_path = '/home/wang/my_dataimgs/a.png',显然是不对的。
img_dir = '/home/wang/my_data/imgs'
png_files = glob.glob(os.path.join(img_dir, '*.png'))
# 输出结果为 png_file = ['/home/wang/my_data/a.png', '/home/wang/my_data/b.png']
这样我们就可以轻松地获取我们所关心的文件的所有路径啦~
今天的内容算是一个基础知识点,之前没有讲到,就算是查漏补缺了,最近事情比较多,保持更新不易,希望大家能多多点赞支持一下。那今天就到这里啦,祝大家变得更强,明天见!
今天的小tips:
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- nryq.cn 版权所有 赣ICP备2024042798号-6
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务