python中的os.path路径模块中的操作方法总结

解析路径
路径解析依赖与os中定义的一些变量:

os.sep-路径各部分之间的分隔符。
os.extsep-文件名与文件扩展名之间的分隔符。
os.pardir-路径中表示目录树上一级的部分。
os.curdir-路径中当前目录的部分。

split()函数将路径分解为两个单独的部分,并返回包含这些结果的tuple。第二个元素是路径的最后部分,地一个元素是其他部分。

import os.path
for path in [ ‘/one/two/three’,
‘/one/two/three/’,
‘/’,
‘.’,
”]:
print ‘%15s : %s’ % (path, os.path.split(path))

输入参数以os.sep结尾时,最后一个元素是空串。

输出:

/one/two/three : (‘/one/two’, ‘three’)
/one/two/three/ : (‘/one/two/three’, ”)
/ : (‘/’, ”)
. : (”, ‘.’)
: (”, ”)

basename()函数返回的值等价与split()值的第二部分。

import os.path
for path in [ ‘/one/two/three’,
‘/one/two/three/’,
‘/’,
‘.’,
”]:
print ‘%15s : %s’ % (path, os.path.basename(path))

整个路径会剥除到只剩下最后一个元素。

输出:

/one/two/three : three
/one/two/three/ :
/ :
. : .
:

dirname()函数返回分解路径得到的第一部分。

import os.path
for path in [ ‘/one/two/three’,
‘/one/two/three/’,
‘/’,
‘.’,
”]:
print ‘%15s : %s’ % (path, os.path.dirname(path))

将basename()与dirname()结合,得到原来的路径。

/one/two/three : /one/two
/one/two/three/ : /one/two/three
/ : /
. :
:

splitext()作用类似与split(),不过它会根据扩展名分隔符而不是目录分隔符来分解路径。import os.path

for path in [ ‘/one.txt’,
‘/one/two/three.txt’,
‘/’,
‘.’,

‘two.tar.gz’]:
print ‘%21s : %s’ % (path, os.path.splitext(path))

查找扩展名时,只使用os.extsep的最后一次出现。

/one.txt : (‘/one’, ‘.txt’)
/one/two/three.txt : (‘/one/two/three’, ‘.txt’)
/ : (‘/’, ”)
. : (‘.’, ”)
two.tar.gz : (‘two.tar’, ‘.gz’)

commonprefix()取一个路径列表作为参数,返回一个字符串,表示所有路径中出现的公共前缀。

import os.path
paths = [ ‘/one/two/three’,
‘/one/two/threetxt’,
‘/one/two/three/four’,]
for path in paths:
print ‘path:’, path
print
print ‘prefix:’, os.path.commonprefix(paths)

输出:

path: /one/two/three
path: /one/two/threetxt
path: /one/two/three/four
prefix: /one/two/three

建立路径
除了分解现有路径外,还需要从其他字符串建立路径,使用join()。

import os.path
for parts in [ (‘one’, ‘two’, ‘three’),
(‘\one’, ‘two’, ‘three’),
(‘/one’, ‘/two’, ‘/three’, ‘/four’),]:
print parts, ‘:’, os.path.join(*parts)

如果要连接的某个参数以os.sep开头,前面所有参数都会丢弃,参数会返回值的开始部分。

(‘one’, ‘two’, ‘three’) : one\two\three
(‘\\one’, ‘two’, ‘three’) : \one\two\three
(‘/one’, ‘/two’, ‘/three’, ‘/four’) : /four

规范化路径
使用join()或利用嵌入变量由单独的字符串组合路径时,得到的路径最后可能会有多余的分隔符或者相对路径部分,使用normpath()可以清除这些内容。

import os.path
for path in [ ‘one/two/three’,
‘one/./two/three’,
‘one/../alt/two/three’,
]:
print ‘%20s : %s’ % (path, os.path.normpath(path))

可以计算并压缩有os.curdir和os.pardir构成的路径段。

one/two/three : one\two\three
one/./two/three : one\two\three
one/../alt/two/three : alt\two\three

要把一个相对路径转换为一个绝对文件名,可以使用abspath()。

import os.path
for path in [ ‘.’,
‘..’,
‘one/two/three’,
‘one/./two/three’,
‘one/../alt/two/three’,
]:
print ‘%20s : %s’ % (path, os.path.abspath(path))

结果是从一个文件系统树最顶层开始的完整路径。

. : c:\users\administrator\desktop
.. : c:\users\administrator
one/two/three : c:\users\administrator\desktop\one\two\three
one/./two/three : c:\users\administrator\desktop\one\two\three
one/../alt/two/three : c:\users\administrator\desktop\alt\two\three

文件时间

import os
import time
print ‘file:’, __file__
print ‘access time:’, time.ctime(os.path.getatime(__file__))
print ‘modified time:’, time.ctime(os.path.getmtime(__file__))
print ‘change time:’, time.ctime(os.path.getctime(__time__))
print ‘size:’, os.path.getsize(__file__)

返回访问时间,修改时间,创建时间,文件中的数据量。

测试文件
程序遇到一个路径名,通常需要知道这个路径的一些信息。

import os.path
filename = r’c:\users\administrator\desktop\tmp’
print ‘file :’, filename
print ‘is file? :’, os.path.isfile(filename)
print ‘absoulute :’, os.path.isabs(filename)
print ‘is dir? :’, os.path.isdir(filename)
print ‘is link? :’, os.path.islink(filename)
print ‘mountpoint? :’, os.path.ismount(filename)
print ‘exists? :’, os.path.exists(filename)
print ‘link exists? :’, os.path.lexists(filename)

所有测试都返回布尔值。

file : c:\users\administrator\desktop\tmp
is file? : false
absoulute : true
is dir? : true
is link? : false
mountpoint? : false
exists? : true
link exists? : true

遍历一个目录树

import os
import os.path
import pprint
def visit(arg, dirname, names):
print dirname, arg
for name in names:
subname = os.path.join(dirname, name)
if os.path.isdir(subname):
print ‘%s/’ % name
else:
print ‘ %s’ % name
print
if not os.path.exists(‘example’):
os.mkdir(‘example’)
if not os.path.exists(‘example/one’):
os.mkdir(‘example/one’)
with open(‘example/one/file.txt’, ‘wt’) as f:
f.write(‘i love you’)
with open(‘example/one/another.txt’, ‘wt’) as f:
f.write(‘i love you, two’)
os.path.walk(‘example’, visit, ‘(user data)’)

会生成一个递归的目录列表。

example (user data)
one/
example\one (user data)
another.txt
file.txt

一些实际的用法合集:

#创建文件:
os.mknod(“test.txt”) 创建空文件
fp = open(“test.txt”,w) 直接打开一个文件,如果文件不存在则创建文件
#获取扩展名:
>>> os.path.splitext(‘/volumes/leopard/users/caroline/desktop/1.mp4’)[1:]
(‘.mp4’,)
>>> os.path.splitext(‘/volumes/leopard/users/caroline/desktop/1.mp4’)[1]
‘.mp4′
#获取文件名:
>>> print os.path.basename(r’/root/hahaha/123.txt’)
123.txt
>>> print os.path.dirname(r’/root/hahaha/123.txt’)
/root/hahaha
#判断目录或文件的存在:
>>> os.path.exists(‘/root/1.py’)
true
>>> os.path.exists(‘/root/’)
true
>>> os.path.exists(‘/root’)
true
>>> os.path.isdir(‘/root’)
true
#改变工作目录:
>>> os.chdir(‘/home’)
>>> os.getcwd()
‘/home’
#字符串分割:
>>> ‘/usr/bin/env’.split(‘/’)
[”, ‘usr’, ‘bin’, ‘env’]
#获取文件夹大小(python2.x):
import os
from os.path import join, getsize
def getdirsize(dir):
size = 0l
for root, dirs, files in os.walk(dir):
size += sum([getsize(join(root, name)) for name in files])
return size
if __name__ == ‘__main__’:
filesize = getdirsize(‘/tmp’)
print ‘there are %.3f’ % (filesize/1024/1024), ‘mbytes in /tmp’
#获取文件夹大小(python3.x):
import os
from os.path import join, getsize
def getdirsize(dir):
size = 0
for root, dirs, files in os.walk(dir):
size += sum([getsize(join(root, name)) for name in files])
return size
if __name__ == ‘__main__’:
filesize = getdirsize(‘/tmp’)
print (‘there are ‘ + str(filesize/1024/1024) + ‘mbytes in /tmp’)

Posted in 未分类

发表评论