python字符串和文件操作常用函数分析

本文实例分析了python字符串和文件操作常用函数。分享给大家供大家参考。具体如下:

# -*- coding: utf-8 -*-
”’
created on 2010-12-27
@author: sumory
”’
import itertools
def a_containsanyof_b(seq,aset):
”’判断seq中是否含有aset里的一个或者多个项
seq可以是字符串或者列表
aset应该是字符串或者列表”’
for item in itertools.ifilter(aset.__contains__,seq):
return true
return false
def a_allin_b(seq,aset):
”’判断seq中的所有项是否都在aset里
seq可以是字符串或者列表
aset应该是字符串或者列表”’
for item in seq:
if item not in aset:
return false
return true
def a_containsall_b(seq,aset):
”’判断seq是否包含aset里的所有项
seq可以是字符串或者列表
aset应该是字符串或者列表
任何一个set对象a,a.difference(b)等价于a-set(b),即返回a中所有不属于b的元素”’
return not set(aset).difference(seq)
import string
#生成所有字符的可复用的字符串
sumory_allchars=string.maketrans(”,”)
def makefilter(keep):
”’返回一个函数,此函数接受一个源字符串作为参数\
并返回字符串的一个部分拷贝\
此拷贝只包括keep中的字符,keep必须是一个普通的字符串\
调用示例:makefilter(‘abca ‘)(‘abcdefgh ijkal cba’)\
在后面的字符串中保留前面出现的字符 abc a cba
”’
#按照sumory_allchars规则剔除sumory_allchars字符串中的keep里的字符
#这里得到keep在sumory_allchars的补集
deletechars=sumory_allchars.translate(sumory_allchars,keep)
#生成并返回需要的过滤函数(作为闭包)
def realdelete(soursestr):
return soursestr.translate(sumory_allchars,deletechars)
return realdelete
def list_removesame(list):
”’删除list中的重复项”’
templist=[]
for c in list:
if c not in templist:
templist.append(c)
return templist
def re_indent(str,numberofspace):
”’
缩进\
将字符串str中按换行符划分并在每句前加上numberofspace个space\
再组合成字符串”’
spaces=numberofspace*’ ‘
lines=[spaces+line.strip() for line in str.splitlines()]
return ‘\n’.join(lines)
def replace_strby_dict(soursestr,dict,marker='”‘,safe=false):
”’使用字典替换源字符串中的被marker包裹的相应值”’
#如果safe为true,那么字典中没找到key时不替换
if safe:
def lookup(w):
return dict.get(w,w.join(marker*2))
#w.join(marker*2)用marker包裹w
#如果safe为false,那么字典中没找到key时抛异常\
#若将dict[w]换为dict.get(w)则没找到时返回none
else:
def lookup(w):
return dict[w]
#根据marker切分源字符串
splitparts=soursestr.split(marker)
#取出切分后的奇数项
#因为切分后,列表中源字符串中marker包裹的项肯定位于基数部位
#就算是'”first”s is one’这样的字符串也是如此
#分割后的第0项为空串,第1项为first
splitparts[1::2]=map(lookup,splitparts[1::2])
return ”.join(splitparts)
def simply_replace_strby_dict(soursestr,dict,safe=true):
”’根据dict内容替换soursestr原串中$标记的子字符串\
dict= {‘name’:’sumory’,’else’:’default’}
$$5 -> $5
$else -> default
${name}’s method -> sumory’s method
”’
style=string.template(soursestr)
#如果safe,在dict中找不到的话不会替换,照样保留原串
if safe:
return style.safe_substitute(dict)
#false,找不到会抛异常
else:
return style.substitute(dict)
##################################################
def scanner(object,linehandler):
”’用linehandler方法遍历object的每一项”’
for line in object:
linehandler(line)
def printfilelines(path):
”’读取path路径下的文件屏逐行打印”’
fileobject=open(path,’r’)#open不用放到try里
try:
for line in fileobject:
print(line.rstrip(‘\n’))
finally:
fileobject.close()
def writelisttofile(path,ilist):
fileobject=open(path,’w’)
try:
fileobject.writelines(ilist)
finally:
fileobject.close()
import zipfile
def listzipfilesinfo(path):
z=zipfile.zipfile(path,’r’)
try:
for filename in z.namelist():
bytes=z.read(filename)
print(‘file:%s size:%s’%(unicode(filename, ‘cp936’).decode(‘utf-8′),len(bytes)))
finally:
z.close()
import os,fnmatch
def list_all_files(root,patterns=’*’,single_level=false,yield_folders=false):
”’列出目录(或者及其子目录下的文件)”’
#分割模式到列表
patterns=patterns.split(‘;’)
for path,subdirs,files in os.walk(root):
if yield_folders:
files.extend(subdirs)
files.sort()
for name in files:
for pat in patterns:
if fnmatch.fnmatch(name, pat):
yield ‘/’.join(unicode(os.path.join(path,name),’cp936′).split(‘\\’))
break
if single_level:
break
def swapextensions(root,before,after):
if before[:1]!=’.’:
before=’.’+before
extensionlen=-len(before)
if after[:1]!=’.’:
after=’.’+after
for path,subdirs,files in os.walk(root):
for oldfile in files:
if oldfile[extensionlen:]==before:
oldfile=os.path.join(path,oldfile)
newfile=oldfile[:extensionlen]+after
os.rename(oldfile, newfile)

希望本文所述对大家的python程序设计有所帮助。

Posted in 未分类

发表评论