python拆分中英文混合字符串

20 6月01 1月 by test31297505

#coding=utf-8
import re
s = ‘hi新手oh’.decode(‘utf-8′) #举个栗子是字符串s，为了匹配下文的unicode形式，所以需要解码
p = re.compile(ur'[\u4e00-\u9fa5]’) #这里是精髓，[\u4e00-\u9fa5]是匹配所有中文的正则，因为是unicode形式，所以也要转为ur
print p.split(s) #使用re库的split切割

发表评论取消回复

要发表评论，您必须先登录。

发表评论 取消回复

发表评论取消回复