python实现全角半角字符互转的方法

前言

相信对于每一个编程人员来说，在文本处理的时候，经常会遇到全角半角不一致的问题。于是需要程序能够快速的在两者之间互转。由于全角半角本身存在着映射关系，所以处理起来并不复杂。

具体规则为：

全角字符unicode编码从65281~65374 （十六进制 0xff01 ~ 0xff5e）

半角字符unicode编码从33~126 （十六进制 0x21~ 0x7e）

空格比较特殊，全角为 12288（0x3000），半角为 32（0x20）

而且除空格外，全角/半角按unicode编码排序在顺序上是对应的（半角 + 65248 = 全角）

所以可以直接通过用+-法来处理非空格数据，对空格单独处理。

用到的一些函数

chr()函数用一个范围在range（256）内的（就是0～255）整数作参数，返回一个对应的字符。

unichr()跟它一样，只不过返回的是unicode字符。

ord()函数是chr()函数或unichr()函数的配对函数，它以一个字符（长度为1的字符串）作为参数，返回对应的ascii数值，或者unicode数值。

先来打印下映射关系：

for i in xrange(33,127):
print i,chr(i),i+65248,unichr(i+65248)

返回结果

33 ! 65281 ！
34 ” 65282 ＂
35 # 65283 ＃
36 $ 65284 ＄
37 % 65285 ％
38 & 65286 ＆
39 ‘ 65287 ＇
40 ( 65288 （
41 ) 65289 ）
42 * 65290 ＊
43 + 65291 ＋
44 , 65292 ，
45 – 65293 －
46 . 65294 ．
47 / 65295 ／
48 0 65296 ０
49 1 65297 １
50 2 65298 ２
51 3 65299 ３
52 4 65300 ４
53 5 65301 ５
54 6 65302 ６
55 7 65303 ７
56 8 65304 ８
57 9 65305 ９
58 : 65306 ：
59 ; 65307 ；
60 < 65308 ＜ 61 = 65309 ＝ 62 > 65310 ＞
63 ? 65311 ？
64 @ 65312 ＠
65 a 65313 Ａ
66 b 65314 Ｂ
67 c 65315 Ｃ
68 d 65316 Ｄ
69 e 65317 Ｅ
70 f 65318 Ｆ
71 g 65319 Ｇ
72 h 65320 Ｈ
73 i 65321 Ｉ
74 j 65322 Ｊ
75 k 65323 Ｋ
76 l 65324 Ｌ
77 m 65325 Ｍ
78 n 65326 Ｎ
79 o 65327 Ｏ
80 p 65328 Ｐ
81 q 65329 Ｑ
82 r 65330 Ｒ
83 s 65331 Ｓ
84 t 65332 Ｔ
85 u 65333 Ｕ
86 v 65334 Ｖ
87 w 65335 Ｗ
88 x 65336 Ｘ
89 y 65337 Ｙ
90 z 65338 Ｚ
91 [ 65339 ［
92 \ 65340 ＼
93 ] 65341 ］
94 ^ 65342 ＾
95 _ 65343 ＿
96 ` 65344 ｀
97 a 65345 ａ
98 b 65346 ｂ
99 c 65347 ｃ
100 d 65348 ｄ
101 e 65349 ｅ
102 f 65350 ｆ
103 g 65351 ｇ
104 h 65352 ｈ
105 i 65353 ｉ
106 j 65354 ｊ
107 k 65355 ｋ
108 l 65356 ｌ
109 m 65357 ｍ
110 n 65358 ｎ
111 o 65359 ｏ
112 p 65360 ｐ
113 q 65361 ｑ
114 r 65362 ｒ
115 s 65363 ｓ
116 t 65364 ｔ
117 u 65365 ｕ
118 v 65366 ｖ
119 w 65367 ｗ
120 x 65368 ｘ
121 y 65369 ｙ
122 z 65370 ｚ
123 { 65371 ｛
124 | 65372 ｜
125 } 65373 ｝
126 ~ 65374 ～

把全角转成半角：

def full2half(s):
n = []
s = s.decode(‘utf-8’)
for char in s:
num = ord(char)
if num == 0x3000:
num = 32
elif 0xff01

发表评论 取消回复

发表评论取消回复