绝大部分的字都编码正常,但发现有少数字不一致,比如。
玥
这个字,使用如下代码
urlencode(mb_convert_encoding($name, ‘gb2312’, ‘utf-8’))
编码后,得到的是
s%a5
而在站长工具里面,http://tool.chinaz.com/tools/urlencode.aspx
得到是
%abh
%abh 和系统后台的一致。
那么 urlencode(mb_convert_encoding($name, ‘gb2312’, ‘utf-8’)) 对于 玥 这个字,为什么不对呢?
回复讨论(解决方案)
因为 玥 属于 gbk 字符集,不属于 gb2312 字符集
谢谢,程序上有没有办法区分属于哪种字符集呢?
gbk包括了gb2312了,一语点醒,多谢