php中正则匹配中文汉字

在php中如果你想正则来获取字符串中汉字我们先需要知道页面编码，正则匹配中文汉字根据页面编码不同而略有区别：gbk/gb2312编码：[x80-xff>]+ 或 [xa1-xff]+ 而utf-8编码：[x{4e00}-x{9fa5}]+/u 。

例

代码如下

echo (mb_eregi(“[x80-xff].”,”中d文”) ? “有” : “无”) .”汉字”;
echo (mb_eregi(“^([x80-xff].)+$”,”中文”) ? “全是汉字” : “”); 看一判断全中文字符串函数

以下以php为例进行匹配：

代码如下

输出：

array
(
[0] => array
(
[0] => 学习
[1] => 是一件快乐的事。
)

)

正则汉字

代码如下

$str = “请问php中的eregi如何匹配汉字”;
if (preg_match(“/^[“.chr(0x80).”-“.chr(0xff).”]+$/”,$str)) {
echo “这是一个纯中文字符串”;
} else{
echo “这不是一个纯中文字串”;
}
preg_match_all($pat,……)与preg_replace($pat,……)……

preg_match_all(“/(汉字)+/ism”,”我是汉字，看你把我怎么着！”,$m_a);
了各个编码的高位与低位的开始与结束，那么自然就可以写出正则，而且直接是十六位的，有啥困难？呵呵。不过要注意，在php里面，表示十六位是用的x

我们还可以用该正则表达式来判断是否是gb2312的汉字

代码如下

http://www.bkjia.com/phpjc/628906.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/628906.htmltecharticle在php中如果你想正则来获取字符串中汉字我们先需要知道页面编码，正则匹配中文汉字根据页面编码不同而略有区别：gbk/gb2312编码：[x80-x…

发表评论 取消回复

发表评论取消回复