【www.gdgbn.com--中文酷站】

编码表

双字节字符编码范围

1. gbk (gb2312/gb18030)
x00-xff gbk双字节编码范围
x20-x7f ascii
xa1-xff 中文 gb2312
x80-xff 中文 gbk

2. utf-8 (unicode)

u4e00-u9fa5 (中文)
x3130-x318f (韩文
xac00-xd7a3 (韩文)
u0800-u4e00 (日文)

<script type="text/网页特效"> if ($ != jquery) { $ = jquery.noconflict(); } var islogined = false; var cb_blogid = 72706; var cb_entryid = 1904791; var cb_blogapp = "zcy_soft"; var cb_bloguserguid = "c4d4393c-4c87-df11-ba8f-001cf0cd104b"; var cb_entrycreateddate = "2010/12/13 17:36:00"; </script>
$str = "中国";
echo $str;
echo "
";

//if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在gb2312情况下使用 
if (preg_match("/^[x7f-xff]+$/", $str)) { //兼容gb2312,utf-8
    echo "正确输入";
} else {
    echo "错误输入";
}
?>

中文判断问题,其实有很多学问,底层的内部编码,涉及utf-8,gbk,gb13800的各种不同。曾经研究过如何区分一个字符是什么字符的问题。关联细节太多。

本文来源:http://www.gdgbn.com/kuzhan/29059/