mysql 中文排序问题各种方法介绍
方法1
----
"mysql在查询字符串时是大小写不敏感的,在编绎mysql时一般以ISO-8859字符集作为默认的字符集,因此在比较过程中
中文编码字符大小写转换造成了这种现象,比较应急的方法是对于包含中文的字段加上"binary"属性,使之作二进制比较,
例如将"name char(10)"改成"name char(10)binary"."
(已试验成功)
方法2
-----
编译mysql时使用--with--charset=gbk
utf8中文排序的
解决办法如下:
1、不想改变表定义及默认编码的情况,将字段先转换成gbk编码再排序:
SELECT * FROM table ORDER BY CONVERT( chinese_field USING gbk ) ;
前提是在安装mysql时安装了gbk字符集,不然会报错:
#1115 - Unknown character set: 'gbk'
在编译源码时加上gbk编码即可,如果已经安装好了,重新编译再安装,重新编译安装一般不会影响mysql的已有设置,包括数据都不会受到影响。
2、直接将字段的字符集改成gbk,然后直接使用order by 排序即可。
mysql 5.x支持某列单独定义字符集。
3、网上也有人说将字段定义加上binary属性也能达到效果,未作测试,不敢评论。
mysql的文档中也提到字符集校对规则:
代码如下 | |
SELECT * FROM t1 ORDER BY a COLLATE utf8_bin; |
但此仅仅只影响校对规则,并不影响字符的字符集本身
对于包含中文的字段加上"binary"属性,使之作为二进制比较,例如将"name char(10)"改成"name char(10)binary"。
如果你使用源码编译MySQL,可以编译MySQL时使用 --with--charset=gbk 参数,这样MySQL就会直接支持中文查找和排序了(默认的是latin1)。也可以用 extra-charsets=gb2312,gbk 来加入多个字符集。
如果不想对表结构进行修改或者重新编译MySQL,也可以在查询语句的 order by 部分使用 CONVERT 函数。
比如
代码如下 | |
select * from mytable order by CONVERT(chineseColumnName USING gbk); |
UTF8 默认校对集是 utf8_general_ci , 它不是按照中文来的。你需要强制让MySQL按中文来排序。
代码如下 | |
select * from core_vender_info order by convert(vender_abbrev USING gbk) COLLATE gbk_chinese_ci |
1、对于包含中文的字段加上"binary"属性,使之作为二进制比较。
CREATE TABLE testtable (
Id int(11) NOT NULL auto_increment,
Name varchar(60) binary default NULL,
PRIMARY KEY (Id)
) TYPE=MyISAM;
2、在编译MySql源代码的时使用--with--charset=gbk参数,这样MySQL就会直接支持中文查找和排序了。--with--charset=gbk比--with--charset=gb2312好。默认的是latin1,编译时用extra-charsets=gb2312,gbk,其中,用来加入多个字符集。
解决办法代码
代码如下 | |
select name from test1 order by convert(name using gb2312) asc; |