肖飞:mysql汉字16进制编码转换方法
2011/01/16 20:08 ArthurXF
今天在做一个系统GBK转UTF8的编码转换,竟然发现这个系统的sql文件里的汉字都被处理成了16进制编码了。
而GBK,和UTF8的16进制编码不一致,导致根本无法在utf8下正常导入数据库。
现我肖飞为大家倾情奉献,解决办法如下:
一、在utf8的mysql下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex(CONVERT( '游客' USING gbk ));
-> D3CEBFCD
反推gbk的16进制编码,取回中文
mysql> SELECT CONVERT( unhex('d3cebfcd') USING gbk);
-> ’游客'
从gbk的16进制编码直接转成utf8的16进制编码
mysql> SELECT HEX(CONVERT(CONVERT( unhex('d3cebfcd') USING gbk) USING utf8));
-> 'E6B8B8E5AEA2'
二、如果在gbk的mysql环境下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex('游客');
-> D3CEBFCD
反推gbk的16进制编码,取回中文
mysql> unhex('d3cebfcd') ;
-> ’游客'
原理知道了,就可以写个小程序来替换进行转编码了。不过特别提醒在文本里16进制必须在头部加上0x,例如:0xD3CEBFCD才能正常使用。
而GBK,和UTF8的16进制编码不一致,导致根本无法在utf8下正常导入数据库。
现我肖飞为大家倾情奉献,解决办法如下:
一、在utf8的mysql下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex(CONVERT( '游客' USING gbk ));
-> D3CEBFCD
反推gbk的16进制编码,取回中文
mysql> SELECT CONVERT( unhex('d3cebfcd') USING gbk);
-> ’游客'
从gbk的16进制编码直接转成utf8的16进制编码
mysql> SELECT HEX(CONVERT(CONVERT( unhex('d3cebfcd') USING gbk) USING utf8));
-> 'E6B8B8E5AEA2'
二、如果在gbk的mysql环境下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex('游客');
-> D3CEBFCD
反推gbk的16进制编码,取回中文
mysql> unhex('d3cebfcd') ;
-> ’游客'
原理知道了,就可以写个小程序来替换进行转编码了。不过特别提醒在文本里16进制必须在头部加上0x,例如:0xD3CEBFCD才能正常使用。