mysql4.1开始推出了字符集概念,因为相关说明不够丰富,或许也是因为大家都没注意到这方面问题,多字节文字国家因为这个字符集问题涌现出了大批乱码不乱码的问题。
随着问题的铺开,明白字符集问题后,一系列问题便迎刃而解了。
不过从测试来看,其实多字节文字,大概都是采用utf-8编码方式存贮的,就像中国的选择gbk,其实和选择utf-8是没实质性区别的。
如果说有区别,我就不太明白为什么只是加个set names utf8 就直接从gbk字符集的库中,取出utf8编码的中文来了。
加上 set names gbk 取出来的就是gbk编码的中文了。
这真是个奇妙的问题,所以我直接打算,把原来的一个gbk编码的论坛,换到utf8去了。其实什么也不用变。直接去官方下载一套utf8编码的程序,改下数据库连接,就直接可以用了。而且经过测试完全没有问题。
評論