MySQL編碼機制與亂碼
以下的文章主要是向大家描述的是MySQL編碼機制, 我們大家都知道從 MySQL4.1 版本開始,其支持很多種編碼,包括 latin1、gbk、utf8、big5 等等,當(dāng)然還有一些我們聞所未聞的,以下就是具體內(nèi)容的描述。
在使用 PHP 連接 MySQL 查詢出來的數(shù)據(jù)有的時候居然會是亂碼,關(guān)于亂碼的解決首先我們要了解MySQL編碼機制。
拿 Discuz! 論壇為例,Discuz! 論壇在連接 MySQL 后會立即執(zhí)行一個設(shè)定(見include/db_mysql.class.php ):
復(fù)制內(nèi)容到剪貼板Code:
@mysql_query("SET character_set_connection=$dbcharset, character_set_results=$dbcharset, character_set_client=binary", $this->link); 此三處的字符設(shè)定很大程度上會解決亂碼問題,那么這三個設(shè)定具體有什么作用呢?如果我們了解了MySQL編碼機制,就可以避免在安裝插件及平時的操作過程中產(chǎn)生亂碼,還可以自行對論壇的數(shù)據(jù)進行轉(zhuǎn)碼。
character_set_client 我們可以理解為 SQL 語句的編碼,如果設(shè)置為 binary,MySQL 就當(dāng)二進制來處理,character_set_connection 設(shè)定的值則告訴 MySQL 用來運行 SQL 語句的時候使用的編碼,也就是說,程序發(fā)送給 MySQL 的 SQL 語句,會首先被 MySQL 從 character_set_client 指定的編碼轉(zhuǎn)換到 character_set_connection 指定的編碼,如果 character_set_clien 指定的是 binary ,則 MySQL 就會把 SQL 語句按照 character_set_connection 指定的編碼解釋執(zhí)行。
當(dāng)執(zhí)行 SQL 語句的過程中,比如向數(shù)據(jù)庫中插入取出數(shù)據(jù)的時候,字段也有編碼設(shè)置,如果字段的編碼設(shè)置和 character_set_connection 指定的不同,則 MySQL 會把插入的數(shù)據(jù)轉(zhuǎn)換成字段設(shè)定的編碼。
當(dāng) SQL 執(zhí)行完畢向客戶端返回數(shù)據(jù)的時候,會把數(shù)據(jù)從字段指定的編碼轉(zhuǎn)換為 character_set_results 指定的編碼,如果 character_set_results=NULL 則不做任何轉(zhuǎn)換動作,(注意這里設(shè)置為 NULL 不等于沒有設(shè)置,沒有設(shè)置的時候 MySQL 會繼承全局設(shè)置)。
了解了MySQL編碼機制,我們就可以利用這個機制進行數(shù)據(jù)的轉(zhuǎn)碼以及避免在程序使用過程中出現(xiàn)亂碼了。
補充:
mysql_query("character_set_client=gbk"); 這句告訴 MySQL 我接下來要用的 SQL 語句的編碼是 GBK 的
mysql_query("character_set_connection=gbk"); 這句 告訴 MySQL 要把 SQL 語句轉(zhuǎn)換成 GBK 進行處理
mysql_query("character_set_results=gbk"); 這句告訴 MYSQL 查詢返回的結(jié)果要統(tǒng)一都轉(zhuǎn)換成 GBK 編碼的
【編輯推薦】