解決MySQL Python 漢字亂碼并不難
以下的文章那個(gè)主要介紹的是MySQL Python 漢字亂碼的正確解決方案,MySQL Python 漢字亂碼在實(shí)際操作中帶來(lái)很多的不便,以下的文章主要介紹的是MySQL Python 漢字亂碼的正確解決方案。
1.想實(shí)現(xiàn)對(duì)一個(gè)二類文本問(wèn)題的兩種分類方法,首先要對(duì)文檔集合的文本進(jìn)行分詞,然后建立倒排表,倒排表是借助于MySQL數(shù)據(jù)庫(kù)的,但是有一個(gè)眾所周知的事情,MySQL插入漢字會(huì)出現(xiàn)各種莫名奇妙的情況,首當(dāng)其沖是插不進(jìn)去,而獲是插進(jìn)去了,但是顯示是亂碼,然后將插入后的數(shù)據(jù)再讀到程序中仍然是亂碼。
這歸根結(jié)底是編碼符號(hào)不一致的問(wèn)題也就是。再解決這個(gè)問(wèn)題的過(guò)程中,我參考了一些網(wǎng)站的東東,這里對(duì)他凌亂的內(nèi)容加以總結(jié),讓和我一樣的菜鳥(niǎo)能夠快速入門。
我們所說(shuō)的編碼格式一致:可以如下圖所示:character_set_client,character_set_connection,character_set_database,
character_set_results,character_set_server編碼要一致。下面說(shuō)說(shuō)如何將這三者調(diào)為一致。
1.首先,修改my.ini文件(該文件在MySQL安裝目錄下)
(1)修改 my.ini(MySQL Server Instance Configuration 文件)
- # CLIENT SECTION
- [client]
- port=3306
- [MySQL]
- default-character-set=gbk
- # SERVER SECTION
- [MySQLd]
- default-character-set=gbk
然后修改character_set_server 這個(gè)是最麻煩的,也是最關(guān)鍵的,具體方法如下:
先關(guān)掉服務(wù),
DOS-》MySQL安裝目錄,bin
MySQLadmin -u root -p shutdown (回車)然後系統(tǒng)將提示輸入密碼
因?yàn)橥V筂ySQL數(shù)據(jù)庫(kù)是需要MySQL的root權(quán)限的
然后MySQLd –C GBK啟動(dòng)服務(wù)器 –C是character_set_server的一個(gè)簡(jiǎn)寫(可以也可以寫成MySQLd –character_set_server gbk).
其次,創(chuàng)建新數(shù)據(jù)庫(kù),方法如下:MySQLCommandLineClient下:
- create database yourDB CHARACTER SET gbk;
- set names 'gbk'
然后重啟將MySQL 服務(wù)關(guān)掉,再重啟后就可以插入漢字了
完成以上操作后,在MySQLCommandLineClient下輸入 use nlpprocess;(注:我新建的數(shù)據(jù)庫(kù))
show variables like 'character%'就會(huì)出現(xiàn)博文開(kāi)頭的圖,也就說(shuō)明字符集設(shè)置一致了。
下面我們看看修改后數(shù)據(jù)庫(kù)顯示情況(我的系統(tǒng)為MySQL5.1+administrator+querybrowser)
上圖中的數(shù)據(jù)是C#向MySQL中加入的,需要注意的是鏈接字符串應(yīng)該如下構(gòu)造,
- string conmyengine="server=localhost;user=root;database=nlpprocess;port=3306;password=xxxx;charset=gbk";
下面說(shuō)下MySQL Python如何設(shè)置才能正確無(wú)誤,沒(méi)有亂碼地從數(shù)據(jù)庫(kù)中讀取漢字字段。
MySQL Python讀取有漢字值的表單
- import MySQLdb
- db=MySQLdb.connect(user='root',db='nlpprocess',passwd='xxx',host='localhost')
- cursor=db.cursor()
- select='select term_id,stemroot from nlpinvert where term_id between 10 and 14'
- cursor.execute("set NAMES GBK")
- cursor.execute(select)
- for r in cursor.fetchall():
- print str(r[0])+':'+r[1]
- cursor.close()
- db.close()
結(jié)果如下:
以上的相關(guān)內(nèi)容就是對(duì)MySQL Python 漢字亂碼的解決方案的介紹,望你能有所收獲。
【編輯推薦】
- MySQL數(shù)據(jù)庫(kù)備份基礎(chǔ)知識(shí)匯總
- 在.NET訪問(wèn)MySQL數(shù)據(jù)庫(kù)經(jīng)驗(yàn)總結(jié)
- MySQL數(shù)據(jù)庫(kù)出現(xiàn)N多問(wèn)題的原因
- MySQL數(shù)據(jù)庫(kù)移植到sql server遇到的N多問(wèn)題
- jsp MySQL中的一些中文問(wèn)題的解決