MySQL新特性之復制特性的測試
MySQL內(nèi)部復制功能是建立在兩個或兩個以上服務器之間,通過設定它們之間的主-從關系來實現(xiàn)的。其中一個作為主服務器,其它的作為從服務器。我將詳細討論如何配置兩臺服務器,將一個設為主服務器,另一個設為從服務器。并且描述一下在它們之間進行切換的處理過程。我是在MySQL的3.23.23版本上進行的配置設置過程,并且也是在這個版本上進行的測試。MySQL開發(fā)人員建議最好使用最新版本,并且主-從服務器均使用相同的版本。同時MySQL 3.23版本仍然是beta測試版,而且這個版本可能不能向下兼容。所以因為這個原因,在實際的網(wǎng)站中,我現(xiàn)在還沒有使用這個版本。擁有容錯能力具有一個好處是,在不需中斷任何查詢的情況下,對服務器進行升級。
第一步:配置主服務器
在這篇文章的剩下篇幅中,我將指定兩臺服務器。A(IP為10.1.1.1)作為主服務器(簡稱為主機)。B(IP為10.1.1.2)作為后備服務器(簡稱為備機)。
MySQL的復制功能的實現(xiàn)過程為:備機(B)與主機(A)連接,然后讀出主機的二進制更新日志,再將發(fā)生的變化合并到自已的數(shù)據(jù)庫中。備機需要一個用戶帳號來與主機連接,所以在主機上創(chuàng)建一個帳號,并只給它FILE權(quán)限,如下操作:
GRANT FILE ON *.* TO replicate@10.1.1.2 IDENTIFIED BY password;
為了備機能夠與主機連接,要在主機上運行FLUSH PRIVILEGES,不過不要擔心,因為我們將在下面的步驟中停掉服務器。
現(xiàn)在我們需要主機數(shù)據(jù)庫的一個快照,并且對主機進行配置,允許生成二進制的更新日志。首先編輯my.cnf文件,以便允許二進制更新日志,所以在[mysqld]部分的下面某個地方增加一行:log-bin。在下一次服務器啟動時,主機將生成二進制更新日志(名為:<主機名>-bin.<增量序號#>)。為了讓二進制更新日志有效,關閉MySQL服務程序,然后將主機上的所有數(shù)據(jù)庫目錄到另一個目錄中,接著重新啟動mysqld。
請確定得到了所有數(shù)據(jù)庫,否則在進行復制時,如果一個表在主機上存在但在備機上不存在,將因為出錯而退出?,F(xiàn)在你已經(jīng)得到了數(shù)據(jù)的快照,和一個從建立快照以來的二進制日志,上面記錄著任何對數(shù)據(jù)庫的修改。請注意MySQL數(shù)據(jù)文件(*.MYD,*.MYI和*.frm)是依賴于文件系統(tǒng)的,所以你不能僅僅進行文件傳輸,如從Solaris到Linux。如果你處于一個異種的服務器環(huán)境,你將不得不使用mysqldump實用程序或其它的定制腳本來得到數(shù)據(jù)快照。
第二步:配置備機
讓我們繼續(xù)。停掉備機上的MySQL服務程序,并且把從主機上拷貝來的數(shù)據(jù)庫目錄移到備機上的data目錄下。請確認將目錄的擁有者和屬組改變?yōu)镸ySQL用戶相應值,并且修改文件模式為660(只對擁有者和屬組可讀、可寫),目錄本身為770(只對擁有者和屬組可讀、可寫和可執(zhí)行)。
繼續(xù)。在備機上啟動MySQL服務程序,確認MySQL工作正常。運行幾個select查詢(不要update或insert查詢),看一看在第一步中得到的數(shù)據(jù)快照是否成功。接著,在測試成功后關掉MySQL服務程序。
在備機上配置需要訪問的主機,以便接收主機的更改。所以需要編輯務機上的my.cnf文件,在[mysqld]部分中增加下面幾行:
master-host=10.1.1.1 master-user=replicate master-password=password
在啟動備機服務程序后,備機服務程序?qū)⒉榭丛趍y.cnf文件中所指定的主機,查看是否有改變,并且將這些改變合并到自已的數(shù)據(jù)庫中。備機保持了主機的更新記錄,這些記錄是從主機的master.info文件中接收下來的。備機線程的狀態(tài)可以通過sql命令SHOW SLAVE-STATUS看到。在備機上處理二進制日志中如果發(fā)生錯誤,都將導致備機線程的退出,并且在*.err的日志文件中生成一條信息。然后錯誤可以被改正,接著可以使用sql語句SLAVE START來重新啟動備機線程。線程將從主機二進制日志處理中斷的地方繼續(xù)處理。
至此,在主機上所發(fā)生的數(shù)據(jù)改變應該已經(jīng)復制到備機上了,要測試它,你可以在主機上插入或更新一條記錄,而在備機上選擇這條記錄。
現(xiàn)在我們擁有了從A機到B機的這種主-從關系,這樣當A機可能當機的時候,允許我們將所有的查詢重定向到B機上去,但是當A機恢復時,我們沒有辦法將發(fā)生的改變恢復到A機中去。為了解決這個問題,我們創(chuàng)建從B機到A機的主-從關系。
第三步:創(chuàng)建相互的主從關系
首先在B機上的my.cnf文件中,在[mysqld]部分中加入log-bin,接著重新啟動mysqld,然后創(chuàng)建可在它的上面執(zhí)行復制功能的用戶帳號,使用:
GRANT FILE ON *.* TO replicate@10.1.1.1 IDENTIFIED BY password;
在B機上運行FLUSH PRIVILEGES命令,以便裝入在加入復制用戶后的新的授權(quán)表,接著回到A機上,在它的my.cnf中加入下面幾行:
master-host=10.1.1.2
master-user=replicate
master-password=password
在重啟A機的服務程序之后,現(xiàn)在我們一擁有了在A機與B機之間的相互主-從關系。不管在哪個服務器上更新一條記錄或插入一條記錄,都將被復制到另一臺服務器上。要注意的是:我不敢確定一個備機合并二進制日志變化的速度有多快,所以用這種方法來進行插入或更新語句的負載平衡可能不是一個好辦法。
#p#
第四步:修改你的數(shù)據(jù)庫連接程序
既然你已經(jīng)在A機和B機之間建立了一個相互的關系,你需要修改數(shù)據(jù)庫連接程序,以便從這種方式中得到好處。下面的函數(shù)首先試圖與A機連接,如果不能建立連接則與B機連接。
/******************************************************** function db_connect() returns a link identifier on success, or false on error ********************************************************/ function db_connect(){ ?$username = "replUser"; ?$password = "password"; ?$primary = "10.1.1.1"; ?$backup = "10.1.1.2"; # attempt connection to primary if(!?$link_id = @mysql_connect(?$primary, ?$username, ?$password)) # attempt connection to secondary ?$link_id = @mysql_connect(?$secondary, ?$username, ?$password) return ?$link_id; } ?> |
我在兩種情況下對使用了上面技術(shù)的數(shù)據(jù)庫連接建立過程進行了測試,一種是主MySQL服務程序關閉了,但是服務器還在運行,另一種情況是主服務器關閉了。如果只是mysqld關閉了,連接會馬上轉(zhuǎn)向備機;但是如果整個服務器關閉了,就出現(xiàn)了無限地等待(兩分鐘后我放棄了跟蹤 -- 很短的注意跨度),因為PHP在查找一個不存在的服務器。不幸地是,不象fsockopen函數(shù),mysql_connect函數(shù)沒有一個超時參數(shù),然而我們可以使用fsockopen來模擬一個超時處理。
第五步:一個改進的數(shù)據(jù)庫連接程序
/******************************************************** function db_connect_plus() returns a link identifier on success, or false on error ********************************************************/ function db_connect_plus(){ ?$username = "username"; ?$password = "password"; ?$primary = "10.1.1.1"; ?$backup = "10.1.1.2"; ?$timeout = 15; // timeout in seconds if(?$fp = fsockopen(?$primary, 3306, &?$errno, &?$errstr, ?$timeout)){ fclose(?$fp); return ?$link = mysql_connect(?$primary, ?$username, ?$password); } if(?$fp = fsockopen(?$secondary, 3306, &?$errno, &?$errstr, ?$timeout)){ fclose(?$fp); return ?$link = mysql_connect(?$secondary, ?$username, ?$password); } return 0; } ?> |
這個新改進的函數(shù)向我們提供了一個可調(diào)的超時特性,這正是mysql_connect函數(shù)所缺少的。如果連接立即失敗,這種情況如機器"活"著,但mysqld"當"掉了,函數(shù)立即移到第二個服務器。上面的函數(shù)相當健壯,在試圖進行連接之前先測試一下,查看服務程序是否在指定端口進行監(jiān)聽,讓你的腳本在一段可接受的時間段后超時,允許你適當?shù)貙Τ鲥e情況進行處理。如果你修改了缺省端口3306,請保證對端口號進行修改。
結(jié)論和意見
首先,要確定得到了一個完整的數(shù)據(jù)快照。如果忘記拷貝一個表或數(shù)據(jù)庫將導致備機線程序停止。生成快照的時刻是很關健的。你應該確保在拷貝數(shù)據(jù)文件之前二進制日志功能是無效的。如果在得到快照之前就允許了二進制日志功能,備機的線程可能會停止,原因就是當線程試圖導入重要的記錄時,可能會由于主鍵重復而停止。最好就是接照第二部分所討論的處理辦法來做:關閉-拷貝-允許二進制日志功能重啟。
你可能想要按照最初的一種方式來配制復制處理,并且在合適的時間關注備機,確保備機與主機保持同步。
我沒有測試過一個使用了復制特性的系統(tǒng)的負載平衡處理性能,但是我會靈活地使用這樣系統(tǒng)來平衡插入和更新。例如,如果在兩臺服務器上兩條記錄都給出了同一個auto_increment值,這種情況備機線程會在哪一條記錄上停掉呢?象這樣的問題將會讓負載平衡作為只讀的處理,一臺服務器處理所有的插入和更新,同時一組備機(是的,你可以有多個與主機分離的備機)處理所有的選擇。
我非常高興,MySQL已經(jīng)具備了復制系統(tǒng)的某些功能,并且配置很簡單。使用它,你就可以開始針對失控的事件提供額外的安全措施了。我僅僅涉及了復制特性,這個我已經(jīng)測試并且使用了,但是在MySQL的在線文檔中的第11部分有中更詳細的說明。
【編輯推薦】