、MySQL 主從同步
MySQL主從又叫做Replication、Master/Slave復制。簡單講就是A和B兩臺機器做主從后,其中Master負責寫操作的負載,也就是說一切寫的操作都在Master上進行,而讀的操作則分攤到Slave上進行,兩者數據實時同步。
主上有一個log dump線程,用來和從的I/O線程傳遞binlog
從上有兩個線程,其中I/O線程用來同步主的binlog并生成relaylog,另外一個SQL線程用來把relaylog里面的sql語句執行一遍
兩種情況:一種是做備份用,一種是作為讀用
MySQL主從是基于binlog的,主上須開啟binlog才能進行主從。 主從過程大致有3個步驟
1)主將更改操作記錄到binlog里
2)從將主的binlog事件(sql語句)同步到從本機上并記錄在relaylog里
3)從根據relaylog里面的sql語句按順序執行
2、MySQL 數據庫環境
MySQL 數據庫版本都是mysql-5.7,兩臺電腦都在同一個網段之中。
主庫所在的操作系統:win7 從庫所在的操作系統:windows server 2008
主庫的版本:mysql-5.7.20-winx64.zip 從庫的版本:mysql-5.7.20-winx64.zip
主庫的ip地址:192.168.0.116 從庫的ip地址:192.168.0.254
主庫的端口:3306 從庫的端口:3306
3、MySQL 主從同步配置
1)配置主庫,主要是my.ini增加如下選項:
配置完成后需要重啟mysql服務,如下圖所示:
2)添加主數據庫用于同步的賬號:
給主數據庫授權一個可以進行復制的用戶,執行如下命令:
#進入到mysql的bin目錄下,執行
#重啟主數據庫,然后在主數據庫中建立一個備份賬戶
mysql -h localhost -u root -p
輸入密碼 進入
mysql mysql>show databases;
mysql>grant replication slave on *.* to 'slave_username'@'192.168.1.12' identified by 'slave_password' ;
mysql>flush privileges;
3)顯示主數據庫的同步信息:
可以看出已經產生了二進制的日志文件信息,mysql的同步就是通過這個二進制日志文件進行同步,主數據庫把對數據庫的操作的指令都記錄到該日志文件下,從數據庫通過讀取該文件,來對從數據庫中的數據進行修改,從而達到主從同步的效果。
#顯示主服務器的狀態信息,并且找到File 和 Position 的值記錄下來;
#此處加\G的意思是格式化輸出,否則輸出亂七八糟,看不清楚
mysql>show master status \G;
#記下File 和 Position,從庫配置要用
4) 配置從庫
從數據庫的話只需要配置server-id,binlog-do-db,binlog-ignore-db即可。
#從庫配置
server_id=2
relay-log-index=slave-relay-bin.index
relay-log=slave-relay-bin
配置完成重啟mysql服務
5) 設置從數據庫鏈接到主數據庫
#進入到mysql的bin目錄下,執行
#重啟從數據庫,設置登錄主數據庫的賬號和密碼等信息,然后啟動slave
mysql>change master to master_host='192.168.0.254',master_user='slave_username',master_password='slave_password', master_log_file='.000001',master_log_pos=0;
mysql>start slave;
#此處加\G的意思是格式化輸出,否則輸出亂七八糟,看不清楚
mysql>show slave status \G;
#如果出現: Slave_IO_Running: Yes Slave_SQL_Running: Yes以上兩項都為Yes,那說明沒問題了
6)錯誤問題匯總
在配置MySQL主從復制時,通過show slave status 命令可能發現問題,到MySQL日志文件路徑(D:\Program Files\mysql-5.7.20-winx64\data)以計算機名+.err就是錯誤日志文件
Slave_IO_Running:連接到主庫,并讀取主庫的日志到本地,生成本地日志文件
Slave_SQL_Running:讀取本地日志文件,并執行日志里的SQL命令。
a) Slave_IO_Running :No
2018-07-20T02:52:13.894200Z 4 [ERROR] Slave I/O for channel '': Fatal error: The slave I/O thread stops because master and slave have equal MySQL server UUIDs; these UUIDs must be different for replication to work. Error_code: 1593
解決辦法:是由于當初從庫數據庫是直接從主庫復制而來,導致MySQL 主庫和從庫server-uuid 重復問題,只需要到MySQL 安裝目錄(D:\Program Files\mysql-5.7.20-winx64\data)下auto.cnf文件打開更改server-uuid即可或者刪掉auto.cnf,重新啟動;
#可以通過select uuid(); 命令獲取uuid
select uuid();
b)Slave_SQL_Running : No
2018-07-20T03:37:14.074200Z 23 [ERROR] Slave SQL for channel '': Error executing row event: 'Table 'ryw-ec.sys_log' doesn't exist', Error_code: 1146
2018-07-20T03:37:22.213200Z 24 [ERROR] Slave SQL for channel '': Error 'Can't drop database 'ryw-ec'; database doesn't exist' on query. Default database: 'ryw-ec'. Query: 'DROP DATABASE `ryw-ec`', Error_code: 1008
解決辦法:
在從服務器上設置忽略該錯,在my.cnf文件中添加“slave-skip-errors=1146”,
如果少量的這種錯誤,直接在mysql client里面設置“set global sql_slave_skip_counter=1”;
mysql> stop slave;
mysql> set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;
mysql> start slave;
PS:本人多次遇到從數據庫的同步進程自動停掉的問題,有時簡單通過slave stop,slave start即可解決。有時slave start啟動后又會自動停掉,這時使用 change master重設主數據庫信息的方式解決了問題。
文章目錄
系統唯一id是我們在設計階段常常遇到的問題。在復雜的分布式系統中,幾乎都需要對大量的數據和消息進行唯一標識。在設計初期,我們需要考慮日后數據量的級別,如果可能會對數據進行分庫分表,那么就需要有一個全局唯一id來標識一條數據或記錄。生成唯一id的策略有多種,但是每種策略都有它的適用場景、優點以及局限性。
最常見的一種生成id方式。利用數據庫本身來進行設置,在全數據庫內保持唯一。
【優點】
非常簡單。利用現有數據庫系統的功能實現,成本小,代碼簡單,性能可以接受。ID號單調遞增。可以實現一些對ID有特殊要求的業務,比如對分頁或者排序結果這類需求有幫助。
【缺點】
【部分優化方案】
針對主庫單點, 如果有多個Master庫,則每個Master庫設置的起始數字不一樣,步長一樣,可以是Master的個數。比如:Master1 生成的是 1,4,7,10,Master2生成的是2,5,8,11 Master3生成的是 3,6,9,12。這樣就可以有效生成集群中的唯一ID,也可以大大降低ID生成數據庫操作的負載。
常見的生成id方式,利用程序生成。
UUID (Universally Unique Identifier) 的目的,是讓分布式系統中的所有元素,都能有唯一的辨識資訊,而不需要透過中央控制端來做辨識資訊的指定。如此一來,每個人都可以建立不與其它人沖突的 UUID。在這樣的情況下,就不需考慮數據庫建立時的名稱重復問題。
UUID的標準形式包含32個16進制數字,以連字號分為五段,形式為8-4-4-4-12的36個字符,示例:550e8400-e29b-41d4-a716-446655440000,到目前為止業界一共有5種方式生成UUID。
在Java中我們可以直接使用下面的API生成UUID:
UUID uuid=UUID.randomUUID(); String s=UUID.randomUUID().toString();
【優點】
【缺點】
【部分優化方案】
當使用數據庫來生成ID性能不夠要求的時候,我們可以嘗試使用Redis來生成ID。這主要依賴于Redis是單線程的,所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR和INCRBY來實現。
可以使用Redis集群來獲取更高的吞吐量。假如一個集群中有5臺Redis。可以初始化每臺Redis的值分別是1,2,3,4,5,然后步長都是5。各個Redis生成的ID為:
這個負載到哪臺機器上需要提前設定好,未來很難做修改。但是3-5臺服務器基本能夠滿足,都可以獲得不同的ID。步長和初始值一定需要事先設定好。使用Redis集群也可以防止單點故障的問題。
比較適合使用Redis來生成日切流水號。比如訂單號=日期+當日自增長號。可以每天在Redis中生成一個Key,使用INCR進行累加。
【優點】
【缺點】
zookeeper主要通過其znode數據版本來生成序列號,可以生成32位和64位的數據版本號,客戶端可以使用這個版本號來作為唯一的序列號。
很少會使用zookeeper來生成唯一ID。主要是由于需要依賴zookeeper,并且是多步調用API,如果在競爭較大的情況下,需要考慮使用分布式鎖。因此,性能在高并發的分布式環境下,也不甚理想。
snowflake(雪花算法)是Twitter開源的分布式ID生成算法,結果是一個long型的ID。這種方案把64-bit分別劃分成多段,分開來標示機器、時間等。如圖:
其核心思想是:使用41bit作為毫秒數,10bit作為機器的ID(5個bit是數據中心,5個bit的機器ID),12bit作為毫秒內的流水號(意味著每個節點在每毫秒可以產生 4096 個 ID),最后還有一個符號位,永遠是0。具體實現的代碼可以參看github。
snowflake算法可以根據自身項目的需要進行一定的修改。比如估算未來的數據中心個數,每個數據中心的機器數以及統一毫秒可以能的并發數來調整在算法中所需要的bit數。
【優點】
【缺點】
原文鏈接:https://mp.weixin.qq.com/s/9rMgyA1PIK9S_j4AZml9DA