在第一部分,有簡單的介紹MyCAT的搭建和配置文件的基本情況,這篇詳細介紹schema的一些具體參數,以及實際作用
首先貼上自己測試用的schema文件,雙引號之前的反斜線不會消除,姑且當成不存在吧...
<?xml version=\"1.0\"?> <!DOCTYPE mycat:schema SYSTEM \"schema.dtd\"> <mycat:schema xmlns:mycat=\"http://org.opencloudb/\"> <schema name=\"mycat\" checkSQLschema=\"false\" sqlMaxLimit=\"100\"> <!-- auto sharding by id (long) --> <table name=\"students\" dataNode=\"dn1,dn2,dn3,dn4\" rule=\"rule1\" /> <table name=\"log_test\" dataNode=\"dn1,dn2,dn3,dn4\" rule=\"rule2\" /> <!-- global table is auto cloned to all defined data nodes ,so can join with any table whose sharding node is in the same data node --> <!--<table name=\"company\" primaryKey=\"ID\" type=\"global\" dataNode=\"dn1,dn2,dn3\" /> <table name=\"goods\" primaryKey=\"ID\" type=\"global\" dataNode=\"dn1,dn2\" /> --> <table name=\"item_test\" primaryKey=\"ID\" type=\"global\" dataNode=\"dn1,dn2,dn3,dn4\" /> <!-- random sharding using mod sharind rule --> <!-- <table name=\"hotnews\" primaryKey=\"ID\" dataNode=\"dn1,dn2,dn3\" rule=\"mod-long\" /> --> <!-- <table name=\"worker\" primaryKey=\"ID\" dataNode=\"jdbc_dn1,jdbc_dn2,jdbc_dn3\" rule=\"mod-long\" /> --> <!-- <table name=\"employee\" primaryKey=\"ID\" dataNode=\"dn1,dn2\" rule=\"sharding-by-intfile\" /> <table name=\"customer\" primaryKey=\"ID\" dataNode=\"dn1,dn2\" rule=\"sharding-by-intfile\"> <childTable name=\"orders\" primaryKey=\"ID\" joinKey=\"customer_id\" parentKey=\"id\"> <childTable name=\"order_items\" joinKey=\"order_id\" parentKey=\"id\" /> <ildTable> <childTable name=\"customer_addr\" primaryKey=\"ID\" joinKey=\"customer_id\" parentKey=\"id\" /> --> </schema> <!-- <dataNode name=\"dn\" dataHost=\"localhost\" database=\"test\" /> --> <dataNode name=\"dn1\" dataHost=\"localhost\" database=\"test1\" /> <dataNode name=\"dn2\" dataHost=\"localhost\" database=\"test2\" /> <dataNode name=\"dn3\" dataHost=\"localhost\" database=\"test3\" /> <dataNode name=\"dn4\" dataHost=\"localhost\" database=\"test4\" /> <!-- <dataNode name=\"jdbc_dn1\" dataHost=\"jdbchost\" database=\"db1\" /> <dataNode name=\"jdbc_dn2\" dataHost=\"jdbchost\" database=\"db2\" /> <dataNode name=\"jdbc_dn3\" dataHost=\"jdbchost\" database=\"db3\" /> --> <dataHost name=\"localhost\" maxCon=\"100\" minCon=\"10\" balance=\"1\" writeType=\"1\" dbType=\"mysql\" dbDriver=\"native\"> <heartbeat>select user()<beat> <!-- can have multi write hosts --> <writeHost host=\"localhost\" url=\"localhost:3306\" user=\"root\" password=\"wangwenan\"> <!-- can have multi read hosts --> <readHost host=\"hostS1\" url=\"localhost:3307\" user=\"root\" password=\"wangwenan\"/> </writeHost> <writeHost host=\"localhost1\" url=\"localhost:3308\" user=\"root\" password=\"wangwenan\"> <!-- can have multi read hosts --> <readHost host=\"hostS11\" url=\"localhost:3309\" user=\"root\" password=\"wangwenan\"/> </writeHost> </dataHost> <!-- <writeHost host=\"hostM2\" url=\"localhost:3316\" user=\"root\" password=\"123456\"/> --> <!-- <dataHost name=\"jdbchost\" maxCon=\"1000\" minCon=\"1\" balance=\"0\" writeType=\"0\" dbType=\"mongodb\" dbDriver=\"jdbc\"> <heartbeat>select user()<beat> <writeHost host=\"hostM\" url=\"mongodb://192.168.0.99/test\" user=\"admin\" password=\"123456\" ></writeHost> </dataHost> --> <!-- <dataHost name=\"jdbchost\" maxCon=\"1000\" minCon=\"10\" balance=\"0\" dbType=\"mysql\" dbDriver=\"jdbc\"> <heartbeat>select user()<beat> <writeHost host=\"hostM1\" url=\"jdbc:mysql://localhost:3306\" user=\"root\" password=\"123456\"> </writeHost> </dataHost> --> </mycat:schema>
## 第一行參數<schema name="mycat" checkSQLschema="false" sqlMaxLimit# #"100"/>
與#, checkSQLschema這個參數為False的時候,顯示MyCAT會自動忽略掉當表名前的資料庫名稱,例如說mydatabase1.test1,會被當做#1; # sqlMaxLimit指定了SQL語句回傳的行數限制;
,右上角可以看到,MyCAT本身也是有快取的; 那麼,如果我們執行的語句要傳回較多的資料行,在不修改這個資料列的情況下,Mylimit?#CAT #
中搭配上使用中排上的實際資料列#0/ #,所以如果實際應用裡面需要回傳大量資料,可能就得手動改邏輯了 # MyCAT的1.4版本裡面,使用者的Limit版本參數會覆寫預設的MyCAT設定## MyCAT的1.4版本裡面,使用者的Limit版本參數會覆寫預設的MyCAT設定## MyCAT設定
#############################################' #### ###------------------------------------------- -------------------------------------------------- -------------------------------------------------- -------------------------------######### 則為##<##### #table
name######=######"students"###### dataNode######=######"dn1,dn2,dn3,dn4"#### ## rule######=######"rule1"###### ######/######>##### MyCAT前端會顯示哪些表名,類似幾行都代表一樣的意思,這裡強調的是表,而MyCAT並不會在配置文件裡面定義表結構### 如果在前端使用的表格結構資訊,觀察Debug日誌,### ######可以看到,MyCAT把指令分發給了dn1代表的資料庫,然後把dn1的查詢結果回傳給了前端
可以判斷,類似的資料庫層級的一些查詢指令,有可能是單獨分發給某個節點,然後再把某個節點的資訊回傳至前端;
rule所代表的是這個邏輯表students的具體切分策略,目前MyCAT只支援依照某一個特殊列,遵循一些特殊的規則來切分,如取模,枚舉等,具體的留給之後細說
----- -------------------------------------------------- -------------------------------------------------- -------------------------------------------------- --------------------
name="item_test" primaryKey="ID" type ="global" dataNode="dn1,dn2,dn3,dn4"# />##卷查詢的時候還會分發到所有的資料庫麼? ,而針對全局表的查詢,只會分發到某一個節點上
配置的primaryKey沒發現作用在哪裡,姑且忽略吧,以後發現了再補上
#---------- -------------------------------------------------- -------------------------------------------------- -------------------------------------------------- -------------
#childtable我在測試中並沒有實際用起來不過在MyCAT的設計文件裡面有提到,childtable是一種依賴於父錶的結構,
這意味著,以父錶的parentKey的策略一起切分,當父表與子表進行連接,且連接條件是childtable.joinKey=parenttable.parentKey時,不會進行跨庫的連接.
PS:具體測試以後再補
-------------------------------------------------- -------------------------------------------------- -------------------------------------------------- -----------------------
dataNode的參數在先前的篇章介紹過,這裡直接跳過~
# -------------------------------------------------- -------------------------------------------------- -------------------------------------------------- ------------------------
dataHost配置的是實際的後端資料庫叢集,大部分參數簡單易懂,這裡就不一個個介紹了,只介紹比較重要的兩個參數,writeType和balance.
writeType和balance是用來控制後端集群的讀寫分離的關鍵集群參數,這裡我用了雙主雙balance是用來控制後端集群的讀寫分離的關鍵集群參數,這裡我用了雙主雙balance是用來控制後端集群的讀寫參數從
的群集配置
這裡的測試過程中比較麻煩,所以直接貼結論: 失敗時,後端直接失敗)
2.balance=1時,讀取作業會隨機分散在localhost1和兩個readhosthost(##localhost(##local211111,219707222)如果作業上會在12#localhost1#localhostlocalhost#local2#lo localhost1再失敗,則無法進行寫入作業##) #localhost1,
localhost1和兩個readhost上面(同上) 切換到localhost1,localhost恢復以後並不會切換回localhost進行寫入操作
# 5.write_Type1,在寫作業時寫上localhost和localhost1上,單點失敗並不會影響叢集的寫入操作,但是後端的從函式庫會無法從掛掉的主函式庫取得更新,會在讀取資料的時候出現資料不一致
,但是localhost的從庫無法從localhost獲取更新,localhost的從庫於其他庫出現資料不一致------------- -------------------------------------------------- -------------------------------------------------- -------------------------------------------------- -------------#實際上,MyCAT本身的讀寫分離是基於後端叢集的同步來實現的,而MyCAT本身則提供語句的分發功能,當然,那個sqlLimit的限制也使得MyCAT會對前端應用層的邏輯造成一些影響
由schema到table的配置,則顯示出MyCAT本身的邏輯結構裡面,就包含了分庫分錶的這種特性(可以指定不同的表格存在於不同的資料庫中,而不必分到全部資料庫)
以上是MySQL分散式叢集之MyCAT(二)schema程式碼詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!