MySQL使用为什么要分库分表

作者:吴炳锡 来源:http://www.mysqlsupport.cn/ 联系方式: wubingxi#gmail.com 转载请注明作/译者和出处,并且不能用于商业用途,违者必究.

可以用说用到MySQL的地方,只要数据量一大, 马上就会遇到一个问题,要分库分表.
这里引用一个问题为什么要分库分表呢?MySQL处理不了大的表吗?
其实是可以处理的大表的.我所经历的项目中单表物理上文件大小在80G多,单表记录数在5亿以上,而且这个表
属于一个非常核用的表:朋友关系表.

但这种方式可以说不是一个最佳方式. 因为面临文件系统如Ext3文件系统对大于大文件处理上也有许多问题.
这个层面可以用xfs文件系统进行替换.但MySQL单表太大后有一个问题是不好解决: 表结构调整相关的操作基
本不在可能.所以大项在使用中都会面监着分库分表的应用.

从Innodb本身来讲数据文件的Btree上只有两个锁, 叶子节点锁和子节点锁,可以想而知道,当发生页拆分或是添加
新叶时都会造成表里不能写入数据.
所以分库分表还就是一个比较好的选择了.

那么分库分表多少合适呢?
经测试在单表1000万条记录一下,写入读取性能是比较好的. 这样在留点buffer,那么单表全是数据字型的保持在
800万条记录以下, 有字符型的单表保持在500万以下.

如果按 100库100表来规划,如用户业务:
500万*100*100 = 50000000万 = 5000亿记录.

心里有一个数了,按业务做规划还是比较容易的.

MySQL使用为什么要分库分表》上有8个想法

  1. @wubx 呵呵,非常感谢,这个正是我关注的地方,我们的新环境是要考虑这个问题。

  2. 多谢,如果大了,直接应该分表,库有趋势满之前分库,你觉得一个库到多大是瓶颈呢。

    • @秋风,
      这个要看单机的容量, 如果单机IO不是问题如果Fusion-io这种IO设备+SAS ,单库可以达到800G甚至1T都没问题.如果是传统的SAS建议单机单库别超过200G. 如果可能控制在100G以内,不然不容易运维.

  3. @wubx
    单库到多大会是系统的瓶颈?提前预估可能会有资源浪费,怎么样避免资源浪费。

    • @秋风,
      我们现在的内存约定,尽可能把单表控制在800W以下,如果有字符型的,单表控制在500W以下. 在这个数据下规划一下即可.

    • @晒工资,
      分库的原因,更多的为将来扩展及性能考虑. 性能是,一个进程下打开的文件句柄有限,这是分库分表要限制在单个进程下的数量.当然这些表也可以全放到一个库下.但引入另外一个问题,单机性能达到瓶颈时,扩展又是一个麻烦事. 所以引入了一个分库,这样,才开始时,所有的库都可以在事一个事例下,等到压力增大后,单机成为瓶颈了,可以通过移库的形式能快速的移动数据.

评论已关闭。