题库分库分表架构方案，看完受益匪浅_教育 _ 頭條網

个人博客地址 https://www.texixi.com/2019/0...

方案

项目背景

在现在题库架构下，针对新购买的1300W多道数据进行整合，不影响现有功能。由于数据量偏多，需要进行数据的切分

目标场景

兼容旧的功能对1300多W数据进行分库分表需要对旧的数据进行整合老师端选题组卷可以根据学段、学科、知识点、难度、题型来筛选学生端根据老师端所选题目获取对应的题目对3年内以后扩展的增量数据预留数量空间

数据样例

学段数据量小学1285336初中6655780高中6144072学段学科数据量初中数学1869524初中化学1356224初中英语288440

切分方案一

切分为3个库，分别是小学、初中、高中数据占比如上每个库切分10个表根据（学科+首级知识点）%10每个库一个总表

缺点：例：用到不同知识点时，需要多表获取数据

优点：数据分布较为平均

切分方案二（采用）

切分为3个库，分别是小学、初中、高中数据占比如上每个库切分10个表(全部10个学科) 根据学科区分，例：数学表、物理表每个库一个总表

缺点：数据不大平均，数据量多的例数学有186W多、英语28W多

优点：当有用到组卷等需要筛选多知识点题目时，不用多表查询

数据id 自增区间划分

小学 1-2亿中学 2-3亿高中 3亿起

关联关系图

根据知识点获取题目流程

自增id

对原有的id区间段不做处理对切分后的id自增段进行规划

兼容旧功能

解决的问题

新旧数据有重复的知识点、题目新旧数据的结构不一样对旧的题库功能代码的修改两套题库合并主键冲突问题

兼容旧功能方案一（个人推荐）

有操作的旧的数据洗入新的结构，旧的数据只为兼容原有的功能数据，不做显示。

优点：

不用变动数据结构，最新的购买的数据结构较为清晰。易维护扩展，因为目前旧的数据已经整合了两套数据

缺点：

需要修改全部旧有的功能代码（针对新的数据结构）

兼容旧功能方案二

把新购买的数据整合进老的数据结构，同时保留三批数据，需要处理所有表的主键冲突、三批各表数据去重

优点：

旧有代码只修改数据结构切分的部分，不用全部修改功能代码

缺点：

数据较乱，三套不同的数据同时存在数据库需要处理新的结构整合进旧的数据结构，同时需要处理主键冲突，代码上需要处理对应的数据

问题点

测试环境和正式环境图片存放在那里？100多G，上传cdn需要几十天时间，有4000多W张，目前cdn不支持打包上传

解决方案：购买单独服务器，主备，存放图片

测试db 正式db 1300多w 目前占用100G左右, 需要存放空间

解决方案：测试环境新加硬盘，新加db实例端口3307，正式环境db存放在图片服务器

代码设计模式

采用适配器模式（原先的代码结构不变）类图

调研内容

中间件MYCAT（未使用）

什么是MYCAT

一个彻底开源的，面向企业应用开发的大数据库集群支持事务、ACID、可以替代MySQL的加强版数据库一个可以视为MySQL集群的企业级数据库，用来替代昂贵的Oracle集群一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQL Server结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品一个新颖的数据库中间件产品

MYCAT特性

==支持库内分表（1.6）====支持单库内部任意join，支持跨库2表join，甚至基于caltlet的多表join==支持全局序列号，解决分布式下的主键生成问题。==分片规则丰富==，插件化开发，易于扩展。基于Nio实现，有效管理线程，解决高并发问题。==支持通过全局表，ER关系的分片策略，实现了高效的多表join查询==支持分布式事务（弱xa）。支持SQL黑名单、sql注入攻击拦截==支持MySQL、Oracle、DB2、SQL Server、PostgreSQL等DB的常见SQL语法====遵守Mysql原生协议==，跨语言，跨平台，跨数据库的通用中间件代理。==基于心跳的自动故障切换，支持读写分离，支持MySQL主从，==以及galera cluster集群。可以大幅降低开发难度，提升开发速度具体看 mycat 官网

Mycat 注意事项

全局表一致性检测 1.6版本开始支持（一致性的定时检测）分片 join（尽量避免使用 Left join 或 Right join,而用 Inner join）

Mycat 原理

应用要面对很多个数据库的时候，这个时候就需要对数据库层做一个抽象，来管理这些数据库，而最上面的应用只需要面对一个数据库层的抽象或者说数据库中间件就好了，这就是Mycat的核心作用。分片分析、路由分析、读写分离分析、缓存分析等，然后将此SQL发往后端的真实数据库，并将返回的结果做适当的处理，最终再返回给用户。

Mycat 应用场景

读写分离，配置简单分表分库，对于超过1000万的表进行分片，最大支持1000亿的单表分片报表系统，借助于Mycat的分表能力，处理大规模报表的统计

文章整理

应用场景那些适合，那些不适合 https://www.cnblogs.com/barry...使用说明 https://juejin.im/post/59c325...

总表使用mysql MERGE 引擎(不考虑)

合并的表使用的必须是MyISAM引擎表的结构必须一致，包括索引、字段类型、引擎和字符集对于增删改查，直接操作总表即可。

数据切分原则

能不切分尽量不要切分。如果要切分一定要选择合适的切分规则，提前规划好。数据切分尽量通过数据冗余或表分组（Table Group）来降低跨库 Join 的可能。由于数据库中间件对数据 Join 实现的优劣难以把握，而且实现高性能难度极大，业务读取尽量少使用多表 Join。尽可能的比较均匀分布数据到各个节点上该业务字段是最频繁的或者最重要的查询条件。

技术的乐趣在于分享，关注我每天分享JAVA干货知识。

欢迎下方留言点赞，你的支持是我最大的动力~

相關文章:

题库！2020马鞍山市事业单位备考：数量关系考试练习题

20年中级会计备考最全计划：超全分录+题库！努力不会撒谎，加油

江汉湖《食品微生物学》第3版教材+笔记+题库

20年中级会计备考最全计划：超全分录+题库，努力不会撒谎，加油

一建实务126分所用的努力，一建教材+题库+笔记+导图等，一建速领

2020煤矿安全检查作业考试题库及模拟考试答案

2020年中级《经济法》：总资产运营能力分析

60集全套小学1-6年奥数高清视频已整理，内附教材+题库，限时领取

据统计建造师考试试题，重复率最低都有40%！复习请重视真题

2020焊工（技师）考试题库及模拟考试答案

两年拿下一建！全套备考资料无偿送(讲义+笔记+题库),一建考生共勉

2月押题还没刷完？3月高频押题预测来啦

抄底价！医考题库低至66折

教学助手V3.0智能检测！如何利用个人试卷组卷

宁夏导游基础知识 题库

二建资料合集:知识点汇总+神总结+历年题库，一键领取！

103分拿下二建管理！全靠这些资料合集：知识点汇总+神总结+题库

10.10 “学习就是女朋友”，清华第一的学霸男神答爆《一站到底》题库

判断推理题库：判断推理考试练习题（751）

你知道吗？二级建造师考试题目出题重复率50%！

大学考证｜计算机二级考试报名开始，附全套视频教程+题库+课件

2018计算机二级考试全套学习资料课件+题库，95%考试原题重现

免费领取：初中数学 题库+辅助线+知识点总结+考点大全！

免费领取｜初中数学 题库+辅助线+知识点总结+考点大全

08.19 建筑施工安全检查标准JGJ59-2011分值计算你会吗？举例说明！

05.13 2018年5月12日初级会计职称考试真题及答案完整版

01.29 2018二建报名信息可以修改吗？

01.03 一级建造师公示多久后能拿证？

12.30 惊讶，二建竟能免考？免考条件是……

12.29 导致二建考试翻车的原因你肯定不知道……

09.21 「每日考点」科目二丨思维的分类

2014年注册会计师考试帮考网喜报

要对高校教育质量负责！网络答辩不是降低标准的理由

最新！沪2020年普通高等学校招生志愿填报与投档录取实施办法公布

山东高校开学定了！研究生和毕业年级学生自5月16日起开学返校

陕西省：将公布有招生资质中职学校名录

天津：初高中及小学高年级5月18日复课开学，小学低年级段、幼儿园等暂不开学

临沂教育培训机构将重新洗牌，招生大战一触即发

小学低年级必须掌握的量词大全，附识记顺口溜，建议家长收藏

山东高校开学时间确定

鹤壁看郑州，夏初长 你归来 广电南路16号迎来大团圆

山东高校开学时间确定

艳阳高照五月天 逐梦前行正当时

唐山检查初三年级开学准备工作

高三学生迎来复课后首次线下“大考”

山东高校要开学了

重磅！山东高校开学时间确定

莒县第三中学召开2020年春季复学准备暨教学衔接工作会议

山东高校开学时间确定 5月16日起开学返校

山西忻州市第十一中学教师招聘7人启事

山东高校开学时间确定

济宁这6名学生入选国家级奖学金名单

厦门复学后体育课怎么上？保持安全距离可不戴口罩

柳州小学1-6年级开学时间公布！校外培训机构、午托恢复时间也定了→

@大学生，我市多所高校公布返校复课时间，你们准备好了吗？

教育部：努力开发适合毕业生的科研助理岗位

转起周知！天津初高中非毕业班18日开学

秦皇岛昌黎县高端汲养助力教师专业发展

强基计划：华中科技大学今年首招计划不超过120人

哈佛出现财政赤字！美国最“烧钱”的研究生院终于曝光

湖北3地确定初三开学和中考时间

百日冲刺促就业 万千学子创未来 2020届普通高校毕业生就业“百日冲刺”行动启动

市体育中学高三年级复学

考研云复试准备好了吗 青岛多所高校公布分数线

宿松县五里中小召开4—6年级线上线下教学衔接交流会

退完住宿费，陕西这所#高校掏400万为师生做核酸检测#

中国各地高考难度地图：今年上大学最难的省份是哪里？

研究马克思主义要有立场有能力

应届毕业生注意，今年应聘教师、护士等岗位，可以先上岗再考证

走在前列！益阳赫山区沧水铺镇启动“5G+智慧教育”试点建设

初三开学在即，听听莒县桑园镇第二中学校长的深情寄语

初三开学在即，听听莒县桑园镇中心初中校长的深情寄语

宁夏导游基础知识题库

免费领取：初中数学题库+辅助线+知识点总结+考点大全！

免费领取｜初中数学题库+辅助线+知识点总结+考点大全

鹤壁看郑州，夏初长你归来广电南路16号迎来大团圆

艳阳高照五月天逐梦前行正当时

百日冲刺促就业万千学子创未来 2020届普通高校毕业生就业“百日冲刺”行动启动

考研云复试准备好了吗青岛多所高校公布分数线