dbaplus社群 02月17日
完蛋!又被分库分表坑惨了……
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文深入探讨了分库分表策略在解决单库单表性能瓶颈时所带来的七大问题,并提供了相应的解决方案。这些问题包括全局唯一ID的生成、跨库跨表查询的复杂性、分布式事务的处理、分片键设计的挑战、数据迁移的难题、分页查询的复杂性以及运维复杂性的增加。针对每个问题,文章都给出了具体的技术方案,如使用Snowflake算法生成全局唯一ID,利用ShardingSphere中间件进行跨库查询,采用Seata框架处理分布式事务等,旨在帮助读者理解并有效应对分库分表带来的挑战。

🆔 **全局唯一ID问题**:分库分表后,各表自增ID仅在本表内唯一,导致全局ID冲突。解决方案包括使用Snowflake、百度UidGenerator或Leaf等分布式ID生成器,以及数据库号段分配。

🔍 **跨库跨表查询复杂性**:聚合查询需跨多分片表执行,增加复杂度。推荐使用ShardingSphere或MyCAT等中间件,或手动分片查询并在业务层合并结果。

🔄 **数据迁移问题**:扩容时,旧数据需迁移至新分片,过程复杂且影响服务。解决方案包括双写策略和使用Canal监听MySQL Binlog进行增量同步。

🔒 **分布式事务问题**:跨库事务无法使用单库事务,可能导致数据不一致。可使用Seata分布式事务框架或消息中间件实现最终一致性。

🛠️ **运维复杂性**:分库分表后,数据库实例增多,监控和备份复杂,故障排查需跨多库。建议采用自动化运维平台如阿里云DMS,以及监控工具如Prometheus + Grafana实现分片监控。

苏三 2025-02-17 07:16 广东

分库分表带来了哪些问题?


前言


分库分表是解决单库单表性能瓶颈的有效手段,但也会引入新的复杂性和技术挑战。


这篇文章跟大家一起聊聊,分库分表后带来的7个问题,以及相关的解决方案,希望对你会有所帮助。


一、全局唯一 ID 问题


1、问题描述


在分库分表后,每张表的自增 ID 只在本表范围内唯一,但无法保证全局唯一。


例如:



2、解决方案


1)使用分布式 ID 生成器


推荐工具:



代码示例:Snowflake 算法


public class SnowflakeIdGenerator {    private final long epoch = 1622476800000L; // 自定义时间戳    private final long workerIdBits = 5L; // 机器ID    private final long datacenterIdBits = 5L; // 数据中心ID    private final long sequenceBits = 12L; // 序列号
    private final long maxWorkerId = ~(-1L << workerIdBits); private final long maxDatacenterId = ~(-1L << datacenterIdBits); private final long sequenceMask = ~(-1L << sequenceBits);
    private long workerId; private long datacenterId; private long sequence = 0L; private long lastTimestamp = -1L;
    public SnowflakeIdGenerator(long workerId, long datacenterId) { if (workerId > maxWorkerId || workerId < 0) throw new IllegalArgumentException("Worker ID out of range"); if (datacenterId > maxDatacenterId || datacenterId < 0) throw new IllegalArgumentException("Datacenter ID out of range"); this.workerId = workerId; this.datacenterId = datacenterId; }
    public synchronized long nextId() { long timestamp = System.currentTimeMillis(); if (timestamp < lastTimestamp) throw new RuntimeException("Clock moved backwards");
        if (timestamp == lastTimestamp) { sequence = (sequence + 1) & sequenceMask; if (sequence == 0) timestamp = waitNextMillis(lastTimestamp); } else sequence = 0L;
        lastTimestamp = timestamp; return ((timestamp - epoch) << (workerIdBits + datacenterIdBits + sequenceBits)) | (datacenterId << (workerIdBits + sequenceBits)) | (workerId << sequenceBits) | sequence; }
    private long waitNextMillis(long lastTimestamp) { long timestamp = System.currentTimeMillis(); while (timestamp <= lastTimestamp) timestamp = System.currentTimeMillis(); return timestamp; }}


2)数据库号段分配


原理:维护一个独立的 global_id 表,分库按步长分配 ID:


示例

CREATE TABLE global_id (    id INT PRIMARY KEY AUTO_INCREMENT,    stub CHAR(1) NOT NULL UNIQUE);-- 步长设置:SET @@auto_increment_increment = 2;SET @@auto_increment_offset = 1;

二、跨库跨表查询复杂性


1、问题描述


分库分表后,聚合查询(如总数统计、分页查询)需要跨多个分片表执行,增加了查询复杂度。


例如:


2、解决方案


1)使用中间件(推荐)



2)手动分片查询



示例代码:聚合查询


public int countAllOrders() {    int total = 0;    for (String db : List.of("db1", "db2", "db3")) {        String sql = "SELECT COUNT(*) FROM " + db + ".orders";        total += jdbcTemplate.queryForObject(sql, Integer.class);    }    return total;}

示例代码:跨分片分页查询


public List<Order> paginateOrders(int page, int size) {    List<Order> allOrders = new ArrayList<>();    for (String table : List.of("orders_1", "orders_2")) {        String sql = "SELECT * FROM " + table + " LIMIT 100";        allOrders.addAll(jdbcTemplate.query(sql, new OrderRowMapper()));    }    allOrders.sort(Comparator.comparing(Order::getCreatedAt));    return allOrders.stream()            .skip((page - 1) * size)            .limit(size)            .collect(Collectors.toList());}

手动分片查询的方案,如果数据比较多,性能会比较差。


三、分布式事务问题


1、问题描述


分布式事务(如订单表在库 A,库存表在库 B)无法使用单库事务,导致可能会出现数据的一致性问题。


2、解决方案


1)分布式事务框架



示例代码:


@GlobalTransactionalpublic void createOrder(Order order) {    orderService.saveOrder(order); // 写入库A    stockService.reduceStock(order.getProductId()); // 更新库B}

2)柔性事务



四、分片键设计问题


1、问题描述


分片键选择不当可能导致数据倾斜(热点问题)或查询路由效率低。


2、解决方案


1)分片键设计原则



2)路由表



示例代码:路由表查询


public String getTargetTable(int userId) {    String sql = "SELECT table_name FROM routing_table WHERE user_id = ?";    return jdbcTemplate.queryForObject(sql, new Object[]{userId}, String.class);}

五、数据迁移问题


1、问题描述


扩容(如从 4 个分片扩展到 8 个分片)时,旧数据需要迁移到新分片,迁移复杂且可能影响线上服务。


2、解决方案


1)双写策略



2)增量同步



示例:Canal 配置

canal.destinations:  example:    mysql:      hostname: localhost      port: 3306      username: root      password: password    kafka:      servers: localhost:9092      topic: example_topic



六、分页查询问题


1、问题描述


分页查询需要从多个分片表合并数据,再统一分页,逻辑复杂度增加。


2、解决方案


各分片分页后合并:先按分片分页查询,业务层合并排序后分页。

中间件支持分页:如 ShardingSphere。


示例代码:跨分片分页


public List<Order> queryPagedOrders(int page, int size) {    List<Order> results = new ArrayList<>();    for (String table : List.of("orders_1", "orders_2")) {        results.addAll(jdbcTemplate.query("SELECT * FROM " + table + " LIMIT 100", new OrderRowMapper()));    }    results.sort(Comparator.comparing(Order::getCreatedAt));    return results.stream().skip((page - 1) * size).limit(size).collect(Collectors.toList());}

但如果分的表太多,可能会有内存占用过多的问题,需要做好控制。


七、运维复杂性


1、问题描述


分库分表后,运维难度增加:



2、解决方案


自动化运维平台:如阿里云 DMS。

监控工具:使用 Prometheus + Grafana 实现分片监控。


总结


分库分表本质上是“性能换复杂度”,它虽然能有效提升系统的性能和扩展性,但问题也随之而来。


分库分表后带来的问题总结如下:


问题解决方案
全局唯一 ID雪花算法、号段分配、Leaf
跨库跨表查询中间件支持(如 ShardingSphere)或手动合并
分布式事务分布式事务框架(Seata)、消息最终一致性
分片键设计问题路由表或高效分片键
数据迁移问题双写策略或增量同步(如 Canal)
分页查询问题分片查询后合并排序
运维复杂性自动化工具(DMS)、监控工具(Prometheus + Grafana)


应根据业务场景选择适合的分库分表策略,并通过工具和技术方案,解决由此带来的一些问题,最终实现系统的高性能与高可靠性。


作者丨苏三

来源丨公众号:苏三说技术(ID:susanSayJava)

dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

分库分表 分布式事务 ShardingSphere 数据迁移 全局唯一ID
相关文章