为什么数据库会丢失数据?( 二 )


  • ...
  • RAID 使用的分割和镜像策略与分布式数据库中的分片(Partition)和副本(Replication)比较相似,分割和分片将数据切分后分配到不同的磁盘或者机器,而镜像和副本的作用都是复制数据 。
    很多现代的操作系统都会提供基于软件的 RAID 实现,一些云服务厂商也会使用自研的文件系统或者冗余备份机制:
    • Google 使用 Google 文件系统管理文件,它以块的方式存储文件并且通过主服务管理所有的文件块[^8];
    • Microsoft 在 Azure 中使用擦除编码的方式计算冗余数据[^9];
    硬件错误在生产环境中很常见,我们只有通过数据冗余和校验才能降低数据丢失的可能性,但是增加冗余的方式也只能不断降低数据丢失的概率,不能 100% 的避免 。
    实现复杂
    数据库管理系统最终会将数据存储在磁盘上,对于很多数据库来说,数据落到磁盘上就意味着持久化完成了 。磁盘作为数据库系统的下层,磁盘能够稳定存储数据是数据库能够持久化数据的基础 。
    为什么数据库会丢失数据?

    文章插图
    database-and-disk
    图 3 - 数据库依赖磁盘
    很多人都误认为使用 write就能将数据写入到磁盘上,然而这是错误的 。函数 write不仅不能保证数据写入磁盘,有的实现甚至都不能保证目标空间保留给了写入的数据[^10] 。一般情况下,对文件的 write只会更新内存中的页缓存,这些页缓存不会立刻刷入磁盘,操作系统的 flusher 内核线程会在满足以下条件时将数据落盘[^11]:
    • 空闲内存下降到了特定的阈值,需要释放脏页占用的内存空间;
    • 脏数据持续了一定时间,最老的数据就会被写入磁盘;
    • 用户进程执行 sync或者 fsync系统调用;
    如果我们想要将数据立刻刷入磁盘,就需要在执行 write后立刻调用 fsync等函数[^12],当 fsync等函数返回后,数据库才会通知调用方数据已经成功写入 。
    为什么数据库会丢失数据?

    文章插图
    write-and-fsyn
    图 4 - 写入和落盘
    write和 fsync在数据库管理系统中非常重要,它们是提供持久性保证的核心方法,一些开发者对 write的理解错误写出错误的代码就会导致数据丢失 。
    除了持久化的特性之外,数据库可能还需要提供 ACID(Atomicity, Consistency, Isolation, Durability)或者 BASE(Basically Available, Soft state, Eventual consistency)的保证,有些数据库还会提供分片、副本以及分布式事务等复杂功能,这些功能的引入也增加了数据库系统的复杂性,而随着程序复杂性的增加,出现问题的可能性也随之增长 。
    总结
    数据库管理系统是软件工程中最复杂、最重要的系统之一,几乎所有服务的正常运行都建立在数据库不会丢失数据的假设上 。然而因为如下所示的原因,数据库不能完全保证数据的安全:
    • 运维人员在配置和运维时极有可能因为操作失误导致数据丢失;
    • 数据库依赖的底层磁盘发生硬件错误,导致数据无法恢复;
    • 数据库系统支持的功能非常多而且复杂,数据没有及时落盘就可能造成数据丢失;
    一旦发生数据丢失的事故,造成的影响就会非常大,我们在使用数据库存储核心业务数据时也不能完全信任数据库的稳定性,可以考虑使用热备以及快照等方式容灾 。到最后,我们还是来看一些比较开放的相关问题,有兴趣的读者可以仔细思考一下下面的问题:
    • 除了文中列出的数据丢失事故,还有哪些数据库或者云服务商丢失过数据?
    • redis 的 RDB 和 AOF 机制什么时候会将数据落盘?
    • 数据成功写入数据库究竟应该如何定义?
    如果对文章中的内容有疑问或者想要了解更多软件工程上一些设计决策背后的原因,可以在博客下面留言,作者会及时回复本文相关的疑问并选择其中合适的主题作为后续的内容 。
    [^1]: Brandur. May 7, 2017. "The long road to Mongo's durability" https://brandur.org/fragments/mongo-durability
    [^2]: Huachao HUANG. Fri, Sep 8, 2017. "How We Found a Data Corruption Bug in RocksDB" https://pingcap.com/blog/2017-09-08-rocksdbbug/
    [^3]: 腾讯云. Aug, 2018. 关于客户“前沿数控”数据完整性受损的技术复盘 https://mp.weixin.qq.com/s/8JSPY6vHPhg8pX0JwjqttQ
    [^4]: Draven. Dec, 2019. "为什么基础服务不应该高可用 · Why's THE Design?" https://draveness.me/whys-the-design-unstable-infrastructure


    推荐阅读