「升级」升级MySQL 8.0的诡异故障，utf8mb4_0900_ai

有程序员看到这个需求，想当然就按照先后顺序，用1、2、3、4、5来表示对应状态，确实简单不会出错，也方便先后对比，比如要查找所有“已确认”之前的订单，就查查“已确认”的状态码是4，那么找状态码<4的订单就可以。
然后，有一天，忽然要在两个状态之间加入某个中间状态，比如“已确认”之后需要新的风险评估，通过了才可以去拣货，怎么办？总不可能在3和4之间加一个3.5吧？因为这个数据字段本来就是整数型啊。
所以“有经验”一点的程序员会改改，一开始就不按照1、2、3、4、5这样来分配状态码，而是按100、200、300、400、500，留足空隙，这样就避免了3.5的尴尬，直接给“风控系统已通过”分配350就可以了。
但这仍然不够。如果业务忽然要求既有顺序要变，比如之前“已确认”在前，“风控系统已通过”在后，现在要求“风控系统已通过”在前，“已确认”在后，该怎么办？350总不可能大于400呀。
如果你了解了collation就会发现，这是同样的问题。数据的标识和数据的有序性应当隔离开来，标识是一套规范，有序性是另一套规范，两者可以随意组合。你看，Unicode字符的排序可以按照字符的编码值来，也可以按照其它规范来——加载不同collation就是了嘛。
所以，“已下单，未支付”的代码就可以是OUPD，“已支付“的代码就可以是PDED，“已确认”的代码就可以是CFMD…… 它们只用来做唯一标识，没有任何其它意义。然后在外面定义一套顺序规则，比如OUPD < PDED < CFMD，然后提供一个查询接口，做任何比较的时候都查询这个接口就好——实际上许多语言可以自定义compare函数来做排序，道理就在这里。万一将来要改业务流程，比如加入新状态，或者更改状态的先后顺序，也只需要做一点点更改，规则查询接口保持不变，其它地方更是保持原封不动。
最后我想补充的是，即便你有非常多的软件开发经验，但如果要做“国际化”的业务，仍然会面对许多想不到的问题——e、ē、é、ě、è、ê、?的等价问题就是一例。这类问题，不亲自经历是很难想象的。
【「升级」升级MySQL 8.0的诡异故障，utf8mb4_0900_ai_ci是什么？】回想起来，十多年前我开始接触这方面业务，还真的积累了一些经验，是坐在办公室里写代码想不到，也非常有意思的问题。如果大家有兴趣，下回我们接着聊。

「升级」升级MySQL 8.0的诡异故障，utf8mb4_0900_ai_ci是什么？( 三 )

推荐阅读

庆祝中华人民共和国成立70周年系列论坛第六场9月19日开讲

商标|四川多家带青花椒店名餐馆被诉因上海一公司注册了商标：专家回应

形容杂志的词?诗词选刊杂志

旅行者|靠“捡破烂”捡出一套别墅？还能自己当镇长，这款游戏也太自由了

女神|气质温婉的小姐姐，优雅时尚的穿搭，女神范儿十足！

前额头发少怎么办

小便短赤是阴虚火旺吗

巫刚|和初恋有一段失败的婚姻，62岁离异无儿无女，巫刚的无奈谁又懂？

南方大部气温将缓慢回升江南华南多阴雨雪天气

虎扑篮球|里弗斯：球队今晚情绪低迷但是相比前几场比赛已经有所改善

维纳斯被称为什么女神？

科技视讯 ROG幻14创新设计引领“像素潮”，ROG跨界再出圈

李潇|大象专访编剧李潇：《纵有疾风起》中男主角是为靳东量身打造的！

佳德智诚|德智诚：店铺运营的引流、转化和变现技巧有那些？

『中国青年网』 “网红窗帘”主人回来了！网友：连续剧杀青了，

攻略：如何玩转iQOO社区

茯红茶价格,安化黑茶茯砖茶价格

中国蓝新闻把教玩具“搬”上网、开启英语直播…桥下西岙创收致富这样做！

光明网-《光明日报》|“拿得起”还要“放得下”

吕布被称为三姓家奴的原因