memcached使用中踩的一些坑世界速读

2023-06-25 12:59:14 博客园

背景

线上启用memcached(以下简称mc)作为热点缓存组件已经多年，其稳定性和性能都经历住了考验，这里记录一下踩过的几个坑。

大key存储

某年某月某日，观察mysql的读库CPU占比有些异常偏高，去check慢查询log，发现部分应有缓存的慢sql居然存在几秒执行一次情况，不符合缓存数小时的代码逻辑。查看业务log在每次查询sql之后也确实有将结果set至mc之中：

(相关资料图)

# python代码mc.set(cache_key, v, 3600)

而set返回的取值却是False而非正常的True，很快想到mc著名的只可存储不超过1MB大小的key限制，在以往的业务场景中没有出现过这么大的key，所以一直没达到过这个限制，直到这一次撞上。要解决超过1MB大小的key存储问题有以下几个思路：

想办法将cache结果变小换个cache组件mc >=1.4.2 版本其实已经支持命令行参数-I指定最大key大小了，线上使用版本支持最小1KB最大128MB的设置将大key拆分为几个子key，通过set_multi和get_multi实现统一的读写。

无论是通过2或3都可以支持更大的key存储，但是更大的key存储对于读写传输其实都更不友好，而思路4需要手动拆分、组装子key略显麻烦，所以优先从思路1着手，意外发现python使用的memcached库其实提供了key压缩功能，在写入时指定min_compress_len参数即可：

mc.set(key, v, time=expires, min_compress_len=1024)

如上表示写入的v对象序列化大小若>=1024则启用压缩存储，库底层会将其压缩后再写入mc，读取时库底层也会自动解压缩后再返回，业务层可以说完全无感，并且压缩后还能极大降低存储和传输成本。最终通过min_compress_len参数启用大key压缩后，原1MB大小的key直瘦身了4/5。

slab钙化

启用大key压缩后mc度过了好一段岁月静好的日子，直到某一天...

大规模key分布变动导致的钙化

查看zabbix上的相关监控，发现mc的key查询miss比例居然接近50%！这个缓存命中率着实让人深思，进一步check后发现同时异常的指标还有evicted items数，日常取值居然可以达到数百/S的级别。mc官方文档对evicted items的定义如下：

evicted                Number of times an item had to be evicted from the LRU before it expired.

即存储的key在其实际过期前被从LRU强制清理了，这一般说明mc剩余可分配内存不足了，所以新key写入时只能先从LRU淘汰一部分key腾出空间后再给新key使用，但是查看mc的内存使用率，明明还有超过>2GB的剩余内存可用。最终调查后真相大白：mc明明剩余大量内存可用，写入新key却不断导致旧key被提前清除的现象其实是mc特有的slab钙化问题所致：

Memcached采用LRU(Least Recent Used）淘汰算法，在内存容量满时踢出过期失效和LRU数据，为新数据腾出内存空间。不过该淘汰算法在内存空间不足以分配新的Slab情况下，这时只会在同一类Slab内部踢出数据。即当某个Slab容量满，且不能在内存足够分配新的Slab，只会在相同Slab内部踢出数据，而不会挪用或者踢出其他Slab的数据。这种局部剔除数据的淘汰算法带来一个问题：Slab钙化。

简单来说memcached 使用的不同尺寸slab一旦分配完成就不可变了，所以如果某类slab已用尽，即便其他slab剩余大量空闲内存也无法再对其加以利用。业务这边之前对使用mc的部分缓存key进行了整合优化，在优化之前单mc的全部5GB内存均已根据key存储情况分配给了特定的slab，而优化之后大大降低了小key的数量，取而代之的是相对更紧凑的大key，key的数量和大小分布都发生了显著的变化，于是原有的适用于大量小key的slab分配就无法满足优化后的key存储了。最终体现为，中等大小的slab内存已被耗尽，每次写入新key只能先通过LRU淘汰部分旧key腾出空间，体现为evicted数异常偏高，并且直接影响了缓存命中率，而小尺寸的slab却长期大量空闲，体现为mc内存使用剩余空间一直充足。网上检索解决钙化问题有三个办法：

1) 重启Memcached实例，简单粗暴，启动后重新分配Slab class，但是如果是单点可能造成大量请求访问数据库，出现雪崩现象，冲跨数据库。2) 随机过期：过期淘汰策略也支持淘汰其他slab class的数据，twitter工程师采用随机选择一个Slab，释放该Slab的所有缓存数据，然后重新建立一个合适的Slab。3) 通过slab_reassign、slab_authmove参数控制。

方法2看上去应是twitter的定制版mc Twemcache的特有功能，方法3则是线上mc已支持的方案，但首次接触也不敢贸然直接在线上使用。考虑到mc仅作为热点缓存其数据可丢失，且部署有多台分摊压力，直接采用低峰时段分别重启单个mc的策略解决，重启后evicted item直接降为0，cache命中率升至90%上下。

少量大key变动导致的钙化

首次钙化之后又是一段岁月静好，直到...某段时间开始一个主要接口偶发耗时会突然飙升一下，对应机器的CPU使用也会瞬间飚高一小阵，查看zabbix监控时，发现mc的 evicted items>0已持续好一段时间，但一直是个位数/S的级别，看着影响不大。进一步执行stats items命令，发现发生key evict的是最大的chunk_size=1048576 的slab 42，这也就是说存在大小在512KB~1MB之间的大key，同时当前mc分配的1MB slab个数已无法满足其存储，也无法再分配出新的1MB大小的slab，最终体现为对于大key的再次钙化。由于slab钙化大key会被频繁evict，对应缓存机制基本失效，所幸server端针对该类大key的读取还做了一个短期的本地cache，避免了每次请求都穿透到db。在某些特定时刻，当mc中对应大key失效且本地cache失效，对应请求又较多的时候，多个独立的请求都会穿透到db获取数据，而后再写入mc，无论是穿透到db获取数据后本地进行相应的数据组装处理逻辑，还是读写mc的压缩、解压缩数据操作，都比较耗CPU，最终会体现为api耗时增加，且CPU使用率也存在飚高的现象。近期并没有涉及大key读写的改动，那这次的大key slab钙化又是怎么来的？进一步探查原因：触发evict的大key近期确实无相关逻辑改动，但该部分旧key的大小和运营放出的资源多少直接相关，近一段时间放出的资源一直持续增加，旧key原本大小是<512KB，所以使用的是512KB的slab 41，近期持续增大为>512KB后，就只能使用1MB的slab 42存储了，对于slab 42来说相当于在原有支持的大key数量基础上又新的大key存储需要支持，又由于slab钙化无法再分配新的slab 42，最终触发evict，cache命中率降低，api偶发耗时上升。最终解决方案：还是在业务低峰期逐个重启mc，触发slab重分配即可。

总结

memcached作为一个开源的纯内存kv缓存组件，上手简单、性能、稳定性都有足够保证，但是实际使用时也不可掉以轻心，对其相关监控与关注不能少，对于其特有的最大key存储限制、slab钙化问题要有一定的认识并能及时处理。转载请注明出处，原文地址：https://www.cnblogs.com/AcAc-t/p/memcached_large_key_slab_calcification.html

参考

https://github.com/memcached/memcached/blob/master/doc/protocol.txt#L637https://github.com/memcached/memcached/wiki/ReleaseNotes142#configurable-maximum-item-sizehttps://www.jianshu.com/p/b91a45711460https://blog.twitter.com/engineering/en_us/a/2012/caching-with-twemcachehttps://www.cnblogs.com/AcAc-t/p/memcached_large_key_slab_calcification.htmlhttps://bugwz.com/2020/05/24/memcached-slab-calcification/#2-2-2、Rebalance执行逻辑https://www.cnblogs.com/Leo_wl/p/3310294.html

张逸杰高考成绩多少_张逸杰高考成绩

6月25日兰州石化丁腈橡胶挂牌价暂稳

威士顿：公司研发的无序分拣机器人除杂效果已在实际应用场景中得到验证，目前产品尚未投入量产，对公司的收入贡献较小

重装电脑系统要多少钱 天天速递

柏拉图制作方法与步骤（柏拉图制作方法）-环球热推荐

梁静茹演唱会观众齐喊开空调上热搜 网友：谁给的勇气不开空调

类黄酮类物质含量排行榜_类黄酮含量高的食物-全球球精选

天天新资讯：海鸥岛有什么地方好玩_海鸥岛有什么好玩的

d18t和nk32有什么区别 d18t 世界新消息

芝罘区启动游泳场所专项整治行动 拒不整改将列入黑名单_焦点消息

环球消息！1周以后，四大生肖事业棒桃花旺，富贵满仓，腰包鼓鼓

热讯：高温持续 各地采取措施积极应对

家庭人口情况说明_家庭贫困情况说明范文

热门：北京警方破环境领域刑事案件近两百起

沙特阿拉伯正在全力追逐尤文主帅阿莱格里，他们提高...

新资讯：三养火鸡面有真假区别?

长源电力资金流向是什么？长源电力主力控盘怎么样？

焦点速递！宝骏悦也“卫士版”正式发售！整套改装仅需6570元

高质量发展看中国|“湘”村振兴：一只小兔子“蹦”出三亿元大产业 热讯

【环球新视野】长三角铁路端午小长假三天发送旅客超900万人次

焦点要闻：中国科学家发现河蚌铰链的耐疲劳秘密

世界速看：万科香港：已向港交所申请批准95亿美元中票计划上市

环球速递！2023年河南高考分数查询网站入口

佳县李家圪台村开展“和谐邻里情 端午粽飘香”主题活动

“绿建”赋能 福州力推装配式建筑及装修应用 今日最新

小叶紫檀盆栽怎么鉴别_小叶紫檀盆景真假鉴别

新疆军区总医院推进优质资源下沉演训一线-每日速讯

剑与远征第七期秘宝峡湾活动什么时候开启

中国男篮开启新一期集训-环球报道

微软将强制更新Win11：经典功能回归-今热点

天天观焦点：2023年大选：阿根廷经济部长马萨代表执政派参加总统竞选

世界关注：北方高温稍稍减弱，9省市仍有35℃以上高温

【环球热闻】北京连续三天最高温超40℃，6月“炎值”因何爆表？

中国石油天然气集团有限公司原副总经理徐文荣接受审查调查

股价连续20交易日低于1元 A股8家房企锁定退市 还有12家走到退市边缘_环球即时看

粮安天下 耕保为先 让5950万亩永久基本农田始终姓“粮”

多名“90后”干部被查引关注：身处关键岗位，贪腐目的“单纯”，爱打网游易入歧途_世界快报

通讯！次世代主机也撑不住：《赛博朋克2077》DLC主机分辨率最低仅900P

环球微头条丨华硕新Zenfone 10曝光：价格不错

观点：教育部发布2023年高考志愿填报十问十答，你关心的都在这

端午假期首日 各地景区人气值咋样？数据来了-资讯推荐

今日看点：聪明睿智，城府深沉的星座，蔑视算计他人，品格高尚，水平高

天天资讯：逆水寒手游神相和素问哪个好玩 职业对比分析

宁德时代：拟出资6.26亿元为员工提供无息借款买房

天天热讯:职工转岗就业打造森林旅游经济产业链 绿色转型见成效

全球焦点！【宇锋智能】参评“维科杯·OFweek 2023中国智造数字化转型先锋人物奖”

热文：6月25日河南地区萤石市场价格暂稳

全球看热讯：赛尔号十四周年氪金/福利大汇总！

朱巷镇：推进“四好农村路”建设 为乡村振兴不断注入活力

全国最大新能源配套电化学储能电站并网_世界新动态

“数实融合”为长三角中小企业高质量发展开辟新天地

环球头条：工信部：推动不少于3000家企业建设5G工厂

今日看点：最终幻想16AP点怎么获得？最终幻想16AP点速刷攻略

浙江一药农卖元胡10分钟赚52万元 多味中药价冲破天花板|世界观点

环球观天下！旅游总收入突破190亿元！端午假期江苏接待国内游客超1880万人次

世界微动态丨海洋环境保护法修订草案二审：健全生态保护补偿制度

2023年陕西高考录取分数线：一本文史类489分，理工类443分|环球今日讯

视频：瓦格纳撤离画面曝光 焦点热闻

端午小长假北京市公园纳客326万人次

苹果 Vision Pro 头显特性：可在厨房家电“身上”设置倒计时

天天时讯：公牛集团(603195)重大事项点评：股东拟减持释放流动性 经营稳健向好

怀安联社：全力推动双基共建 开创农信“新”局面

国铁集团：全国铁路今日预计发送旅客1515万人次

南平：循绿争先，闽北农事兴

奇葩！男子“偷”走两条路，民警一看：真没了

OpenAI首席执行官表态支持欧盟AI监管-全球焦点

气象专家：厄尔尼诺将给我国带来哪些影响？ 当前播报

无锡首座千吨级船闸——江阴船闸江河咽喉 13个省(市)船舶常年过闸

勇士签下破产版库里，他能在接下来的夏季联赛中大杀四方吗？

天天实时：成都市郫都区人才驿站申请指南（条件＋流程）

IGBT股票的龙头有哪些？（2023/6/25）_全球快播

试车日志 | 东风本田UR-V：家用还得大五座！

苏州36路公交车路线图_苏州36路公交车路线

6月24日欧洲地区对二甲苯收盘价格下滑

世界头条：用户黏度_关于用户黏度介绍

全球动态:用户驻地设备_关于用户驻地设备介绍

热消息：国内首条跨省轨交系统无感换乘线路开通

四川聚焦住房城乡建设领域重大科技战略任务 单个项目最高补助60万元_天天信息

信达证券给予合康新能买入评级 合康定增美的股比提升 光储事业有望加速发展|全球时快讯

每日观察!沅陵县市场监管局开展打击传销进校园宣传活动

重装电脑系统要多少钱天天速递

梁静茹演唱会观众齐喊开空调上热搜网友：谁给的勇气不开空调

芝罘区启动游泳场所专项整治行动拒不整改将列入黑名单_焦点消息

热讯：高温持续各地采取措施积极应对

高质量发展看中国|“湘”村振兴：一只小兔子“蹦”出三亿元大产业热讯

佳县李家圪台村开展“和谐邻里情端午粽飘香”主题活动

“绿建”赋能福州力推装配式建筑及装修应用今日最新

股价连续20交易日低于1元 A股8家房企锁定退市还有12家走到退市边缘_环球即时看

粮安天下耕保为先让5950万亩永久基本农田始终姓“粮”

端午假期首日各地景区人气值咋样？数据来了-资讯推荐

天天资讯：逆水寒手游神相和素问哪个好玩职业对比分析

天天热讯:职工转岗就业打造森林旅游经济产业链绿色转型见成效

朱巷镇：推进“四好农村路”建设为乡村振兴不断注入活力

浙江一药农卖元胡10分钟赚52万元多味中药价冲破天花板|世界观点

视频：瓦格纳撤离画面曝光焦点热闻

天天时讯：公牛集团(603195)重大事项点评：股东拟减持释放流动性经营稳健向好

怀安联社：全力推动双基共建开创农信“新”局面

气象专家：厄尔尼诺将给我国带来哪些影响？当前播报

四川聚焦住房城乡建设领域重大科技战略任务单个项目最高补助60万元_天天信息

信达证券给予合康新能买入评级合康定增美的股比提升光储事业有望加速发展|全球时快讯

费卢杰六日武器瞄准敌人有什么技巧环球热消息

绍兴新昌：“微改精提”推进乡村民宿品质发展

上交所中报预约时间出炉康缘药业拔得头筹

武汉外贸持续升温第三艘汉亚直航船首航日韩航线汉亚直航系列船舶再添“新军”

全力支持中小微企业纾困增产增效南通投放专项资金贷款超17亿元，占全省规模比例超17%

memcached使用中踩的一些坑世界速读

6月25日巴陵石化己内酰胺价格动态讯息

【环球快播报】重阳节吃啥?_重阳节吃什么呀重阳节吃的食物

世界视讯！多伦多记者：西亚卡姆想整个生涯都留在猛龙成效力时间最长球员

川能动力：正在积极筹备采矿系统的试生产前期准备工作环球新视野

重装电脑系统要多少钱天天速递

蔚蓝档案兑换码永久有效蔚蓝档案兑换码2023最新大全-全球即时

苏菲的世界简介主要内容（苏菲的世界主要内容是什么）

弯曲半径一般不小于管径的_____倍弯曲半径-全球速递

小说中虚构好听的地名_好听的地名当前动态

88倍单挑8亿奖池，大乐透第23071期晒票，往前走去找自己的方向焦点短讯