服務(wù)器端緩存失效的應(yīng)對方法經(jīng)驗(yàn)總結(jié)
  • 更新時(shí)間:2024-10-30 22:16:50
  • 建站經(jīng)驗(yàn)
  • 發(fā)布時(shí)間:2年前
  • 399

緩存失效情況舉例

看下這個(gè)段偽代碼:

local value = get_from_cache(key)

if not value then

value = query_db(sql)

set_to_cache(value, timeout = 100)

end

return value

看上去沒有問題,在單元測試情況下,也不會(huì)有異常。

但是,進(jìn)行壓力測試的時(shí)候,你會(huì)發(fā)現(xiàn),每隔100秒,數(shù)據(jù)庫的查詢就會(huì)出現(xiàn)一次峰值。如果你的cache失效時(shí)間設(shè)置的比較長,那么這個(gè)問題被發(fā)現(xiàn)的機(jī)率就會(huì)降低。

為什么會(huì)出現(xiàn)峰值呢?想象一下,在cache失效的瞬間,如果并發(fā)請求有1000條同時(shí)到了 query_db(sql) 這個(gè)函數(shù)會(huì)怎樣?沒錯(cuò),會(huì)有1000個(gè)請求打向數(shù)據(jù)庫。這就是緩存失效瞬間引起的風(fēng)暴。它有一個(gè)英文名,叫 "dog-pile effect"。

怎么解決?自然的想法是發(fā)現(xiàn)緩存失效后,加一把鎖來控制數(shù)據(jù)庫的請求。具體的細(xì)節(jié),春哥在lua-resty-lock的文檔里面做了詳細(xì)的說明,我就不重復(fù)了,請看這里。多說一句,lua-resty-lock庫本身已經(jīng)替你完成了wait for lock的過程,看代碼的時(shí)候需要注意下這個(gè)細(xì)節(jié)。

傳統(tǒng)緩存失效應(yīng)對策略 為了提高業(yè)務(wù)訪問速度,提升業(yè)務(wù)讀并發(fā),很多用戶都會(huì)在業(yè)務(wù)架構(gòu)中引入緩存層。業(yè)務(wù)所有讀請求全部路由到緩存層,通過緩存的內(nèi)存讀取機(jī)制大大提升業(yè)務(wù)讀取性能。緩存中的數(shù)據(jù)不能持久化 ,一旦緩存異常退出,那么內(nèi)存中的數(shù)據(jù)就會(huì)丟失,所以為了保證數(shù)據(jù)完整,業(yè)務(wù)的更新數(shù)據(jù)會(huì)落地到持久化存儲中,例如DB。目前云用戶的業(yè)務(wù)架構(gòu)一般如下圖:

在上圖中,大家可以看到,用戶的更新數(shù)據(jù)直接持久化到DB, 業(yè)務(wù)讀請求直接請求緩存數(shù)據(jù),所以業(yè)務(wù)需要解決緩存失效問題,即解決因?yàn)閿?shù)據(jù)變更導(dǎo)致緩存中的數(shù)據(jù)失效的問題。 目前業(yè)務(wù)解決緩存失效問題的解決方法一般是業(yè)務(wù)實(shí)現(xiàn)DB、緩存雙寫。通過業(yè)務(wù)雙寫解決緩存失效,存在如下的問題:

代碼侵入性比較強(qiáng),需要雙寫兩份存儲,任何對DB的數(shù)據(jù)變更,都需要同時(shí)更新緩存,代碼層面后期可維護(hù)程度不高

用戶請求線程里同步調(diào)用緩存,對緩存存在強(qiáng)以來,遇到緩存超時(shí)等異常時(shí),沒有辦法做到有效的重試,遇到異常給用戶返回系統(tǒng)錯(cuò)誤、操作失敗等信息,嚴(yán)重影響用戶體驗(yàn)

用戶請求線程里同步完成DB、緩存雙寫,變更請求鏈路長,訪問延遲大,影響用戶體驗(yàn)

RDS數(shù)據(jù)訂閱消費(fèi),輕松解決緩存失效

在阿里巴巴內(nèi)部同樣也遇到了緩存失效的問題,隨著業(yè)務(wù)架構(gòu)得不斷調(diào)整優(yōu)化,我們已經(jīng)沉淀出一套高可靠、極優(yōu)雅得緩存失效架構(gòu)。即通過數(shù)據(jù)傳輸提供的數(shù)據(jù)訂閱功能,異步獲取DB(例如公共云上的RDS)的增量數(shù)據(jù),根據(jù)增量數(shù)據(jù)進(jìn)行緩存失效。具體的架構(gòu)類似下圖:

在這個(gè)架構(gòu)里面,緩存更新流程如下:

1.業(yè)務(wù)完成DB更新后即返回請求

2.數(shù)據(jù)訂閱通過日志解析方式實(shí)時(shí)解析并訂閱DB的增量更新數(shù)據(jù),當(dāng)發(fā)現(xiàn)DB有數(shù)據(jù)更新時(shí),將增量數(shù)據(jù)推送給下游消費(fèi)者

3.下游消費(fèi)業(yè)務(wù)一旦接收到增量更新數(shù)據(jù),即調(diào)用消費(fèi)線程進(jìn)行緩存更新

至此完成整個(gè)緩存更新過程。

從上面的緩存失效流程,可以看出這種緩存失效機(jī)制:

1.更新路徑短,延遲低: 緩存失效為異步流程,業(yè)務(wù)更新DB完成后直接返回,不需要關(guān)心緩存失效流程,整個(gè)更新路徑短,更新延遲低

2.應(yīng)用簡單可靠:應(yīng)用無需實(shí)現(xiàn)復(fù)雜雙寫邏輯,只需啟動(dòng)異步線程監(jiān)聽增量數(shù)據(jù),更新緩存數(shù)據(jù)即可

3.應(yīng)用更新無性能消耗:因?yàn)閿?shù)據(jù)訂閱是通過解析DB的增量日志來獲取增量數(shù)據(jù),獲取數(shù)據(jù)的過程對業(yè)務(wù)、DB性能無損

小結(jié) 數(shù)據(jù)訂閱功能為阿里云數(shù)據(jù)傳輸提供的一種數(shù)據(jù)分發(fā)方式。通過數(shù)據(jù)訂閱實(shí)現(xiàn)的緩存失效策略,讓業(yè)務(wù)更新更快捷,讓業(yè)務(wù)邏輯更簡單、更可靠。

數(shù)據(jù)訂閱只是數(shù)據(jù)傳輸提供的一種傳輸方式,除數(shù)據(jù)訂閱之外,數(shù)據(jù)傳輸還提供了數(shù)據(jù)實(shí)時(shí)同步,不停服遷移等多種傳輸能力,如需了解數(shù)據(jù)傳輸更多詳情,請猛擊數(shù)據(jù)傳輸。

我們專注高端建站,小程序開發(fā)、軟件系統(tǒng)定制開發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開發(fā)、各類API接口對接開發(fā)等。十余年開發(fā)經(jīng)驗(yàn),每一個(gè)項(xiàng)目承諾做到滿意為止,多一次對比,一定讓您多一份收獲!

本文章出于推來客官網(wǎng),轉(zhuǎn)載請表明原文地址:https://www.tlkjt.com/experience/7402.html
推薦文章

在線客服

掃碼聯(lián)系客服

3985758

回到頂部