阿里云對象存儲OSS(Object Storage Service)是阿里云提供的海量、安全、低成本、高可靠的云存儲服務(wù)。其數(shù)據(jù)設(shè)計持久性不低于99.9999999999%(12個9),服務(wù)可用性(或業(yè)務(wù)連續(xù)性)不低于99.995%。

如果發(fā)現(xiàn)賬號下的 Bucket 出現(xiàn)可用性(5xx)降低的潛在風(fēng)險,建議您按照如下思路檢查:
1、如果發(fā)現(xiàn)客戶端側(cè)出現(xiàn) 504/502/503 的場景,可以嘗試 ping 延遲是否穩(wěn)定、MTR 鏈路是否存在間接性丟包、telnet 服務(wù)端 80/443 端口是否正常通信。如果發(fā)現(xiàn)網(wǎng)絡(luò)異常,需要先排除掉客戶端的網(wǎng)絡(luò)鏈路異常后再向下分析。
2、如果發(fā)現(xiàn)客戶端側(cè)出現(xiàn) 500 的場景并且復(fù)現(xiàn)頻率較高,可以先通過 try catch 機(jī)制捕獲到異常后合理進(jìn)行重試,記錄下異常的 requestID 盡快反饋到阿里云售后進(jìn)行分析。
3、如果是 ECS 通過公網(wǎng)訪問 OSS 出現(xiàn)了 5xx ,檢查您的 ECS 是否有公網(wǎng)帶寬超過限制、網(wǎng)卡持續(xù)跑滿的情況。帶寬超限后應(yīng)及時擴(kuò)容 ECS 帶寬,避免帶來業(yè)務(wù)影響。
4、檢查 ECS 主機(jī)的網(wǎng)絡(luò)連接數(shù)、文件描述符的數(shù)量是否出現(xiàn)瓶頸,可能導(dǎo)致 SocketTimeOut 的問題出現(xiàn)。根據(jù)主機(jī)的負(fù)載情況、實(shí)例規(guī)格,合理的設(shè)置并發(fā)數(shù)量,優(yōu)化業(yè)務(wù)代碼。

5、檢查客戶業(yè)務(wù)代碼中初始化配置的, MaxConnections、SocketTimeout、ConnectionTimeout 參數(shù)是否合理,弱網(wǎng)情況下應(yīng)該適當(dāng)放大。
6、檢查客戶是否配置過 OSS 鏡像回源功能,保證鏡像回源的站點(diǎn)可以正常通信,盡量不要對 OSS 回源 IP 設(shè)置防火墻策略, OSS 鏡像回源采用的是公網(wǎng) IP 回源,定期會進(jìn)行 IP 或者 IP 段的更換,如果客戶的原站設(shè)置了防火墻,可能出現(xiàn) 5xx 的回源超時
