常見問題
本文主要介紹云服務診斷在使用過程中的常見問題及解決辦法。如需更多幫助請查看云服務診斷目錄下其他幫助文檔。歡迎加入釘釘交流群(群號:86570007290)與產品團隊分享您的問題和觀點。
FAQ
問:使用健康狀態為什么需要創建AliyunServiceRoleForHealth服務關聯角色?
答:云服務診斷在獲取資源的歷史健康狀態時會進行定期的檢測,需要AliyunServiceRoleForHealth服務關聯角色以及對應的角色權限策略AliyunServiceRolePolicyForHealth來查詢您賬戶下云資源的資源可用性狀態。 健康狀態檢測不消耗您賬戶下的資源。
問:「網站無法訪問」診斷為什么需要創建AliyunServiceRolePolicyForNis和AliyunServiceRoleForResourceMetaCenter的服務關聯角色?
答:云服務診斷在「網站無法訪問」診斷場景中需通過資源管理查詢您賬戶下的云資源信息來形成資源關系拓撲,資源管理需要AliyunServiceRoleForResourceMetaCenter服務關聯角色以及對應的角色權限策略AliyunServiceRolePolicyForResourceMetaCenter。 另外在「網站無法訪問」診斷場景中使用網絡智能服務的能力進行網絡資源實例的診斷,網絡智能服務需要AliyunServiceRolePolicyForNis服務關聯角色以及對應的角色權限策略AliyunServiceRolePolicyForNis。
問:為什么我的RAM用戶(子賬號)無法創建服務關聯角色?
答:RAM子賬號需要擁有指定的權限才能創建相應的服務關聯角色,請根據界面提示操作即可。主賬號創建服務關聯角色更加簡單方便,主賬號創建后子賬號無需再創建。
問:為什么我有云資源,但看不到云資源的健康狀態?
答:若健康狀態資源列表為空,您可能未開通資源中心服務。健康狀態依賴資源中心服務同步您保有的云資源列表,您可前往免費開通。同時健康狀態支持的云產品仍在不斷豐富中,可能暫時無法覆蓋您所有云資源,查看已支持的產品清單請參見健康狀態支持產品及說明。
問:為什么我的RAM用戶(子賬號)無法訪問云服務診斷?
答:為了提供更安全的服務,云服務診斷進行了系統升級。自2024年10月8日起,RAM子賬號訪問云服務診斷需要只讀或管理權限,請聯系管理員授權。權限說明請參見只讀及管理權限。
問:為什么有些功能不支持子賬號和STS賬號使用?
答:「網站無法訪問」診斷以及「網絡與CDN」相關診斷,因為涉及比較多的其他云產品能力和復雜的權限管控要求,暫時不支持子賬號和STS賬號使用,支持時間另行通知。如需使用以上功能,請以主賬號登錄使用。
問:健康狀態的不可用具體指什么,判斷標準是什么,可信度如何?
答:不可用定義:因阿里云原因(如故障、計劃內維護變更等)導致客戶某個云資源在某個時段完全不響應用戶正常請求(如宕機、完全無法連通、全部返回5xx或不返回等)或服務可用性低于正常波動范圍(根據服務特點而定),則認為該云資源在該時段內服務不可用。
因為云產品較多,差異較大,不同云產品在不可用定義上可能存在差別,判斷標準也有所不同。詳情請參見健康狀態支持產品及說明。
健康狀態基于各云產品的自主監測或云資源的日志分析,結果可信。如您對產品功能或判斷標準有寶貴建議,歡迎加入釘釘交流群(群號:86570007290),我們將竭誠為您服務。
問:健康狀態與阿里云健康看板有什么區別?
答:云服務診斷的云資源健康狀態與阿里云健康看板均可展示云產品可用性狀態。但兩者在應用場景、資源粒度等方面各有側重,詳見下表:
應用場景 | 用戶云資源日常運維和問題排查 | 重大故障披露和公示 |
可用性粒度 | 資源粒度:云產品每一個可獨立管理及運行的實例或服務統稱為一個云資源,如ECS的每一個實例、OSS的每一個bucket | 可用區+云產品粒度:如華北2(北京)可用區的ECS |
時間粒度 | 以小時為粒度,部分產品可精確到秒。可查看近15天 | 以天為粒度,可查看近1年 |
產品范圍 | 用戶賬號下的云資源 | 阿里云全部公共云產品 |
總結 | 后者針對的是所有阿里云用戶;前者針對的單一用戶。 后者出現可用性異常,若影響了某用戶的某云資源不可用,前者會在該用戶下展示異常,未影響的用戶不展示異常。 前者出現可用性異常,若只是個別云資源問題,則不會在后者展示異常。 用戶運維排查問題時,可優先查看前者,若前者出現異常再查看后者,若后者正好有對應的服務事件,可關注服務事件的處理動態。若后者無服務事件,可通過診斷進一步排查或聯系客服。 |
問:健康狀態與服務等級協議(SLA)的關系,是否可以依據健康狀態結果進行賠償申請?
答:云服務診斷的云資源健康狀態與服務等級協議沒有直接關系,也不能依據健康狀態結果進行賠償申請。詳見下表:
應用場景 | 用戶云資源日常運維和問題排查 | 云產品服務等級指標及賠償方案,即服務承諾 |
不可用定義 | 部分產品相同,部分產品不相同,需針對特定產品進行比較,不能簡單等價 | |
時間因素 | 以小時為粒度展示異常,但不代表該小時全部不可用。假設ECS 9:05-9:15異常,則9:00-9:59的小時段會標記異常。且僅保留近15天的記錄 | 以月為粒度計算可用性指標,某天或某小時異常不能單獨申請賠償,需要進行累計 |
指標計算 | 計算的指標僅反映某個時段的二分情況,即只區分正常或異常,不記錄具體指標值 | 往往需要計算整個月的平均值,每個時段的指標值都對結果有影響,都應該準確計算 |
限制條件 | 不區分引起不可用的原因,只關注可用性狀態 | 往往有一些排除項,如客戶受到黑客攻擊引起的、阿里云所屬設備以外的問題引起的、阿里云預先通知客戶后進行系統維護所引起的不可用等,不在指標計算范圍 |
總結 | 兩者除了部分產品的不可用定義相同,其余關鍵維度均有明顯差異,不能將云服務診斷的健康狀態用于計算服務等級指標。如有賠償申請訴求,請遵循服務等級協議。 |