在作業啟動前,您需要配置作業部署信息。本文為您介紹如何配置作業部署信息。
前提條件
操作步驟
登錄實時計算控制臺。
單擊目標工作空間操作列下的控制臺。
在 頁面,單擊目標作業名稱。
在部署詳情頁簽,單擊目標區域右側的編輯。
說明因為SQL作業基礎配置需要返回到
頁面,才能編輯作業草稿并重新部署。所以在單擊基礎配置區域右側的編輯后,您還需要在彈出的對話框中,單擊確定。修改作業部署信息。
單擊保存。
基礎配置
作業類型 | 說明 |
SQL作業 | 包括SQL代碼、引擎版本、附加依賴文件、備注和作業標簽信息。參數含義詳情請參見SQL作業開發。 說明 單擊基礎配置右側的編輯后,需要返回到SQL開發頁面編輯作業草稿并重啟部署。如果您需要繼續進行編輯,請單擊確定。 |
JAR作業 | 包括引擎版本、JAR Uri、 Entry Point Class、 Entry Point Main Arguments、附加依賴文件、備注、Kerberos集群和作業標簽。參數含義詳情請參見部署作業。 |
Python作業 | 包括引擎版本、Python Uri、Entry Module、Entry Point Main Arguments、Python Libraries、Python Archives、 附加依賴文件、備注、Kerberos集群和作業標簽。參數含義詳情請參見部署作業。 |
運行參數配置
參數 | 說明 |
系統檢查點間隔 | 定時執行系統檢查點的時間間隔。如果不填寫,將會關閉系統檢查點。 |
系統檢查點超時時間 | 默認值為10分鐘,到達默認值后系統檢查點將生成失敗。 |
兩次系統檢查點間最短間隔 | 兩次系統檢查點之間的最短時間間隔,如果系統檢查點最大并行度是1,則該配置確保兩個系統檢查點之間有一個最短時間間隔。 |
State數據過期時間 | 即TTL(Time-to-Live),狀態信息的存活時間,單位為小時,默認值為36小時,即作業狀態信息將在36小時后自動過期并清除。 重要 此處默認值根據云上最佳實踐的經驗值設置,與開源的默認值不同(開源默認值為0,表示狀態信息永不過期)。 當數據首次進入系統并被處理后,它會存儲在狀態內存中。當下一次相同主鍵的數據到來時,系統會使用之前存儲的狀態數據進行計算,并更新其訪問時間。這一過程是實時計算的核心,因為它依賴于數據的持續流動。如果數據在設定的TTL時間窗口內未被再次訪問,它將被系統視為過期,并從狀態存儲中清除。 通過合理設置TTL的值,不僅可以維持計算的精確性,還能及時清理陳舊數據,有效減少狀態內存的占用,進而降低系統內存負擔,提升計算效率和系統穩定性。 |
Flink重啟策略 | 在Flink作業中,任務失敗與重啟的機制依賴于作業的拓撲結構。即當多個任務(Task)在短時間內失敗時,它們之間的連接關系會影響重啟行為:
只有沒配置重啟策略的情況下,Flink才會根據系統檢查點開啟與否來決定是否要重啟作業。如果配置了重啟策略,則會按照配置的策略進行重啟。該參數取值如下:
|
其他配置 | 在此設置其他Flink配置。例如 |
日志配置
參數 | 說明 |
日志歸檔 | 默認已開啟日志歸檔功能。開啟日志歸檔后,您可以在作業日志頁面查看歷史作業實例的日志,詳情請參見查看歷史作業實例日志。 說明
|
歸檔日志有效期 | 歸檔日志有效期默認為7天。 |
根日志級別 | 日志級別從低到高順序如下:
|
類日志等級 | 填寫日志名稱和日志級別。 |
日志模板 | 可以選擇為default系統模板或自定義模板。選擇自定義模板時支持將日志輸出到其他存儲,詳情請參見配置作業日志輸出。 |
相關文檔
支持設置算子TTL,更精準的控制各個算子的狀態大小,節約大狀態作業的使用資源,詳情請參見算子狀態生命周期(State TTL)提示
本文檔配置的是單個作業的日志,如果您需要對整個項目空間下的作業的日志進行配置,請參見配置項目空間下所有作業日志輸出。