使用冷熱分層存儲(chǔ)
并不是所有OSS-HDFS中存儲(chǔ)的數(shù)據(jù)都需要頻繁訪問,但基于數(shù)據(jù)合規(guī)或者存檔等原因,部分?jǐn)?shù)據(jù)仍然需要繼續(xù)保存。針對(duì)以上問題,OSS-HDFS服務(wù)支持?jǐn)?shù)據(jù)的冷熱分層存儲(chǔ),對(duì)于經(jīng)常需要訪問的數(shù)據(jù)以標(biāo)準(zhǔn)類型進(jìn)行存儲(chǔ),對(duì)于較少訪問的數(shù)據(jù)以低頻、歸檔以及冷歸檔類型進(jìn)行存儲(chǔ),從而降低總存儲(chǔ)成本。
前提條件
已在OSS-HDFS服務(wù)中寫入數(shù)據(jù)。
華東1(杭州)、華東2(上海)、華北2(北京)、華南1(深圳)、華北3(張家口)、中國香港、新加坡、德國(法蘭克福)、美國(硅谷)、美國(弗吉尼亞)、印度尼西亞(雅加達(dá))地域支持使用冷熱分層存儲(chǔ)功能。
已提交工單申請(qǐng)使用冷熱分層存儲(chǔ)功能。
已安裝4.4.0及以上版本JindoSDK 。具體操作,請(qǐng)參見非EMR集群接入OSS-HDFS服務(wù)快速入門。
注意事項(xiàng)
讀取OSS-HDFS歸檔類型數(shù)據(jù)時(shí),涉及數(shù)據(jù)取回費(fèi)用。因此對(duì)于需要頻繁訪問的數(shù)據(jù),應(yīng)避免使用低頻、歸檔以及冷歸檔類型。關(guān)于這三種類型數(shù)據(jù)取回費(fèi)用的更多信息,請(qǐng)參見數(shù)據(jù)處理費(fèi)用。
為OSS-HDFS服務(wù)的數(shù)據(jù)設(shè)置存儲(chǔ)策略時(shí),涉及數(shù)據(jù)塊添加標(biāo)簽操作。數(shù)據(jù)塊標(biāo)簽費(fèi)用遵循OSS對(duì)象標(biāo)簽計(jì)費(fèi)規(guī)則。更多信息,請(qǐng)參見對(duì)象標(biāo)簽費(fèi)用。
當(dāng)使用的JindoSDK版本低于6.4.0時(shí),不支持在設(shè)置為低頻、歸檔以及冷歸檔存儲(chǔ)類型的目錄下創(chuàng)建文件。如果您需要在這三種類型的目錄下創(chuàng)建文件,可以在標(biāo)準(zhǔn)類型目錄下創(chuàng)建并關(guān)閉文件后,通過rename操作轉(zhuǎn)移到低頻、歸檔以及冷歸檔目錄。
如果您希望在低頻、歸檔以及冷歸檔存儲(chǔ)類型的目錄下直接創(chuàng)建文件,您需要升級(jí)JindoSDK至6.4.0及以上版本。
數(shù)據(jù)轉(zhuǎn)換為歸檔或者冷歸檔存儲(chǔ)類型時(shí),系統(tǒng)開銷大,解凍取回慢,請(qǐng)謹(jǐn)慎選擇。
支持?jǐn)?shù)據(jù)從歸檔類型轉(zhuǎn)換為冷歸檔存儲(chǔ)類型,不支持?jǐn)?shù)據(jù)從冷歸檔類型轉(zhuǎn)換為歸檔類型。
操作步驟
配置環(huán)境變量。
連接ECS實(shí)例。具體操作,請(qǐng)參見連接ECS實(shí)例。
進(jìn)入已安裝的JindoSDK JAR包下的bin目錄。
以下以
jindosdk-x.x.x-linux
為例,如使用其他版本的JindoSDK,請(qǐng)?zhí)鎿Q為對(duì)應(yīng)的JAR包名稱。cd jindosdk-x.x.x-linux/bin/
說明x.x.x表示JindoSDK JAR包版本號(hào)。
授予bin目錄下的
jindo-util
文件的讀、寫、執(zhí)行的權(quán)限。chmod 700 jindo-util
將
jindo-util
文件重命名為jindo
。mv jindo-util jindo
新建配置文件
jindosdk.cfg
,然后在配置文件中添加以下配置項(xiàng)。[common]保持以下默認(rèn)配置。 logger.dir = /tmp/jindo-util/ logger.sync = false logger.consolelogger = false logger.level = 0 logger.verbose = 0 logger.cleaner.enable = true hadoopConf.enable = false [jindosdk]自定義以下配置項(xiàng)。 <!-- 以下以杭州地域?yàn)槔渌赜蛘?qǐng)根據(jù)實(shí)際情況替換。 --> fs.oss.endpoint = cn-hangzhou.oss-dls.aliyuncs.com <!-- 配置訪問OSS-HDFS服務(wù)的AccessKeyId、AccessKeySecret。 --> fs.oss.accessKeyId = LTAI******** fs.oss.accessKeySecret = KZo1********
設(shè)置環(huán)境變量。
export JINDOSDK_CONF_DIR=<JINDOSDK_CONF_DIR>
<JINDOSDK_CONF_DIR>填寫
jindosdk.cfg
配置文件所在的絕對(duì)路徑。
指定為寫入OSS-HDFS服務(wù)的數(shù)據(jù)設(shè)置存儲(chǔ)策略。
場(chǎng)景
執(zhí)行命令
執(zhí)行結(jié)果
為寫入OSS-HDFS服務(wù)的數(shù)據(jù)設(shè)置存儲(chǔ)策略為低頻訪問存儲(chǔ)
./jindo fs -setStoragePolicy -path oss://examplebucket/dir1 -policy CLOUD_IA
dir1/目錄下的文件對(duì)應(yīng)的數(shù)據(jù)塊會(huì)攜帶Key為transition-storage-class、Value為IA的標(biāo)簽信息。
為寫入OSS-HDFS服務(wù)的數(shù)據(jù)設(shè)置存儲(chǔ)策略為歸檔存儲(chǔ)
./jindo fs -setStoragePolicy -path oss://examplebucket/dir2 -policy CLOUD_AR
dir2/目錄下的文件對(duì)應(yīng)的數(shù)據(jù)塊會(huì)攜帶Key為transition-storage-class、Value為Archive的標(biāo)簽信息。
為寫入OSS-HDFS服務(wù)的數(shù)據(jù)設(shè)置存儲(chǔ)策略為冷歸檔存儲(chǔ)
./jindo fs -setStoragePolicy -path oss://examplebucket/dir3 -policy CLOUD_COLD_AR
dir3/目錄下的文件對(duì)應(yīng)的數(shù)據(jù)塊會(huì)攜帶Key為transition-storage-class、Value為ColdArchive的標(biāo)簽信息。
開啟冷熱分層存儲(chǔ)。
單擊左側(cè)導(dǎo)航欄的Bucket列表,然后單擊目標(biāo)Bucket。
在左側(cè)導(dǎo)航欄,選擇 。
在HDFS服務(wù)頁簽,單擊設(shè)置冷熱分層。
在冷熱分層的冷熱分層基礎(chǔ)設(shè)置區(qū)域,打開狀態(tài)開關(guān)。
為避免配置錯(cuò)誤導(dǎo)致冷熱分層無法正常工作,OSS會(huì)自動(dòng)創(chuàng)建同時(shí)包含以下三種策略的生命周期規(guī)則:
指定OSS-HDFS的數(shù)據(jù)存儲(chǔ)目錄.dlsdata/下攜帶Key為transition-storage-class、Value為IA標(biāo)簽的數(shù)據(jù)在1天后轉(zhuǎn)為低頻訪問存儲(chǔ)。
指定OSS-HDFS的數(shù)據(jù)存儲(chǔ)目錄.dlsdata/下攜帶Key為transition-storage-class、Value為Archive標(biāo)簽的數(shù)據(jù)在1天后轉(zhuǎn)為歸檔存儲(chǔ)。
指定OSS-HDFS的數(shù)據(jù)存儲(chǔ)目錄.dlsdata/下攜帶Key為transition-storage-class、Value為ColdArchive標(biāo)簽的數(shù)據(jù)在1天后轉(zhuǎn)為冷歸檔存儲(chǔ)。
重要請(qǐng)勿編輯分層存儲(chǔ)開啟后自動(dòng)創(chuàng)建的包含轉(zhuǎn)換為低頻、歸檔以及冷歸檔類型三種策略的生命周期規(guī)則,否則可能導(dǎo)致OSS-HDFS數(shù)據(jù)及服務(wù)異常。
單擊確定。
OSS-HDFS服務(wù)會(huì)根據(jù)步驟2設(shè)置的存儲(chǔ)策略應(yīng)用生命周期中對(duì)應(yīng)的轉(zhuǎn)儲(chǔ)策略。
生命周期規(guī)則創(chuàng)建后的24小時(shí)內(nèi),OSS會(huì)加載規(guī)則。規(guī)則加載完成后,OSS會(huì)在每天的北京時(shí)間08:00開始執(zhí)行規(guī)則,具體執(zhí)行時(shí)間取決于文件數(shù)量,最快48小時(shí)內(nèi)轉(zhuǎn)換為指定的存儲(chǔ)類型。
相關(guān)命令
命令語法 | 使用說明 |
| 該命令用于為某個(gè)路徑下的數(shù)據(jù)指定存儲(chǔ)策略。
重要
|
| 該命令用于查詢指定路徑下數(shù)據(jù)的存儲(chǔ)策略。 |
| 該命令用于取消指定路徑下的數(shù)據(jù)的存儲(chǔ)策略。 |
| 該命令用于查詢指定路徑下數(shù)據(jù)存儲(chǔ)策略的轉(zhuǎn)換狀態(tài)。轉(zhuǎn)換狀態(tài)分為以下四種:
說明 該命令只用于查詢OSS-HDFS元數(shù)據(jù)轉(zhuǎn)換任務(wù)的狀態(tài),不能反映已提交到OSS的任務(wù)處理狀態(tài)。 |
| 該命令用于臨時(shí)解凍指定路徑下的歸檔或者冷歸檔存儲(chǔ)類型的數(shù)據(jù)。
臨時(shí)解凍歸檔或者冷歸檔數(shù)據(jù)時(shí),有以下注意事項(xiàng): 重要
|