DataHub可用于統一服務模塊創建API。本文為您介紹DataHub命令行創建topic并上傳數據的操作流程。
操作步驟
下載“DataHub console”,更多信息,請參見DataHub命令行工具。
配置console。
解壓并運行“datahub_console.tar”。
在conf目錄中的“datahub.properties”文件填寫ak endpoint信息。參數說明:
datahub.accessid:訪問DataHub的accessId
datahub.accesskey:訪問DataHub的accessKey信息
datahub.endpoint:域名,具體可查看域名列表。
創建topic
-p:project名稱
-t:topic名稱
-m:表示不同的Topic類型,Blob代表創建Blob類型的Topic,Tuple表示創建Tuple類型的Topic。
-f:Tuple類型Topic字段格式為[(fieldName,fieldType,isNull)],多個字段以逗號隔開。
-s:shard數量
-l:數據生命周期,范圍1-7天。
-c: topic描述
創建銀行客戶topic:修改projectName。
ct -p projectName -t yhkh1 -m TUPLE -s 1 -l 7 -c 銀行客戶信息 -f [(id,bigint,true),(zzhm,string,true),(khmc,string,true),(nl,bigint,true),(xb,string,true),(yddh1,string,true),(csrq,string,true),(jysp,string,true),(career,string,true),(hyzk,string,true),(gz,bigint,true),(decdbyjyje,bigint,true),(decdbyjybs,bigint,true),(zjzdjyrq,string,true),(jtnsr,bigint,true),(dqckcy,bigint,true)]
上傳data.csv數據:修改projectName和文件路徑。
-f:參數表示文件路徑。
說明Windows路徑下請添加轉義符,示例:D:\\test\\test.txt
-p:project名稱
-t:topic名稱
-m:參數表示文本分隔符,目前支持逗號、空格分隔符
-n:參數表示每次上傳batchsize大小,默認為1000。
uf -f D:\\DataHubcmd\\data.csv -p projectName -t yhkh1 -m "," -n 10000
文檔內容是否對您有幫助?