本文以導入On Time數據集至clickhouse_demo數據庫的分布式表ontime_local_distributed為例,介紹如何使用客戶端clickhouse-client工具導入數據到云數據庫ClickHouse。
前提條件
操作步驟
單擊On Time Data下載On Time數據集。
解壓下載的On Time數據集。
unzip ontime-data(1).zip
連接云數據庫ClickHouse集群并導入數據到云數據庫ClickHouse。
在clickhouse-client客戶端的安裝目錄下執行如下命令。
./clickhouse-client --host=<host> --port=<port> --user=<user> --password=<password> --query="INSERT INTO <ClickHouse_table> FORMAT CSVWithNames" < ontime-data.csv
參數說明如下。
參數
說明
host
外網地址或VPC地址,您可以在集群信息頁面查看。
如果clickhouse-client所在服務器與云數據庫ClickHouse集群在同一VPC內,您可以使用VPC地址。否則,請使用外網地址。
port
TCP端口號,您可以在集群信息頁面查看。
user
您通過云數據庫ClickHouse控制臺創建的數據庫賬號。
password
數據庫賬號對應的密碼。
ClickHouse_table
要導入數據的云數據庫ClickHouse表。
示例語句如下。
./clickhouse-client --host=cc-bp16qwvp7hy8i****.public.clickhouse.ads.aliyuncs.com --port=3306 --user=test --password=123456Aa --query="INSERT INTO clickhouse_demo.ontime_local_distributed FORMAT CSVWithNames" < ontime-data.csv
查詢數據,驗證數據是否導入成功。
SELECT OriginCityName, count(*) AS flights FROM ontime_local_distributed GROUP BY OriginCityName ORDER BY flights DESC LIMIT 10;
查詢結果如下。
OriginCityName │ flights ──────────────────────│──────── Chicago, IL │ 24114 Atlanta, GA │ 22001 Dallas/Fort Worth, TX │ 17340 Los Angeles, CA │ 14494 Denver, CO │ 14170 New York, NY │ 14075 Washington, DC │ 11985 Houston, TX │ 11483 San Francisco, CA │ 11259 St. Louis, MO │ 10721
文檔內容是否對您有幫助?