使用須知
本文根據(jù)您的角色推薦不同的文檔閱讀順序。
如果您是MaxCompute初學(xué)者
如果您是初學(xué)者,建議先熟悉如下模塊,然后再有針對性地對深入學(xué)習(xí)其他模塊。
模塊 | 說明 |
介紹MaxCompute產(chǎn)品的概況、主要功能、應(yīng)用場景、使用限制及基本概念。通過閱讀該章節(jié),您會對MaxCompute有一個總體的認知。 | |
通過示例指導(dǎo)您如何準備賬號、準備環(huán)境、創(chuàng)建表、導(dǎo)入數(shù)據(jù)、運行SQL及導(dǎo)出結(jié)果數(shù)據(jù)。 | |
介紹MaxCompute的常用命令。您可以進一步熟悉如何操作MaxCompute。 | |
您需要在分析數(shù)據(jù)前掌握MaxCompute涉及的客戶端、MaxCompute Studio等工具。 | |
介紹MaxCompute各地域支持的連接方式及Endpoint信息,并對您在與其他云產(chǎn)品(ECS、Tablestore或OSS)互訪場景中遇到的網(wǎng)絡(luò)連通性和下載數(shù)據(jù)收費等問題進行說明。 |
如果您是數(shù)據(jù)分析師
如果您是數(shù)據(jù)分析師,建議熟讀SQL模塊的內(nèi)容。您可以查詢并分析存儲在MaxCompute上的大規(guī)模數(shù)據(jù)。MaxCompute SQL支持如下主要功能。
功能項 | 說明 |
支持管理表、分區(qū)、列、生命周期及視圖。 | |
支持插入或更新表、分區(qū)數(shù)據(jù)。 | |
支持SELECT、子查詢等多種查詢操作。 | |
支持通過命令導(dǎo)入導(dǎo)出MaxCompute表中的數(shù)據(jù)、復(fù)制表數(shù)據(jù)等SQL增強操作。 | |
支持通過內(nèi)建數(shù)學(xué)函數(shù)、窗口函數(shù)、日期函數(shù)、聚合函數(shù)、字符串函數(shù)等處理數(shù)據(jù)。 | |
支持通過創(chuàng)建自定義函數(shù)來滿足更多的計算需求。 |
如果您擁有一定開發(fā)經(jīng)驗
如果您擁有一定的開發(fā)經(jīng)驗,了解分布式概念,且希望解決某些無法用SQL實現(xiàn)的數(shù)據(jù)分析問題,推薦您學(xué)習(xí)MaxCompute更高級的功能模塊。
模塊 | 說明 |
MaxCompute提供Java MapReduce編程模型。您可以使用MapReduce提供的接口(Java API)編寫MapReduce程序,處理MaxCompute中的數(shù)據(jù)。 | |
一套面向迭代的圖計算處理框架。使用圖進行建模,圖由點(Vertex)和邊(Edge)組成,點和邊包含權(quán)值(Value)。通過迭代對圖進行編輯、演化,最終得出結(jié)果。 | |
您可以使用Tunnel服務(wù)向MaxCompute批量上傳離線數(shù)據(jù)或從MaxCompute下載離線數(shù)據(jù)。 | |
向開發(fā)者提供的Java接口。 | |
向開發(fā)者提供的Python接口。 |
如果您是項目Owner或管理員
如果您是一個項目的Owner(創(chuàng)建和使用項目)或管理員(管理項目、安全和費用)需要熟知如下模塊。
模塊 | 子模塊 | 說明 |
項目管理 | 創(chuàng)建項目前期工作 | 項目(Project)是MaxCompute的基本組織單元,它類似于傳統(tǒng)數(shù)據(jù)庫的Database或Schema的概念,是進行多用戶隔離和訪問控制的主要邊界。一個用戶可以同時擁有多個項目的權(quán)限,通過安全授權(quán),可以在一個項目中訪問另一個項目中的對象,例如表(Table)、資源(Resource)、函數(shù)(Function)和實例(Instance)。使用MaxCompute,實際是操作項目中的各種對象。前期準備工作如下:
|
創(chuàng)建項目 | 創(chuàng)建項目具體操作,請參見創(chuàng)建MaxCompute項目。 創(chuàng)建項目時,需要從業(yè)務(wù)角度考慮選擇標準模式或簡單模式項目,從安全角度考慮使用個人賬號或計算引擎指定賬號,詳情請參見MaxCompute訪問身份和MaxCompute數(shù)據(jù)安全管理指南。 | |
項目成員管理 | 成員管理主要考慮成員的職責(zé)和安全問題,如果通過DataWorks使用MaxCompute,您需要考慮兩個產(chǎn)品之間的關(guān)聯(lián)權(quán)限,詳情請參見MaxCompute和DataWorks的權(quán)限關(guān)系。 | |
RAM用戶管理 | MaxCompute項目支持阿里云賬號和RAM用戶兩種賬號體系。您可以將阿里云賬號下的任意RAM用戶加入MaxCompute的某一個項目中。RAM用戶詳情,請參見創(chuàng)建RAM用戶。 通過DataWorks使用MaxCompute和DataWorks的工作空間,僅支持添加阿里云賬號下的RAM用戶為成員。因此,需要阿里云賬號通過RAM系統(tǒng)創(chuàng)建RAM用戶,并對RAM用戶進行維護管理。 說明
| |
調(diào)度資源管理 |
| |
項目設(shè)置 | 在項目開發(fā)過程中,部分項目的設(shè)置操作需要項目Owner來執(zhí)行。例如,設(shè)置項目是否允許全表掃描、設(shè)置項目默認打開2.0新類型等。詳情請參見項目操作。 | |
安全管理 | 人員管理 | 安全管理包括人員管理、角色管理、權(quán)限管理等。通過DataWorks使用MaxCompute時,由于DataWorks和MaxCompute有各種權(quán)限模型,因此您需要理清楚兩個產(chǎn)品之間的權(quán)限關(guān)系,再從業(yè)務(wù)需求出發(fā)進行權(quán)限管理。安全管理過程中,您需要了解如何進行用戶授權(quán)、跨項目的資源共享、設(shè)置項目的數(shù)據(jù)保護功能、Policy授權(quán)等操作:
|
角色管理 | ||
權(quán)限管理 | ||
費用管理 | 無 | 資源預(yù)算是在使用之前進行成本預(yù)估。基于MaxCompute的計費方式,很多業(yè)務(wù)無法更準確地預(yù)估成本,因此在整個業(yè)務(wù)開發(fā)過程中需要進行費用管理,主要需要關(guān)注:
|