當MaxCompute提供的內建函數無法滿足您的業務需求時,您可在MaxCompute Studio中自行開發UDF(自定義函數)以實現業務功能,本文介紹如何使用MaxCompute Studio開發及調試Java UDF。
前提條件
您需要完成以下操作:
背景信息
您可以按照本文介紹自行開發UDF,也可以單擊如下圖所示。
直接創建函數。編寫UDF
在Project區域,右鍵單擊Module的源碼目錄(即 ),選擇 。
填寫Name并選擇類型為UDF,按下Enter鍵。
Name:創建的MaxCompute Java Class名稱。如果需要創建Package,可以在此處填寫packagename.classname,會自動生成Package。
創建成功后,在編輯界面開發Java程序。
Java UDF示例,請參見UDF概述。
通過本地運行調試UDF
通過本地運行方式測試,查看UDF的運行結果是否符合預期。
右鍵單擊編寫完成的Java腳本,選擇Run。
在Run/Debug Configurations頁面上配置運行參數。
MaxCompute project:UDF運行使用的MaxCompute空間。本地運行時選擇local。
說明如果需要使用MaxCompute項目中的表數據,需要先在MaxCompute project中更改設置Endpoint和指定項目名稱,指定的MaxCompute項目的表數據未被下載至warehouse目錄中,會先下載數據;如果數據已經下載,則跳過此步驟。
MaxCompute project選擇local,則表示本地項目無需與MaxCompute的數據或資源進行交互,即可在本地環境中進行開發、測試和調試。
MaxCompute table:UDF運行時需要使用的MaxCompute表的名稱。
Table columns:UDF運行時需要使用的MaxCompute表的列信息。
單擊OK,開始運行。
說明本地運行會讀取warehouse中指定的表數據作為輸入,您可以在控制臺查看日志輸出。
更多warehouse的說明,請參見warehouse目錄。
通過單元測試調試UDF
您可以參照examples目錄下的單元測試實例,編寫自己的測試用例。
后續步驟
完成開發和調試UDF之后,需要對UDF代碼進行打包、上傳和注冊,使其在MaxCompute中可用。詳情請參見打包、上傳及注冊。
相關文檔
如果您希望在MaxCompute Studio中使用Python語言進行UDF開發,請參見開發Python UDF。