Dataphin僅支持開發基于Python的腳本,不支持開發依賴第三方組件的腳本。開發基于第三方組件的腳本,需要通過pip install下載第三方組件。本文為您介紹基于Dataphin如何通過構建Shell任務調用Python讀取第三方文件。
前提條件
- 添加訪問地址mirrors.aliyun.com和端口*至項目空間的沙箱白名單,詳情請參見設置白名單。
- 已準備Python支持讀取的文件,例如TXT、CSV、XLS、XLSX或PDF等格式文件。
步驟一:上傳文件
步驟二:創建Shell任務
- 在數據處理頁簽,單擊左側導航欄計算任務圖標。
- 在計算任務頁面,單擊計算任務后的圖標,選擇 。
- 編寫DataX任務代碼。