本文為您介紹如何管理EMR Notebook內的筆記本。
筆記本概述
筆記本是進行程序開發的載體,每個筆記本對應一個.ipynb文件。您可以在一個工作空間內創建一個或多個筆記本。
每個筆記本由單元格(Cell)組成。目前EMR Notebook支持以下類型的單元格:
SQL:用于編輯和運行SQL代碼。
Python:用于編輯和運行Python程序。
Markdown:用于進行文本編輯,支持Markdown的語法。
新建筆記本
進入EMR Notebook頁面。
在左側導航欄,選擇EMR Workbench > Notebook。
在Notebook頁面,單擊目標工作空間操作列的控制臺。
在文件瀏覽器頁面,單擊。
在彈出的添加筆記本對話框中,輸入名稱,單擊確定,新建一個筆記本。
(可選)在文件瀏覽器頁面,將鼠標懸浮至目標筆記本,右鍵選擇重命名,可以對目標筆記本進行重命名操作。
運行筆記本
啟動機器。
您可以通過工作空間設置 > 機器,單擊啟動按鈕來啟動機器。
配置訪問方式。
您可以根據程序代碼類型進行配置。
SQL
當程序代碼為SQL時,需要提前配置數據庫,并在SQL單元格中,選擇合適的目標數據庫。配置數據庫的具體操作,請參見管理數據庫。
PySpark
當程序代碼為PySpark時,需要提前添加外部集群,詳情請參見管理外部集群。如果您綁定的集群,集群存儲根路徑使用了OSS-HDFS,則在運行PySpark時,還需授予Notebook訪問OSS-HDFS的權限,具體操作請參見授予EMR Notebook訪問OSS-HDFS的權限。
Python
當程序代碼為Python時,可以在機器啟動后,直接運行單元格。
運行單元格。
運行所有單元格:在目標筆記本頁面,單擊上方的運行所有單元格。
運行單個單元格:在目標單元格中,單擊左側的按鈕。
運行選中語句:在SQL放大模式下,選中需要執行的語句,單擊上方的運行選中。
(可選)停止機器。
為了避免資源浪費,您可以運行筆記本后,通過工作空間設置 > 機器,單擊停止按鈕來停止機器。
說明機器空閑1小時后,將自動停止。
機器停止后,再次啟動機器時,需要手動重新安裝您自定義添加的第三方庫。
復制筆記本
您可以參照以下方法復制出一個同名、且配置相同的筆記本,但默認不會自動啟動新建筆記本的機器。
在文件瀏覽器頁面,將鼠標懸浮至目標筆記本,右鍵選擇復制。
在目標Notebook的右上角,選擇 > 復制。
刪除筆記本
刪除后的筆記本無法恢復,請謹慎操作。
您可以參照以下方法刪除筆記本:
在文件瀏覽器頁面,將鼠標懸浮至目標筆記本,右鍵選擇刪除。
在目標Notebook的右上角,選擇>刪除。
導出筆記本
您可以參照以下方法導出筆記本(.ipynb文件):
在文件瀏覽器頁面,將鼠標懸浮至目標筆記本,右鍵選擇導出。
在目標Notebook的右上角,選擇 > 導出。
導入筆記本
在文件瀏覽器頁面,單擊圖標。
選擇導出到本地的筆記本(.ipynb文件)。