Notebook是由一個或多個Note單元組成的,每個Note是一個獨立的Spark任務。本文介紹如何使用Notebook。
前提條件
開發Note
添加單元格
在DataInsight Notebook頁面,將鼠標移動到任意已存在單元格的頂部或底部,單擊+ Add Paragraph,即可在頁面上添加新的單元格。
創建表
刪除單元格
運行Note
在DataInsight Notebook頁面,單擊單元格右上角的圖標,即可在Notebook內運行作業。
查看可視化運行結果
運行完Note后,在當前單元格中,可單擊圖形來查看運行結果。Notebook內置了多種圖形來可視化Spark的DataFrame:Table、Bar Chart、Pie Chart、Area Chart、Line Chart、Scatter Chart,并且您可以單擊settings對各種圖形進行配置。
查看作業詳情
修改Interpreter模式
默認情況下Spark Interpreter的綁定模式是Shared模式,即所有的Note都是共享同一個Spark App。如果是多用戶場景的話,建議設置成Isolated Per Note,這樣每個Note都有自己獨立的Spark App,互相不會有影響。
配置Interpreter
支持以下兩種方式配置Interpreter:
- 配置全局的Interpreter。
- 在DataInsight Notebook頁面,單擊右上角的圖標。
- 在Settings區域,單擊Interpreter。
- 在spark區域,單擊edit,修改相關的參數。
- 單擊Save。
- 在彈出框中單擊OK。
- 配置單個Note的Interpreter。
通過
%spark.conf
來對每個Note的Spark Interpreter進行定制化,但前提是把Interpreter設置成isolated per note。在DataInsight Notebook頁面的
%spark.conf
區域,可修改相關的參數。%spark.conf SPARK_HOME <PATH_TO_SPARK_HOME> #set driver memory to 8g spark.driver.memory 8g #set executor number to be 6 spark.executor.instances 6 #set executor memory 4g spark.executor.memory 4g
問題反饋
您在使用阿里云Databricks數據洞察過程中有任何疑問,歡迎用釘釘掃描下面的二維碼加入釘釘群進行反饋。