本文將解答與Notebook相關(guān)的問題。
Q:Notebook里執(zhí)行任務(wù),不同用戶之間是串行的么?
如果是SQL,是可以并行執(zhí)行的;如果是Scala代碼,是串行執(zhí)行的,因?yàn)槟J(rèn)所有Note共享一個(gè)SparkContext。
相關(guān)配置:
參數(shù) | 默認(rèn)取值 |
---|---|
zeppelin.spark.concurrentSQL | true |
zeppelin.spark.currentSQL.max | 10 |
Q:如何使Note之間相互獨(dú)立?
設(shè)置 per note isolated,使每個(gè)Note是一個(gè)獨(dú)立的SparkContext。
Q: 如何配置依賴(jars, python packages)
通過設(shè)置spark.jars 來設(shè)置依賴的jar包。jar包必須放在OSS上,多個(gè)jar包之間通過逗號分隔。
通過設(shè)置spark.jars.packages 來設(shè)置依賴的package,格式:groupId:artifactId:version, 多個(gè)package逗號分隔。
Python package 需要通過Databricks數(shù)據(jù)洞察控制頁面選擇相應(yīng)的python包。
Q:如何配置Spark Application 資源
通過以下屬性配置driver的資源:
spark.driver.memory
spark.driver.cores
通過以下屬性配置executor的資源:
spark.executor.memory
spark.executor.cores
通過以下屬性配置executor數(shù)目:
spark.executor.instances