本文將解答與Notebook相關(guān)的問題。

Q:Notebook里執(zhí)行任務(wù),不同用戶之間是串行的么?

如果是SQL,是可以并行執(zhí)行的;如果是Scala代碼,是串行執(zhí)行的,因?yàn)槟J(rèn)所有Note共享一個(gè)SparkContext。

相關(guān)配置:
參數(shù) 默認(rèn)取值
zeppelin.spark.concurrentSQL true
zeppelin.spark.currentSQL.max 10

Q:如何使Note之間相互獨(dú)立?

設(shè)置 per note isolated,使每個(gè)Note是一個(gè)獨(dú)立的SparkContext。

notebook_q2

Q: 如何配置依賴(jars, python packages)

通過設(shè)置spark.jars 來設(shè)置依賴的jar包。jar包必須放在OSS上,多個(gè)jar包之間通過逗號分隔。

通過設(shè)置spark.jars.packages 來設(shè)置依賴的package,格式:groupId:artifactId:version, 多個(gè)package逗號分隔。

Python package 需要通過Databricks數(shù)據(jù)洞察控制頁面選擇相應(yīng)的python包。

Q:如何配置Spark Application 資源

通過以下屬性配置driver的資源:

spark.driver.memory

spark.driver.cores

通過以下屬性配置executor的資源:

spark.executor.memory

spark.executor.cores

通過以下屬性配置executor數(shù)目:

spark.executor.instances