日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

EMR HDFS

重要

本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業務造成影響,請務必仔細閱讀。

本文介紹如何使用Databricks 讀寫EMR HDFS文件系統數據。

前提條件

接入EMR HDFS數據源

1.查看EMR創建集群信息

data

2.進入DDI集群選擇數據源,選擇添加數據源

data

3.查看是否添加成功

成功

4.非HA集群查看HDFS的路徑

打他
警告

此為HDFS的訪問路徑

可通過登錄master節點命令hdfs dfs -ls / 訪問HDFS目錄

5.訪問EMR HDFS 數據源代碼實現

%spark
val path="hdfs://emr-header-1.cluster-202360:9000/user/test/export.csv"
val data = spark.read 
  .option("header", "true") 
  .option("inferSchema", "true") 
  .csv(path)
data.show(5)
data

6.HA 集群訪問HDSF

HA
警告

DDI打通多個EMR HA集群會有名稱沖突

%spark
val path="hdfs://emr-cluster/user/test"
val data = spark.read 
  .option("header", "true") 
  .option("inferSchema", "true") 
  .csv(path)
data.show(5)
HAData