阿里云E-MapReduce(簡(jiǎn)稱EMR)支持Spark、Trino計(jì)算引擎直接訪問(wèn)Hologres和MaxCompute表,為您提供了更加完善的湖倉(cāng)一體化的解決方案,以及更加高效、穩(wěn)定的數(shù)據(jù)分析體驗(yàn)。

背景信息

Hologres是阿里巴巴自主研發(fā)的一站式實(shí)時(shí)數(shù)倉(cāng)引擎,支持海量數(shù)據(jù)實(shí)時(shí)寫(xiě)入、實(shí)時(shí)更新、實(shí)時(shí)加工、實(shí)時(shí)分析,支持標(biāo)準(zhǔn)SQL(兼容PostgreSQL協(xié)議),支持PB級(jí)數(shù)據(jù)多維分析(OLAP)與即席分析(Ad Hoc),支持高并發(fā)低延遲的在線數(shù)據(jù)服務(wù)(Serving),提供企業(yè)級(jí)離在線一體化全棧數(shù)倉(cāng)解決方案。

MaxCompute是適用于數(shù)據(jù)分析場(chǎng)景的企業(yè)級(jí)SaaS(Software as a Service)模式云數(shù)據(jù)倉(cāng)庫(kù),以Serverless架構(gòu)提供快速、全托管的在線數(shù)據(jù)倉(cāng)庫(kù)服務(wù),消除了傳統(tǒng)數(shù)據(jù)平臺(tái)在資源擴(kuò)展性和彈性方面的限制,最小化用戶運(yùn)維投入,使您可以經(jīng)濟(jì)并高效地分析處理海量數(shù)據(jù)。

湖倉(cāng)一體
隨著EMR支持Hologres和MaxCompute數(shù)據(jù)源,您可以:
  • 高效訪問(wèn)在線數(shù)據(jù): 直接使用在線數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,無(wú)需導(dǎo)出Hologres和MaxCompute中的數(shù)據(jù)至OSS等中心化存儲(chǔ),從而避免了導(dǎo)出數(shù)據(jù)可能引起的數(shù)據(jù)丟失和安全問(wèn)題,同時(shí)還提高了數(shù)據(jù)處理和分析的速度,使您可以更加靈活地利用自己的數(shù)據(jù),并快速響應(yīng)業(yè)務(wù)需求。
  • 降低數(shù)據(jù)處理成本:由于無(wú)需進(jìn)行數(shù)據(jù)ETL的操作,以及額外的數(shù)據(jù)存儲(chǔ)和管理,降低了數(shù)據(jù)分析的整體成本。

使用限制

適用于EMR-3.45.1及之后版本、EMR-5.11.1及之后版本。

Spark配置Hologres數(shù)據(jù)源

詳細(xì)信息,請(qǐng)參見(jiàn)Spark對(duì)接Hologres