什么是圖計(jì)算服務(wù)
圖計(jì)算服務(wù)Graph Compute是阿里云自主研發(fā)的高性能分布式圖計(jì)算產(chǎn)品,為開發(fā)者提供萬億級(jí)數(shù)據(jù)規(guī)模的一站式圖技術(shù)服務(wù)。Graph Compute支持復(fù)雜圖關(guān)系數(shù)據(jù)的存儲(chǔ)、查詢和計(jì)算,高效對(duì)接圖算法與模型,在搜索推薦廣告、實(shí)時(shí)風(fēng)控、知識(shí)圖譜、社交網(wǎng)絡(luò)等場(chǎng)景有著廣泛的應(yīng)用。
前置概念
閱讀本文前,您可能需要了解如下概念:
為什么選擇圖計(jì)算服務(wù)
復(fù)雜關(guān)系,簡(jiǎn)化表達(dá)
通過KKV可高效表達(dá)圖模型中的關(guān)聯(lián)關(guān)系,將常用的2度查詢簡(jiǎn)化為1度查詢,查詢表達(dá)更簡(jiǎn)單。
源于開源,勝于開源
支持開源Gremlin語法,重點(diǎn)算子性能優(yōu)化,讓計(jì)算效率更高。
海量數(shù)據(jù),靈活擴(kuò)展
分布式集群架構(gòu)可彈性運(yùn)維,分鐘級(jí)快速擴(kuò)展服務(wù)和數(shù)據(jù)存儲(chǔ)能力。
大數(shù)據(jù)生態(tài),深度對(duì)接
對(duì)接完整的阿里云大數(shù)據(jù)及AI產(chǎn)品生態(tài),提供基于MaxCompute+Flink+Graph Compute 的場(chǎng)景化圖計(jì)算解決方案。
圖計(jì)算服務(wù)Graph Compute特點(diǎn)
高性能
查詢延時(shí)低、數(shù)據(jù)導(dǎo)入快(千億數(shù)據(jù)查詢延時(shí)2ms以內(nèi),數(shù)據(jù)載入最高達(dá)500w doc/s )。
低成本
通過提供倒排查詢和向量計(jì)算的擴(kuò)展能力,同需求場(chǎng)景下,引擎資源開銷是采用其他方案的50%。
高可用
離線系統(tǒng)支持多版本備份,提供分鐘級(jí)數(shù)據(jù)恢復(fù)功能,具有更強(qiáng)的容災(zāi)和數(shù)據(jù)回滾能力。
百萬級(jí)TPS
Graph Compute采用異步更新架構(gòu),單節(jié)點(diǎn)支持百萬級(jí)別TPS更新,保證數(shù)據(jù)的高時(shí)效性。
全托管
提供圖形化展示的控制臺(tái),提升數(shù)據(jù)開發(fā)效率。數(shù)據(jù)鏈路全托管,業(yè)務(wù)運(yùn)維0投入。
Graph Compute 與其他開源圖計(jì)算相比的優(yōu)勢(shì)
問題一:查詢性能為什么能比開源好很多
圖計(jì)算服務(wù)內(nèi)核引擎iGraph在分區(qū)并發(fā)查詢的基礎(chǔ)上,通過自研的協(xié)程異步框架并發(fā)召回,將同步串行磁盤訪問改造為異步并行,極大的提高了查詢性能;同時(shí)將部分計(jì)算下沉,保證了復(fù)雜計(jì)算的性能。
在基于磁盤的查詢?cè)L問場(chǎng)景下引入了io_uring,支持高iops下穩(wěn)定運(yùn)行。
內(nèi)核引擎iGraph自研多級(jí)緩存,對(duì)熱數(shù)據(jù)更加友好。
問題二:大數(shù)據(jù)導(dǎo)入能力對(duì)比開源有較大的提升?
Graph Compute擁有一套自研分布式索引構(gòu)建服務(wù),使得離線全量、增量、實(shí)時(shí)數(shù)據(jù)統(tǒng)一入口,離線全量、批次增量索引、配合在線實(shí)時(shí)增量索引解決在線索引LSM tree過度膨脹的問題。
實(shí)時(shí)數(shù)據(jù)更新寫入支持最終一致性,性能對(duì)比強(qiáng)一致性的寫入對(duì)比開源有1~2個(gè)數(shù)據(jù)量級(jí)的性能優(yōu)勢(shì)。
問題三:Graph Compute的成本總體為什么能比開源低?
架構(gòu)的設(shè)計(jì)上我們優(yōu)先考慮成本和高性能,保證資源的高利用率。
較為完善的自動(dòng)化運(yùn)維系統(tǒng)讓運(yùn)維成本直線下降。
天然支持多種類型索引(kv/kkv/倒排/向量),不需要申請(qǐng)額外的業(yè)務(wù)資源。
問題四:Graph Compute的穩(wěn)定性為什么比開源高?
針對(duì)異常和大促場(chǎng)景下iGraph內(nèi)核引擎做了多年技術(shù)優(yōu)化和沉淀來保證穩(wěn)定性,同時(shí)配合高可用、自動(dòng)負(fù)載均衡、自動(dòng)擴(kuò)縮容、自動(dòng)降級(jí)等一系列自動(dòng)化運(yùn)維系統(tǒng)進(jìn)行動(dòng)態(tài)平衡流量和快速恢復(fù)。