日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

什么是DLC

分布式訓練DLC(Deep Learning Containers)是基于云原生的AI訓練平臺,為開發者和企業提供靈活、穩定、易用和高性能的機器學習訓練環境。它支持多種算法框架,能夠處理大規模的分布式深度學習任務,同時也支持自定義算法框架。通過DLC,開發者和企業能享受到更優的訓練環境,在降低成本的同時提升訓練效率。

產品優勢

  • 支持多樣算力資源

    基于靈駿智算和通用計算資源,支持云上ECS、ECI、神龍裸金屬和靈駿裸金屬等多種算力形態,實現異構算力的混合調度。

  • 多樣的分布式任務類型

    DLC作為分布式訓練系統,您不需要搭建各種集群,可以直接提交Megatron、Deepspeed、Pytorch、Tensorflow、Slurm、Ray、MPIXGBoost等十多種訓練框架的任務。DLC預置了多種官方鏡像,支持自定義開發運行環境, 支持控制臺、SDK或命令行的提交方式, 為AI訓練場景提供一站式服務,也為大型客戶提供簡單的集成方式。

  • 高穩定

    在大模型訓練場景中,通過自研的容錯引擎AIMaster、高性能Checkpoint框架EasyCKPT、健康檢測SanityCheck以及節點自愈功能,PAI-DLC能夠有效解決多種穩定性問題。PAI-DLC具備快速探查、準確感應與快速反饋的能力,有效降低算力損失,提升訓練穩定性。

  • 高性能

    通過PAI自主研發的AI訓練加速框架,實現統一數據并行、流水并行、算子拆分以及嵌套的并行加速策略。通過并行策略自動探索和多維度顯存優化技術,并結合高速網絡的拓撲感知調度,以及通信線程池、梯度分組融合、混合精度通信、梯度壓縮的分布式通信庫的優化,提升分布式訓練效率。尤其在大模型分預訓練、持續訓練和Alignment的分布式訓練場景下,為您提供較優的訓練引擎。

資源形態

通過分布式訓練(DLC)提交訓練任務時,根據使用場景和所需的算力類型,PAI提供了以下兩種資源形態:

  • 靈駿智算:專為大模型訓練設計,適用于需要大量計算資源的深度學習任務。是面向超大規模深度學習和融合智算,基于軟硬件一體優化技術。構建高性能異構算力底座,提供全流程AI工程化能力,具備高性能、高效率、高利用率等核心優勢,以滿足在大模型訓練、自動駕駛、基礎科研以及金融等領域的廣泛需求。

  • 通用計算:適用于常規訓練需求,能夠靈活地支持多種規模和類型的機器學習任務。

靈駿智算和通用計算資源支持以下幾種使用方式:

  • 資源配額:您可以通過包年包月的方式提前購買靈駿智算或通用計算資源,用于AI開發和訓練,從而實現資源的靈活管理和高效利用。

  • 公共資源:無需提前購買資源,您可以在提交訓練任務時,按需使用靈駿智算或通用計算資源,并通過按量付費的方式進行結算。

  • 競價資源:靈駿智算提供競價資源,助力您以較低成本獲取所需的AI算力,從而降低任務運行所需的資源成本。

應用場景

  • 數據預處理

    支持您自定義運行環境,可以對數據進行離線并行預處理,從而大幅降低數據預處理工程的難度。

  • 大規模分布式訓練

    支持使用多種開源深度學習框架進行離線大規模分布式深度訓練。DLC支持上千個節點同時訓練,顯著縮短訓練時間。

  • 離線推理

    通過DLC可以離線對模型進行離線推理,有效增加閑時GPU機器使用率,大大降低資源浪費。

相關文檔