PyTorch是一個開源的機器學習框架,具有高度靈活性和可擴展性,被廣泛用于深度學習任務,如圖像分類、目標檢測、自然語言處理和生成對抗網絡等。Intel? Extension for PyTorch(簡稱IPEX),為Intel硬件提供額外的性能提升,針對即時模式和圖模式都提供了優化,但是與即時模式相比,PyTorch中的圖模式通常會通過操作融合等優化技術獲得更好的性能。IPEX通過更全面的圖優化進一步增強了它們,并優化利用了在Intel CPU上的AVX-512向量神經網絡指令和AMX(Advanced Matrix Extensions),以及在Intel離散GPU上的Intel Xe矩陣擴展(XMX)AI引擎。特別的,在第四代英特爾至強可擴展處理器Sapphire Rapids,阿里云規格為g8i的新一代實例上極大提升在深度學習訓練和推理的性能。pytorch-intel鏡像是專門針對Intel CPU的優化鏡像,包含PyTorch和IPEX,為用戶提供開箱即用的高性能PyTorch鏡像,方便用戶進行深度學習研究和實踐。
鏡像列表
鏡像 | 地址 |
pytorch-intel | ac2-registry.cn-hangzhou.cr.aliyuncs.com/ac2/pytorch-intel:2.2.0.1-alinux3.2304 |
鏡像內容
pytorch-intel:2.2.0.1-alinux3.2304
BaseOS: Alinux 3.2304
Python: 3.10.13
aiodns: 3.0.0
aiohttp: 3.9.3
aiosignal: 1.3.1
appdirs: 1.4.4
async-timeout: 4.0.2
attrs: 22.2.0
bcrypt: 3.2.2
Brotli: 1.0.9
certifi: 2023.7.22
cffi: 1.15.1
charset-normalizer: 3.1.0
contourpy: 1.0.7
coverage: 7.2.1
cryptography: 41.0.7
cycler: 0.11.0
exceptiongroup: 1.1.1
filelock: 3.9.0
fonttools: 4.47.0
frozenlist: 1.3.3
fs: 2.4.16
fsspec: 2023.6.0
idna: 3.4
iniconfig: 1.1.1
intel-extension-for-pytorch: 2.2.0+cpu
Jinja2: 3.1.2
kiwisolver: 1.4.4
libcomps: 0.1.19
lxml: 4.9.2
MarkupSafe: 2.1.2
matplotlib: 3.7.1
mpmath: 1.3.0
multidict: 6.0.4
networkx: 2.8.8
numpy: 1.24.2
olefile: 0.46
packaging: 23.0
paramiko: 2.12.0
Pillow: 10.1.0
pip: 23.3.1
pluggy: 1.0.0
ply: 3.11
pyarrow: 14.0.2
pyasn1: 0.4.8
pycairo: 1.23.0
pycares: 4.3.0
pycparser: 2.21
PyNaCl: 1.4.0
pyparsing: 3.0.7
PySocks: 1.7.1
pytest: 7.3.1
pytest-cov: 4.0.0
python-dateutil: 2.8.2
requests: 2.31.0
SciPy: 1.10.1
setuptools: 65.5.1
six: 1.16.0
sympy: 1.11.1
tomli: 2.0.1
torch: 2.2.0.1
torchaudio: 2.2.0.1
torchvision: 0.17.0.1
tqdm: 4.65.0
typing_extensions: 4.9.0
urllib3: 1.26.18
yarl: 1.8.2
鏡像運行要求
pytorch-intel鏡像充分利用Intel CPU的AVX512和AMX指令,因此需要在支持上述指令的平臺上運行。
重要特性說明
1、pytorch-intel鏡像性能優化
下表是在阿里云g8i 2xlarge實例上,使用pytorch 2.2.0.1版本,比對pytorch-intel與pytorch鏡像,在圖像處理場景,對比resnet50模型在不同精度下推理性能。數據為圖片處理時延,數值越小性能越好,數據對比看出使用pytorch-intel鏡像性能有明顯提升。
測試項 | fp32 | bf16 |
pytorch鏡像 | 45.48 ms | 16.15 ms |
pytorch-intel鏡像 | 27.99 ms | 10.14 ms |
更新記錄
2024.05:發布pytorch-intel 2.2.0.1鏡像