AMD將于今年秋季在部分RDNA 3 GPU上添加ROCm的支持
人工智能是塑造下一代計算的決定性技術。近幾個月來,我們都看到了生成式人工智能和大語言模型的爆炸式增長正在徹底改變我們與技術交互的方式,并推動以GPU為中心的數據中心對高性能計算的需求顯著增加。
ROCm是一個開放軟件平臺,允許研究人員利用AMD Instinct加速器的強大功能,促進HPC和AI創新跨平臺的可移植性。ROCm 5具有針對AI和HPC工作負載的全面優化套件。其中包括針對大型語言模型精細調整的內核、對新數據類型的支持以及對像OpenAI Triton類編程語言等新技術的支持。
ROCm驗證現在包括每晚進行數十萬次框架測試,以及跨數千個模型和運算符的驗證。這包括對PyTorch、TensorFlow、ONNX和JAX等領先框架的支持,為基于這些框架構建的所有AI模型提供更佳的開箱即用的開發者體驗。
我很高興地宣布ROCm 5.6的最新版本。
ROCm 5.6通過針對大語言(和其他)模型的新型AI軟件附加組件增強了功能,包括跨ROCm 庫組合的許多性能優化。它還反映了支持人工智能社區的持續改進,包括:
- 將Hugging Face單元測試套件集成到ROCm QA中
- 在PyTorch 2.0感應器模式下對OpenAI Triton的增量支持
- 通過ROCm對PyTorch、TensorFlow和JAX啟用OpenXLA支持,從而支持更廣泛的社區
ROCm 5.6還引入了對FFT、BLAS和求解器等多個數學庫的改進,這些數學庫構成了HPC應用程序的基礎,并增強了ROCm開發和部署工具,包括安裝、ROCgdb(CPU-GPU集成調試器)、ROCm分析器和文檔。
隨著行業朝著支持廣泛加速器的開放生態系統發展,我們將繼續努力進一步優化框架和后端編譯器,以實現更佳性能,包括MLIR基礎設施改進,鞏固AMD對OpenAI Triton和OpenXLA編譯器的支持。我們還將繼續在Hugging Face的AMD hub中添加針對AMD解決方案優化的其他開源AI模型。
對于HPC用戶,我們最近在AMD Infinity Hub上發布了許多發布方法,使客戶能夠構建HPC應用程序容器,未來的ROCm版本將增加AMD Instinct解決方案支持的HPC應用程序數量。
我們還看到開發人員對在Radeon消費級和 Radeon Pro工作站級GPU上運行用于AI和ML的ROCm開放軟件平臺表現出了極大的興趣,并聽到了社區對不受支持的GPU上的特定驅動程序問題提出的挑戰。我可以很高興地說,我們已經修復了ROCm 5.6中報告的問題,并且我們致力于今后擴大我們的支持。
我們計劃將ROCm支持從當前支持的AMD RDNA 2工作站GPU:Radeon Pro v620和w6800 擴展到特定的AMD RDNA 3工作站和消費級GPU。Linux上對基于RDNA 3的GPU的正式支持計劃于今年秋季開始推出,首先是48GB Radeon PRO W7900和24GB Radeon RX 7900 XTX,隨著時間的推移,還會發布更多卡和擴展功能。
責任編輯:彭菁
-
amd
+關注
關注
25文章
5497瀏覽量
134640 -
人工智能
+關注
關注
1796文章
47673瀏覽量
240289 -
RDNA
+關注
關注
0文章
20瀏覽量
1930
原文標題:新的ROCm? 5.6版本為AI和HPC工作負載帶來增強和優化
文章出處:【微信號:AMD中國,微信公眾號:AMD中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
AMD將DeepSeek-V3模型集成至Instinct MI300X GPU
AMD集成DeepSeek-V3模型至Instinct MI300X GPU
RDNA 4顯卡定在3月發售 AMD解釋原因
《CST Studio Suite 2024 GPU加速計算指南》
AMD確認2025年推出RDNA 4顯卡,光追與AI性能大幅提升
AMD與NVIDIA GPU優缺點
英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行
AMD將棄用700系命名,下代桌面主板升級至800系?
AMD發布ROCm更新,新增RX 8000系列GPU的Navi 44命名
AMD RDNA4或采用GDDR6顯存,Navi 4X或Navi 4C具備216個計算單元?
AMD RDNA4顯卡全部搭載18Gbps顯存,帶寬略遜于部分RDNA3產品
英偉達GPU壟斷局面下,開源能否成為顛覆市場的關鍵力量?

AMD ROCm 6.1升級MIPOpen 3.1,引入AI參數預測模型
在AMD GPU上如何安裝和配置triton?

評論