感謝您提交詢問!我們的一位團隊成員將在短時間內與您聯繫。
感謝您提交預訂!我們的一位團隊成員將在短時間內與您聯繫。
課程簡介
Biren GPU 架構簡介
- Biren 概述及應用場景
- 硬件佈局:核心、內存、計算集羣
- 與 NVIDIA 和 AMD GPU 的對比
搭建 Biren Programming 環境
- 安裝 Biren SDK 和運行時
- 理解工具鏈和編譯器模型
- 基本項目結構與構建過程
使用 Biren 堆棧進行 GPU Programming
- 線程和塊模型
- 內存管理與數據傳輸
- 內核開發與啓動模式
從 CUDA 遷移到 Biren
- CUDA 代碼的轉換技術
- 常見 API 映射與適配
- 代碼轉換實驗與實踐
調試與性能分析
- 使用 Biren 的調試器和性能分析器
- 識別性能瓶頸
- 內存訪問模式與優化
優化技術
- 線程調度與指令流水線
- 循環展開與共享內存使用
- 高級內核調優以提高吞吐量
案例研究與應用示例
- 使用 Biren 加速器訓練模型
- 遷移與性能分析視覺或 NLP 模型
- 與 CUDA/NVIDIA 的性能對比
總結與下一步
最低要求
- 瞭解GPU架構與並行處理
- 具備CUDA、OpenCL或類似GPU編程環境的經驗
- 熟悉深度學習框架,如PyTorch或TensorFlow
受衆
- HPC開發者
- AI基礎設施工程師
- 性能優化專家
21 時間:
客戶評論 (1)
逐步进行的培训,包含大量练习。整个过程就像一场工作坊,对此我感到非常满意。
Ireneusz - Inter Cars S.A.
課程 - Intelligent Applications Fundamentals
機器翻譯