課程簡介

介紹

  • 什麼是GPU編程?
  • 爲什麼使用CUDA與Python?
  • 關鍵概念:線程、塊、網格

CUDA功能和架構概述

  • GPU與CPU架構
  • 理解SIMT(單指令多線程)
  • CUDA編程模型

設置開發環境

  • 安裝CUDA工具包和驅動程序
  • 安裝Python和Numba
  • 設置和驗證環境

並行編程基礎

  • 並行執行簡介
  • 理解線程和線程層次結構
  • 處理線程束和同步

使用Numba編譯器

  • Numba簡介
  • 使用Numba編寫CUDA內核
  • 理解@cuda.jit裝飾器

構建自定義CUDA內核

  • 編寫和啓動基本內核
  • 使用線程進行逐元素操作
  • 管理網格和塊維度

內存管理

  • GPU內存類型(全局、共享、本地、常量)
  • 主機和設備之間的內存傳輸
  • 優化內存使用並避免瓶頸

GPU加速高級主題

  • 共享內存和同步
  • 使用流進行異步執行
  • 多GPU編程基礎

將基於CPU的應用程序轉換爲GPU

  • 分析CPU代碼
  • 識別可並行化的部分
  • 將邏輯移植到CUDA內核

故障排除

  • 調試CUDA應用程序
  • 常見錯誤及解決方法
  • 測試和驗證的工具與技術

總結與下一步

  • 回顧關鍵概念
  • GPU編程的最佳實踐
  • 持續學習的資源

最低要求

  • 具備Python編程經驗
  • 熟悉NumPy(ndarrays、ufuncs等)

受衆

  • 開發者
 14 小時

人數


每位參與者的報價

客戶評論 (1)

即將到來的課程

課程分類