課程簡介

Python數據任務基礎

  • 安裝Python並設置開發環境
  • 語言基礎:變量、數據類型、控制結構
  • 編寫和運行簡單的Python腳本

文件處理:CSV和Excel

  • 使用csv模塊和Pandas讀寫CSV文件
  • 使用openpyxl/xlrd和Pandas處理Excel文件
  • 實踐練習:自動化文件轉換

Pandas入門

  • DataFrame基礎:創建、索引、選擇和過濾
  • 聚合和分組操作
  • 常見清理操作:缺失值、重複值和類型轉換

Polars入門

  • Polars的概念及其與Pandas的性能對比
  • Polars中的基本DataFrame操作
  • 用例示例:何時選擇Polars而非Pandas

高級數據轉換(中級)

  • Pandas中的複雜連接、窗口函數和透視操作
  • 使用Polars進行高效數據處理
  • 鏈式操作和優化內存使用

使用Python進行流程自動化

  • 編寫腳本以自動化重複數據任務和ETL步驟
  • 使用操作系統調度器或任務調度器調度腳本
  • 日誌記錄、錯誤處理和通知

腳本打包與最佳實踐

  • 使用PyInstaller或類似工具創建可執行文件
  • 項目結構、虛擬環境和依賴管理
  • 版本控制基礎和文檔化工作流程

動手小項目

  • 端到端任務:讀取原始文件,清理和轉換數據,生成輸出
  • 自動化工作流程並將其打包爲可運行腳本或可執行文件
  • 基於同行反饋的回顧與改進

總結與下一步

最低要求

  • 對編程概念有基本瞭解或願意學習
  • 能夠使用命令行或終端進行包安裝
  • 有使用電子表格(CSV/Excel)的經驗

受衆

  • 自動化數據任務的數據分析師和運營人員
  • 尋求輕量級ETL腳本的分析工程師
  • 對基於Python的實際數據工作流感興趣的專業人士
 14 時間:

人數


每位參與者的報價

客戶評論 (5)

即將到來的課程

課程分類