課程簡介

AWS雲運維基礎

  • 雲中的運維角色和職責。
  • AWS賬戶結構、組織和多賬戶策略。
  • 核心運維服務:CloudWatch、CloudTrail、AWS Config。

基礎設施即代碼與配置管理

  • IaC和不可變基礎設施的原則。
  • 使用Terraform和AWS CloudFormation進行配置。
  • 管理狀態、模塊和環境升級。

CI/CD與部署策略

  • 爲雲原生apps設計CI/CD流水線。
  • 藍綠部署、金絲雀部署和滾動部署。
  • 自動回滾、健康檢查和發佈驗證。

監控、可觀測性與告警

  • 指標、日誌和跟蹤:收集、存儲和分析。
  • 使用CloudWatch、X-Ray和第三方可觀測性工具。
  • 定義SLOs/SLIs、告警策略和值班實踐。

安全運維與身份管理

  • IAM最佳實踐、最小權限和跨賬戶訪問。
  • 密鑰管理、KMS和安全參數存儲。
  • 運維安全:補丁策略、漏洞掃描和審計跟蹤。

彈性、備份與災難恢復

  • 設計容錯和高可用性。
  • 備份策略、快照自動化和恢復流程。
  • 災難恢復計劃和操作手冊創建。

成本優化與治理

  • 成本可見性:計費、標籤和成本分配策略。
  • 資源優化、預留實例/節省計劃和預算控制。
  • 治理:策略、護欄和合規自動化。

容器、Serverless與運行時運維

  • ECS、EKS和Lambda的運維注意事項。
  • 服務發現、自動擴展和資源限制。
  • 日誌記錄、跟蹤和調試容器化工作負載。

事件響應、操作手冊與混沌工程

  • 基於操作手冊的事件響應和事後分析實踐。
  • 自動化修復和自愈模式。
  • 混沌實驗簡介:驗證彈性。

實踐工作坊:操作一個示例工作負載

  • 使用IaC和CI/CD流水線部署一個示例應用。
  • 實施監控、告警和自動化修復腳本。
  • 模擬事件並練習基於操作手冊的響應。

總結與下一步

最低要求

  • 對雲概念和網絡有基本瞭解。
  • 熟悉Linux命令行和腳本。
  • 具備源代碼控制(Git)和基本CI/CD概念的經驗。

受衆

  • 雲運維工程師。
  • SRE和平臺工程師。
  • DevOps工程師和技術團隊負責人。
 21 時間:

人數


每位參與者的報價

客戶評論 (5)

即將到來的課程

課程分類