課程簡介

大規模監控簡介

  • 在高流量環境中進行監控的挑戰
  • Prometheus 和 Grafana 的擴展策略
  • 分散式系統的體系結構注意事項

縮放 Prometheus

  • 在分片環境中設定 Prometheus
  • 對大規模系統使用 Prometheus 聯合
  • 實施 Prometheus 存儲優化

針對大型環境進行優化 Grafana

  • 配置 Grafana 以處理大型數據集
  • 提高控制面板性能和載入時間
  • 複雜可視化的最佳實踐

使用 Prometheus 和 Grafana 進行分散式監控

  • 將 Prometheus 與分散式追蹤工具集成
  • 在 Kubernetes 環境中監控微服務
  • 高級警報和通知策略

管理高可用性

  • 設置冗餘 Prometheus 和 Grafana 實例
  • 用於監視系統的故障轉移策略
  • 確保數據的一致性和可靠性

故障排除和調試

  • 識別和解決性能瓶頸
  • 調試 PromQL 查詢和控制面板配置
  • 大規模監控中的常見陷阱

高級集成

  • 將 Prometheus 和 Grafana 與外部資料庫集成
  • 使用 Grafana 外掛程式增強功能
  • 利用第三方工具進行擴展監控

總結和後續步驟

最低要求

  • 對 Prometheus 和 Grafana 基礎知識有深入的理解
  • 具有 Linux 系統管理經驗
  • 熟悉分散式系統架構

觀眾

  • DevOps 名工程師
  • 網站可靠性工程師 (SRE)
 14 時間:

人數


每位參與者的報價

客戶評論 (2)

Provisional Upcoming Courses (Require 5+ participants)

課程分類