課程簡介

Stratio平臺簡介

  • Stratio架構與核心模塊概述
  • Rocket和Intelligence在數據生命週期中的作用
  • 登錄並導航Stratio用戶界面

使用Rocket模塊

  • 數據攝取與管道創建
  • 連接數據源並配置轉換
  • 在Rocket中使用PySpark進行預處理任務

Stratio用戶的PySpark基礎

  • PySpark數據結構與操作
  • 循環結構:for、while、if/else的使用
  • 使用def編寫自定義函數並應用

高級使用Rocket與PySpark

  • 流式攝取與轉換
  • 在批處理和即時場景中使用循環與函數
  • PySpark管道中的性能最佳實踐

探索Intelligence模塊

  • 數據建模與分析功能概述
  • 特徵選擇、轉換與探索
  • PySpark在自定義分析與洞察中的作用

構建高級分析工作流

  • 在Intelligence中創建用戶自定義函數(UDFs)
  • 應用條件與循環實現數據邏輯
  • 用例:分段、聚合與預測

部署與協作

  • 保存、導出與重用工作流
  • 在Stratio中與其他團隊成員協作
  • 審查輸出並與下游工具集成

總結與後續步驟

最低要求

  • 具備Python編程經驗
  • 理解數據分析或大數據處理概念
  • 具備Apache Spark和分佈式計算的基礎知識

目標受衆

  • 在Stratio平臺上工作的數據工程師
  • 使用Rocket和Intelligence模塊的分析師或開發人員
  • 在Stratio中轉向PySpark工作流程的技術團隊
 14 時間:

人數


每位參與者的報價

客戶評論 (4)

即將到來的課程

課程分類