課程簡介
Stratio平臺簡介
- Stratio架構與核心模塊概述
- Rocket和Intelligence在數據生命週期中的作用
- 登錄並導航Stratio用戶界面
使用Rocket模塊
- 數據攝取與管道創建
- 連接數據源並配置轉換
- 在Rocket中使用PySpark進行預處理任務
Stratio用戶的PySpark基礎
- PySpark數據結構與操作
- 循環結構:for、while、if/else的使用
- 使用def編寫自定義函數並應用
高級使用Rocket與PySpark
- 流式攝取與轉換
- 在批處理和即時場景中使用循環與函數
- PySpark管道中的性能最佳實踐
探索Intelligence模塊
- 數據建模與分析功能概述
- 特徵選擇、轉換與探索
- PySpark在自定義分析與洞察中的作用
構建高級分析工作流
- 在Intelligence中創建用戶自定義函數(UDFs)
- 應用條件與循環實現數據邏輯
- 用例:分段、聚合與預測
部署與協作
- 保存、導出與重用工作流
- 在Stratio中與其他團隊成員協作
- 審查輸出並與下游工具集成
總結與後續步驟
最低要求
- 具備Python編程經驗
- 理解數據分析或大數據處理概念
- 具備Apache Spark和分佈式計算的基礎知識
目標受衆
- 在Stratio平臺上工作的數據工程師
- 使用Rocket和Intelligence模塊的分析師或開發人員
- 在Stratio中轉向PySpark工作流程的技術團隊
客戶評論 (4)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
課程 - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
課程 - QGIS for Geographic Information System
I really enjoyed the training. I found all modules to be applicable to problems that I am trying to solve at work. The integration of the training with jupyter notebooks was really impressive.
Mark Firmin - Environment and Climate Change Canada
課程 - Python for Geographic Information System (GIS)
The thing I liked the most about the training was the organization and the location