課程簡介
Stratio平台简介
- Stratio架构与核心模块概述
- Rocket与Intelligence在数据生命周期中的作用
- 登录与导航Stratio用户界面
Rocket模块的使用
- 数据摄取与管道创建
- 连接数据源并配置转换
- 使用PySpark在Rocket中进行预处理任务
PySpark Stratio用户基础
- PySpark数据结构与操作
- 循环结构:for、while、if/else的使用
- 使用def编写自定义函数并应用
Rocket与PySpark的高级使用
- 流式摄取与转换
- 在批处理和实时场景中使用循环与函数
- PySpark管道中的性能最佳实践
Intelligence模块探索
- 数据建模与分析功能概述
- 特征选择、转换与探索
- PySpark在自定义分析与洞察中的作用
构建高级分析工作流
- 在Intelligence中创建用户定义函数(UDFs)
- 应用条件与循环进行数据逻辑处理
- 用例:分段、聚合与预测
部署与Collaboration
- 保存、导出与重用工作流
- 与团队成员在Stratio上协作
- 审查输出并与下游工具集成
总结与下一步
最低要求
- 具备Python编程经验
- 理解数据分析或大数据处理概念
- 具备Apache Spark和分布式计算的基础知识
目标受众
- 在基于Stratio平台上工作的数据工程师
- 使用Rocket和Intelligence模块的分析师或开发人员
- 在Stratio内部过渡到PySpark工作流程的技术团队
客戶評論 (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
我喜歡 Pablo 的風格,他涵蓋了很多主題,從報告設計、html 定製到實現簡單的 ML 演算法。Good 平衡理論資訊/練習。Pablo 真的涵蓋了我感興趣的所有主題,並全面回答了我的問題。
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
機器翻譯
Actual application of spotfire and all basic functions.
Michael Capili - STMicroelectronics, Inc.
Course - Introduction to Spotfire
The thing I liked the most about the training was the organization and the location