感謝您提交詢問!我們的一位團隊成員將在短時間內與您聯繫。
感謝您提交預訂!我們的一位團隊成員將在短時間內與您聯繫。
課程簡介
介紹:
- Apache Spark 在 Hadoop 生態系統中
- python、scala 的簡短介紹
基礎知識(理論):
- 建築
- RDD型
- 轉型與行動
- 階段、任務、依賴項
使用 Databricks 環境瞭解基礎知識(動手研討會):
- 使用 RDD API 的練習
- 基本操作和轉換函數
- 貨幣對RDD
- 加入
- 緩存策略
- 使用 DataFrame API 的練習
- 火花SQL
- DataFrame:選擇、篩選、分組、排序
- UDF(使用者定義函數)
- 查看數據集 API
- 流
使用 AWS 環境瞭解部署(動手研討會):
- AWS Glue 基礎知識
- 瞭解 AWS EMR 和AWS Glue 之間的差異
- 兩個環境中的示例作業
- 瞭解利弊
額外:
- Apache Airflow 編排簡介
最低要求
程式設計技能(最好是 python,scala)
SQL 基礎知識
21 時間:
客戶評論 (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
課程 - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
課程 - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift