課程簡介

介紹

  • Spark 和 Hadoop 功能和體系結構概述
  • 了解大數據
  • Python 程式設計基礎

開始

  • 設置 Python、Spark 和 Hadoop
  • 瞭解 Python 中的數據結構
  • 瞭解 PySpark API
  • 瞭解HDFS和MapReduce

將 Spark 和 Hadoop 與 Python 集成

  • 在 Python 中實現Spark RDD
  • 使用MapReduce處理數據
  • 在HDFS中創建分散式數據集

Machine Learning 使用 Spark MLlib

使用 Spark Streaming 處理大數據

使用推薦系統

使用 Kafka、Sqoop、Kafka 和 Flume

Apache Mahout 與 Spark 和 Hadoop

故障排除

摘要和後續步驟

最低要求

  • Spark和Hadoop經驗
  • Python 程式設計經驗

觀眾

  • 數據科學家
  • 開發人員
 21 時間:

人數



每位參與者的報價

客戶評論 (2)

相關課程

Python and Spark for Big Data (PySpark)

21 時間:

Introduction to Graph Computing

28 時間:

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 時間:

Apache Spark MLlib

35 時間:

Data Analysis in Python using Pandas and Numpy

14 時間:

Accelerating Python Pandas Workflows with Modin

14 時間:

Machine Learning with Python and Pandas

14 時間:

Scaling Data Analysis with Python and Dask

14 時間:

FARM (FastAPI, React, and MongoDB) Full Stack Development

14 時間:

Developing APIs with Python and FastAPI

14 時間:

Scientific Computing with Python SciPy

7 時間:

Game Development with PyGame

7 時間:

Web application development with Flask

14 時間:

Advanced Flask

14 時間:

Build REST APIs with Python and Flask

14 時間:

課程分類

1