課程簡介

Big Data 概述:

  • 什麼是 Big Data
  • 為什麼 Big Data 越來越受歡迎
  • Big Data 案例研究
  • Big Data 特性
  • 要處理的解決方案Big Data。

Hadoop 及其元件:

  • 什麼是 Hadoop 以及它的組成部分是什麼。
  • Hadoop 架構及其特性 它可以處理的數據 /Process。
  • 簡要介紹 Hadoop 歷史、使用它的公司以及他們開始使用它的原因。
  • Hadoop 框架工作及其元件-詳細解釋。
  • 什麼是 HDFS 和對 Hadoop 分散式文件系統的讀取-寫入。
  • 如何設置 Hadoop 不同模式的集群 - 獨立/偽/多節點集群。

(這包括在 VirtualBox/KVM/VMware 中設置一個 Hadoop 集群,需要仔細研究的網路配置,運行 Hadoop 守護進程和測試集群)。

  • 什麼是 Map Reduce 框架工作及其工作原理。
  • 在 Hadoop 集群上運行 Map Reduce 作業。
  • 瞭解 Hadoop 集群上下文中的 Replication、Mirroring 和 Rack 感知。

Hadoop 集群規劃:

  • 如何規劃Hadoop集群。
  • 了解硬體-軟體以規劃您的Hadoop集群。
  • 瞭解工作負載並規劃集群以避免故障並執行最佳性能。

什麼是 MapR 以及為什麼選擇 MapR :

  • MapR 及其體系結構概述。
  • 理解並操作MapR控制系統、MapR卷、快照和鏡像。
  • 在 MapR 的上下文中規劃集群。
  • MapR 與其他發行版和 Apache 的比較 Hadoop。
  • MapR 安裝和集群部署。

集群設置和管理:

  • 管理服務、節點、快照、鏡像卷和遠端集群。
  • 瞭解和管理節點。
  • 瞭解 Hadoop 個元件,與 MapR 服務一起安裝 Hadoop 個元件。
  • Accessing 集群上的數據,包括通過NFS管理服務和節點。
  • 通過使用卷管理數據,管理使用者和組,管理和分配節點角色,調試停用節點,集群管理和性能監控,配置/分析和監控指標以監控性能,配置和管理MapR安全性。
  • 瞭解和使用 MapR 表的 M7 本機存儲。
  • 集群配置和優化以實現最佳性能。

集群升級並與其他設置集成:

  • 升級 MapR 的軟體版本和升級類型。
  • 配置Mapr集群訪問 HDFS 集群。
  • 在 Amazon Elastic MapReduce 上設置 MapR 集群。

以上所有主題都包括演示和練習課程,供學習者親身體驗該技術。

最低要求

  • FS 基礎知識 Linux
  • 基本 Java
  • 瞭解 Apache Hadoop(推薦)
 28 時間:

人數


每位參與者的報價

客戶評論 (1)

Provisional Upcoming Courses (Require 5+ participants)

課程分類