Jupyter for Data Science Teams培訓
Jupyter 是一個開源的、基於 Web 的交互式集成開發環境和計算環境。
本課程爲講師引導的培訓(線上或線下),介紹了數據科學中的協作開發理念,並演示瞭如何使用 Jupyter 跟蹤並作爲團隊參與“計算想法的生命週期”。課程將帶領學員基於 Jupyter 生態系統創建一個示例數據科學項目。
在本課程結束時,學員將能夠:
- 安裝和配置 Jupyter,包括在 Git 上創建和集成團隊倉庫。
- 使用 Jupyter 的擴展、交互式小部件、多用戶模式等功能,實現項目協作。
- 與團隊成員創建、共享和組織 Jupyter Notebook。
- 通過 Jupyter 界面選擇 Scala、Python、R 等語言,編寫並執行鍼對 Apache Spark 等大數據系統的代碼。
課程形式
- 互動式講座和討論。
- 大量練習和實踐。
- 在即時實驗環境中進行動手操作。
課程定製選項
- Jupyter Notebook 支持包括 R、Python、Scala、Julia 等在內的 40 多種語言。如需根據您選擇的語言定製本課程,請聯繫我們安排。
課程簡介
Jupyter 簡介
- Jupyter 及其生態系統概述
- 安裝和設置
- 爲團隊協作配置 Jupyter
協作功能
- 使用 Git 進行版本控制
- 擴展和交互式小部件
- 多用戶模式
創建和管理 Notebook
- Notebook 的結構和功能
- 共享和組織 Notebook
- 協作的最佳實踐
使用 Jupyter 編程
- 選擇和使用編程語言(Python、R、Scala)
- 編寫和執行代碼
- 與大數據系統(Apache Spark)集成
高級 Jupyter 功能
- 自定義 Jupyter 環境
- 使用 Jupyter 自動化工作流程
- 探索高級用例
實踐環節
- 動手實驗
- 真實世界的數據科學項目
- 小組練習和同行評審
總結與下一步
最低要求
- 具備 Python、R、Scala 等編程語言的經驗。
- 具備數據科學背景。
目標受衆
- 數據科學團隊
公開培訓課程需要5名以上參與者。
Jupyter for Data Science Teams培訓 - 訂單
Jupyter for Data Science Teams培訓 - 詢問
Jupyter for Data Science Teams - 咨詢詢問
客戶評論 (1)
很高興課程能夠根據我在課前問卷中強調的關鍵領域進行定製。這確實有助於解決我在該主題上的疑問,並與我的學習目標保持一致。
Winnie Chan - Statistics Canada
課程 - Jupyter for Data Science Teams
機器翻譯
即將到來的課程
相關課程
Apache Airflow 用於 Data Science:自動化 Machine Learning 管道
21 小時本次由講師指導的培訓(線上或線下)面向中級參與者,旨在幫助他們使用Apache Airflow自動化和管理機器學習工作流,包括模型訓練、驗證和部署。
培訓結束後,參與者將能夠:
- 設置Apache Airflow以進行機器學習工作流編排。
- 自動化數據預處理、模型訓練和驗證任務。
- 將Airflow與機器學習框架和工具集成。
- 使用自動化管道部署機器學習模型。
- 監控和優化生產中的機器學習工作流。
Anaconda 數據科學家生態系統
14 小時這種由 講師指導的 香港 現場培訓(在線或現場)面向希望使用 Anaconda 生態系統在單一平臺中捕獲、管理和部署軟體包和數據分析工作流 的數據科學家。
在本次培訓結束時,參與者將能夠:
- 安裝和配置 Anaconda 個元件和庫。
- 瞭解 Anaconda 的核心概念、功能和優勢。
- 使用 Anaconda Navigator 管理包、環境和頻道。
- 將 Conda、R 和 Python 包用於數據科學和機器學習。
- 瞭解管理多個數據環境的一些實際使用案例和技術。
AWS Cloud9 數據科學應用
28 小時本課程爲講師指導的培訓,在 香港(線上或線下)進行,面向希望使用 AWS Cloud9 簡化數據科學工作流程的中級數據科學家和分析師。
培訓結束後,參與者將能夠:
- 在 AWS Cloud9 中設置數據科學環境。
- 在 Cloud9 中使用 Python、R 和 Jupyter Notebook 進行數據分析。
- 將 AWS Cloud9 與 AWS 數據服務(如 S3、RDS 和 Redshift)集成。
- 使用 AWS Cloud9 進行機器學習模型的開發和部署。
- 優化基於雲的數據分析和處理工作流程。
Google Colab 數據科學入門
14 小時本次由講師主導的培訓在香港(線上或線下)進行,面向初學者級別的數據科學家和 IT 專業人士,旨在幫助他們學習使用 Google Colab 進行數據科學的基礎知識。
在培訓結束後,參與者將能夠:
- 設置和導航 Google Colab。
- 編寫和執行基本的 Python 代碼。
- 導入和處理數據集。
- 使用 Python 庫創建可視化。
A Practical Introduction to Data Science
35 小時完成本培訓的學員將獲得對數據科學及其相關技術、方法和工具的實踐性、現實世界的理解。
學員將有機會通過動手練習將所學知識付諸實踐。小組互動和講師反饋是課程的重要組成部分。
課程從數據科學的基本概念介紹開始,然後逐步深入數據科學中使用的工具和方法。
受衆
- 開發者
- 技術分析師
- IT顧問
課程形式
- 部分講座,部分討論,練習和大量動手實踐
注意
- 如需爲此課程定製培訓,請聯繫我們安排。
Data Science for Big Data Analytics
35 小時大數據是如此龐大和復雜的數據集,傳統的數據處理應用軟件不足以處理它們。大數據挑戰包括捕獲數據,數據存儲,數據分析,搜索,共享,傳輸,可視化,查詢,更新和信息隱私。
Data Science essential for Marketing/Sales professionals
21 小時本課程面向市場營銷和銷售專業人士,旨在深入探討數據科學在市場營銷和銷售中的應用。課程詳細介紹了用於“向上銷售”、“交叉銷售”、市場細分、品牌建設和客戶終身價值(CLV)的各種數據科學技術。
市場營銷與銷售的區別 - 銷售和市場營銷有何不同?
簡單來說,銷售可以被視爲一個專注於個人或小羣體的過程。而市場營銷則針對更大的羣體或公衆。市場營銷包括研究(識別客戶需求)、產品開發(生產創新產品)和產品推廣(通過廣告)以及在消費者中建立產品意識。因此,市場營銷意味着生成潛在客戶或線索。一旦產品進入市場,銷售人員的工作就是說服客戶購買產品。銷售意味着將潛在客戶或線索轉化爲購買和訂單,而市場營銷則着眼於長期目標,銷售則與短期目標相關。
數據科學導論
35 小時本次由講師主導的培訓(線上或線下)面向希望開啓數據科學職業生涯的專業人士。
培訓結束後,參與者將能夠:
- 安裝和配置Python和MySql。
- 理解數據科學是什麼,以及它如何爲幾乎任何業務增加價值。
- 學習Python編程的基礎知識
- 學習監督和非監督的機器學習技術,如何實現它們並解釋結果。
課程形式
- 互動講座和討論。
- 大量練習和實踐。
- 在即時實驗環境中進行實踐操作。
課程定製選項
- 如需爲本課程定製培訓,請聯繫我們安排。
Kaggle
14 小時這個由 講師指導的 香港 現場培訓(在線或現場)面向希望在 Data Science 中使用 Kaggle 學習和建立職業生涯的數據科學家和開發人員。
在本次培訓結束時,參與者將能夠:
- 了解數據科學和機器學習。
- 探索數據分析。
- 瞭解 Kaggle 及其工作原理。
使用KNIME分析平臺進行數據科學
21 小時KNIME分析平臺是數據驅動創新的領先開源選擇,幫助您發現數據中隱藏的潛力,挖掘新的見解,或預測未來。擁有超過1000個模塊、數百個即用示例、全面的集成工具集以及最廣泛的高級算法選擇,KNIME分析平臺是任何數據科學家和業務分析師的完美工具箱。
本課程爲KNIME分析平臺提供了理想的機會,適合初學者、高級用戶和KNIME專家,介紹KNIME,學習如何更有效地使用它,並基於KNIME工作流創建清晰、全面的報告。
本次由講師主導的培訓(線上或線下)面向希望使用KNIME解決複雜業務需求的數據專業人士。
目標受衆是不懂編程,但希望使用前沿工具實現分析場景的人員。
培訓結束後,學員將能夠:
- 安裝和配置KNIME。
- 構建數據科學場景。
- 訓練、測試和驗證模型。
- 實現數據科學模型的端到端價值鏈。
課程形式
- 互動講座和討論。
- 大量練習和實踐。
- 在即時實驗室環境中進行實操。
課程定製選項
- 如需爲本課程定製培訓或瞭解更多信息,請聯繫我們安排。
MATLAB基礎、數據科學與報告生成
35 小時在本培訓的第一部分,我們將介紹 MATLAB 的基礎知識及其作為語言和平臺的功能。 本次討論包括對 MATLAB 語法、陣列和矩陣、數據可視化、腳本開發和面向對象原則的介紹。
在第二部分中,我們將演示如何使用 MATLAB 進行數據挖掘、機器學習和預測分析。為了向參與者提供一個清晰而實用的視角來瞭解 MATLAB 的方法和能力,我們將使用 MATLAB 與使用其他工具(如電子表格、C、C++ 和 Visual Basic)進行比較。
在培訓的第三部分,參與者學習如何通過自動化數據處理和報告生成來簡化他們的工作。
在整個課程中,參與者將通過實驗室環境中的實踐練習將學到的想法付諸實踐。在培訓結束時,參與者將全面掌握 MATLAB 的能力,並能夠利用它來解決現實世界的數據科學問題,以及通過自動化來簡化他們的工作。
將在整個課程中進行評估,以衡量進展情況。
課程形式
- 課程包括理論和實踐練習,包括案例討論、示例代碼檢查和動手實施。
注意
- 實踐課程將基於預先安排的樣本數據報告範本。如果您有具體要求,請聯繫我們安排。
Machine Learning – Data science
21 小時這項由講師指導的香港(線上或線下)培訓,針對中級數據分析師、開發人員或有志成為數據科學家的人士,旨在應用機器學習技術於Python中,以提取洞察、進行預測並自動化數據驅動的決策。
在本課程結束時,參與者將能夠:
- 理解並區分關鍵的機器學習範式。
- 探索數據預處理技術和模型評估指標。
- 應用機器學習算法解決實際數據問題。
- 使用Python庫和Jupyter筆記本進行實作開發。
- 構建用於預測、分類、推薦和聚類的模型。
使用Modin加速Python Pandas工作流
14 小時這種由 講師指導的 香港 現場現場培訓(在線或現場)面向希望使用 Modin 構建和實施並行計算的數據科學家和開發人員 Pandas 以加快數據分析速度。
在本次培訓結束時,參與者將能夠:
- 設置必要的環境,開始使用 Modin 大規模開發 Pandas 工作流。
- 瞭解 Modin 的功能、架構和優勢。
- 瞭解 Modin、Dask 和 Ray 之間的區別。
- 使用 Modin 更快地執行 Pandas 操作。
- 實現整個 Pandas API 和函數。
GPU數據科學之NVIDIA RAPIDS
14 小時本次由講師指導的線下或線上培訓,面向希望使用RAPIDS構建GPU加速的數據管道、工作流和可視化的數據科學家和開發者,應用如XGBoost、cuML等機器學習算法。
培訓結束後,參與者將能夠:
- 設置必要的開發環境,使用NVIDIA RAPIDS構建數據模型。
- 瞭解RAPIDS的特性、組件和優勢。
- 利用GPU加速端到端的數據和分析管道。
- 使用cuDF和Apache Arrow實現GPU加速的數據準備和ETL。
- 學習如何使用XGBoost和cuML算法執行機器學習任務。
- 使用cuXfilter和cuGraph構建數據可視化並執行圖分析。