Jupyter for Data Science Teams培訓
Jupyter 是一個開源的、基於 Web 的交互式集成開發環境和計算環境。
本課程爲講師引導的培訓(線上或線下),介紹了數據科學中的協作開發理念,並演示瞭如何使用 Jupyter 跟蹤並作爲團隊參與“計算想法的生命週期”。課程將帶領學員基於 Jupyter 生態系統創建一個示例數據科學項目。
在本課程結束時,學員將能夠:
- 安裝和配置 Jupyter,包括在 Git 上創建和集成團隊倉庫。
- 使用 Jupyter 的擴展、交互式小部件、多用戶模式等功能,實現項目協作。
- 與團隊成員創建、共享和組織 Jupyter Notebook。
- 通過 Jupyter 界面選擇 Scala、Python、R 等語言,編寫並執行鍼對 Apache Spark 等大數據系統的代碼。
課程形式
- 互動式講座和討論。
- 大量練習和實踐。
- 在即時實驗環境中進行動手操作。
課程定製選項
- Jupyter Notebook 支持包括 R、Python、Scala、Julia 等在內的 40 多種語言。如需根據您選擇的語言定製本課程,請聯繫我們安排。
課程簡介
Jupyter 簡介
- Jupyter 及其生態系統概述
- 安裝和設置
- 爲團隊協作配置 Jupyter
協作功能
- 使用 Git 進行版本控制
- 擴展和交互式小部件
- 多用戶模式
創建和管理 Notebook
- Notebook 的結構和功能
- 共享和組織 Notebook
- 協作的最佳實踐
使用 Jupyter 編程
- 選擇和使用編程語言(Python、R、Scala)
- 編寫和執行代碼
- 與大數據系統(Apache Spark)集成
高級 Jupyter 功能
- 自定義 Jupyter 環境
- 使用 Jupyter 自動化工作流程
- 探索高級用例
實踐環節
- 動手實驗
- 真實世界的數據科學項目
- 小組練習和同行評審
總結與下一步
最低要求
- 具備 Python、R、Scala 等編程語言的經驗。
- 具備數據科學背景。
目標受衆
- 數據科學團隊
公開培訓課程需要5名以上參與者。
Jupyter for Data Science Teams培訓 - 訂單
Jupyter for Data Science Teams培訓 - 詢問
Jupyter for Data Science Teams - 咨詢詢問
客戶評論 (1)
很高興課程能夠根據我在課前問卷中強調的關鍵領域進行定製。這確實有助於解決我在該主題上的疑問,並與我的學習目標保持一致。
Winnie Chan - Statistics Canada
課程 - Jupyter for Data Science Teams
機器翻譯
即將到來的課程
相關課程
Python數據科學與人工智能入門
35 小時深入探討使用Python進行數據科學與人工智能的實用方法,爲專業人士提供探索數據、構建機器學習模型以及在業務場景中部署AI驅動應用的技能;涵蓋CRISP-DM工作流、統計分析、監督與無監督學習、使用Tensorflow進行深度學習、自然語言處理、使用Spark處理大數據以及數據驅動講故事;適合初學者獲取Python數據科學認證和職業準備的分析培訓。
Apache Airflow 用於 Data Science:自動化 Machine Learning 管道
21 小時本次由講師指導的培訓(線上或線下)面向中級參與者,旨在幫助他們使用Apache Airflow自動化和管理機器學習工作流,包括模型訓練、驗證和部署。
培訓結束後,參與者將能夠:
- 設置Apache Airflow以進行機器學習工作流編排。
- 自動化數據預處理、模型訓練和驗證任務。
- 將Airflow與機器學習框架和工具集成。
- 使用自動化管道部署機器學習模型。
- 監控和優化生產中的機器學習工作流。
Anaconda 數據科學家生態系統
14 小時這種由 講師指導的 香港 現場培訓(在線或現場)面向希望使用 Anaconda 生態系統在單一平臺中捕獲、管理和部署軟體包和數據分析工作流 的數據科學家。
在本次培訓結束時,參與者將能夠:
- 安裝和配置 Anaconda 個元件和庫。
- 瞭解 Anaconda 的核心概念、功能和優勢。
- 使用 Anaconda Navigator 管理包、環境和頻道。
- 將 Conda、R 和 Python 包用於數據科學和機器學習。
- 瞭解管理多個數據環境的一些實際使用案例和技術。
AWS Cloud9 數據科學應用
28 小時本課程爲講師指導的培訓,在 香港(線上或線下)進行,面向希望使用 AWS Cloud9 簡化數據科學工作流程的中級數據科學家和分析師。
培訓結束後,參與者將能夠:
- 在 AWS Cloud9 中設置數據科學環境。
- 在 Cloud9 中使用 Python、R 和 Jupyter Notebook 進行數據分析。
- 將 AWS Cloud9 與 AWS 數據服務(如 S3、RDS 和 Redshift)集成。
- 使用 AWS Cloud9 進行機器學習模型的開發和部署。
- 優化基於雲的數據分析和處理工作流程。
Google Colab 數據科學入門
14 小時本次由講師主導的培訓在香港(線上或線下)進行,面向初學者級別的數據科學家和 IT 專業人士,旨在幫助他們學習使用 Google Colab 進行數據科學的基礎知識。
在培訓結束後,參與者將能夠:
- 設置和導航 Google Colab。
- 編寫和執行基本的 Python 代碼。
- 導入和處理數據集。
- 使用 Python 庫創建可視化。
Data Science essential for Marketing/Sales professionals
21 小時本課程面向市場營銷和銷售專業人士,旨在深入探討數據科學在市場營銷和銷售中的應用。課程詳細介紹了用於“向上銷售”、“交叉銷售”、市場細分、品牌建設和客戶終身價值(CLV)的各種數據科學技術。
市場營銷與銷售的區別 - 銷售和市場營銷有何不同?
簡單來說,銷售可以被視爲一個專注於個人或小羣體的過程。而市場營銷則針對更大的羣體或公衆。市場營銷包括研究(識別客戶需求)、產品開發(生產創新產品)和產品推廣(通過廣告)以及在消費者中建立產品意識。因此,市場營銷意味着生成潛在客戶或線索。一旦產品進入市場,銷售人員的工作就是說服客戶購買產品。銷售意味着將潛在客戶或線索轉化爲購買和訂單,而市場營銷則着眼於長期目標,銷售則與短期目標相關。
Kaggle
14 小時這個由 講師指導的 香港 現場培訓(在線或現場)面向希望在 Data Science 中使用 Kaggle 學習和建立職業生涯的數據科學家和開發人員。
在本次培訓結束時,參與者將能夠:
- 了解數據科學和機器學習。
- 探索數據分析。
- 瞭解 Kaggle 及其工作原理。
使用KNIME分析平臺進行數據科學
21 小時KNIME分析平臺是數據驅動創新的領先開源選擇,幫助您發現數據中隱藏的潛力,挖掘新的見解,或預測未來。擁有超過1000個模塊、數百個即用示例、全面的集成工具集以及最廣泛的高級算法選擇,KNIME分析平臺是任何數據科學家和業務分析師的完美工具箱。
本課程爲KNIME分析平臺提供了理想的機會,適合初學者、高級用戶和KNIME專家,介紹KNIME,學習如何更有效地使用它,並基於KNIME工作流創建清晰、全面的報告。
本次由講師主導的培訓(線上或線下)面向希望使用KNIME解決複雜業務需求的數據專業人士。
目標受衆是不懂編程,但希望使用前沿工具實現分析場景的人員。
培訓結束後,學員將能夠:
- 安裝和配置KNIME。
- 構建數據科學場景。
- 訓練、測試和驗證模型。
- 實現數據科學模型的端到端價值鏈。
課程形式
- 互動講座和討論。
- 大量練習和實踐。
- 在即時實驗室環境中進行實操。
課程定製選項
- 如需爲本課程定製培訓或瞭解更多信息,請聯繫我們安排。
Machine Learning – Data science
21 小時這項由講師指導的香港(線上或線下)培訓,針對中級數據分析師、開發人員或有志成為數據科學家的人士,旨在應用機器學習技術於Python中,以提取洞察、進行預測並自動化數據驅動的決策。
在本課程結束時,參與者將能夠:
- 理解並區分關鍵的機器學習範式。
- 探索數據預處理技術和模型評估指標。
- 應用機器學習算法解決實際數據問題。
- 使用Python庫和Jupyter筆記本進行實作開發。
- 構建用於預測、分類、推薦和聚類的模型。
使用Modin加速Python Pandas工作流
14 小時這種由 講師指導的 香港 現場現場培訓(在線或現場)面向希望使用 Modin 構建和實施並行計算的數據科學家和開發人員 Pandas 以加快數據分析速度。
在本次培訓結束時,參與者將能夠:
- 設置必要的環境,開始使用 Modin 大規模開發 Pandas 工作流。
- 瞭解 Modin 的功能、架構和優勢。
- 瞭解 Modin、Dask 和 Ray 之間的區別。
- 使用 Modin 更快地執行 Pandas 操作。
- 實現整個 Pandas API 和函數。
預訓練模型簡介
14 小時這種由講師指導的 香港 現場培訓(在線或現場)面向希望瞭解預訓練模型概念並學習如何應用它們來解決實際問題而無需從頭開始構建模型的初級專業人員。
在本次培訓結束時,參與者將能夠:
- 瞭解預訓練模型的概念和優勢。
- 探索各種預先訓練的模型架構及其使用案例。
- 針對特定任務微調預先訓練的模型。
- 在簡單的機器學習項目中實施預訓練模型。
Python金融編程
35 小時Python 是一種在金融行業中廣受歡迎的程式語言。它被大型投資銀行和對沖基金採用,用於構建各種金融應用程式,從核心交易程式到風險管理系統。
在這場由講師指導的現場培訓中,學員將學習如何使用 Python 開發實際應用程式,以解決一系列特定的金融相關問題。
培訓結束時,學員將能夠:
- 理解 Python 程式語言的基本原理
- 下載、安裝並維護用於在 Python 中創建金融應用程式的最佳開發工具
- 選擇並利用最合適的 Python 套件和程式技術來組織、可視化和分析來自各種來源(CSV、Excel、數據庫、網絡等)的金融數據
- 構建解決資產配置、風險分析、投資績效等問題的應用程式
- 對 Python 應用程式進行故障排除、集成、部署和優化
目標受眾
- 開發人員
- 分析師
- 量化分析師
課程形式
- 部分講授、部分討論、練習和大量實踐操作
注意事項
- 本培訓旨在為金融專業人員面臨的一些主要問題提供解決方案。如果您有特定的主題、工具或技術希望補充或進一步詳細說明,請聯繫我們進行安排。
Qlik Sense 數據科學應用
14 小時本次由講師主導的培訓在 香港(線上或線下)面向希望使用 Qlik Sense 開發關聯模型的數據分析師和 Web 開發人員。
培訓結束後,學員將能夠:
- 在數據科學中應用 Qlik Sense。
- 使用和導航 Qlik Sense 界面。
- 通過 AI 互動構建數據素養團隊。
- 使用 Qlik Sense 創建數據驅動型企業。
GPU數據科學之NVIDIA RAPIDS
14 小時本次由講師指導的線下或線上培訓,面向希望使用RAPIDS構建GPU加速的數據管道、工作流和可視化的數據科學家和開發者,應用如XGBoost、cuML等機器學習算法。
培訓結束後,參與者將能夠:
- 設置必要的開發環境,使用NVIDIA RAPIDS構建數據模型。
- 瞭解RAPIDS的特性、組件和優勢。
- 利用GPU加速端到端的數據和分析管道。
- 使用cuDF和Apache Arrow實現GPU加速的數據準備和ETL。
- 學習如何使用XGBoost和cuML算法執行機器學習任務。
- 使用cuXfilter和cuGraph構建數據可視化並執行圖分析。