預訓練模型簡介培訓
預訓練模型是現代 AI 的基石,提供可適應各種應用的預構建功能。本課程向參與者介紹預訓練模型的基礎知識、架構和實際用例。參與者將學習如何利用這些模型完成文本分類、圖像識別等任務。
這種由講師指導的現場培訓(在線或現場)面向初級專業人員,他們希望瞭解預訓練模型的概念,並學習如何應用它們來解決實際問題,而無需從頭開始構建模型。
在本次培訓結束時,參與者將能夠:
- 瞭解預訓練模型的概念和優勢。
- 探索各種預先訓練的模型架構及其使用案例。
- 針對特定任務微調預先訓練的模型。
- 在簡單的機器學習項目中實施預訓練模型。
課程形式
- 互動講座和討論。
- 大量的練習和練習。
- 在即時實驗室環境中動手實施。
課程自定義選項
- 要申請本課程的定製培訓,請聯繫我們進行安排。
課程簡介
Introduction to Pre-trained Models
- 什麼是預訓練模型?
- 使用預訓練模型的好處
- 流行的預訓練模型(例如 BERT、ResNet)概述
瞭解預訓練模型架構
- 模型架構基礎知識
- 遷移學習和微調概念
- 如何構建和訓練預訓練模型
設置環境
- 安裝和配置 Python 和相關庫
- 探索預先訓練的模型存儲庫(例如 Hugging Face)
- 載入和測試預訓練模型
動手操作預訓練模型
- 使用預先訓練的模型進行文本分類
- 將預訓練模型應用於圖像識別任務
- 為自訂數據集微調預訓練模型
部署預訓練模型
- 匯出和保存微調模型
- 將模型整合到應用程式中
- 在生產環境中部署模型的基礎知識
挑戰和最佳實踐
- 瞭解模型限制
- 在微調過程中避免過擬合
- 確保合乎道德地使用 AI 模型
預訓練模型的未來趨勢
- 新興架構及其應用
- 遷移學習的進步
- 探索大型語言模型和多模態模型
總結和後續步驟
最低要求
- 對機器學習概念的基本理解
- 熟悉 Python 程式設計
- 使用庫進行數據處理的基本知識,如 Pandas
觀眾
- 數據科學家
- 人工智慧愛好者
公開培訓課程需要5名以上參與者。
預訓練模型簡介培訓 - 訂單
預訓練模型簡介培訓 - 詢問
即將到來的課程
相關課程
AdaBoost Python 機器學習
14 小時本課程爲講師主導的培訓,在 香港(線上或線下)進行,面向希望使用 AdaBoost 構建機器學習提升算法的數據科學家和軟件工程師。
通過本培訓,參與者將能夠:
- 設置必要的開發環境,開始使用 AdaBoost 構建機器學習模型。
- 理解集成學習方法,並掌握如何實現自適應提升。
- 學習如何使用 AdaBoost 模型提升 Python 中的機器學習算法。
- 使用超參數調優,提高 AdaBoost 模型的準確性和性能。
Anaconda 數據科學家生態系統
14 小時這種由 講師指導的 香港 現場培訓(在線或現場)面向希望使用 Anaconda 生態系統在單一平臺中捕獲、管理和部署軟體包和數據分析工作流 的數據科學家。
在本次培訓結束時,參與者將能夠:
- 安裝和配置 Anaconda 個元件和庫。
- 瞭解 Anaconda 的核心概念、功能和優勢。
- 使用 Anaconda Navigator 管理包、環境和頻道。
- 將 Conda、R 和 Python 包用於數據科學和機器學習。
- 瞭解管理多個數據環境的一些實際使用案例和技術。
使用Google AutoML創建自定義聊天機器人
14 小時這種以講師為主導的香港(在線或現場)現場培訓面向具有不同專業水平的參與者,他們希望利用 Google 的 AutoML 平臺為各種應用程式構建定製的聊天機器人。
在培訓結束時,參與者將能夠:
- 瞭解聊天機器人開發的基礎知識。
- 流覽 Google 雲平臺並訪問 AutoML。
- 為訓練聊天機器人模型準備數據。
- 使用 AutoML 訓練和評估自定義聊天機器人模型。
- 將聊天機器人部署並整合到各種平台和管道中。
- 隨時間推移監控和優化聊天機器人性能。
Pattern Recognition
21 小時這門由講師指導的香港(線上或線下)培訓課程,介紹了模式識別和機器學習的領域,並涵蓋了統計學、計算機科學、信號處理、計算機視覺、數據挖掘和生物信息學中的實際應用。
通過本培訓,參與者將能夠:
- 應用核心統計方法於模式識別。
- 使用神經網絡和核方法等關鍵模型進行數據分析。
- 實施高級技術以解決複雜問題。
- 通過結合不同模型來提高預測準確性。
DataRobot
7 小時這種由 講師指導的 香港 現場培訓(在線或現場)面向希望使用 DataRobot 的機器學習功能自動化、評估和管理預測模型的數據科學家和數據分析師。
在本次培訓結束時,參與者將能夠:
- 在 DataRobot 中載入數據集以分析、評估和品質檢查數據。
- 構建和訓練模型以識別重要變數並滿足預測目標。
- 解釋模型以創建有助於做出業務決策的寶貴見解。
- 監控和管理模型以保持優化的預測性能。
Google Cloud AutoML
7 小時這種講師指導的 香港 現場培訓(在線或現場)面向數據科學家、數據分析師和開發人員,他們希望探索 AutoML 產品和功能,以最少的工作量創建和部署自定義 ML 訓練模型。
在本次培訓結束時,參與者將能夠:
- 探索 AutoML 產品線,為各種數據類型實施不同的服務。
- 準備和標記數據集以創建自定義 ML 模型。
- 訓練和管理模型以生成準確、公平的機器學習模型。
- 使用經過訓練的模型進行預測,以滿足業務目標和需求。
Kaggle
14 小時這個由 講師指導的 香港 現場培訓(在線或現場)面向希望在 Data Science 中使用 Kaggle 學習和建立職業生涯的數據科學家和開發人員。
在本次培訓結束時,參與者將能夠:
- 了解數據科學和機器學習。
- 探索數據分析。
- 瞭解 Kaggle 及其工作原理。
Kubeflow 基礎:使用 Kubernetes 構建、訓練與部署
14 小時Kubeflow 是一個開源平臺,旨在簡化在 Kubernetes 上構建、訓練和部署機器學習工作負載的過程。
本課程爲講師指導的培訓(線上或線下),面向希望使用 Kubeflow 構建可靠機器學習工作流的初級到中級專業人士。
完成本培訓後,學員將掌握以下技能:
- 熟悉 Kubeflow 生態系統及其核心組件。
- 使用 Kubeflow Pipelines 構建可重複的工作流。
- 在 Kubernetes 上運行可擴展的訓練任務。
- 使用 Kubeflow Serving 高效部署機器學習模型。
課程形式
- 引導式演示與協作討論。
- 使用真實 Kubeflow 組件的實踐操作。
- 構建端到端機器學習工作流的實際練習。
課程定製選項
- 可根據團隊的技術棧和項目需求定製本培訓內容。
Kubeflow 基礎
28 小時這種以講師為主導的香港現場培訓(現場或遠端)面向希望在Kubernetes上構建,部署和管理機器學習工作流的開發人員和數據科學家。
在培訓結束時,參與者將能夠:
- 在本地和雲端安裝和配置 Kubeflow。
- 基於 Docker 個容器和 Kubernetes 構建、部署和管理 ML 工作流。
- 在不同的架構和雲環境中運行整個機器學習管道。
- 使用 Kubeflow 生成和管理 Jupyter 筆記本。
- 跨多個平台構建 ML 訓練、超參數調優併為工作負載提供服務。
使用Google ML Kit進行移動apps的機器學習
14 小時本課程爲講師指導的(線上或線下)培訓,面向希望使用Google的ML Kit構建專爲移動設備優化的機器學習模型的開發者。
培訓結束後,學員將能夠:
- 設置必要的開發環境,開始爲移動apps開發機器學習功能。
- 使用ML Kit API將新的機器學習技術集成到Android和iOS apps中。
- 使用ML Kit SDK增強和優化現有apps,進行設備端處理和部署。
使用Modin加速Python Pandas工作流
14 小時這種由 講師指導的 香港 現場現場培訓(在線或現場)面向希望使用 Modin 構建和實施並行計算的數據科學家和開發人員 Pandas 以加快數據分析速度。
在本次培訓結束時,參與者將能夠:
- 設置必要的環境,開始使用 Modin 大規模開發 Pandas 工作流。
- 瞭解 Modin 的功能、架構和優勢。
- 瞭解 Modin、Dask 和 Ray 之間的區別。
- 使用 Modin 更快地執行 Pandas 操作。
- 實現整個 Pandas API 和函數。
使用隨機森林進行機器學習
14 小時本課程爲講師指導的培訓,在香港(線上或線下)進行,面向希望使用隨機森林爲大型數據集構建機器學習算法的數據科學家和軟件工程師。
在本培訓結束時,參與者將能夠:
- 設置必要的開發環境,開始使用隨機森林構建機器學習模型。
- 瞭解隨機森林的優勢,以及如何應用它來解決分類和迴歸問題。
- 學習如何處理大型數據集,並解釋隨機森林中的多個決策樹。
- 通過調整超參數來評估和優化機器學習模型的性能。
高級分析使用RapidMiner
14 小時此講師指導的 香港 現場培訓(在線或現場)面向 希望學習如何使用 RapidMiner 估計和預測值並利用分析工具進行時間序列預測的中級數據分析師。
在本次培訓結束時,參與者將能夠:
- 學習應用 CRISP-DM 方法,選擇合適的機器學習演算法,並增強模型構建和性能。
- 使用 RapidMiner 估計和預測值,並利用分析工具進行時間序列預測。
GPU數據科學之NVIDIA RAPIDS
14 小時本次由講師指導的線下或線上培訓,面向希望使用RAPIDS構建GPU加速的數據管道、工作流和可視化的數據科學家和開發者,應用如XGBoost、cuML等機器學習算法。
培訓結束後,參與者將能夠:
- 設置必要的開發環境,使用NVIDIA RAPIDS構建數據模型。
- 瞭解RAPIDS的特性、組件和優勢。
- 利用GPU加速端到端的數據和分析管道。
- 使用cuDF和Apache Arrow實現GPU加速的數據準備和ETL。
- 學習如何使用XGBoost和cuML算法執行機器學習任務。
- 使用cuXfilter和cuGraph構建數據可視化並執行圖分析。