首頁
機器學習培訓
Reinforcement Learning 培訓
大型語言模型（LLMs）與強化學習（RL）培訓

大型語言模型（LLMs）與強化學習（RL）培訓

Large Language Models (LLMs) 是高級類型的神經網路，旨在根據接收到的輸入來理解和生成類似人類的文本。Reinforcement Learning （RL）是一種機器學習，其中代理通過在環境中執行操作來學習做出決策，以最大化累積獎勵。

這種以講師為主導的現場培訓（在線或遠端）面向希望全面瞭解 Large Language Models (LLMs) 和 Reinforcement Learning （RL）的中級數據科學家。

在培訓結束時，參與者將能夠：

瞭解變壓器模型的元件和功能。
針對特定任務和應用程式優化和微調 LLM。
瞭解強化學習的核心原則和方法。
瞭解強化學習技術如何提高 LLM 的性能。

課程形式

互動講座和討論。
大量的練習和練習。
在現場實驗室環境中動手實施。

課程自定義選項

如需申請本課程的定製培訓，請聯繫我們進行安排。

感謝您提交詢問！我們的一位團隊成員將在短時間內與您聯繫。

感謝您提交預訂！我們的一位團隊成員將在短時間內與您聯繫。

課程簡介

Large Language Models (LLMs) 簡介

LLM概述
定義和意義
當今人工智慧中的應用

變壓器架構

什麼是變壓器，它是如何工作的？
主要元件和特點
嵌入和位置編碼
多頭注意力
前饋神經網路
歸一化和殘差連接

變壓器型號

自注意力機制
編碼器-解碼器架構
位置嵌入
BERT（來自 Transformer 的雙向編碼器表示）
GPT（產生式預訓練轉換器）

性能優化和陷阱

上下文長度
曼巴和狀態空間模型
閃光注意力
稀疏變壓器
視覺變壓器
量化的重要性

改進變壓器

檢索增強文本生成
模型混合
思想之樹

微調

低秩適應理論
使用 QLora 進行微調

LLM 中的縮放定律和優化

LLM擴展法的重要性
數據和模型大小縮放
計算擴展
參數效率縮放

優化

模型大小、數據大小、計算預算和推理需求之間的關係
優化 LLM 的性能和效率
用於訓練和微調 LLM 的最佳實踐和工具

訓練和微調 LLM

從頭開始培訓 LLM 的步驟和挑戰
數據採集與維護
大規模數據、CPU 和記憶體要求
優化挑戰
開源 LLM 的前景

Reinforcement Learning （RL）的基礎知識

Reinforcement Learning 簡介
通過積極強化學習
定義和核心概念
瑪律可夫決策過程（MDP）
動態規劃
蒙特卡羅方法
時差學習

深 Reinforcement Learning

深度 Q 網路（DQN）
近端策略優化（PPO）
Element秒，共 Reinforcement Learning

LLM 和 Reinforcement Learning 的集成

將 LLM 與 Reinforcement Learning 相結合
RL在LLM中的使用方式
Reinforcement Learning 人工反饋（RLHF）
RLHF的替代品

案例研究和應用

實際應用
成功案例和挑戰

高級主題

先進技術
高級優化方法
尖端研發

摘要和後續步驟

最低要求

基本瞭解 Machine Learning

觀眾

數據科學家
軟體工程師

21 時間：

人數

在線

課堂

選擇地點

請選擇一個場地

每位參與者的報價

公開培訓課程需要5名以上參與者。

大型語言模型（LLMs）與強化學習（RL）培訓 - 訂單

全名 *

郵件 *

電話 *

職務

公司名稱

地址1 *

市 *

州/省

國家 *

郵編 *

開始日期

稅號

日期視乎可用性而定，將在 09:30 和 16:30 之間舉行。

支付 *

銀行轉帳（發票，收據）

借記卡 / 信用卡

評論

條款與條件 *

我是上述客戶的授權代表，我希望根據 NobleProg 條款和條件以及隱私政策預訂上述課程或服務。

通知我有關折扣和促銷的信息

請閱讀我們的隱私政策以了解我們如何使用您的數據

大型語言模型（LLMs）與強化學習（RL）培訓 - 詢問

全名 *

郵件 *

電話 *

人數

公司名稱

公司地址

您想以何種方式參加課程？

客戶場地

线上

課堂

評論

通知我有關折扣和促銷的信息

請閱讀我們的隱私政策以了解我們如何使用您的數據

大型語言模型（LLMs）與強化學習（RL） - 咨詢詢問

咨詢詢問

全名 *

電話 *

郵件 *

公司名稱

諮詢主題 *

諮詢目標

諮詢師將會和什麼人合作

35 時間：

LangGraph 是一個用於構建具狀態、多參與者 LLM 應用程式的框架，其特點是可組合的圖結構、持久狀態以及對執行的控制。

這是一個由講師主導的培訓課程（線上或線下），旨在為高階 AI 平台工程師、AI DevOps 工程師以及處理生產級 LangGraph 系統的 ML 架構師提供優化、調試、監控和運營的相關技能。

在本課程結束時，參與者將能夠：

設計並優化複雜的 LangGraph 拓撲結構，以實現速度、成本和可擴展性的最佳化。
通過重試、超時、冪等性和基於檢查點的恢復來實現可靠性工程。
調試和追蹤圖執行過程，檢查狀態，並系統性地重現生產問題。
為圖添加日誌、指標和追蹤，部署到生產環境，並監控 SLA 和成本。

課程形式

互動式講座與討論。
大量練習與實踐。
在即時實驗環境中進行實作。

課程定制選項

如需定制本課程，請聯繫我們進行安排。

更多...

使用 Devstral 構建編碼代理：從代理設計到工具化

14 時間：

Devstral 是一個開源框架，旨在構建和運行編碼代理，這些代理可以與代碼庫、開發者工具和 API 交互，以提升工程效率。

本課程由講師指導，採用線上或線下培訓形式，面向中高級 ML 工程師、開發者工具團隊以及 SRE，幫助他們使用 Devstral 設計、實現和優化編碼代理。

通過本課程，學員將能夠：

設置和配置 Devstral 以進行編碼代理開發。
設計用於代碼庫探索和修改的代理工作流。
將編碼代理與開發者工具和 API 集成。
實施安全和高效代理部署的最佳實踐。

課程形式

互動式講座和討論。
大量練習和實踐。
在即時實驗室環境中進行動手操作。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

開源模型運維：使用Devstral和Mistral模型進行自託管、微調和治理

14 時間：

Devstral 和 Mistral 模型是開源 AI 技術，專爲靈活部署、微調和可擴展集成而設計。

本次由講師指導的培訓（線上或線下）面向中級到高級的機器學習工程師、平臺團隊和研究工程師，旨在幫助他們在生產環境中自託管、微調和管理 Mistral 和 Devstral 模型。

培訓結束後，參與者將能夠：

設置和配置 Mistral 和 Devstral 模型的自託管環境。
應用微調技術以提升特定領域的性能。
實現版本控制、監控和生命週期治理。
確保開源模型的安全性、合規性和負責任的使用。

課程形式

互動講座和討論。
自託管和微調的實踐練習。
治理和監控管道的即時實驗室實施。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

LangGraph在金融領域的應用

35 時間：

LangGraph 是一個用於構建有狀態、多參與者 LLM 應用的框架，通過可組合的圖結構實現持久狀態和執行控制。

本次由講師主導的培訓（線上或線下）面向中級到高級專業人士，旨在幫助他們設計、實施和運營基於 LangGraph 的金融解決方案，確保其具備適當的治理、可觀測性和合規性。

通過本次培訓，參與者將能夠：

設計與監管和審計要求一致的金融專用 LangGraph 工作流。
將金融數據標準和本體集成到圖狀態和工具中。
爲關鍵流程實施可靠性、安全性和人工介入控制。
部署、監控和優化 LangGraph 系統，以滿足性能、成本和 SLA 要求。

課程形式

互動式講座與討論。
大量練習與實踐。
在即時實驗室環境中進行實際操作。

課程定製選項

如需定製本課程，請聯繫我們安排。

更多...

LangGraph基礎：基於圖的LLM提示與鏈式編程

14 時間：

LangGraph 是一個用於構建圖結構 LLM 應用的框架，支持規劃、分支、工具使用、內存和可控執行。

本次由講師指導的培訓（線上或線下）面向初級開發者、提示工程師和數據從業者，旨在幫助他們使用 LangGraph 設計和構建可靠的多步驟 LLM 工作流。

培訓結束後，參與者將能夠：

解釋 LangGraph 的核心概念（節點、邊、狀態）及其使用場景。
構建支持分支、調用工具和保持內存的提示鏈。
將檢索和外部 API 集成到圖工作流中。
測試、調試和評估 LangGraph 應用的可靠性和安全性。

課程形式

互動講座和引導討論。
在沙盒環境中進行指導實驗和代碼演練。
基於場景的設計、測試和評估練習。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

LangGraph在醫療保健中的應用：受監管環境中的工作流編排

35 時間：

LangGraph 支持由 LLM 驅動的有狀態、多參與者工作流，並能精確控制執行路徑和狀態持久化。在醫療領域，這些功能對於合規性、互操作性以及構建符合醫療工作流的決策支持系統至關重要。

本次講師主導的培訓（線上或線下）面向中高級專業人員，旨在幫助他們設計、實施和管理基於 LangGraph 的醫療解決方案，同時應對監管、道德和操作挑戰。

培訓結束後，參與者將能夠：

設計符合合規性和可審計性的醫療專用 LangGraph 工作流。
將 LangGraph 應用與醫療本體和標準（FHIR、SNOMED CT、ICD）集成。
在敏感環境中應用可靠性、可追溯性和可解釋性的最佳實踐。
在醫療生產環境中部署、監控和驗證 LangGraph 應用。

課程形式

互動式講座與討論。
基於真實案例的實踐練習。
在即時實驗環境中進行實施實踐。

課程定製選項

如需定製本課程，請聯繫我們安排。

更多...

LangGraph法律應用

35 時間：

LangGraph是一個用於構建有狀態、多參與者LLM應用的框架，它通過可組合的圖結構實現持久狀態，並對執行過程進行精確控制。

本課程爲講師指導的培訓（線上或線下），面向中高級專業人員，旨在幫助他們設計、實施和操作基於LangGraph的法律解決方案，並確保必要的合規性、可追溯性和治理控制。

培訓結束後，學員將能夠：

設計特定於法律的LangGraph工作流程，確保可審計性和合規性。
將法律本體和文檔標準集成到圖狀態和處理中。
實施護欄、人工審批和可追溯的決策路徑。
在生產環境中部署、監控和維護LangGraph服務，並確保可觀測性和成本控制。

課程形式

互動式講座與討論。
大量練習與實踐。
在即時實驗室環境中進行動手操作。

課程定製選項

如需定製本課程，請聯繫我們進行安排。

更多...

使用LangGraph和LLM代理構建動態工作流

14 時間：

LangGraph 是一個用於構建圖結構 LLM 工作流的框架，支持分支、工具使用、內存和可控執行。

本次由講師指導的培訓（線上或線下）面向中級工程師和產品團隊，他們希望將 LangGraph 的圖邏輯與 LLM 代理循環相結合，以構建動態、上下文感知的應用程序，如客戶支持代理、決策樹和信息檢索系統。

在培訓結束時，參與者將能夠：

設計基於圖的工作流，協調 LLM 代理、工具和內存。
實現條件路由、重試和回退，以確保穩健執行。
將檢索、API 和結構化輸出集成到代理循環中。
評估、監控並強化代理行爲，以確保可靠性和安全性。

課程形式

互動講座和引導討論。
在沙盒環境中進行引導實驗和代碼演練。
基於場景的設計練習和同行評審。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

LangGraph用於營銷自動化

14 時間：

LangGraph是一個基於圖的編排框架，支持條件化、多步驟的LLM和工具工作流，非常適合自動化和個性化內容管道。

本次由講師指導的培訓（線上或線下）面向中級營銷人員、內容策略師和自動化開發人員，旨在幫助他們使用LangGraph實現動態、分支的電子郵件營銷活動和內容生成管道。

培訓結束後，學員將能夠：

使用條件邏輯設計圖結構的內容和電子郵件工作流。
集成LLM、API和數據源以實現自動化個性化。
在多步驟活動中管理狀態、內存和上下文。
評估、監控和優化工作流性能和交付結果。

課程形式

互動講座和小組討論。
動手實驗，實現電子郵件工作流和內容管道。
基於場景的練習，涵蓋個性化、分段和分支邏輯。

課程定製選項

如需定製本課程，請聯繫我們進行安排。

更多...

Le Chat Enterprise：私有ChatOps、集成與管理控制

14 時間：

Le Chat Enterprise 是一款私有的 ChatOps 解決方案，爲組織提供安全、可定製且受管控的對話式 AI 功能，支持 RBAC、SSO、連接器以及企業應用集成。

本次由講師主導的培訓（線上或線下）面向中級產品經理、IT 負責人、解決方案工程師以及安全/合規團隊，旨在幫助他們部署、配置和管理企業環境中的 Le Chat Enterprise。

培訓結束後，參與者將能夠：

爲安全部署設置和配置 Le Chat Enterprise。
啓用 RBAC、SSO 和合規驅動的控制。
將 Le Chat 與企業應用程序和數據存儲集成。
爲 ChatOps 設計和實施治理和管理手冊。

課程形式

互動式講座和討論。
大量練習和實踐。
在即時實驗環境中進行實際操作。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

高性價比LLM架構：大規模Mistral（性能/成本工程）

14 時間：

Mistral 是一個高性能的大型語言模型系列，專爲經濟高效的大規模生產部署而優化。

本課程爲講師指導的培訓（線上或線下），面向高級基礎設施工程師、雲架構師和 MLOps 負責人，旨在幫助他們設計、部署和優化基於 Mistral 的架構，以實現最大吞吐量和最低成本。

通過本培訓，參與者將能夠：

爲 Mistral Medium 3 實施可擴展的部署模式。
應用批處理、量化和高效服務策略。
在保持性能的同時優化推理成本。
爲企業工作負載設計生產就緒的服務拓撲。

課程形式

互動式講座和討論。
大量練習和實踐。
在即時實驗室環境中進行實際操作。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

使用Mistral連接器和集成實現對話助手產品化

14 時間：

Mistral AI 是一個開放的人工智能平臺，使團隊能夠構建對話助手，並將其集成到企業和麪向客戶的工作流程中。

本次講師指導的培訓（線上或線下）面向初級到中級的產品經理、全棧開發人員和集成工程師，旨在幫助他們使用 Mistral 連接器和集成設計、集成併產品化對話助手。

培訓結束後，參與者將能夠：

將 Mistral 對話模型與企業及 SaaS 連接器集成。
實現檢索增強生成（RAG）以提供基於上下文的響應。
爲內部和外部聊天助手設計用戶體驗模式。
將助手部署到產品工作流程中，用於實際應用場景。

課程形式

互動式講座與討論。
動手集成練習。
即時實驗室開發對話助手。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

企業級部署與Mistral Medium 3

14 時間：

Mistral Medium 3 是一款高性能、多模態的大型語言模型，專爲在企業環境中進行生產級部署而設計。

本課程爲講師指導的線下或線上培訓，面向希望在企業用例中部署、優化和保護 Mistral Medium 3 的中級到高級 AI/ML 工程師、平臺架構師和 MLOps 團隊。

培訓結束後，參與者將能夠：

使用 API 和自託管選項部署 Mistral Medium 3。
優化推理性能和成本。
使用 Mistral Medium 3 實現多模態用例。
在企業環境中應用安全和合規最佳實踐。

課程形式

互動講座和討論。
大量練習和實踐。
在即時實驗室環境中進行動手實踐。

課程定製選項

如需爲此課程定製培訓，請聯繫我們安排。

更多...

Mistral for Responsible AI: Privacy, Data Residency & Enterprise Controls

14 時間：

Mistral AI 是一個開放且企業就緒的 AI 平臺，提供安全、合規且負責任的 AI 部署功能。

本次由講師主導的培訓（線上或線下）面向中級合規負責人、安全架構師以及法律/運營相關方，旨在通過利用隱私、數據駐留和企業控制機制，在 Mistral 中實施負責任的 AI 實踐。

培訓結束後，參與者將能夠：

在 Mistral 部署中實施隱私保護技術。
應用數據駐留策略以滿足法規要求。
設置企業級控制，如 RBAC、SSO 和審計日誌。
評估供應商和部署選項以實現合規性。

課程形式

互動講座和討論。
以合規爲重點的案例研究和練習。
企業 AI 控制的實際操作實施。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

多模態應用與Mistral模型（視覺、OCR與文檔理解）

14 時間：

Mistral模型是開源的人工智能技術，現已擴展到多模態工作流程，支持企業和研究應用中的語言和視覺任務。

本次由講師主導的培訓（線上或線下）面向中級ML研究人員、應用工程師和產品團隊，旨在幫助他們使用Mistral模型構建多模態應用，包括OCR和文檔理解流程。

培訓結束後，參與者將能夠：

爲多模態任務設置和配置Mistral模型。
實施OCR工作流程，並將其與NLP管道集成。
爲企業用例設計文檔理解應用。
開發視覺文本搜索和輔助UI功能。

課程形式

互動講座和討論。
動手編碼練習。
多模態管道的即時實驗室實施。

課程定製選項

如需爲本課程定製培訓，請聯繫我們安排。

更多...

大型語言模型（LLMs）與強化學習（RL）培訓

課程簡介

最低要求

即將到來的課程

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

課程分類

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

大型語言模型（LLMs）與強化學習（RL）培訓

課程簡介

最低要求

即將到來的課程

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

大型語言模型（LLMs）與強化學習（RL）

相關課程

高級LangGraph：複雜圖的優化、調試與監控

使用 Devstral 構建編碼代理：從代理設計到工具化

開源模型運維：使用Devstral和Mistral模型進行自託管、微調和治理

LangGraph在金融領域的應用

LangGraph基礎：基於圖的LLM提示與鏈式編程

LangGraph在醫療保健中的應用：受監管環境中的工作流編排

LangGraph法律應用

使用LangGraph和LLM代理構建動態工作流

LangGraph用於營銷自動化

Le Chat Enterprise：私有ChatOps、集成與管理控制

高性價比LLM架構：大規模Mistral（性能/成本工程）

使用Mistral連接器和集成實現對話助手產品化

企業級部署與Mistral Medium 3

Mistral for Responsible AI: Privacy, Data Residency & Enterprise Controls

多模態應用與Mistral模型（視覺、OCR與文檔理解）

課程分類

Reinforcement Learning

Large Language Models (LLMs)

其他國家的本網站

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites