課程簡介
介紹
本節概述了何時使用“機器學習”,應考慮什麼以及它意味著什麼,包括優缺點。數據類型(結構化/非結構化/靜態/流),數據有效性/數量,數據驅動與用戶驅動分析,統計模型與機器學習模型/無監督學習的挑戰,偏差-方差權衡,反覆運算/評估,交叉驗證方法,監督/無監督/強化。
主要議題
1. 理解樸素貝葉斯
- 貝葉斯方法的基本概念
- 概率
- 聯合概率
- 使用貝葉斯定理的條件概率
- 樸素貝葉斯算法
- 樸素貝葉斯分類
- 拉普拉斯估計器
- 在樸素貝葉斯中使用數值特徵
2. 了解決策樹
- 分而治之
- C5.0決策樹算法
- 選擇最佳分割點
- 決策樹剪枝
3. 了解神經網路
- 從生物神經元到人工神經元
- 激活函數
- 網絡拓撲結構
- 層數
- 信息傳遞方向
- 每層節點數
- 使用反向傳播訓練神經網絡
- Deep Learning
4. 了解支援向量機
- 使用超平面進行分類
- 尋找最大邊界
- 線性可分數據的情況
- 非線性可分數據的情況
- 在非線性空間中使用核函數
5. 瞭解聚類
- 聚類作為機器學習任務
- k-means聚類算法
- 使用距離分配和更新聚類
- 選擇適當的聚類數目
6. 分類性能的衡量
- 處理分類預測數據
- 深入瞭解混淆矩陣
- 使用混淆矩陣衡量性能
- 超越準確性——其他性能指標
- kappa統計量
- 靈敏度和特異性
- 精確率和召回率
- F-measure
- 可視化性能權衡
- ROC曲線
- 估計未來性能
- 保留方法
- 交叉驗證
- Bootstrap 採樣
7. 調整庫存模型以獲得更好的性能
- 使用caret進行自動參數調優
- 創建簡單的調優模型
- 自定義調優過程
- 使用元學習提升模型性能
- 理解集成方法
- Bagging
- Boosting
- 隨機森林
- 訓練隨機森林
- 評估隨機森林性能
次要主題
8. 瞭解使用最近鄰的分類
- kNN算法
- 計算距離
- 選擇適當的k值
- 為kNN準備數據
- 為什麼kNN算法是懶惰的?
9. 了解分類規則
- 分而治之
- One Rule算法
- RIPPER算法
- 從決策樹中提取規則
10. 了解回歸
- 簡單線性回歸
- 普通最小二乘估計
- 相關性
- 多元線性回歸
11. 了解回歸樹和模型樹
- 在樹中添加回歸
12. 了解關聯規則
- 用於關聯規則學習的Apriori算法
- 衡量規則的興趣度——支持度和置信度
- 使用Apriori原則構建規則集
額外
- Spark/PySpark/MLlib 與多臂老虎機
最低要求
Python 知識
客戶評論 (7)
我非常喜歡這次培訓,並且對機器學習的深入探討感到非常滿意。我特別欣賞理論與實踐應用之間的平衡,尤其是動手編碼環節。培訓師提供了引人入勝的示例和精心設計的練習,提升了學習體驗。課程涵蓋了廣泛的主題,Abhi展示了出色的專業知識,能夠清晰且輕鬆地回答所有問題。
Valentina
課程 - Machine Learning
機器翻譯
我非常喜歡那些幫助我理解理論並逐步應用的練習。同時,我也很欣賞培訓師以簡單明瞭的方式解釋一切。儘管我對Python不太熟悉,但課程內容很容易跟上。我仍然不想錯過學習我真正感興趣的內容的機會。 我也很感激提供的多樣化信息,以及培訓師在解釋和支持我們理解概念時的耐心。通過這門課程,我對機器學習的理解更加清晰,現在我感到有了方向,對這個主題也有了更好的理解。
Cristina
課程 - Machine Learning
機器翻譯
培訓結束時,我能夠看到所講授主題的實際應用案例。
Daniel
課程 - Machine Learning
機器翻譯
我喜歡課程的節奏,理論與實踐之間的平衡,涵蓋的主要主題,以及培訓師能夠將一切平衡得很好的方式。我也非常喜歡你們的培訓基礎設施,使用虛擬機非常實用。
Andrei
課程 - Machine Learning
機器翻譯
保持簡潔明瞭。圍繞概念創建直觀的視覺模型(如決策樹圖、線性方程,手動計算y_pred以證明模型的工作原理)。
Nicolae - DB Global Technology
課程 - Machine Learning
機器翻譯
這幫助我實現了理解機器學習的目標。非常感謝Pablo在這個主題上提供了恰當的介紹,經過三天的培訓後,很明顯這個主題是多麼廣泛。我也非常喜歡你們提供的虛擬機,它們的延遲非常低!這使得每個學員都能按照自己的節奏進行實驗。
Silviu - DB Global Technology
課程 - Machine Learning
機器翻譯
實踐部分的方式很棒,看到理論轉化爲實際應用令人印象深刻。
Lisa Fekade - Vodacom
課程 - Machine Learning
機器翻譯