課程簡介
介紹
本節概述了何時使用“機器學習”,應考慮什麼以及它意味著什麼,包括優缺點。數據類型(結構化/非結構化/靜態/流),數據有效性/數量,數據驅動與用戶驅動分析,統計模型與機器學習模型/無監督學習的挑戰,偏差-方差權衡,反覆運算/評估,交叉驗證方法,監督/無監督/強化。
主要議題
1. 理解樸素貝葉斯
- 貝葉斯方法的基本概念
- 概率
- 聯合概率
- 使用貝葉斯定理的條件概率
- 樸素貝葉斯算法
- 樸素貝葉斯分類
- 拉普拉斯估計器
- 在樸素貝葉斯中使用數值特徵
2. 了解決策樹
- 分而治之
- C5.0決策樹算法
- 選擇最佳分割點
- 決策樹剪枝
3. 了解神經網路
- 從生物神經元到人工神經元
- 激活函數
- 網絡拓撲結構
- 層數
- 信息傳遞方向
- 每層節點數
- 使用反向傳播訓練神經網絡
- Deep Learning
4. 了解支援向量機
- 使用超平面進行分類
- 尋找最大邊界
- 線性可分數據的情況
- 非線性可分數據的情況
- 在非線性空間中使用核函數
5. 瞭解聚類
- 聚類作為機器學習任務
- k-means聚類算法
- 使用距離分配和更新聚類
- 選擇適當的聚類數目
6. 分類性能的衡量
- 處理分類預測數據
- 深入瞭解混淆矩陣
- 使用混淆矩陣衡量性能
- 超越準確性——其他性能指標
- kappa統計量
- 靈敏度和特異性
- 精確率和召回率
- F-measure
- 可視化性能權衡
- ROC曲線
- 估計未來性能
- 保留方法
- 交叉驗證
- Bootstrap 採樣
7. 調整庫存模型以獲得更好的性能
- 使用caret進行自動參數調優
- 創建簡單的調優模型
- 自定義調優過程
- 使用元學習提升模型性能
- 理解集成方法
- Bagging
- Boosting
- 隨機森林
- 訓練隨機森林
- 評估隨機森林性能
次要主題
8. 瞭解使用最近鄰的分類
- kNN算法
- 計算距離
- 選擇適當的k值
- 為kNN準備數據
- 為什麼kNN算法是懶惰的?
9. 了解分類規則
- 分而治之
- One Rule算法
- RIPPER算法
- 從決策樹中提取規則
10. 了解回歸
- 簡單線性回歸
- 普通最小二乘估計
- 相關性
- 多元線性回歸
11. 了解回歸樹和模型樹
- 在樹中添加回歸
12. 了解關聯規則
- 用於關聯規則學習的Apriori算法
- 衡量規則的興趣度——支持度和置信度
- 使用Apriori原則構建規則集
額外
- Spark/PySpark/MLlib 與多臂老虎機
最低要求
Python 知識
客戶評論 (7)
我非常喜歡這次培訓,並且對Machine Learning主題的深入探討感到非常滿意。我特別欣賞理論與實際應用之間的平衡,尤其是實際操作的編碼環節。培訓師提供了引人入勝的範例和精心設計的練習,這大大提升了學習體驗。課程涵蓋了廣泛的主題,Abhi展現了出色的專業知識,清晰且輕鬆地回答了所有問題。
Valentina
Course - Machine Learning
機器翻譯
我很欣賞這些練習,它們幫助我理解理論並逐步應用。同時,培訓師以簡單清晰的方式解釋一切,即使我對Python不太熟悉,也能輕鬆跟上。我不想錯過學習我真正感興趣的東西的機會。 我也很感激提供的多樣化資訊,以及培訓師在解釋和支持我們理解概念時的耐心。經過這門課程,機器學習的概念對我來說更加清晰了,現在我感到有了方向,對這個主題有了更好的理解。
Cristina
Course - Machine Learning
機器翻譯
在培训结束时,我能够看到所讲授主题的实际应用案例。
Daniel
Course - Machine Learning
機器翻譯
I liked the pace, I liked the balance between theory and practice, the main topics covered and the way the trainer was able to put everything into balance. I also really like your training infrastructure, very practical to work with VMs
Andrei
Course - Machine Learning
保持簡短和簡單。 圍繞概念創建直覺和視覺模型(決策樹圖、線性方程、手動計算y_pred以證明模型的工作原理)。
Nicolae - DB Global Technology
Course - Machine Learning
機器翻譯
它説明我實現了理解ML的目標。非常尊重 Pablo 在這個主題上給出適當的介紹,因為經過 3 天的培訓后,這個主題變得非常廣泛。我也很喜歡你提供的虛擬機的想法,它的延遲非常好!它允許每個專家按照自己的節奏進行實驗。
Silviu - DB Global Technology
Course - Machine Learning
機器翻譯
The way practical part, seeing the theory materializing into something practical is great.