Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
課程簡介
詳細的培訓大綱
-
NLP簡介
瞭解 NLP
NLP 框架
NLP的商業應用
從 Web 抓取數據
使用各種 API 檢索文本數據
處理和存儲文本語料庫,保存內容和相關元數據
使用 Python 和 NLTK 速成班的優勢
對語料庫和數據集的實際理解
為什麼我們需要語料庫?
語料庫分析
數據屬性的類型
語料庫的不同檔格式
為 NLP 應用程式準備數據集
理解句子的結構
NLP的組成部分
自然語言理解
形態學分析 - 詞幹、單詞、標記、語音標籤
句法分析
語義分析
處理歧義
文本數據預處理
語料庫 - 原始文本
句子標記化
原始文字的詞幹提取
原始文本的引述
停用詞刪除
語料庫原始句子
Word 代幣化
Word 詞形還原
使用 Term-Document/Document-Term 矩陣
將文本標記化為 n-gram 和句子
實用和定製的預處理
分析文字數據
NLP的基本特徵
解析器和解析器
POS 標記和標記器
名稱實體識別
N-gram
一袋字
NLP的統計特徵
NLP 線性代數的概念
NLP的概率理論
TF-IDF型
矢量化
編碼器和解碼器
正常化
概率模型
高級特徵工程和 NLP
word2vec 的基礎知識
word2vec 模型的元件
word2vec 模型的邏輯
word2vec 概念的擴展
word2vec模型的應用
案例研究:詞袋的應用:使用簡化和真實的 Luhn 演算法進行自動文本摘要
文檔聚類、分類和主題建模
文件聚類和模式挖掘(分層聚類、k-means、聚類等)
使用 TFIDF、Jaccard 和餘弦距離測量值對文檔進行比較和分類
使用樸素貝葉斯和最大熵進行文檔分類
識別重要的文本元素
降維:主成分分析、奇異值分解、非負矩陣分解
使用潛在語義分析進行主題建模和資訊檢索
實體提取、情感分析和高級主題建模
積極與消極:情緒程度
項目反應理論
詞性標註及其應用:查找文本中提到的人物、地點和組織
高級主題建模:潛在狄利克雷分配
案例研究
挖掘非結構化用戶評論
產品評論數據的情緒分類和可視化
挖掘使用模式的搜索日誌
文本分類
主題建模
最低要求
對NLP 原理的了解和認識,以及對人工智慧在商業中的應用的理解
21 時間:
客戶評論 (1)
I feel I get the core skills I need to understand how the ROS fits together, and how to structure projects in it.