課程介紹
本課程從實(shí)戰(zhàn)的角度對(duì)自然語言處理(NLP)進(jìn)行了全面的剖析,并結(jié)合實(shí)際案例分析和探討NLP的應(yīng)用場景,給NLP相關(guān)從業(yè)人員以指導(dǎo)和啟迪。
培訓(xùn)對(duì)象
對(duì)此課程感興趣的人員;
從事計(jì)算機(jī)語言工作的IT人員;
從事數(shù)據(jù)分析數(shù)據(jù)管理的IT人員。
課程收益
掌握NLP基礎(chǔ);
關(guān)鍵詞提取與文本分類方法;
文本向量化與句法分析方法;
NLP與深度學(xué)習(xí)技術(shù)的相應(yīng)算法;
理解并掌握Tensorflow框架。
知識(shí)概要
-- NLP入門與基礎(chǔ)介紹;
-- 關(guān)鍵詞提取與文本分類;
-- 文本向量化與句法分析;
-- NLP與深度學(xué)習(xí)。
課程大綱
NLP入門與基礎(chǔ)介紹(一)
1.NLP的基本概念
2.NLP的發(fā)展歷程
3.NLP主要研究方向
1)句法語義分析
2)信息抽取
3)文本挖掘
4)機(jī)器翻譯
5)信息檢索
6)問答系統(tǒng)
7)對(duì)話系統(tǒng)
NLP入門與基礎(chǔ)介紹(二)
4.NLP的基礎(chǔ)
1)分詞
正向最大匹配算法
逆向最大匹配算法
雙向最大匹配算法
基于N-gram語言模型的分詞
基于HMM的分詞方法
基于CRF的分詞法法
2)文本基本處理
文本提取
正在表達(dá)式
本文統(tǒng)計(jì)
3)詞性標(biāo)注
基于最大熵的詞性標(biāo)注
基于統(tǒng)計(jì)最大概率輸出詞性
基于HMM詞性標(biāo)注
基于CRF的詞性標(biāo)注
4)命名實(shí)體識(shí)別
基于CRF的命名實(shí)體識(shí)別
5.案例
1)在線中文分詞系統(tǒng)實(shí)戰(zhàn)
2)命名實(shí)體識(shí)別接口開發(fā)
3)基于詞性標(biāo)注的關(guān)鍵詞提取
關(guān)鍵詞提取與文本分類
1.關(guān)鍵詞提取概述
2.關(guān)鍵詞提取算法
1)TF-IDF
2)LSA/LSI算法
3)PLSA算法
4)LDA算法
3.文本分類算法
1)樸素貝葉斯
2)線性分類器
3)支持向量機(jī)
4)Bagging模型
5)Boosting模型
6)淺層神經(jīng)網(wǎng)絡(luò)
4.案例
1)新聞主題提取
2)新聞分類實(shí)戰(zhàn)
文本向量化與句法分析
1.文本向量化概述
2.文本向量化常用算法
1)詞袋算法
2)HashTF算法
3)Word2Vec算法
4)Glove算法
3.句法分析概述
4.句法分析常用算法
1)PCFG算法
2)條件隨機(jī)場算法
5.案例
1)文本情感分析的開發(fā)示例
2)基于依存句法分詞的問句相似度計(jì)算
NLP與深度學(xué)習(xí)(一)
1.深度學(xué)習(xí)概述
1)神經(jīng)網(wǎng)絡(luò)
2)損失函數(shù)
3)梯度下降
2.深度學(xué)習(xí)常用算法
1)CNN
2)RNN
3)GRU
4)LSTM
NLP與深度學(xué)習(xí)(二)
3.Tensorflow框架學(xué)習(xí)
1)Tensorflow簡介
2)Tensorflow安裝
3)Tensorflow基礎(chǔ)使用
圖(graphs)
會(huì)話(session)
張量(tensor)
變量(Variable)
4)Tensorflow線性回歸以及分類的簡單使用
5)Tensorflow中各種優(yōu)化器的介紹
4.案例
1)基于CNN的文本分類
2)基于RNN的歌詞生成
3)基于LSTM的機(jī)器翻譯
4)基于Seq2Seq的問答系統(tǒng)
認(rèn)證過程
無認(rèn)證考試
開班信息
暫無開班信息