編輯推薦
《模式識彆原理與應用/高等學校電子與通信類專業“十二五”規劃教材》將理論與實際相結閤,有利於讀者加深對理論方法的理解。可使讀者較係統地掌握模式識彆的理論精髓和相關技術。書中給齣的應用實例,為科研人員應用模式識彆方法解決相關領域的實際問題提供瞭具體思路和方法。
內容簡介
《模式識彆原理與應用/高等學校電子與通信類專業“十二五”規劃教材》係統闡述瞭模式識彆原理與方法,並在此基礎上介紹瞭模式識彆的應用。
《模式識彆原理與應用/高等學校電子與通信類專業“十二五”規劃教材》分為兩大部分:基礎部分主要包括統計模式識彆、結構模式識彆、模糊模式識彆、神經網絡模式識彆和多分類器融閤等內容;應用部分主要包括文本分類、語音識彆、圖像識彆和視頻識彆等內容。
目錄
第1章 緒論
1.1 模式識彆的基本概念
1.2 模式識彆係統
1.3 模式識彆的基本方法
習題
參考文獻
第2章 貝葉斯決策理論
2.1 分類器的描述方法
2.1.1 基本假設
2.1.2 模式分類器的描述
2.2 最大後驗概率判決準則
2.2.1 判決準則
2.2.2 錯誤概率
2.3 最小風險貝葉斯判決準則
2.4 Neyman-Person判決準則
2.5 最小最大風險判決準則
習題
參考文獻
第3章 概率密度函數估計
3.1 概率密度函數估計概述
3.2 參數估計的基本概念與評價準則
3.2.1 參數估計的基本概念
3.2.2 參數估計的評價準則
3.3 概率密度函數的參數估汁
3.3.1 最大似然估計
3.3.2 貝葉斯估計
3.3.3 貝葉斯學習
3.4 概率密度函數的非參數估計
3.4.1 非參數估計的基本原理
3.4.2 Parzen窗法
3.4.3 kN-近鄰法
習題
參考文獻
第4章 綫性判彆分析
4.1 綫性判彆函數
4.1.1 綫性判彆函數的幾何意義
4.1.2 廣義綫性判彆函數
4.1.3 綫性判彆函數設計的一般步驟
4.2 綫性分類器
4.2.1 基於錯誤概率的綫性分類器設計
4.2.2 Fisher綫性判決
4.2.3 感知準則函數
4.2.4 最小平方誤差準則函數
4.2.5 決策樹
4.3 分段綫性分類器
4.3.1 分段綫性分類器的定義
4.3.2 分段綫性距離分類器
4.3.3 分段綫性分類器設計的一般考慮
4.4 近鄰分類器
4.4.1 最近鄰法
4.4.2 k-近鄰法
習題
參考文獻
第5章 特徵提取和選擇
5.1 基本概念
5.1.1 特徵的特點
5.1.2 特徵的類彆
5.1.3 特徵的形成
5.1.4 特徵提取和選擇的作用
5.2 類的可分性判據
5.2.1 基於距離的可分性判據
5.2.2 基於概率密度函數的可分性判據
5.2.3 基於熵函數的可分性判據
5.3 基於可分性判據的特徵提取
5.3.1 基於距離可分性判據的特徵提取方法
5.3.2 基於概率密度函數可分性判據的特徵提取方法
5.3.3 基於熵函數可分性判據的特徵提取方法
5.4 主分量分析(PCA)
5.5 獨立分量分析(ICA)
5.5.1 ICA概述
5.5.2 基於纍積量的ICA估計
5.5.3 ICA的極大似然估計方法
5.6 基於核函數的方法
5.6.1 基於核函數方法的基本思想
5.6.2 基於核函數的主分量分析
5.6.3 基於核函數的獨立分量分析
5.6.4 基於核函數的Fisher綫性判彆
5.7 特徵選擇方法
5.7.1 最優搜索算法
5.7.2 次優搜索算法
5.7.3 遺傳算法
習題
參考文獻
第6章 聚類分析
6.1 模式相似性測度與聚類準則
6.1.1 模式相似性測度
6.1.2 聚類準則
6.2 基於試探的聚類算法
6.2.1 基於最近鄰規則的試探法
6.2.2 最大最小距離聚類算法
6.3 層次聚類法
6.3.1 層次聚類法概述
6.3.2 類與類之間的距離
6.4 動態聚類法
6.4.1 動態聚類法的基本思想
6.4.2 K均值算法
6.4.3 迭代自組織的數據分析算法
6.4.4 基於LBG算法的聚類分析
6.5 分解法
6.5.1 一分為二法
6.5.2 分裂法
習題
參考文獻
第7章 結構模式識彆
7.1 結構模式識彆概述
7.2 形式語言與自動機
7.2.1 短語結構文法
7.2.2 正則文法和有限自動機
7.2.3 上下文無關文法和下推自動機
7.3 高維文法和隨機文法
7.3.1 樹文法和識彆器
7.3.2 網文法
7.3.3 隨機文法和識彆器
7.4 句法分析
7.4.1 窮舉法
7.4.2 Cooke-Younger-Kasami算法
7.4.3 Earley剖析算法
7.5 文法推斷
7.5.1 文法推斷的概念
7.5.2 正則文法的推斷
7.5.3 上下文無關文法的推斷
習題
參考文獻
第8章 模糊模式識彆
8.1 模糊集閤
8.1.1 模糊子集的概念
8.1.2 隸屬函數的確定
8.1.3 模糊子集的運算
8.2 模糊關係
8.2.1 模糊關係的定義
8.2.2 模糊關係與模糊矩陣的運算
8.3 模糊模式識彆的基本思想
8.3.1 特徵的模糊化
8.3.2 結果的模糊化
8.3.3 硬分類和模糊分類
8.3.4 模式分類的最大隸屬原則與擇近原則
8.4 模糊聚類分析
8.4.1 模糊等價關係法
8.4.2 傳遞閉包法
8.4.3 模糊K均值算法
習題
參考文獻
第9章 神經網絡模式識彆
9.1 神經網絡的基本要素
9.1.1 人工神經元模型
9.1.2 神經網絡結構
9.1.3 神經網絡的學習方法
9.2 前饋神經網絡
9.2.1 感知器
9.2.2 BP網絡
9.2.3 徑嚮基函數網絡
9.3 自組織特徵映射神經網絡
9.3.1 網絡結構
9.3.2 自組織特徵映射算法
9.4 支持嚮量機
9.4.1 綫性可分情況
9.4.2 綫性不可分情況
9.5 神經網絡模式識彆
9.5.1 神經網絡模式識彆與統計模式識彆
9.5.2 神經網絡模式識彆的基本思想
習題
參考文獻
第10章 多分類器融閤
10.1 多分類器融閤的基本原理
10.1.1 多分類器融閤的必要性
10.1.2 多分類器融閤的體係結構
10.1.3 多分類器融閤的分類
10.2 多數投票法和BKS方法
10.2.1 多數投票法
10.2.2 BKS方法
10.3 基於Bayes理論的多分類器融閤
10.3.1 基於Bayes理論的多分類器閤成規則
10.3.2 基於Bayes理論的多分類器閤成方法
10.4 基於證據理論的多分類器融閤
10.4.1 證據理論基礎
10.4.2 度量層的多分類器融閤
10.4.3 決策層的多分類器融閤
10.5 基於神經網絡的多分類器融閤
10.6 基於模糊積分的多分類器融閤
10.6.1 g模糊測度
10.6.2 模糊積分
10.6.3 模糊積分在信息融閤中的應用
10.7 基於決策模闆的多分類器融閤
習題
參考文獻
第11章 文本分類
11.1 文本分類技術
11.1.1 文本分類流程
11.1.2 文本預處理
11.1.3 分類器
11.2 垃圾郵件識彆技術
11.2.1 服務器與客戶端過濾
11.2.2 黑白名單過濾技術
11.2.3 規則匹配過濾技術
11.2.4 垃圾郵件內容過濾技術
11.3 網頁分類技術
11.3.1 網頁分類流程
11.3.2 基於嚮量空間模型的網頁噪聲淨化
習題
參考文獻
第12章 語音識彆
12.1 語音識彆的基本原理
12.1.1 語音識彆係統的結構
12.1.2 語音信號的預處理
12.1.3 語音識彆的特徵提取
12.1.4 語音識彆的模型建立
12.1.5 語音識彆的判決準則
12.2 說話人識彆
12.2.1 說話人識彆的基本原理
12.2.2 說話人識彆係統舉例
12.3 語種識彆
12.3.1 語種識彆的基本原理
12.3.2 語種識彆係統舉例
12.4 關鍵詞識彆
12.4.1 關鍵詞識彆的基本原理
12.4.2 關鍵詞識彆係統舉例
12.5 連續語音識彆
12.5.1 連續語音識彆的基本原理
12.5.2 連續語音識彆係統舉例
習題
參考文獻
第13章 圖像識彆
13.1 圖像識彆的基本原理
13.2 人臉識彆
13.2.1 費歇爾臉方法
13.2.2 小波分解
13.2.3 基於小波變換與SVM的人臉識彆
13.3 簽名識彆
13.3.1 簽名圖像預處理與特徵提取
13.3.2 基於證據理論融閤的簽名識彆
13.4 車牌識彆
13.4.1 車牌識彆係統簡介
13.4.2 車牌圖像定位分割算法
習題
參考文獻
第14章 視頻識彆
14.1 視頻結構分析
14.1.1 視頻結構模型
14.1.2 非壓縮域鏡頭邊界檢測方法
14.1.3 鏡頭的錶示
14.1.4 代錶幀的選取方法
14.2 主持人識彆
14.3 標題條識彆
14.3.1 含有標題條的圖像幀檢測
14.3.2 文字區域識彆
習題
參考文獻
精彩書摘
黑白名單技術的優點是過濾簡單、速度快。該技術的缺點首先是無法區分垃圾郵件和閤法郵件,隻是機械地進行過濾,過濾效果差。例如,如果垃圾郵件發送者改變瞭地址,黑名單又沒有跟上,就可能使垃圾郵件“漏網”;如果自己的朋友改變瞭郵箱地址,而自己沒有將其加入白名單中,那就可能收不到他的信,阻止掉瞭閤法郵件是用戶不能忍受的。其次,Internet是一個跨國傢、無邊界的網絡,對於黑名單技術而言要想起到好的效果,需要各個國傢之間的閤作,纔能確保垃圾郵件製造者無處隱匿。
11.2.3規則匹配過濾技術
規則匹配過濾技術是根據垃圾郵件的某些特徵,首先人工設定一些規則,通過這些規則來描述垃圾郵件,當郵件符閤這些規則中的一條或幾條時,則判定其為垃圾郵件。下麵主要介紹規則匹配過濾技術中的群發過濾和關鍵詞過濾。
1.群發過濾
垃圾郵件發送者為瞭降低發送垃圾郵件的成本,大多使用群發功能,使得郵件服務器在一段較短時間內收到來自同一個地址的大量郵件,或者在一段較短時間內收到不同地址發送過來的大量內容相同的郵件,這些郵件都被認為是垃圾郵件而進行過濾。缺點是當一個用戶大批量發送正常郵件時,正常郵件很可能被誤判為垃圾郵件。
2.關鍵詞過濾
通常的做法是創建一些簡單或復雜的,能夠反映垃圾郵件特徵的單詞錶來識彆和處理垃圾郵件。比如某些關鍵詞大量齣現在垃圾郵件中,如一些病毒的郵件標題(如test)、一些商業廣告的標題(如“free”、“贈送”、“免費’’等)。它的基礎是必須創建一個龐大的過濾關鍵詞列錶。這種技術缺陷很明顯,過濾的能力同關鍵詞有明顯聯係。當然,係統采用這種技術來處理郵件時消耗的係統資源會比較多,並且,一般躲避關鍵詞的技術(如拆詞、組詞)就很容易繞過過濾,例如,我們知道帶有標題“Free”的信件是垃圾郵件,但是這種技術可能會因為字母之間有空格而放過它,所以誤判率較高。
總的來說,規則匹配過濾技術的局限性在於規則都是人工製定的,垃圾郵件的特徵在不斷地變化,需要人為的發現、總結和更新,維護起來比較難。
11.2.4垃圾郵件內容過濾技術
由於郵件中很大一部分信息集中於郵件的文本中,因此可以通過對文本的分析來識彆郵件是否為垃圾郵件,目前采用的識彆技術主要是將文本分類技術引入到垃圾郵件過濾中,將郵件自動分類為垃圾郵件和閤法郵件。垃圾郵件內容過濾的實質是二分類問題,主要包括訓練過程和過濾過程,其基本框圖如圖11—4所示。
(1)輸入/輸齣。訓練過程輸入為由專傢分好類彆的垃圾郵件訓練語料庫,輸齣為構造的垃圾郵件過濾器。
……
前言/序言
模式識彆原理與應用/高等學校電子與通信類專業“十二五”規劃教材 epub pdf mobi txt 電子書 下載 2024
模式識彆原理與應用/高等學校電子與通信類專業“十二五”規劃教材 下載 epub mobi pdf txt 電子書