貝葉斯分類算法中的那個公式怎么解釋?
貝葉斯分類算法中的那個公式怎么解釋?
度.百.科.里的“貝葉斯分類算法”,文章最后有個公式,不懂,
P(A|t1 ,t2,t3……tn)=(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)]
不要復(fù)制粘貼
度.百.科.里的“貝葉斯分類算法”,文章最后有個公式,不懂,
P(A|t1 ,t2,t3……tn)=(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)]
不要復(fù)制粘貼
數(shù)學(xué)人氣:899 ℃時間:2020-05-26 07:55:53
優(yōu)質(zhì)解答
1.收集大量的垃圾郵件和非垃圾郵件,建立垃圾郵件集和非垃圾郵件集.2.提取郵件主題和郵件體中的獨立字符串,例如 ABC32,¥234等作為TOKEN串并統(tǒng)計提取出的TOKEN串出現(xiàn)的次數(shù)即字頻.按照上述的方法分別處理垃圾郵件集和非垃圾郵件集中的所有郵件.3.每一個郵件集對應(yīng)一個哈希表,hashtable_good對應(yīng)非垃圾郵件集而hashtable_bad對應(yīng)垃圾郵件集.表中存儲TOKEN串到字頻的映射關(guān)系.4.計算每個哈希表中TOKEN串出現(xiàn)的概率P=(某TOKEN串的字頻)/(對應(yīng)哈希表的長度).5.綜合考慮hashtable_good和hashtable_bad,推斷出當(dāng)新來的郵件中出現(xiàn)某個TOKEN串時,該新郵件為垃圾郵件的概率.數(shù)學(xué)表達(dá)式為:A 事件 ---- 郵件為垃圾郵件; t1,t2 …….tn 代表 TOKEN 串 則 P ( A|ti )表示在郵件中出現(xiàn) TOKEN 串 ti 時,該郵件為垃圾郵件的概率.設(shè) P1 ( ti ) = ( ti 在 hashtable_good 中的值) P2 ( ti ) = ( ti 在 hashtable_ bad 中的值) 則 P ( A|ti ) =P2 ( ti ) /[ ( P1 ( ti ) +P2 ( ti ) ] ; 6.建立新的哈希表hashtable_probability存儲TOKEN串ti到P(A|ti)的映射 7.至此,垃圾郵件集和非垃圾郵件集的學(xué)習(xí)過程結(jié)束.根據(jù)建立的哈希表 hashtable_probability可以估計一封新到的郵件為垃圾郵件的可能性.當(dāng)新到一封郵件時,按照步驟2,生成TOKEN串.查詢hashtable_probability得到該TOKEN 串的鍵值.假設(shè)由該郵件共得到N個TOKEN 串,t1,t2…….tn,hashtable_probability中對應(yīng)的值為 P1 ,P2 ,……PN ,P(A|t1 ,t2,t3……tn) 表示在郵件中同時出現(xiàn)多個TOKEN串t1,t2……tn時,該郵件為垃圾郵件的概率.由復(fù)合概率公式可得 P(A|t1 ,t2,t3……tn)=(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)] 當(dāng) P(A|t1 ,t2,t3……tn) 超過預(yù)定閾值時,就可以判斷郵件為垃圾郵件.
我來回答
類似推薦
猜你喜歡
- 1老友記第六季第二集11分23秒,phoebe said:you could do a lot worse than joey
- 2布萊克一家現(xiàn)在習(xí)慣吃中餐了(be used to)英語翻譯
- 3兩個數(shù)學(xué)方程 (x-320)/x=34 (320-x)/x=34
- 4原句:烈火燒死了邱少云,我的心很痛.改成“把”字句________________________________
- 5戈 這個字少一撇,然后加個 心 字,這個字怎么念?
- 6小明有54枚郵票小明的郵票枚數(shù)是小新的4分之3小新的郵票枚數(shù)是小紅的7分之6小紅有多少枚郵票
- 7詢問天氣是情況是,how 和what及其答語 有什么區(qū)別.關(guān)于問天氣的各種句型
- 8英語作文:A Word About English Learning
- 9xy<0且x+y>0x<y試把x,y,0,-x,-y這5個數(shù)用<連接
- 10亙字的讀音
- 11關(guān)于國慶的英語作文
- 12請高手幫忙寫一篇100字左右關(guān)于最喜歡的節(jié)目的英文~~