貝葉斯分類算法中的那個公式怎么解釋?

貝葉斯分類算法中的那個公式怎么解釋?
度.百.科.里的“貝葉斯分類算法”,文章最后有個公式,不懂,
P(A|t1 ,t2,t3……tn)=（P1*P2*……PN）/[P1*P2*……PN+（1-P1）*（1-P2）*……（1-PN）]
不要復(fù)制粘貼

數(shù)學(xué)人氣：899 ℃時間：2020-05-26 07:55:53

優(yōu)質(zhì)解答

1.收集大量的垃圾郵件和非垃圾郵件,建立垃圾郵件集和非垃圾郵件集.2.提取郵件主題和郵件體中的獨立字符串,例如 ABC32,￥234等作為TOKEN串并統(tǒng)計提取出的TOKEN串出現(xiàn)的次數(shù)即字頻.按照上述的方法分別處理垃圾郵件集和非垃圾郵件集中的所有郵件.3.每一個郵件集對應(yīng)一個哈希表,hashtable_good對應(yīng)非垃圾郵件集而hashtable_bad對應(yīng)垃圾郵件集.表中存儲TOKEN串到字頻的映射關(guān)系.4.計算每個哈希表中TOKEN串出現(xiàn)的概率P=（某TOKEN串的字頻）/（對應(yīng)哈希表的長度）.5.綜合考慮hashtable_good和hashtable_bad,推斷出當(dāng)新來的郵件中出現(xiàn)某個TOKEN串時,該新郵件為垃圾郵件的概率.數(shù)學(xué)表達(dá)式為：A 事件 ---- 郵件為垃圾郵件； t1,t2 …….tn 代表 TOKEN 串則 P （ A|ti ）表示在郵件中出現(xiàn) TOKEN 串 ti 時,該郵件為垃圾郵件的概率.設(shè) P1 （ ti ） = （ ti 在 hashtable_good 中的值） P2 （ ti ） = （ ti 在 hashtable_ bad 中的值）則 P （ A|ti ） =P2 （ ti ） /[ （ P1 （ ti ） +P2 （ ti ） ] ； 6.建立新的哈希表hashtable_probability存儲TOKEN串ti到P（A|ti）的映射 7.至此,垃圾郵件集和非垃圾郵件集的學(xué)習(xí)過程結(jié)束.根據(jù)建立的哈希表 hashtable_probability可以估計一封新到的郵件為垃圾郵件的可能性.當(dāng)新到一封郵件時,按照步驟2,生成TOKEN串.查詢hashtable_probability得到該TOKEN 串的鍵值.假設(shè)由該郵件共得到N個TOKEN 串,t1,t2…….tn,hashtable_probability中對應(yīng)的值為 P1 ,P2 ,……PN ,P(A|t1 ,t2,t3……tn) 表示在郵件中同時出現(xiàn)多個TOKEN串t1,t2……tn時,該郵件為垃圾郵件的概率.由復(fù)合概率公式可得 P(A|t1 ,t2,t3……tn)=（P1*P2*……PN）/[P1*P2*……PN+（1-P1）*（1-P2）*……（1-PN）] 當(dāng) P(A|t1 ,t2,t3……tn) 超過預(yù)定閾值時,就可以判斷郵件為垃圾郵件.

我來回答

類似推薦

猜你喜歡

精品偷拍一区二区三区,亚洲精品永久 码,亚洲综合日韩精品欧美国产,亚洲国产日韩a在线亚洲

貝葉斯分類算法中的那個公式怎么解釋?

精品偷拍一区二区三区,亚洲精品永久码,亚洲综合日韩精品欧美国产,亚洲国产日韩a在线亚洲