精品偷拍一区二区三区,亚洲精品永久 码,亚洲综合日韩精品欧美国产,亚洲国产日韩a在线亚洲

  • <center id="usuqs"></center>
  • 
    
  • 貝葉斯分類算法中的那個公式怎么解釋?

    貝葉斯分類算法中的那個公式怎么解釋?
    度.百.科.里的“貝葉斯分類算法”,文章最后有個公式,不懂,
    P(A|t1 ,t2,t3……tn)=(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)]
    不要復(fù)制粘貼
    數(shù)學(xué)人氣:899 ℃時間:2020-05-26 07:55:53
    優(yōu)質(zhì)解答
    1.收集大量的垃圾郵件和非垃圾郵件,建立垃圾郵件集和非垃圾郵件集.2.提取郵件主題和郵件體中的獨立字符串,例如 ABC32,¥234等作為TOKEN串并統(tǒng)計提取出的TOKEN串出現(xiàn)的次數(shù)即字頻.按照上述的方法分別處理垃圾郵件集和非垃圾郵件集中的所有郵件.3.每一個郵件集對應(yīng)一個哈希表,hashtable_good對應(yīng)非垃圾郵件集而hashtable_bad對應(yīng)垃圾郵件集.表中存儲TOKEN串到字頻的映射關(guān)系.4.計算每個哈希表中TOKEN串出現(xiàn)的概率P=(某TOKEN串的字頻)/(對應(yīng)哈希表的長度).5.綜合考慮hashtable_good和hashtable_bad,推斷出當(dāng)新來的郵件中出現(xiàn)某個TOKEN串時,該新郵件為垃圾郵件的概率.數(shù)學(xué)表達(dá)式為:A 事件 ---- 郵件為垃圾郵件; t1,t2 …….tn 代表 TOKEN 串 則 P ( A|ti )表示在郵件中出現(xiàn) TOKEN 串 ti 時,該郵件為垃圾郵件的概率.設(shè) P1 ( ti ) = ( ti 在 hashtable_good 中的值) P2 ( ti ) = ( ti 在 hashtable_ bad 中的值) 則 P ( A|ti ) =P2 ( ti ) /[ ( P1 ( ti ) +P2 ( ti ) ] ; 6.建立新的哈希表hashtable_probability存儲TOKEN串ti到P(A|ti)的映射 7.至此,垃圾郵件集和非垃圾郵件集的學(xué)習(xí)過程結(jié)束.根據(jù)建立的哈希表 hashtable_probability可以估計一封新到的郵件為垃圾郵件的可能性.當(dāng)新到一封郵件時,按照步驟2,生成TOKEN串.查詢hashtable_probability得到該TOKEN 串的鍵值.假設(shè)由該郵件共得到N個TOKEN 串,t1,t2…….tn,hashtable_probability中對應(yīng)的值為 P1 ,P2 ,……PN ,P(A|t1 ,t2,t3……tn) 表示在郵件中同時出現(xiàn)多個TOKEN串t1,t2……tn時,該郵件為垃圾郵件的概率.由復(fù)合概率公式可得 P(A|t1 ,t2,t3……tn)=(P1*P2*……PN)/[P1*P2*……PN+(1-P1)*(1-P2)*……(1-PN)] 當(dāng) P(A|t1 ,t2,t3……tn) 超過預(yù)定閾值時,就可以判斷郵件為垃圾郵件.
    我來回答
    類似推薦
    請使用1024x768 IE6.0或更高版本瀏覽器瀏覽本站點,以保證最佳閱讀效果。本頁提供作業(yè)小助手,一起搜作業(yè)以及作業(yè)好幫手最新版!
    版權(quán)所有 CopyRight © 2012-2024 作業(yè)小助手 All Rights Reserved. 手機版