理解逆向概率:
現實生活中不確定的很多,觀察能力有侷限性,日常觀察停留在表面,需要靠猜測。
應用場景:拼寫糾錯,垃圾郵件判定、中文分詞。
P(h)為詞頻先驗概率。這裡注意字典庫,字典庫中h1和h2出現的概率。
特殊符號為“正比例於”。
由於P(D)就是輸入正確概率,是固定值,可以簡化。
當最大似然不能作出決定性的判斷時,先驗概率就可以插手進來給出指示。
數據越多的模型優勢越大;越是高階的多項式越不常見。
我拓展的式子需要簡化。這裡我們會使用一個更激進的假設,我們假設 di 與 di-1 是完全條件無關的,於是式子就簡化為 P(d1|h+) * P(d2|h+) * P(d3|h+) * .. 。這個就是所謂的條件獨立假設。
閱讀更多 學點乾貨 的文章