今天跟學長討論HMM訓練相關的問題,在討論的過程中發現我訓練的方式不太正確,我訓練的方式是由建好的Concept Graph來當作HMM的Model,進而去算狀態轉移機率 (A)以及符號出現機率 (B)。照我的方式去算,我發現每個符號(也就是分好的群)在所有的狀態中(T0, T1,..., Tn)只會出現一次,這樣好像是錯誤的。
經討論過後,認為正確的方式應該是回歸當初使用者瀏覽的網頁順序,在這網頁順序中,每一個網頁都有兩個標註,一個是標註此網頁被分為哪一群,另一則是標註此網頁離目標還剩幾步,應該要以這為訓練資料才對,所以之前的程式可能要有點大幅度的修改了。
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言