今天將使用者瀏覽網頁的順序,依昨天更正的想法分別assign相對應的群跟隱藏狀態,
接著利用這些資料來建立HMM模型,也就是A(狀態轉移機率), B(符號出現機率),
我去驗證了一下轉移機率跟符號出現機率,發現在狀態轉移機率這個matrix中,
出現了一些不該出現的狀況,例如T3 -> T1,
這跟一開始假設的T3往下只能到T2的情形有所矛盾。
我在猜想可能是當初在記錄瀏覽順序時,
使用者按Back Button而重複瀏覽的網頁也記錄下來而產生的問題,
例如網頁A連到網頁B,而使用者在瀏覽網頁B時按了Back到網頁A,
進而造成我判斷B會連到A,這個誤判會造成我在breadth first traversal時,造成不正確,
所以在記錄瀏覽順序這邊可能需要修改一下。
沒有留言:
張貼留言