今天終於把分好群的網頁,成功的建立成Concept Graph,也把之前的例外情形都處理了。Concept Graph以adjacency matrix來儲存,而且是非對稱的,下一步需要從Concept Graph提供的資訊來決定HMM要有幾個hidden states,方法是從標示為target的群開始,以Breadth-First Search的方式來traverse這個圖。決定了hidden state的個數後,就有了足夠的資訊來training HMM,這個部份算是核心的部份,預期可能會花比較多的時間在這個地方。
沒有留言:
張貼留言