4/27 (五) 工作日誌

今天試著從每個網站開始,擷取所有的outlinks,並對抓下來的網頁表示成Vector Space Model (VSM),嘗試要去做分類的動作,在這遇到點問題,之前使用者標示的網頁已經抓下來,而term的維度也已經固定,那麼現在抓下來要做分類的網頁,term本身跟term的維度都有些不一樣,該怎麼做分類呢,是否應該將在execution階段抓下來的網頁強制對應到之前使用者標示網頁的維度就好,這個問題需要思考一下!

沒有留言: