5/11 (五) 工作日誌

今天跟老師討論後,在使用者蒐集資料這個部分要做點修改,要修改成讓使用者下關鍵字查詢google後,讓使用者標示哪幾個是target網頁,然後從target網頁的root網頁traverse到target網頁。
而初步實驗結果不好的原因,後來再仔細思考了一下執行的流程,我想到有許多問題可以改善,像是可能看了重複的網頁、VSM挑出來的字可能沒有代表性、要限制在root url的domain name下才看、或是在使用者瀏覽標示的training data不好等等,這些等等的因素我會再試著改善看看是否對準確率跟找到相關網頁的時間能有改善。

沒有留言: