今天meeting後需要改進的地方:
1.在蒐集使用者瀏覽網頁順序這部分方法及介面,需要加入到投影片中
2.將visit sequence放到建立concept graph之前
3.投影片要加入訓練後產生的模型
4.Execution的流程圖簡化成兩部分:get similar sites and crawling from each site
在蒐集訓練資料的方法這部分,等老師回台灣,再跟老師討論。
WEKA: 之前阿岡有提過的data mining tool,它同時提供了GUI介面以及JAR檔,因為我需要 KNN classifier,但似乎裡頭沒有提供。
KNN: 這是我找到以WEKA為基礎所寫的KNN classifier,所以我只要能把之前網頁分群的資訊轉成ARFF的格式,就能順利的利用這個找到的分類器。
沒有留言:
張貼留言