4/30 (一) 工作日誌

在上星期五提到的問題,也就是新抓下來的網頁表示成Vector後,會跟之前的訓練資料的維度不一樣,在今天仔細地詳讀了WVTool相關的文件後,WVTWordList可以保持跟之前的一樣,也就是所有在訓練資料出現的term可以保留下來,用來計算之後抓下網頁的表示法,這樣一來所有網頁向量的維度就會一致了,這對之後的分類就不會產生問題了。

沒有留言: