skip to main
|
skip to sidebar
Dolce Vita
曾經滄海難為水
4/30 (一) 工作日誌
在上星期五提到的問題,也就是新抓下來的網頁表示成Vector後,會跟之前的訓練資料的維度不一樣,在今天仔細地詳讀了WVTool相關的文件後,WVTWordList可以保持跟之前的一樣,也就是所有在訓練資料出現的term可以保留下來,用來計算之後抓下網頁的表示法,這樣一來所有網頁向量的維度就會一致了,這對之後的分類就不會產生問題了。
沒有留言:
張貼留言
較新的文章
較舊的文章
首頁
訂閱:
張貼留言 (Atom)
實驗室Blogs
俊宏
坤章
正揚
阿岡
網誌存檔
網誌存檔
8月 (1)
6月 (17)
5月 (22)
4月 (20)
3月 (20)
2月 (5)
1月 (8)
沒有留言:
張貼留言