skip to main
|
skip to sidebar
Dolce Vita
曾經滄海難為水
3/16 (五) 工作日誌
今天看了一些相關的LSI文章,複習一下主要的作法。它能夠將文字和文章投影到一個向量空間。首先要將文件和詞的關係表示成一個t×d的矩陣X,矩陣X的每個元素x表示詞t在文件d出現的次數,再來將矩陣X經過SVD分解後到三個矩陣的連乘積,選出前K個特徵值就完成了整個過程。
沒有留言:
張貼留言
較新的文章
較舊的文章
首頁
訂閱:
張貼留言 (Atom)
實驗室Blogs
俊宏
坤章
正揚
阿岡
網誌存檔
網誌存檔
8月 (1)
6月 (17)
5月 (22)
4月 (20)
3月 (20)
2月 (5)
1月 (8)
沒有留言:
張貼留言