3/16 (五) 工作日誌

今天看了一些相關的LSI文章,複習一下主要的作法。它能夠將文字和文章投影到一個向量空間。首先要將文件和詞的關係表示成一個t×d的矩陣X,矩陣X的每個元素x表示詞t在文件d出現的次數,再來將矩陣X經過SVD分解後到三個矩陣的連乘積,選出前K個特徵值就完成了整個過程。

沒有留言: