K-Means Clustering 所提供的source code雖然已經很好看懂,但要改成我所需的N維屬性的資料點,還是有點難度。
所以今天又不死心想找看看有沒有現成的可以用,http://www.javaworld.com/javaworld/jw-11-2006/jw-1121-thread.html在這個網頁中幸運的找到符合我需要的K-means分群,它可以接受N維的資料點輸入,source code 這是它提供的函式庫,其中kmeans.jar為一個可執行的jar檔,也可當作函式庫來用,使用這個工具順利的將已表示成向量的網頁分群完畢。
接下來要做的就是建立Concept Graph,也就是建立群跟群之間的連接關係及連接的次數,之後便要用這個資訊來建立HMM model。
沒有留言:
張貼留言