今天在試用Java Robot Package Programming Spiders Bots and Aggregators in Java中提供的Spider Class,這個Class要實作ISpiderReportable這個Interface,它也有multithreading的效果,不過試用後感覺要把它應用在我的問題上,有很多問題需要去了解與克服,所以最後還是決定Execution這個階段由自己的想法來寫起。
目前剩下對網頁做分類、套用HMM算forward value以及決定priority這些部分,這些做完就可以初步跑個小實驗來看效果好不好了!
沒有留言:
張貼留言