5/21 (一) 工作日誌
今天把時間用在寫論文上,分別參考了Evaluating Topic-Driven Web Crawlers (SIGIR '01)以及Intelligent Crawling on the World Wide Web with Arbitrary Predicates (WWW '01)這兩篇論文,將相關研究部分有關PageRank和predicate給寫完了。PageRank說明了一下公式的大概意義,而predicate的部分則是說明了使用哪四種features,content of web page, URL tokens, inlinking page, and sibling page.
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言