2/13 (二) 工作日誌

今天邊看paper邊做投影片,也把paper反覆的再閱讀了幾遍,作者使用了他們自己Lab所發展出來的兩個工具-Mercator and Connectivity Server 2 (CS2)-來跑他們的實驗,Mercator是一個extensible, multithreaded, high performance web crawler,而CS2它把web crawl當作input,建立出相對應的web graph representation。在他們的實驗數據中可以看出breadth-first search的確能在早期找到high quality的pages,而在結論的部份作者也提到,雖然以PageRank當作crawler's strategy有比較好一點,但是相對的需要付出很多computation cost,所以作者認為breadth-first search ordering有比較好的tradeoff!

沒有留言: