8/2 (四) 工作日誌

實驗的部分
近來有試著做銀行的Exchange Rate
以及電腦公司的Server產品資訊

在Exchage Rate這部分
我以www.bankofcanada.ca/en/index.html當作Seed
而以rate當作URL的Keyword
實驗的結果挺差的
在找到網頁的TOP10中只有2到3個是真正符合需求的
造成結果這麼差的原因我覺得有以下一些原因
1.銀行的首頁通常包含太多的Link
一旦路徑走偏了 很難回頭
且Exchage Rate的網頁通常在首頁很難察覺它在哪裡
2.有些銀行是提供表單的方式來做查詢
這麼一來 跟我們所標示的網頁相似度就很低
3.以Google來找相似的英文銀行網站 準確性很低
而有些結果其實是跟用來查詢的銀行同一家銀行的網頁
只是不同頁面而已

而在電腦公司的Server產品資訊這方面
也有著上述的第一點問題
而且在這個domain的首頁
通常畫面都太複雜 也就是搭配像是Flash以及javascript所撰寫出來的功能
像這個部分要取得Link就比較困難
另外就是每家公司的Server產品名稱以及對於產品的敘述
都有所不同
造成與被標示的網頁相似度也不高
而且用Google所找到真正的相似網站也不多
到是找到許多做不同產品的公司 也就是不是賣Server相關的
所以效果比銀行的Exchage Rate還差

因為這兩個domain效果不佳的狀況下
我想說從http://dir.yahoo.com奇摩的分類下去找domain
有試著看了一下醫院的門診時間或是主治醫生
不過國外的醫院網頁架構還挺不同的
再加上對國外的有那些醫院也不熟
目前還在摸索中

沒有留言: