Discussion of Project

2007/08/06
1. 五年五百億: 下午跟專案負責人討論順便確定了一下, 我們分項該負責的項目, 看起來有點小困難, 因為同時要search 三個資料庫, 在透過scoring function 才能回傳結果, 這幾天趁空檔, 趕快將此專案的進度趕一下吧>>>go go go !!!
2. Online Wrapper Creator: 今天順到檢視了一下士鋒的進度, 除了schema matching的部份, 其餘大致上都已經完成 (query interface, select block, and gadget creation…etc.)
關於schema matching的部份, 目前討論出利用兩個網頁產生的record筆數應該相同及record的文字內容去進行比對, 因此在instance level 中可由, (1) the number of record. (2) the length of record. (3) the data type (both string and numeric type ), 如果效果不好的話, 可能要由schema level 來去著手, 但是由於Kayed’s schema 沒有語意的成分在, 因此很難用自然語言的方式去比對, 可能要再想.
3. Mobile Social Networks: 為了日後希望透過web 2.0的方式, 將訊息利用gadget的方式呈現給就輔員, 因為今天偕同小丁設計了一個網頁, 蒐集就輔員平常瀏覽的網站及用途, 俾利日後web 2.0工具的開發.

1 comment:

Jahui said...

你所談的應該是EXTRACTOR部份, 主要是利用SCHEMA和TEMPLATE擷取其中的資料.

SCHEMA MATCHING則是主要用在偵測網頁SCHEMA是否有有所更動.

請TOMELF將他寄給KAYED的信件一併CC給我. THANKS!