Automatic labelling Pros and Cons Problem

2008-05-25
將Epinions網頁中的review抓回來之後,已將pros, cons, and full review分別地擷取出來,當正要進行由Kim所提出來的automatic labeling method時, 遇到一個重大的問題:
文中提出利用pros and cons中的phrase 去比對full review中的sentence, 將它標示為pros, cons, or neutral.
然而, 由人工比對方式實際地去分析, 結果顯示pros's (or cons's)中的phrase和full review 中的sentence重疊的機率少之又少. 因此目前想到採取的解決方法如下:
1. 不利用phrase為單位, 改由單一term為單位, 和full review 進行比對的動作.
2. 也是由單一term 為單位,僅選擇 noun and adjective.

No comments: