2007/07/24
最近這幾天標示透過technical term所屬的類別, 其technical term係透過svm方法所產生, 目前technical term 類別分為四部份 (machine learning, natural language processing, statistical probability, and word wide web), 每個類別的precision and recall都在三四成左右, 效果不盡理想, 後來有去比較關於名詞分類的文章(例如: http://pers-www.wlv.ac.uk/~in8113/papers/coling04_pekar_krkoska_staab.pdf), 當中效果也都在二到四成之間, 莫非這就是名詞分類的普遍效果嗎?
因為目前technical term feature 的選擇, 學生是採回傳k個網頁中的名詞及形容詞, 這段時間在針對technical term不同的feature再跑一下實驗看看. 例如可以和此篇參考文獻一樣選擇動詞來當作feature.
No comments:
Post a Comment