Co-occurence

2007/05/02
今天在我的scoring function中, 增加了co-occurence的概念,其中co-occurence的字詞, 主要係擷取符合標準答案句子中的高頻字. 因此,在調整parameter的部份, 就顯得較為頭痛, 幾天的周旋當中, 會讓我想要嘗試去用machine learning的方法?
在最後輸出字詞的部份, 原本採用每篇文章輸出最高的20字詞當作是這篇的technical terms. 但是發現有些文章的字詞較少, 因為我採用前四分之一較高分數的term.

No comments: