摘要:本文提出一種基于聚類的自動(dòng)摘要方法,該方法將文章中所有句子轉(zhuǎn)換為句子向量,并且使用基于AGNES的算法對(duì)刪除離群點(diǎn)后的句子向量進(jìn)行聚類,形成多個(gè)句子向量個(gè)數(shù)不超過設(shè)定閾值的簇,刪除句子向量個(gè)數(shù)極少的“無(wú)用”簇后,從每個(gè)簇中挑選出最能代表簇的語(yǔ)義的一個(gè)或者兩個(gè)句子,根據(jù)每個(gè)句子到語(yǔ)義中心的距離等信息從小到大確定指定數(shù)量的幾個(gè)句子作為關(guān)鍵句,拼接成文章摘要。通過在中國(guó)科普博覽網(wǎng)站上隨機(jī)挑選的500篇科普文章上進(jìn)行實(shí)驗(yàn),上述方法各項(xiàng)指標(biāo)均優(yōu)于基于圖模型的TextRank算法以及基于統(tǒng)計(jì)的方法,證明了該方法的有效性和可用性。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
主管單位:中國(guó)科學(xué)院;主辦單位:中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心
一對(duì)一咨詢服務(wù)、簡(jiǎn)單快捷、省時(shí)省力
了解更多 >直郵到家、實(shí)時(shí)跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價(jià),物流進(jìn)度實(shí)時(shí)通知
了解更多 >正版雜志,匹配度高、性價(jià)比高、成功率高
了解更多 >