關(guān)鍵詞:專利相似度 詞向量 統(tǒng)計(jì)特征
摘要:【目的】針對傳統(tǒng)專利相似度測量忽略詞語語義關(guān)系的問題,提出一種新的專利相似度測量方法,以提高專利相似度測量的準(zhǔn)確度?!痉椒ā恳牖谏窠?jīng)網(wǎng)絡(luò)的詞向量模型,獲得專利文本中詞的語義信息;計(jì)算詞統(tǒng)計(jì)特征信息,度量不同詞在專利文本中的重要程度;最后結(jié)合詞向量和統(tǒng)計(jì)特征,形成專利文本表示,測量專利相似度。【結(jié)果】本文所提結(jié)合詞向量和統(tǒng)計(jì)特征的專利相似度測量方法比傳統(tǒng)的空間向量方法表示專利文本相似度方法準(zhǔn)確率提高了13.92%。【局限】輔助專利文本集的選取策略有待進(jìn)一步研究?!窘Y(jié)論】使用空間向量方法表示專利文本結(jié)合詞向量和統(tǒng)計(jì)特征能夠顯著提高專利相似度測量的準(zhǔn)確度。
數(shù)據(jù)分析與知識發(fā)現(xiàn)雜志要求:
{1}所有作者的作者簡介(姓名、工作單位、職稱、研究方向);通訊作者請?jiān)偬峁╇娮余]箱。
{2}稿件文責(zé)自負(fù)。編輯部有權(quán)對來稿進(jìn)行文字和技術(shù)性刪改,對實(shí)質(zhì)性內(nèi)容的修改,則應(yīng)征求作者同意。
{3}標(biāo)題序號:可按四級小標(biāo)題的格式寫:一、(一)、1、(1);一級、二級標(biāo)題另起段,正文另起段;三級、四級小標(biāo)題另起段,但正文接排;正文內(nèi)序號用①……②……等。
{4}參考文獻(xiàn):(1)正文格式:作者,發(fā)表年(多版次文獻(xiàn)請同時(shí)提供第 1 版的發(fā)表時(shí)間),頁碼,外加圓括號。(2)文末格式:中、外文獻(xiàn)分開,各按音序排列。
{5}摘要應(yīng)反映論文的目的、方法及主要結(jié)果、結(jié)論,并充分反映論文的創(chuàng)新點(diǎn),表達(dá)簡明、語義確切,以100 ~300 字為宜。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社