關鍵詞:知識圖譜 知識三元組抽取 對抗訓練 端到端網(wǎng)絡 標注策略
摘要:知識圖譜作為一種有效表示現(xiàn)實世界的系統(tǒng)受到學術界和工業(yè)界廣泛關注,并由于其精準表示知識的能力被廣泛應用于信息服務、智慧搜索、自動問答等上層應用.知識圖譜的核心為三元組形式的實體和關系.現(xiàn)有知識圖譜遠不足以描述現(xiàn)實世界,因此,如何通過實體關系抽取方法來補全或者構建新的知識圖譜顯得至關重要.傳統(tǒng)流水線式的實體關系抽取方法會導致誤差傳遞,而已有的聯(lián)合抽取沒有充分考慮命名實體識別與關系抽取之間的聯(lián)系,從而降低抽取效果.針對上述問題,對知識三元組抽取方法進行了深入研究,提出了一種融合對抗訓練的端到端知識三元組聯(lián)合抽取方法.首先,采用了一種實體關系聯(lián)合標注策略,通過端到端的神經(jīng)網(wǎng)絡抽取文本語義特征,并對文本進行自動標注;其次,模型在神經(jīng)網(wǎng)絡中加入自注意力機制增強對文本信息的編碼能力,并通過引入帶偏置項的目標函數(shù)提高對相關聯(lián)實體的辨識能力;最后,模型融合了對抗訓練以提高魯棒性,改進抽取效果.在實驗部分,采用4種分析方法和3種評價指標對模型性能進行評價分析,實驗結果證明了模型在知識抽取上的性能明顯優(yōu)于現(xiàn)有方法.
計算機研究與發(fā)展雜志要求:
{1}摘要200字左右,應具有獨立性和自明性,闡明撰寫該文的目的、方法、結論并體現(xiàn)出原創(chuàng)性,不加引注。
{2}來稿請恪守學術道德,嚴禁抄襲。
{3}來稿經(jīng)審查后,編輯部有權對來稿作適當文字修改.來稿不退,請作者自留底稿。
{4}間接引文通常以“參見”或“詳見”等引領詞引導,反映出與正文行文的呼應,標注時應注出具體參考引證的起止頁碼或章節(jié)。標注項目、順序與格式同直接引文。
{5}本期刊的文獻引證方式均采用頁下注(腳注),采用小五號宋體,每頁單獨編號,注釋中卷次、出版時間、刊期、頁碼一律用阿拉伯數(shù)字表示。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社