鸥玛软件取得无监督知识图构建专利,可对专业文本进行知识抽取
转自:金融界
本文源自:金融界
金融界2023年11月29日消息,据国家知识产权局公告,山东山大鸥玛软件股份有限公司取得一项名为“面向专业文本的无监督知识图构建方法和装置“,授权公告号CN116882494B,申请日期为2023年9月。
专利摘要显示,一种面向专业文本的无监督知识图构建方法和装置,属于自然语言处理的技术领域。本发明提出了一种用于描述专业文本中知识内容的知识图概念,其核心是专业知识中的术语、实体和重要通用词汇构成的专业要素及其之间的关联关系:首先,设计了基于专家规则的专业要素抽取方法用于构建知识图的节点集,通过专业要素的抽取可以识别专业文本中的中心思想,提炼重要词汇;然后,对于抽取出的专业要素,融合其局部上下文特征、依存句法特征和语义相似度特征作为两专业要素之间关联关系的特征,得到知识图的边集及对应特征。本发明能够对缺少实体关系标记的专业文本进行知识抽取,得到的知识图可以反映文本中的专业知识,具有一定的可读性。