知识本体构建的规则与逻辑

在术语的基础上,构建术语之间的本体关系,再以术语之间的关联关系,作为知识拓展搜索的基础。通过基于本体的拓展搜索,能够基于构建好的规则(术语关系),给研发人员提供更多相关知识,从而拓展知识面,发现新知识。

 

术语是知识准确表达的重要基础,所有共享都需要在概念理解一致的情况下进行。规范知识的表达,减少知识的重复新建,让知识易于理解,构建专业术语库是基础,让所有贡献知识的人员都能用相同的专业术语去表达知识。

 

在术语的基础上,构建术语之间的本体关系,再以术语之间的关联关系,作为知识拓展搜索的基础。通过基于本体的拓展搜索,能够基于构建好的规则(术语关系),给研发人员提供更多相关知识,从而拓展知识面,发现新知识。

 

本体拓展知识之间的内在联系,是知识工程应具备的重要特性。知识原本就是一个相互之间有很强联系的整体,不能因为知识管理的分类破坏知识的整体性。本体本质上是实现不同知识之间的相互关联,例如知识跟知识关联、知识与信息关联、知识与具体业务和工作类型关联、知识与人关联等。只有通过知识之间的关联,才能建立新旧知识、不同业务知识之间的互相引用,才能更好解决工作中的问题。

 

虽然现在有一些语义分析技术能够在一定程度上自动建立这种关联关系,但从企业长远发展的角度看,为了关联和搜索的准确性,企业有必要专门组织力量手动建立本企业自己的关键词表。分类词表经常被用在大数据量的信息和知识组织中,例如图书馆、档案馆、行业信息组织等。在企业内部实践中,由于成本和时间的约束,大部分企业不大可能从头建立分类词表。我们的经验是企业可以根据自身核心知识领域,结合部门、职能、流程建立关键词之间的简单关联。例如在某个知识领域,确定其关键词,然后确定关键词的同义词、近义词、上位词、下位词,及跟其他关键词的关系与连接,基本可以建立起初步分类词表,满足企业应用。

 

关键词的同义词、近义词、上位、下位关系,就是术语的几种本体关系。术语是与领域论证工作相关的术语,所以称为领域术语。领域术语之间的关系称为领域本体。领域本体构建方法包括4个步骤:

 

(1) 确定本体的领域与范围

 

首先要明确本体的专业领域、目的、作用、应用对象等信息。应该明确特定专业领域的特定内容及特殊表达法。在领域本体的构建范围确定后,可参考下图进行领域术语本体的构建。

 

1.png

知识本体构建的规则与逻辑的图2

术语本体的构建过程

 

(2) 列举领域中重要术语和概念

 

通过专业领域的标准规范、前人的总结以及人工集中收集获得领域术语。在领域本体创建的初始阶段,尽可能列举出想要陈述或解释的所有概念,而不必在意所要表达的概念之间是否重叠,也不需要考虑这些概念到底用何种方式(类、属性还是实例)来表达。

 

(3) 建立本体框架

 

上一步骤已经产生了大量领域概念,但却是一张毫无组织结构的词汇表,需要按照一定的逻辑规则进行分组。另外,需要对每一个概念的重要性进行评估,选出关键性术语,摒弃那些不必要或者超出领域范围的概念,尽可能准确而精简地表达出领域知识。最终形成一个领域知识的框架体系,得到领域本体的框架结构。

 

第(2)步和第(3)步并非是绝对的顺序,这两个步骤也可以颠倒过来或交叉迭代进行。有时会先列举出领域中的术语和概念,然后从概念中抽象出本体框架。也可以先产生本体框架,再按照框架列举出领域的术语。至于如何具体进行,应该根据开发人员对领域的认识程度,如果领域内已经存在非常清晰的框架或者对领域的认识已经很深刻,则可以直接产生框架。

 

(4) 定义领域中概念之间的本体关系

 

这些关系包括上位、下位、同义等常规术语关系外,还可以定义其他有意义的关系,譬如“相关”。 可以通过人工方式逐个定义术语之间的关系,也可以参考术语定义相关的标准文献,找出术语关系描述规则,通过自动语义分析提取术语之间的关系。

 

这些关系仅涉及相同工作领域的概念。不同工作领域的概念也可以相关,只是在实践中属于同一工作领域的本体才具有实用价值,且跨领域概念之间的关系应该不限于同义词、近义词、上位、下位关系,这里不对此进行深入讨论。

登录后免费查看全文
立即登录
App下载
技术邻APP
工程师必备
  • 项目客服
  • 培训客服
  • 平台客服

TOP