Richtofen写的
构建领域知识地图的目的和意义

在传统制造企业中,企业所拥有的知识包括各种标准、设计规范、相关专利、国际国内法律法规、设计方法和技巧、可制造性评价、设计案例、图纸和说明等。恰当、合理、有效地利用企业所拥有的相关知识至关重要。研究表明,在机电产品的制造和RD过程中,约80%的产品设计工作可以通过重用以前的设计知识来满足当前设计任务的创新设计要求,有数据表明,在一个完整的设计过程中,设计师平均花费70%的时间来整理和搜索已有的设计数据和知识,而用于设计产品的时间约占30%。因此,知识的合理使用在整个产品开发过程中起着重要的作用。
制造知识,如专利、技术规范、设计经验等。,大多以文本的形式存在。行业的特点决定了这些文本的语言高度精炼和概括,每个文档的描述重点相对具体。在生产实践中,对这些重要的开发工程知识的管理过于碎片化,一般存储在数据库中,对知识之间的关系没有深入挖掘。对于设计人员来说,知识获取的方式相对简单,因为大多数情况下,文本检索采用字符串匹配的方式返回检索结果,导致检索结果质量参差不齐,需要设计人员自行选择,一定程度上降低了设计效率。
知识地图由一些相互联系的实体和实体之间的关系组成。这些联系形成了一个结构化的语义网络,它是一个带有语义信息的特定数据结构,用于描述事物之间以及相关事物之间的关系。知识地图能够以特定的形式呈现实体之间丰富的语义,充分挖掘实体之间的关联。
图1知识地图
知识地图的构建过程
知识地图的构建过程包括以下五个步骤:
01定义具体问题
这是首屈一指的环节,因为知识图谱是解决问题的工具,重要的是利用知识图谱根据问题得到问题的答案。根据要解决的问题,判断是构建通用知识图谱还是领域知识图谱,确定是针对细分领域的知识图谱研究还是覆盖面广的知识图谱。如果本文需要解决产品专利推荐的问题,就需要构建专利领域的知识图谱。知识图谱语义关系丰富,有助于提高推荐的准确率。总之,在分析构建哪个领域的知识图谱之前,需要确定要解决的问题,这样构建的知识图谱才有意义。

02数据收集和处理
一旦定义了具体的问题,就定义了需要构建知识地图的领域。定义领域后,需要考虑数据来源,因为构建知识图谱需要大量的数据,而知识图谱可以准确表达语义关系。同时,还需要考虑数据处理。结构化数据和非结构化数据都需要处理,在数据预处理阶段需要对数据进行筛选。数据的收集和处理是必不可少的,也是非常重要的一步,会影响到知识图谱的后续表达。
03知识地图的设计
这个环节需要确定知识图谱的实体、关系和属性。例如,领域知识图谱一般包括以下实体:专利、用户、单位、行业领域、技术领域、行业领域、新技术领域、产业链等。这些实体需要人为定义,落实到具体的实体,代表具体的事物。关系设计基于识别的实体。通常所选的关系是指实体之间的关系,比如附属机构和应用行业之间的关系。属性的确定也是基于具体的实体,不同的实体有不同的属性。确定实体、关系和属性,既要遵循实际的业务逻辑关系,也要考虑避免冗余和知识图谱的轻量化,提高知识图谱的使用效率。
04存储在知识地图中的数据
知识地图设计完成后,从数据中提取所需知识,并存储在知识地图中。知识地图有两种常见的存储方式,一种是以RDF的形式,另一种是存储在地图数据库中。图数据库存储是近年来越来越流行的知识图谱存储方式,Neo4J图数据库是应用最广泛的图数据库。二级图形数据库使用Cypher语句操作数据库,Cypher语句是专门为操作二级数据库而设计的语言。它的开发借鉴了SQL语句的语法规则,使得Cypher语句操作简单,灵活多变。
05上层应用开发

构建知识地图后,许多企业可以使用知识地图来提高效率,如智能问答、语义搜索、社交网络和垂直行业应用。许多企业都在使用知识地图。比如脸书的核心技术就是用知识地图连接用户。Google的搜索引擎功能也是借助构建的知识图谱为用户提供智能搜索服务;“小度”语音助手还提供了基于知识图谱的智能问答功能。
领域知识图谱可以挖掘出某个专业领域内知识之间的潜在关系,并根据不同的搜索语句将深度挖掘的、多样化的、相关的、高度相关的知识返回给设计者,从而实现企业专利知识的高效重用。
以前的建议:
TISC| |什么?专利审查也有高速公路!
海外专利申请布局策略:理解海牙体系


