1.2.2 工业大数据分析与基于本体的知识图谱构建
随着“工业4.0”的提出,以物联网、云计算为基础,以模式识别与机器学习为技术,以实现大规模生产与个性化定制相结合为目的的智慧工业成了当下制造业发展的热点。
作为智慧工业以及工业互联网平台的核心环节,工业大数据分析就是对工业数据进行一个有效处理和分析,并通过智能化决策给予生产过程一个正向反馈。一般意义上,工业大数据具有“6V”特征,即容量(Volume)、多样性(Variety)、速度(Velocity)、真实性(Veracity)、可见性(Visibility)和价值(Value)。其中容量、多样性和速度可以看作是过程工业大数据中的三个主要特征。容量作为首要典型特征,主要体现在数据规模方面。其次,不同传感器的数据以及图像、文本等其他形式的数据构成了大数据下来源多样化的特点。而速度,即基于快速的数据流进行过程建模,一定程度上体现了时效性的重要。如何综合利用带有这些特征的工业大数据,越来越受到研究者的广泛关注。一方面,随着工业大数据时代的到来,数据呈爆炸式增长,使得建模信息足够充分(体现在工业大数据下的“容量”特征);另一方面,即时收集到的历史数据可以包含所有需要的过程状态。此外,另一个困难是选择模型类型及其参数,以使模型能够理解所有的过程状态并学习所有过程中的数据信息。这导致了模型的高度复杂性,反过来又要求模型开发使用大量的历史数据。由此,面对包含充分信息的批量式工业大数据,为了进一步提高建模效率和降低算法复杂度,传统方法被拓展成分布式/并行建模方式。
数据和知识是新一代信息技术与智慧工业深度融合的基础。知识图谱技术本质上是基于语义网络的思想,可以实现对现实世界的事物及其相互关系的形式化描述,该技术可用于解决智慧工业领域数据及知识的关联性表达和相关性搜索推理问题。物联网、云计算、人工智能等新一代信息技术的迅猛发展,带来了制造业的新一轮突破,推动着制造系统向智能化方向发展,驱动着未来制造模式的创新。其中基于知识图谱进行有效数据及知识的关联性研究,从而实现高效的信息检索与信息推理是当前实现智慧工业目标的热点问题之一。而将知识图谱技术应用到智慧工业领域中,首先需要实现领域知识的形式化表达,即在多模态数据要求下实现机器可以理解的知识表达方式。
在智慧工业领域知识的形式化表达方向中,所涉及的关键技术手段包含了谓词逻辑知识表示方法、框架式知识表示方法、基于语义网络的知识表示方法、基于本体的知识表示方法等。相比较而言,基于本体的知识表示方法能够保证知识传递和共享过程中知识理解的唯一性,可以满足知识类型多样、语义关系复杂的要求,已成为智慧工业领域知识表示的主要方法之一。目前基于本体的智慧工业领域知识表示方法的代表性工作有:针对产品设计过程知识和制造过程知识,Chhim等发展了联合两类知识的本体,并尝试将其应用于知识重用过程;针对工艺设计知识,郭鑫等考虑工艺知识特点及领域范围,提出基于本体的工艺知识管理逻辑架构;针对制造业领域全生命周期知识,刘航等基于本体提出多层次、多维度的知识表达模型,实现制造业领域知识结构化、维度化的表示;针对协同设计知识,Bock等探索了结合本体和基于模型技术进行协同设计的方法;Sadik等解决了人机协作制造中协作制造系统组件本体构建的难题,提出一种结合了基于本体多代理系统和业务规则管理系统的分布式控制解决方案;Oguz等针对现有人机协作研究中机器感知操作人员的行为模式被忽视的现状,建立了一个描述广泛的互动场景的本体;Kethavarapu等用基于关键字、基于值的抽取方法对日志文件数据进行集成,再将其转换为WOL(Web Ontology Language,网络本体语言)文件,从而实现了自动本体的生成。
综上所述,当前基于本体的智慧工业领域知识表示方法获得了广泛的研究,为后续知识图谱的自动构建提供了基础。在企业实际应用过程中,可以以现有研究构建的本体作为基础,以提高企业知识本体构建的效率。然而,现有研究中所构建的本体往往细节度不高,应用过程需根据实际的企业需求进行拓展。现有的知识图谱相关理论研究可以尝试应用于基于知识图谱的人机协同与交互技术并提出相应的本体构建方法,比如:智慧工业领域知识的形式化表达方法、智慧工业领域知识推理技术以及智慧工业领域问答技术。