发布网友 发布时间:2022-05-23 12:35
共1个回答
热心网友 时间:2023-10-22 11:46
一、推理网络基本工作程序
本系统矿床模型计算机推理网络采用的推理策略为正反向混合推理,基本工作模型为人机对话模型。系统采用交互式图形界面,通过菜单驱动,能将不同矿床模型的各种典型地质特征灵活展现到用户面前,包括详细的成因注释说明及图片展示,以供参照、对比、选择。首先,系统采用由数据到结论的正向推理,地质勘查人员根据程序的要求输入某个地区的地质观测证据(包括大地构造背景、矿床地质特征如控矿地层、构造、岩浆岩特征、岩石、矿物、蚀变指示标志及物、化、遥信息标志等),确认后,计算机程序将观测证据与各种类型的矿床模型进行对比,并根据矿床模型知识库中的推理规则进行推理计算,然后将各矿床类型推理结果按名称及相应归类概率列于屏幕上,作为该地区可能存在的矿床类型评价结论,供用户选择。在此,系统每次只允许用户选择一个矿床类型进行考查。当用户作出选择后,系统进入反向推理,程序以所选矿床类型为结论,反向逐级考查该矿床模型,找出那些用户尚未提供但却最有效的证据,通过人机交互方式向用户询问,以便从用户处获得新证据,进而改变目标矿床类型的判类可信度概率值。
二、推理规则的表示
一般说来,对一个具体矿床模型,有下列推理规则:
if E1,E2,…,En
then H[LS,LN]
上述规则可以解释为:“若有E1到En的n项观测证据,则认为(在可信度[S,N]上)假说H成立”。[LS,LN]是两个统计量估值,它反映矿床地质学专家总结出的该条规则的可信度。其中,LS估值为规则的充分性度量,表示规则的前提条件存在时,规则结论成立的可能性;LN估值为规则的必要性度量,表示规则的前提条件不存在时,规则结论成立的可能性。估值与LS值和LN值的换算见表4-1。例如,在岩浆型铜矿模型中包含下列规则:
if 侵入体岩石类型条件有利
then 对形成岩浆型铜矿床的岩浆岩条件有利[LS,LN]
通常,一个规则的假说往往涉及到另一个规则的证据。例如,在岩浆型铜矿模型中还包含下列规则:
if 侵入体为镁铁质-超镁铁质基性-超基性岩
then 岩石类型条件有利[LS,LN]
表4-1 推理规则统计量估值换算表
三、基本网络结构
图4-8表示由*数据组成的推理网络中假说和证据的链接,即根据证据推断而得到结点,这个结点还可以与其他结点连接起来,由此组成一个推理网络。图中Ei代表证据,Hi代表假说。图中的H5是一个典型的中间结点,它起到两种作用:为其上的结点H2提供了证据,同时又属于其下的结点E2和E3的假说。为避免混淆,我们将证据和假说统称为断言。在推理网络结构中,每一个端点(叶子)结点是系统可通过提问用户直接获取的证据,而其他结点都是假说。
图4-8 推理网络示意图
断言是一些既可为真又可为假的陈述,在给定的条件下,总是存在着一个是真或假的确定程度。在推理的开始阶段,每个陈述的真假是未知的。当获取到一条事实证据后,就可明确地建立起某些断言。一般情况下,我们给每个断言附上一个概率值。推理网络的连接实际上就是测定一个断言的概率变化在何种程度上影响其他断言。
一个模型推理网络的顶级断言(基本断言),可以看作是一个顶级“空间”。它是由几个因子组成,每一个因子又可看作是一个模型的“空间”。一个顶级空间可使得有效的证据和某个专门模型相匹配。例如,建立斑岩铜矿模型的顶级空间时,必须首先建立下列若干条假说作为它的因子。这些假说是:
1)构造环境对斑岩铜矿有利;
2)岩浆岩条件对斑岩铜矿有利;
3)矿化指示标志对斑岩铜矿有利;
4)物探、化探信息标志对斑岩铜矿有利。
上述4条因子都是研究区的实测数据(证据),可以通过直接向用户询问它们是否为真,即可建立起来。然而通常情况下,它们只是间接证据,即上述因子同时又是假说,并与其他因子有相关关系。例如,上述的构造环境的有利性又可由下列3个因子组成,它们是:
1)研究区位于*边缘造山活动带、岛弧带或陆内构造-岩浆活动带;
2)该带的年代为中生代或新生代;
3)研究区属于深大断裂带及旁侧次级断裂带发育的一系列中酸性钙碱性斑岩体分布地带、火山机构分布地带。
上述3个因子可从测得的事实证据中得到,由此可知,模型是层次结构的,顶级断言是通过几个主要的二级断言确定,而二级断言又由一些*断言确定,以此类推,直至断言可以直接从研究区的事实证据中确定为止。断言按照不同的等级层次由上向下发展。
四、3种基本推理关系
在地质学中,地质成矿规律实际上是各种假说,假说的结论由地质观测证据支持,而地质证据有可能又是另一地质假说的结论,即证据和假说是相对的。在推理网络中,必须反映出这种证据和假说的相对关系,而这种证据—假说—证据的复杂关系是依靠一定的推理关系来连接的。
在本系统中,证据和假说之间存在着下列3种基本推理关系:
1.似然推理关系
在似然推理关系中,不同的证据可对一个假说有不同的支持程度,称为规则强度,它可用可能性比率值来表达。每个规则强度值测定了一个断言概率的变化是如何影响其他断言的。
规则中一个给定的事实证据可以存在或不存在,这可分别用可信度概率值来说明。一般说来,证据事实的存在与否是非确定性的,系统通过在这两个极端值之间进行插值,来计算可能性概率。显然,证据不确定必然会随之改变结论的可信度。
规则可信度由矿床地质专家在设计模型的时候提出来,通过把自然语言表达程度的副词如“肯定”、“不太可能”转换成数字来表示(本系统表示存在与否的描述及其可信度概率值如表4-2所示),推理中概率的变化及其结合,采用Bayes公式。
在Bayes公式中,涉及3个统计参量估计值:假说(规则)的先验概率估值、充分性度量估值LS及必要性度量估值LN(B ayes方法具体介绍详见下章)。在系统推理网络模型中,每个结点对应一个先验概率估值,它由矿床勘查专家在制定该结点时给出,叶子结点的先验概率直接由用户在选择结点时提供。另外,用LS估值和LN估值表示矿床地质学专家总结每条规则的可信度:LS表示规则的前提条件存在时,规则结论成立的可能性;LN表示规则的前提条件不存在时,规则结论成立的可能性,这2个参数也是在建立每条规则时由矿床勘查专家给出。这3个参数反映了领域专家的知识和经验,且代表了推理网络模型的权威性和可靠性。本系统通过聘请10位国内知名矿产资源评价及矿床地质学领域专家,分别对三个参数独立打分,然后对结果进行统计处理,最终得出每类矿床模型的三个参数值。
表4-2 可信度描述及取值
2.逻辑推理关系
推理网络中有些规则的证据与假说之间是一种逻辑关系,即一种假说的真假值由证据的布尔函数式确定。基本的3种逻辑关系是“与”(and)、“或”(or)、“非”(not)。例如斑岩体中钠长石交代斜长石(E1)、白云母交代斜长石(E2)和绿帘石交代斜长石(E3)3种交代作用地质证据对斑岩体内核心带形成有利(H)关系如图4-9所示,这就是一种逻辑推理关系。H的值为:
H=(E1 or E2)and(not E3)
图4-9 逻辑推理关系示意图
3.顺序推理关系
在断言之间有时会有一定次序,必须按照一定的顺序考虑断言。例如,在考虑*边缘地带的年代之前,首先要确定该地带是否存在,所以系统向用户进行提问及获取事实证据是有选择性的。我们不能去询问一个实际上不存在的地质年代问题。在一般情况下,可以用先后次序关系表达一种条件,只有在该条件满足以后才能将一个断言用在推理之中。例如上例中的边缘地带存在与否和询问某年代是具有先后次序关系的。系统首先要用一切办法建立地带的存在证据,而不能够在某地带存在的概率值小于某个阈值时就询问其年代。所以,一个断言只有在另一个先后次序有关的断言已成立的条件下才有意义。
五、基本推理过程及推理控制策略
1.基本推理过程
在铜矿床模型专家推理系统中,存在多个铜矿床地质找矿模型,而系统的最终目的是要推断出研究区可能产出的铜矿床类型。因此,系统进行推断的基本单位是矿床模型。推理的基本过程是:将观测到的地质证据通过正向推理与系统中的各种模型匹配,并取出其中匹配最好的一个;然后,系统用反向推理全面鉴定这个模型,并得出最终结论,这是本系统的基本推理思路。
2.推理控制策略
推理是指按照某种策略从己知事实出发去推出结论的过程。智能系统的推理过程相当于人类的思维过程,它不仅依赖于所用的推理方法,同时也依赖于推理的控制策略。在计算机科学中,推理控制策略是指让一个程序推理系统能有一种方法,在推理过程的任一点上自动做出下一步如何行进的决定,使用领域知识使推理过程尽快达到目标,此类问题称为“控制策略”问题。由于智能系统的推理过程一般表现为一种搜索过程,推理的控制策略又分为推理策略和搜索策略。推理策略主要解决推理方向、冲突消解等问题;搜索策略主要解决推理线路、推理效果、推理效率等问题。
推理方法按所用知识的确定性可分为确定性推理和不确定性推理。不确定推理按是否采用数值来描述不确定性,可分为数值方法和非数值方法。数值方法研究较多,一般分为两种类型,一类是基于概率论的模型,如确定性理论、主观Bayes方法、证据理论、可能性理论等;另一类是基于模糊逻辑理论发展起来的可能性理论方法,称为模糊推理。
搜索是指根据问题的实际情况,不断寻找可利用知识,从而构造一条代价最小的推理路线,使问题得以解决的过程。可根据问题的表示方式分为状态空间搜索和与/或树搜索。
本系统是根据推理网络和传播概率原理,应用推理规则连接而形成矿床模型,并使推理网络计算机化,最终建成矿床模型推理系统。系统采用的推理方法主要为主观Bayes方法,搜索采用与/或树表示方式。其推理控制策略划分为下列两个阶段:
(1)第一阶段控制策略
在第一阶段中,用户首先向系统提供一批原始观测资料。系统将观测资料与系统中存储的各种矿床模型的规则集依次相匹配,找出匹配成功的矿床模型,作为第二阶段考查目标。
1)如果有多个模型匹配成功时,系统就按模型的可信度概率值的排列顺序,选出可能性最大的模型,或由用户指定一个模型,作为进一步考查的对象。
2)如果没有模型匹配成功(或结论可信度小于某阈值如0.5),则提示用户补充原始观测证据,重新进行上述匹配过程。
第一阶段采用的推理方法为数据驱动的正向推理方法。
(2)第二阶段控制策略
第二阶段控制策略的目的是为上述己确定的模型寻找最有效的证据。其基本方法是:考查目标模型下那些尚未确定的前提断言,寻找对结论影响最大的前提断言,反向考查对应次级前提断言,直至端点(叶子)前提断言,通过人机交互方式向用户询问,以便从用户处获得新证据;之后,系统再在该结论下面找下一个次大的前提断言,然后再重复调用这一过程。显然,新证据的获得将改变结论目标模型的可信度概率值。第二阶段采用的推理方法为目标驱动的反向推理方法。