Study on Pyrolysis Gas Chromatography(PGC) Expert System of Polymers

Yang Rui, Shi Qiao, Gao Di, Wang Kunhua
(Department of Chemical Engineering, Tsinghua University, Beijing 100084)

Abstract The PGC analysis of polymers, such as selection of operation condition, interpretation of pyrograms, etc., is very difficult, it must based on experts' experiences because of polymer's complexity, e.g. branching, grafting, copolymerization and so on. A PGC expert system of polymers is developed for qualitative and quantitative analysis of polymers. The qualitative analysis can be achieved by two means: searching from PGC database and intelligent interpretation, the latter can give helpful information about structural features through the analysis of fragments derived from pyrogram of polymers. A standard PGC database is available for searching and knowledge acquisition. The knowledge base is composed of fragment table, peak distribution table and rule table. Forward reasoning and production rule are adopted in this system and the term "uncertainty" is introduced to deal with lots of experiential knowledge of polymers. Furthermore, there are explanations for conclusion so that users can understand the solution course of problem clearly. The PGC expert system can also improve its property with an increasingly perfect knowledge base by self-study.
Key words polymer, PGC, expert system

摘要 聚合物样品的复杂性使得其裂解气相色谱(
PGC)谱图分析在很大程度上要依赖专家的经验,聚合物PGC专家系统可以对聚合物样品谱图进行标准化后,通过智能解析得出有关聚合物结构和组成的信息,并具有自动学习功能。
关键词 聚合物 裂解气相色谱 专家系统


聚合物裂解气相色谱智能解析专家系统

杨睿 石桥 高地 汪昆华
(清华大学化工系高分子研究所 北京
100084)

1 引言
    裂解气相色谱(PGC)用于分析聚合物有许多优点,如分析速度快,灵敏度高,样品用量少且无需预处理,价格低廉等,因此在分析聚合物方面,尤其是不熔不溶的热固性材料和橡胶类制品具有明显的优势。目前多采用高分辨裂解气相色谱(HRPGC)以提高分离效率1。但由于样品的复杂程度越来越高,针对一个具体的样品,寻找合适的分析条件,并对谱图进行定性定量分析,还需要高水平的专家参与。随着计算机和人工智能技术的发展,有可能把专家的知识和经验编制成计算机软件,由计算机来解决以前需要专家才能解决的问题[3-6]。我们通过多年的努力,解决了聚合物裂解气相色谱图的标准化问题[7],建立了聚合物PGC专家系统。通过对这一领域专家经验和理论知识的总结,采用适当的推理机制,帮助分析工作者完成复杂的谱图解析问题。
2 聚合物PGC专家系统的组成
    和所有的专家系统一样,聚合物PGC专家系统的组成主要包括四个部分:知识库(包括事实库和规则集);推理机(又称推理引擎);人机接口(即用户界面,信息输入及结果输出)和辅助部分(数据的采集和处理,解析结果的解释)。其中知识库和推理机部分是专家系统的核心。
3 谱图智能解析
    在聚合物PGC专家系统开发以前,定性分析所采用的方法主要是检索,就是计算未知谱图和标准谱图库中谱图的相似性系数,给出未知谱图的检索结果。已建成的标准谱图库包括十一大类数百种经过标准化的聚合物样品。相似性系数定义如下:
   
其中是峰位相似性系数,是峰强相似性系数,是峰的权重。
    谱库检索方法简单有效,可以得到谱图相似程度的信息,但缺点是峰的权重难以定义,而且对于谱库中没有的谱图,得不到关于结构的信息。因此在专家系统中,除了保留谱图检索的方法外,又进行了谱图智能解析研究。
    未知谱图的智能解析实际上就是利用知识库,对未知谱图进行特征提取,得到碎片表和峰分布特征表,然后根据规则表中的规则,按照一定的推理机制进行推理,最后得出结论的过程(图1)。

   c0004705.gif (3683 bytes)
1 未知谱图的解析过程

3.1 知识库
    知识库是聚合物PGC专家系统各项功能的基础,它的正确和完善与否有着至关重要的影响。它由三个部分组成:特征碎片表、峰分布特征表和规则表。
3.1.1 特征碎片表
    特征碎片表说明聚合物裂解产生的特征碎片的归属,保留值和样品所属的聚合物类别。以聚甲基丙烯酸甲酯(PMMA)为例,它的特征裂解产物为甲基丙烯酸甲酯,保留指数在700左右(表1)。

1 特征碎片表的结构
碎片代码

类别

碎片名称

保留指数

MMA

BXS

甲基丙烯酸甲酯

700

· · ·

· · ·

· · ·

· · ·

3.1.2 峰分布特征表
    峰分布特征表说明了聚合物裂解谱图分布上的特征。如烯烃类聚合物以无规断裂为主,裂解碎片在全谱图上都有分布;PMMA以解聚断裂为主,裂解碎片主要为单体峰(例见表2);聚苯乙烯(PS)无规断裂和解聚断裂相结合,裂解碎片按单体区、二聚体区和多聚体区分布。

2 峰分布特征表的结构

峰特征
代码

类别

保留指数
下界

保留指数
上界

相对浓度
下界

相对浓度
上界

峰数
下界

峰数
上界

解释

PMMA

BXS

600

3000

0.05

1

1

1

保留指数在600以上,相对浓度大于0.05的峰只有一个

· · ·

· · ·

· · ·

· · ·

· · ·

· · ·

· · ·

· · ·

· · ·

3.1.3 规则表
    规则表说明如何由特征碎片信息和峰分布信息推理出有关聚合物结构和组成的信息,由前提和结论两部分组成,形式见表3

3 规则表的结构

规则
编号

类别

前提

是否
OR

结论

是否
输出

置信度

解释

1

BXS

{peak_PMMA}
{frag_s_MMA}

聚甲基丙烯酸甲酯

1

聚甲基丙烯酸甲酯的裂解主要以解聚方式进行,谱图上保留指数在600以上的区域只有MMA一个强峰

· · ·

· · ·

· · ·

· · ·

· · ·

· · ·

· · ·

· · ·

其中peak_PMMAfrag_s_MMA分别表示PMMA裂解谱图的峰分布特征和特征碎片。置信度表示当前提为真时结论的可信程度,由推理过程计算得到。解释可以帮助用户理解专家系统的结论,并学习聚合物裂解的相关知识。
    规则是按其适用的聚合物分类的。在解析谱图时,这种分类使得系统可以根据用户提供的聚合物类型挑选适用的规则,同时这种分类也有利于规则库的管理。
3.2 特征提取
    特征提取是从未知聚合物裂解谱图中获取事实的过程,即根据特征碎片表得出谱图中可能存在的碎片,根据峰分布特征表得出谱图分布的特征对应的聚合物类别,并将结果写入数据库。数据库用于存储这些事实和推理过程中得到的各种中间信息,并在推理过程中动态更新。
    由于许多碎片都具有相似的保留指数,因此在特征提取过程中会得到一些多余的碎片信息,但这并不影响推理结果。因为每一条规则都要考虑多个关联的碎片,因此推理过程会对所有碎片进行筛选,无用的碎片自然会被放弃。
    为了增加结果的可靠性,系统允许用户在特征提取结束后对数据库中的原始事实进行增加、删除和修改,放弃一些明显无关的结果等。
3.3 推理
3.3.1 推理过程
    对于谱图智能解析来说,采用正向推理方式是较为合适的,因为正向推理可以由已知条件推出所有可能的结论,不会遗漏信息。
    系统从规则表中逐条读出规则,将其条件与数据库中的事实进行匹配,若匹配成功则将结论写入数据库。对规则表中所有的规则完成一次扫描后,检查数据库中是否有新的事实产生。如果有,则对未触发过的规则进行再次扫描,因为新的事实有可能满足这些规则的条件。如此反复直到不再有新事实产生为止,此时得到最终结论(如图2)。
3.3.2 不确定性推理
    由于知识库中包含大量的经验知识,具有“不精确”的特征,其推理过程也常常是合情推理,而不是严密的逻辑推理。例如我们常说:“某碎片的峰很强”或“由条件1很可能得到结论1”等等。因此在进行知识表示和进行推理时,我们采用了模糊处理方法,即设置事实、结论和规则的置信度和规则激活阈值(只有当事实与前提条件的匹配度大于此阈值,规则才有效)。
    由于特征碎片的保留指数和峰强有一定的误差范围,因此在进行特征提取时采用模糊化处理方法,以得到特征碎片事实的置信度。
    峰位模糊化是将保留指数偏差定义为对称梯形分布,置信度随偏差绝对值的增大而减小。峰强模糊化是将峰强分为强、中、弱三等,分别对应不同的偏差分布函数,同样置信度随偏差绝对值的增大而减小。因此,一个事实的置信度就是峰位置信度和峰强置信度的乘积。
    进行推理时,首先根据事实运用规则得到结论,并由事实的置信度和规则的置信度求出结论置信度,当它大于系统设定的置信度阈值时,该规则匹配成功,结论写入数据库,作为新的事实进入下一次推理或成为结论。将推理结论加入数据库时要考察两种可能:(1)数据库中没有该结论,则直接将其描述与置信度写入数据库。(2)数据库中已有该结论,则更新结论的置信度,算法为
        CF'(X)=CF(X)+(1-CF(X))×CFi(X)
    其中,CF(X)CF'(X)分别是数据库中事实X更新前后的置信度,CFi(X)是由当前规则得到的结论X的置信度。这种算法保证了由不同规则得到同一结论时,结论的置信度会提高。
3.3.3 推理的解释
    谱图智能解析的解释功能可以就推理过程和结论的原因向用户提供咨询,帮助用户掌握相关知识。
推理的解释是这样实现的:
    ·数据库中的事实都具有一个描述部分,当推理过程中向数据库添加事实的同时,也加入相应的解释信息。
    ·推理结束后,根据得出的结论筛选数据库,输出相应的事实描述。
    ·每条规则都有相应的解释部分,便于用户理解规则的含义。
    通过以上步骤,专家系统在输出结论的同时就输出了结论和相关推理过程的解释。

   c0004706.gif (8456 bytes)
            图2 推理过程流程图

4 学习
    一个好的专家系统应该具有学习功能,使知识库不断更新和完善,系统功能更加强大。学习功能的实现有两种方法:机械学习和自动学习[3]。但由于自动学习要求智能化程度较高,一般难以实现,因此大多采用机械学习方式,由专家系统的开发者不断将更新的知识输入知识库中。我们根据大量聚合物样品的实验结果,参考文献谱图[2],采用分级方式总结从个性到共性的规律,不仅建立了专家系统规则表,而且初步开发了聚合物PGC专家系统的自主学习功能。系统的学习过程可以看作是特征提取的逆过程,通过比较大量同类聚合物裂解谱图,找出某一类聚合物的特征碎片峰组,并将其作为新的规则加入知识库。此外,在推理过程中产生的一些中间结论也可以成为新的规则。例如苯乙烯类聚合物特征峰规则的总结过程见图3

    c0004707.gif (4342 bytes)
3 特征峰规则导出示意图

        为了防止系统将自主学习可能产生的错误结论加入知识库,所有这些过程都允许系统管理员(即专家)对学习的结果进行修改和增删。
5 参考文献
[1] 傅若农,刘虎威. 高分辨气相色谱及高分辨裂解气相色谱. 北京:北京理工大学出版社,1992.
[2]
柘植新,大谷肇. 高分辨裂解气相色谱原理与高分子裂解谱图集. 北京:中国科学技术出版社,1992.
[3]
林尧瑞,张钹,石纯一. 专家系统原理与实践. 北京:清华大学出版社,1988.
[4]
王克宏,汤志忠,胡蓬等. 知识工程与知识处理系统. 北京:清华大学出版社,1994.
[5]
王能斌. 数据库系统. 北京:电子工业出版社,1994.
[6]
李霞,沈精虎. Visual Basic数据库应用程序开发指南. 北京:人民邮电出版社,1997.
[7]
杨睿,刘松涛,汪昆华. Chemistry Online. 1999, 13032.


杨睿 女,28岁,讲师,硕士,主要研究领域包括聚合物结构的表征,反应动力学、老化、降解等过程的研究,热固性树脂的改性。