Study on the Hydration Energy of Metal Ions by Using Artificial Neural Network

Yang Xinghua# , Yin Chunsheng, Cai Wensheng, Li Wei, Pan Zhongxiao
(Department of Applied Chemistry, University of Science and Technology of China, Hefei 230026
#Department of Chemistry, Huaihua Teachers College, Huaihua China 418008 )

Abstract Functional-link net (FLN), a single-layer neural network without the hidden neurons, is employed to estimate and predict the hydration energy of metallic ions, by using a set of atomic structural parameters, such as electric charges (Z), ionic radii (r), electron numbers in the valence layer (f, d, s), principal quantum numbers in the outer-shell (n), electronegativity (XP), and the number of s, p, d empty orbits in valence shell of the metallic ions(NE). The results obtained show a good relationship between the calculated and experimental hydration energy data with a fitting correlation coefficient 0.9995. Hydration energy data of 32 metallic ions lake of experimental data are predicted effectively with the trained FLN.
Key words Hydration energy of Metallic ions, Functional-link net, Thermodynamic parameter, Quantitatively modeling
摘要 采用函数连接型神经网络(FLN),以金属离子的电荷、半径、价电子结构、电负性及空价轨道数NE为输入参数,与51种已知金属离子水化能数据进行了定量关联,并用所建立的非线性FLN模型对32种金属离子的未知水化能作出了预报。
关键词
金属离子水化能 函数连接型神经网络 热力学参数 定量建模


人工神经网络应用于金属离子水化能的研究*

杨兴华# 印春生** 蔡文生 李伟 潘忠孝
(中国科学技术大学应用化学系 合肥
230026
#湖南省怀化师范专科学校化学系 怀化
418008)

         金属离子水化能是金属离子重要的热力学性质参数,不论在基础研究还是在工程计算应用中都经常被加以引用。金属离子水化能数据,通常都由实验测得。迄今为止,文献中报道的金属离子水化能数据尚不完整。在理论上,金属离子的水化能与金属离子的结构有关。不少学者对从理论上计算金属离子的水化能进行过研究[1-4]。文献[1,2]较早从离子极化角度提出了一套金属离子的水化能的计算方法。文献[3]进行了改进,并将计算的离子数目从30个扩大到51个。文献[4]侧重对镧系金属离子水化能进行了一些计算研究。本文对金属离子水化能与其结构之间的关系进行探讨,采用人工神经网络方法进行结构-性能关系建模,对金属离子水化能进行了有效预测,获得相当好的结果,表明本文所采用的原子结构参数可对金属离子水化能作准确估计和定量预测。对目前尚缺的32种金属离子的水化能数据进行了预报,具有一定的参考价值。
1 函数连接型神经网络原理
    人工神经网络是建立在现代神经科学研究成果基础之上的一种抽象的数学模型。它模仿人脑处理信息,具有自学习、自适应与高度非线性表达能力,近几年已在化学研究中获得了广泛的应用[5]。不过,目前在化学研究中绝大多数采用的是误差反向传播算法(BP)[6]。本文采用的是Pao[7]提出的一种新型神经网络——函数连接型网络(FLN),它克服了BP算法的某些固有缺点:如学习速度慢、易陷于局部极小以及难以确定隐含层结点数等。它采用函数连接增强的方式,即把原始模式的分量或原始模式本身作为自变量,求出一组线性无关函数的估计值来作为新增输入模式的值,因而在某种意义上,在没有加入任何新的“特定”信息的前提下增强了模式表达,从而在增强的模式空间获得更好的可分性。同时由于它的算法简洁及没有隐含层,大大提高了学习速度。FLN在处理化学中的分类、校正等问题时均显示出良好的特性[8-9]FLN对原始信号矢量进行增强的方式有三种:卷积型(即联合激励型)、函数扩展型和两者的复合型。设原始模式可表示为S1, S2, . . . , SM则采用联合激励增强方式所产生的增强模式示于图1中。

  

c0003902.gif (1770 bytes)

增强的模式空间

c0003901.gif (856 bytes) c0003901.gif (856 bytes) c0003901.gif (856 bytes)

卷 积 增 强

c0003901.gif (856 bytes)

S1,  S2, . . . ,  SM

原始模式空间


1 FLN的联合激励增强模式

        在图1中,分别称为二阶,三阶和M阶联合激励。M是原始模式数,K是卷积的秩。本文使用了三阶联合激励模型。激活函数为Sigmoid函数,采用推广的d规则学习。FLN的具体算法如下:
(1) 对原始输入 进行非线性增强变换生成新的模式:

  (1)

式中,M为原始模式数,N为增强后的模式数,即FLN中的输入层节点数。必须注意,要消除增强后的数据冗余度,控制扩展后的输入层节点数接近于训练样本数。
(2) 计算输出层的净输入:

  (2)

式中,Netpj是样本p在输出节点j的净输入。Wji是输入层节点i和输出层节点j之间的权重。 Inpi是样本p在输入节点i处的输入。
(3) 计算输出层的输出:

    (3)

式中,Outpj是样本p在输出节点j处的输出。

(4) 定义目标输出与实际输出之差:

  (4)

式中,Targetpj是样本p在输出节点j的目标输出, Outpj是实际节点输出。所有样本的总均方差定义为:

  (5)

式中,J是输出层的节点数。
(5) 权重及阈值的调节:

  (6)
(7)

式中, 是输出层的节点j和输入层的节点i间的权重调节量。 是输出层的节点j处的阈值调节量。h是学习速率,a是动量因子, t(t-1)分别代表当前和上一次的迭代次数。
2 参数选择
    金属离子的水化能是气体金属离子溶于大量水中成为无限稀释溶液时释放出来的能量。水化过程实质上主要是极性的水分子受金属离子正电势场引力作用而在金属离子周围配位,形成水合离子的过程。一般地说,金属离子正电势场越强(也可以说成金属离子的极化能力越强,通常以Z2/r表征),形成的水合金属离子就越稳定,放出的能量也越多。其次,还需考虑下列因素的影响:(1) 水合离子的配位数及配位场稳定化能的影响;(2) 附加极化作用(或共价作用)的影响。
    对于水合离子的配位数,目前尚无完整的数据可引用,本文使用参数NE=价层spd空轨道总数,表征不同的水合金属离子配位数的差异。研究表明,配位场稳定化能和附加极化作用都与金属离子的价层电子结构有关。而其中附加极化作用增强,将导致水分子中的O原子与M离子之间出现较强的共价作用。共价作用的强度在微观上与M离子的价层电子结构有关,在宏观上则可借M-O原子间的电负性差值image72.gif (916 bytes)来量度。根据鲍林[10]的观点,成键原子间的电负性差值image72.gif (916 bytes)是一个键离子性分数的标尺,也即是共价程度的标尺。O原子的XP值为3.50,一般金属的XP值远小于3.50。一些金属的电负性较大,此时M-O之间的共价作用就不能忽略。而且,金属的XP值愈大,image72.gif (916 bytes)愈小,共价作用愈强。其结果是增大了M与水分子的结合力,并释放出更多的能量。因此,本文将金属离子(元素)的XP值也作为金属离子的水化能的一个关联因子。
    综上所述,可以把金属离子的水化能(image71.gif (890 bytes))看作是其电荷Z、半径r、价层(fds)电子数及最外层电子的n值、鲍林电负性值XP和空价轨道数NE等的复杂函数。

  

H=F(n,f,d,s,r,Z,XP,NE)

(8)

Zr等因子则作为神经网络的原始输入模式。

1 32种金属离了水化能FLN预测结果

No.

M(Z) DataFLN No. M(Z) DataFLN
1 Al(3) 40.9284 17 U(4) 59.9977
2 Am(3) 32.5615 18 Y(3) 36.3916
3 Be(2) 27.6792 19 Yb(3) 35.4977
4 Bi(3) 38.1528 20 Zr(4) 64.2275
5 Cf(3) 32.2340 21 Pt(4) 68.4409
6 Cm(3) 32.3865 22 Au(3) 38.4978
7 Eu(3) 34.3037 23 Sb(3) 34.7825
8 Pm(3) 33.9419 24 Ac(3) 32.4711
9 Pu(3) 32.5561 25 Pa(3) 31.3851
10 Pu(4) 62.9547 26 Np(3) 32.5576
11 Ra(2) 10.4216 27 Bk(3) 32.4052
12 Sc(3) 40.7528 28 Es(3) 32.0624
13 Sm(3) 34.2354 29 Fm(3) 32.0898
14 Tb(3) 34.7155 30 Md(3) 32.1277
15 Th(4) 60.6070 31 No(3) 32.1676
16 Tm(3) 35.4134 32 Lr(3) 32.2184
DataFLN:金属离子化能的FLN预测结果

        本文使用的FLN程序用C语言编写,在Pentium 586/100微机上运行。
3. 结果和讨论
3.1 结果
    51个已知水化能数据的金属离子样本[1]构成工作样本集。在51个已知样本中,挑选了
Co2+8个样本为测试集,其它43个为训练集。经过调优后,网络对样本拟合良好,如图2所示。显然,这一结果令人满意。在此基础上,对32个未知样本作出了预测,结果列于表1中。
    为防止过度训练,采用以测试集监控训练集的训练过程的方法,即当测试集的均方根误差从最小点开始增大时,停止迭代。该点对应的连接权重作为网络的最佳数学模型。
3.2 问题和讨论
    从图2可以看出,本文的计算值与文献报道的实验值[1]的线性相关情况非常好。作为一种非线性优化方法,人工神经网络方法的成功取决于对正确模式和正确样本的选择。计算结果表明,本文所选择的模式是合理的,对金属离子结构与其物理化学性质之间进行定量建模是可行的。考察学习样本,已涵盖了1-4价的各种类型离子,因此,对这一范围内32种(未知)金属离子水化能的预测应该认为是可信的,具有一定的参考价值。

   
2 51个金属离子水化能计算值与实验值相关关系图
R=0.9995; SD=0.4895; N=51

4 参考文献
[1] 温元凯,邵俊,离子极化和离子水化能,科学通报, 1976, (2), 84
[2]
温元凯,邵俊,离子极化和金属离子水化能规律性,科学通报, 1977, (6), 267
[3]
周志华,离子极化与金属离子水化能和水解常数的计算法,化学通报, 1978, 5: 291-294
[4]
吴启勋,祁正兴,潘国庆等,镧系元素的键参数拓扑指数及其应用,化学通报, 1998, 4: 44-46
[5] Zupan J, Gasteiger J. Neural networks: A new method for solving chemical problems or just a passing phase? Anal. Chim. Acta., 1991, 248, 1-30
[6]
邓勃,莫华,人工神经网络及其在分析化学中的应用,分析试验室, 1995, 14(5): 88~94
[7] Pao Y H. Adaptive Pattern Recognition and Neural Networks, Addison Wesley, 1988
[8] Pan Z X, Wang Y M, Xiong J H, et al, Application of functional-link net to the prediction of the age of ancient porcelain glaze, Microcomputer Applications, 1997, 16(3): 115-117
[9]
印春生,黄道昌,吴孔导等,函数连接型神经网络应用于维生素B族四组分同时测定,分析科学学报,1999, 15(5): 1-5
[10] L.
鲍林著,卢嘉锡译,化学键的本质,上海科学出版社, 1966
[11] John A D, Edited, Lange
s Handbook of Chemistry(Eleventh Edition), New York: Mcgraw-hill Book Company, 1973


国家自然科学基金(29775001)资助课题;**联系人 1999-05-15收稿,99-10-18修回