The Development of Studies on Hydrophobic Interactions

Ting Wang, Jiaju Zhou
(Laboratory of Computer Chemistry(LCC), Institute of Chemical Metallurgy,Chinese Academy of Sciences P.O. Box 353 Beijing 100080, China)


Abstract Hydrophobic interaction is one of the most important nonbonded interactions which determine protein folding and ligand-receptor binding. The nature and the descriptions of hydrophobic interaction are reviewed in this paper.
Key words Nonbonded interaction,Hydrophobic interaction, Partition coefficient, Hydrophobic field
摘要
疏水作用是重要的非键相互作用,在蛋白质结构预测和药物分子设计中有重要应用。本文简述了目前对疏水作用本质的认识及相关研究发展。
关键词 非键相互作用 疏水作用 分配系数 疏水场


疏水作用及其研究进展

王亭 周家驹
(中国科学院化工冶金研究所计算机化学开放实验室 北京 100080)

    疏水作用是决定生物分子的结构和性质的重要因素,特别是在蛋白质的折叠,药物分子与受体(蛋白质、DNA等)的相互作用中扮演着重要的角色[1-3]。至少50年来,药物化学家始终相信疏水作用是药物的非极性区域与受体的非极性区域之间最重要的作用。疏水作用与氢键作用,静电作用,范德华作用同属非键作用,但是人们对前三种相互作用的研究比较深入,都已经有了得到普遍认可和广泛使用的原子水平的势函数表达式[4]。而疏水作用的研究则进展缓慢,至今仍然是一个研究热点和难点。本文主要介绍目前人们对疏水作用本质的认识以及以分配系数和疏水场表达疏水作用的研究进展。
1 疏水效应和疏水作用

    非极性化合物例如苯、环己烷在水中的溶解度非常小,与水混合时会形成互不相溶的两相,即非极性分子有离开水相进入非极性相的趋势,即所谓的疏水性(Hydrophobicity),非极性溶质与水溶剂的相互作用则称为疏水效应(Hydrophobic effect)[1,5]。在常温下(25° C),非极性溶质溶于水焓的变化(DH)通常较小,有时甚至是负的,似乎是有利于溶解的;但是非极性分子进入水中会导致周围水分子呈有序化排列使熵大量降低(DS<0),自由能的变化(DG)最终是正值。因此25°C时疏水效应是一种熵效应,低溶解度是由于熵的减少。对于疏水溶质周围有序化的水分子外壳,早期的研究[1]认为是一种类似“冰笼”一样的结构,其中生成了更多更强的氢键,但是后来的热力学理论计算[6-7]和中子散射实验[8]却表明水化层中的氢键反而更少。
    为了减少有序水分子的数量,非极性分子有聚集在一起形成最小疏水面积的趋势,保持这些非极性分子聚集在一起的力则称为疏水相互作用(Hydrophobic interaction) [1,5]。疏水作用的强度与非极性分子之间的任何内在吸引无关,受系统获取最大热力学稳定性驱动。一般来说,非极性区域(或称疏水基团)越多,面积越大,则疏水作用越强;温度升高则疏水作用增强[5]。疏水作用最直观的表现是类脂等两亲性分子在水中形成稳态胶束(miscell)以及蛋白质在水中的折叠(Folding)。
    这里要指出的是,对于疏水效应和疏水作用这两个概念的定义还存在一些争议,但是有两点是得到大家公认的[9-11]:1. 在25° C非极性溶质的水合作用是受水分子有序化产生的熵效应阻止的。2. 疏水分子或疏水基团在水中是相互吸引的。
    目前人们对疏水效应的物理起因还没有达成一致认识,但是近年逐渐趋向于这样的看法[12]:水中的氢键重排补偿了疏水效应中少量的焓变和较大量的熵变,因而使疏水溶质也能在水中有少量的溶解度。而对于疏水作用则普遍认为是通过打破疏水溶质周围水分子的有序结构导致熵的增加而获得热力学稳定性的,即疏水作用在25° C时是熵驱动的 [13-15]
    疏水基团之间的相互作用通常被认为是没有方向性的,但是最近对剑桥晶体结构数据库(CSD)和蛋白质晶体结构数据库(PDB)的研究发现[16],疏水作用是有方向倾向性的。例如,富电子的吲哚芳环与苯环通常以边对面的T型方式接触图1(a),而缺电子的恶唑环则多与苯环面对面地平行接触图1(b)。

a b
图1 a)吲哚(下)与苯环(上)边对面T型接触   b)恶唑环(下)与苯环(上)面对面平行接触

     近年的研究还发现,非极性基团芳环的p 电子可以与水分子形成弱的氢键[17],从而增加了芳香化合物在水中的溶解度,芳环的p 电子还可以与Na+K+等阳离子形成较强的非共价键相互作用[18]。这些研究有助于进一步揭示疏水效应和疏水作用的本质。
2 分配系数
  疏水性在药物的吸收,血浆蛋白的结合,药物-受体相互作用以及药代动力学中都是需要考虑的重要物化性质,因此对疏水性的定量描述是非常重要的。
由于疏水效应与溶剂分配现象有关,通常将分子在水-正辛醇体系中的分配系数logP作为疏水性的度量,选择水-正辛醇体系的重要原因是由于该体系与生物体系相似。

logP定义如下:
,Co是分子在正辛醇中的浓度,Cw是分子在水中的浓度
   logP值可以通过实验测定,但是实验方法远远不能满足QSAR研究和分子设计的需要,因为要涉及许多假想的分子。因此,过去三十年来,用各种参数计算
logP一直是QSAR研究的重要内容,即使在最近也仍然有新的logP计算方法发表[19]
    logP的计算可以追溯到1964年,Fujita, IwasaHansch[20]首次提出可以从分子结构预测 logP ,并以取代基和母体的logP差值定义基团的p 常数,从而可以由母体logP与各取代基的p 常数加和计算取代物的logP值,即:
     logP取代物 = logP母体 + p 取代基a + p 取代基b + p 取代基c + .....
Fujita等人的开创性工作之后,Rekker[21]Hansch , Leo[22]提出了一套基团疏水片段值,仍然以加和的方式计算logPAbraham Leo[23]又将片段方法扩展到计算氨基酸和侧链的分配系数。但是,利用这些片段参数的简单加和计算logP是不够的,还需要考虑溶质的一些特别结构因素,主要有空间因素,极性基团的邻近因素,键因素以及立体化学因素,即Leo修正因子。KelloggAbrahamHINT程序[24]则将Hansch, Leo的片段参数简化成了原子参数,并且结合了原子的溶剂可及表面积和距离函数,因此计算的logP值不仅依赖于分子结构还与分子构象有关。
      1986年,Ghose Crippen[25]提出了一套精细的基于原子水平的疏水参数,根据原子周围电子分布和原子的溶剂可接近能力将碳,氢,氧,氮,硫,卤素等元素分成110种原子类型,即110个原子疏水参数(参数数目后来有所发展),数据来源于494个分子的水-正辛醇分配系数实验值。这些基于原子的参数已经得到了广泛的应用,成为许多计算logP的方法和程序的基础。
     基于结构的参数方法虽然已经得到了广泛的使用以及发展,但是缺乏物理基础。参数值强烈依赖于训练集,在使用中会遇到某些原子
/片段类型没有定义而无法计算的情况。因此,一些基于分子性质而非结构片段的方法发展起来了。例如,Klopman[26]利用分子电荷,Bodor[27]BLOG方法利用分子的电荷,偶极矩和分子表面积等性质。这些方法仍然是一些经验模型,同样受到训练集的限制。
    在理论上令人满意的方法应该是直接模拟水和有机溶剂中的溶质。一旦转移自由能D
Gtransfer确定了,logP的计算就很简单了,因为logP = D Gtransfer /-2.303RT。理论计算方法主要有分子动力学(MD) [28]Monte Carlo(MC) [29],但是这些方法都有计算复杂、计算时间太长的缺点。近年,连续溶剂化模型(Continuum Solvation Model) [30]也被用于计算logP,并且比MDMC模拟更为简单有效。
     1996年,MannholdDross[31]对目前常用的14logP计算方法和程序进行了详细的比较,见表1。分别计算了138个有机分子的logP值,并与其实验值比较。这138个分子中有90个普通分子,48个不同化学类型的药物分子。

表1 14种计算logP的方法和程序

方法 作者 原理
ASCLOGP Ulmschneider 基于近似表面计算,并依赖构象
CLOGP Hanch/Leo 基于片段
HINT Abraham,Kellog 基于原子和疏水势,依赖构象
KLOGP Klopman 基于片段
KOWWIN Meylan,Howard 基于原子和片段
MOLCAD Ghose/Crippen 基于原子
PROLOG_atom Ghose/Crippen 基于原子
PROLOG_cdr Rekker 基于片段
PROLOG_comb Darvas,Csizmadia 基于原子和片段
SANALOGP_ER Rekker 基于片段
c9900811.gif (861 bytes)f-SYBYL Rekker 基于片
SMILOGP Dubost 基于原子
Tsar2.2 Ghose/Crippen 基于原子

    结果发现,基于片段的方法比基于原子和依赖构象的方法有显著的优势。而且,计算程序对普通分子的预报能力要高于不同化学类型的药物分子。
3 疏水场
     分配系数logP值是对分子整体疏水性质的定量表示,但不能描述分子的局域疏水性。而局域疏水性对于确定受体的活性位点和药物分子的药效团是很重要的。活性位点通常由氢键给体,氢键受体以及疏水作用位点组成,根据分子结构容易确定氢键位点,但对疏水位点定位却需要定量的方法。因此便有了疏水场[32]概念的提出,并且以溶质从有机液体到水的转移自由能来定义。
     由于疏水作用不是疏水残基相互之间直接显示的作用力,因此有许多科学家认为疏水作用本质上不是一种力,还有人认为非极性相互作用属于标准的Lennard-Jones 作用。因此,疏水场的概念并不象其它标准力场容易被理解和接受,甚至在分子力学和分子动力学的能量计算中都没有疏水力场参数。
     场在物理上的定义是,被某种物理性质特征化的空间区域,每一点都有可测量的值。因此从转移能定义的疏水场概念有其合理性,而且,场这种表达方法可以为从原子水平理解和预测生物分子之间的相互作用提供实用模型。疏水场与其它力场的重要差别在于转移现象和疏水作用包括熵的贡献,而熵在大多数模型化方法中常常被忽略。
     为了描述疏水性在空间的分布,很自然的想法是将疏水参数与距离关联起来,这便是Audry及合作者[33]提出的分子亲油势(MLP)的概念。MLP的计算以由能量最小化或X射线晶体结构决定的最低能量构象为基础。
   
    这里,n是原子数,fi是第i个原子的亲油贡献,dij是原子i和j的拓扑距离。
    但是Furet等人[34]的报道指出,fi值不基于定义好的化学片段形式,因此MLP的实际应用有限。为了使这个概念有广泛的实用价值,Furet等人的MLP修正形式采用了Ghose 和 Crippen 的原子疏水参数。尽管MLP的距离函数缺乏物理基础,但是通过MLP的三维可视化可以获一些有用的结果。
     Fauchere[35]根据Rekker, Hansch和Leo发现的基团邻近效应将MLP中的距离函数改成了指数形式:MLP ~ exp(-d),并且用于分析药物分子和受体的相互作用。但是该距离函数仍然缺乏物理基础。
    前一节提到的HINT程序[24]也可以计算疏水性在空间的分布,并将其可视化。在空间某点t的疏水值At表示为:
   
    si是原子i的溶剂可及表面积,ai是疏水原子常数,r是原子i与空间点的距离,通常取Rit = e-r
    1993年Heiden[36]等人提出了一种将原子疏水参数fi投影到分子的溶剂可及表面的方法,简称MHM方法(Molecular Hydrophobic Mapping)。MHM函数形式为:
    
     di是表面点到原子i的距离,函数g*(di)由距离d确定。当d < dlower, g*等于1,当d > dupper , g*趋向于0,当dlower < d < dupper时g*在0和1之间均匀变化。dlower和dupper 是控制基团邻近效应的经验参数。MHM方法相当于把原子疏水参数加上权重后投影在分子表面上,因而适合于定性讨论分子的局域疏水性。
  
  为了定量计算疏水性在分子表面的分布,Pixner[37]等人将MHM方法扩展到沿分子的溶剂可及表面积分,计算转移自由能D Gtransfer
    
    其中x (r)代表每单位表面的转移自由能,称为自由能表面密度,其函数形式与Heiden的MHM函数类似。因此局域疏水性可以表示成:
   
    其中,oi是与局域i有关的表面元素。
    将疏水场与传统的立体场和静电场结合可以为3D-QSAR研究提供更加准确的模型,已有多篇文献报道了在CoMFA分析中引入疏水场能够提高模型的解释能力和预报能力[38-39]。而且,疏水场的三维图形显示可以更加直观地理解药物与受体以及生物大分子之间的相互作用。
4 结束语
    疏水作用由于涉及到热力学中的难点-熵效应,因而建立简单有效的物理模型有一定难度。然而,疏水作用作为驱动蛋白质在溶液中折叠并且稳定药物分子与受体复合物的重要因素,深入研究的重要意义是不言而喻的。在药物分子设计中常常会遇到这样的情况,在受体蛋白晶体结构甚至药物分子与受体复合物结构已知时,仍然难以解释结合能与活性之间的关系,这其中的重要原因就是溶剂化效应和熵效应没有得到合理的考虑。可以预言,疏水作用研究的不断深入将对药物分子设计发展起着关键作用。
5 参考文献
[1] Tanford C. The Hydrophobic Effect: Formation of Micelles and Biological Membranes. New York: Wiley, 1980.
[2] Dill K A. Biochemistry, 1990, 29: 7133-7155
[3] Tanford C. How Protein Chemists Learned About the Hydrophobic Factor. Protein Sci., 1997, 6: 1358-1366
[4] Wade R C. In Kubinyi H.(Ed.) 3D-QSAR in Drug Design: Theory, Methods and Applications, ESCOM. Leiden, 1993, pp. 486-505
[5] Creighton E. Protein-Structures and Molecular Properties, Freeman, New York, 1993.
[6] Jorgensen W L, Gao J and Ravimohan C J. Monte Carlo Simulations of Alkanes in Water: Hydration Numbers and the Hydrophobic Effect. J. Phys. Chem. 1985, 89, 3470-3473
[7] Van Belle D and Wodak S J. J. Am. Chem. Soc. 1993, 115: 647-652
[8] Finney J L and Soper A K. Chem. Soc. Rev. 1994,1: 1-10
[9] Dill K A. The Meaning of Hydrophobicity. Science, 1990, 250:297-298
[10] Herzfeld J. Understanding Hydrophobic Behavior. Science, 1991,253: 88-90
[11] Ben Naim A. Hydrophobic Interaction. Plenum Press, New York, 1980
[12] Lee B,Graziano G. A Two-State Model of Hydrophobic Hydration that Produces
Compensating Enthalpy and Entropy Changes. J. Am. Chem. Soc. 1995,118: 5163-5168
[13]  Lehninger A L, Nelson D L and Cox M M. Principles of biochemestry, Worth Publishers, New York, 1993
[14] Nicholls A, Sharp K A and Honing B. Protein Folding and Association: Insights from the Interfacial and Thermodynamic Properties of Hydrocarbons. Protein, 1991, 11: 281-296
[15] Sharp K A, Nicholls A, Friedman R and Honing B. Extracting Hydrophobic Free Energies From Experimental Data: Relationship to Protein Folding and Theoretical Models. Biochemistry, 1991, 30:9686-9697
[16] Bruno I J, Cole J C et al. IsoStar: A library of information about nonbonded interactions.J. Comput.-Aided Mol. Design, 1997, 5: 545-552
[17] Ruelle P et. al. Enhancement of the solubilities of polycyclic aromatic hydrocarbons by weak hydrogen bonds with water. J. Comput.-Aided Mol. Design. 1992, 6: 431-448
[18] Dougherty D A. Cation-p Interactions in Chemistry and Biology: A New View of Benzene, Phe,Tyr, and Trp. Science, 1996, 271:163-166
[19] Wang R, Fu Y, Lai L. A New Atom-additive Method for Calculating Partition Coefficients.
J. Chem. Inf. Comput. Sci. 1997, 37: 615-621
[20] Fujita T, Iwasa J, Hansch C. A new substituent constant, p , derived from partition coefficients. J. Am. Chem. Soc., 1964, 86: 5175-5180
[21] Rekker R F. The hydrophobic fragmental constant. Its derivtion and applications. A means of characterizing membrane systems, Elsevier, New York, 1977.
[22] Hansch C, Leo A J. Substituent Constants for Correlation Analysis in Chemistry and Biology, Wiley and Sons, New York, 1979, pp,1-339.
[23] Abraham D J, Leo A J. Extension of the fragment method to calculate amino acid zwitterion and side chain partition coefficients, Proteins, 1987, 2:130-152.
[24] Kellogg G E, Semus S F, Abraham D J. HINT-A new method of empirical field
calculation for CoMFA, J. Comput.-Aided Mol. Design, 1991, 5: 545-552
[25] Ghose A K, Croppen G M. Atomic physicochemical parameters for three-dimensional structure-directed quantitative structure-activity relationships. 1. Partition coefficients as a measure of hydrophobicity, J. Comput. Chem., 1986,7: 565-577.
[26] Klopman G, Namboodiri K, Schochet M. Simple Method of Computing the Partition Coefficient. J. Chem. Chem. 1985, 6: 28-38
[27] Bodor N, Gabanyi Z, Wong C K. A New Method for the Estimation of Partition Coefficient. J. Am. Chem. Soc. 1989, 111: 3783-3786
[28] Essex J W, Reynolds C A and Richards W G. Theoretical Determination of Partition Coefficients.J. Am. Chem. Soc. 1992, 114: 3634-3639
[29] Dunn W J III, Nagy P I, Collantes E R. A Computer-Asisisted Method for Estimation of the Partition Coefficient. Monte Carlo Simulations of the Chloroform/water log P forMethylamine, Methamol, and Acetomitrile. J. Am. Chem. Soc. 1991,113: 7898-7902
[30] Reynolds C H. Estimating Lipophilicity Using the GB/SA Continuum Solvation Model: A Direct Method for Computing Partition Coefficients. J. Chem.Inf. Comput. Sci. 1995, 35: 738-742
[31] Mannhold R, Dross K. Calculation procedures for molecular lipophilicity. A comparative study. Quant. Struct.-Act. Relat. 1996,15: 403-409
[32] Abraham D J , Kellogg G E. In Kubinyi H.(Ed.) 3D-QSAR in Drug Design: Theory, Methods and Applications, ESCOM. Leiden, 1993, pp. 506-522
[33] Audry E, Dubost J P, Colleter J C and Dallet P A. A New Approach to Structure-activity Relations: the “Molecular Lipophilicity Potential”. Eur. J. Med. Chem, 1986, 21: 71-72
[34] Furet P, Sele A, Cohen N C. 3D molecular lipophilicity potential profiles: A new tool in molecular moldeling, J. Mol. Graphics, 1988,6: 182-189
[35] Fauchere J L, Quarendon P, Kaetterer L. Estimating and representing hydrophobicity potential, J. Mol. Graphics, 1988,6:203-206
[36] Heiden W, Moeckel G, Brickmann J. A New Approach to Analysis and Display of Local Lipophilicity/Hydrophilicity Mapped on Molecular Surfaces. J. Comput.-Aided Design. 1993, 7: 503-514
[37] Pixner  P et al. Empirical Method for the Quantification and Localization of Molecular Hydrophobicity. J. Chem. Inf. Comput. Sci. 1994,34:1309-1319
[38] Langlois M H, Audry E, Croizet F et al. Topological lipophilicity potential: A new tool for a fast evaluation of lipophilicity distribution on a molecular graph, In Wermuth, C.G. (Ed.) Trends in QSAR and Molecular Modelling 92(Proceedings of the 9th European Symposium on Structure-Activity Relationships: QSAR and Molecular Modelling), ESCOM, Leiden, 1993:354-355
[39] DePriest S A, CoMFA of thermolysin inhibitors: Further refinement of PLS models derived from an experimentally determined alignment rule, American Crystallographic Association Meeting Albugquerque New Mexico, May 23-28, 1993. Abstract G002, ACA(1993)


1998-06-30收稿