6.2.1 Hansch-藤田分析方法
6.2.1.1 Hansch-藤田法基本原理
Hansch和Fujita在1963年推导出了Hansch-藤田公式:
式中:C表示产生某种生物效应所需的药物初始浓度,如Ki为抑制常数,MIC为最小抑制浓度,IC50为半数抑制浓度,LD50为半数致死量,LC50为半数致死浓度, ED50为半数有效剂量,EC50为半数有效浓度等;A是药物和靶点相互作用时的药物浓度与初始给药部位药物浓度之比,因此lg A是评价药物转运好坏的量;ΔG是药物和受体的结合自由能。疏水性参数是转运过程的良好指标,其中最常用的是脂水分配系数lg P。而ΔG又可以归因于多种效应综合作用的结果,因此可以得到Hansch-藤田公式的具体化形式:
式中:π是疏水效应参数;σ是电子效应参数;Es是立体参数。各项系数a,b,ρ,δ,c通常通过多元线性回归或是偏最小二乘法求算。这些参数并非每一项都必需,有的效应因素对于某些药物的分子活性影响不大。同时,现在也常常加入其他参数参与QSAR模型的建立。
为什么疏水参数要采用二次方的形式呢?这是因为如果药物要从给药部位成功地运输到药效作用部位,其疏水参数不能太大也不能太小。如果过于疏水或亲水,那么在多次穿膜的过程中,就可能滞留在水相或者类脂体系中,而无法到达药效部位。Hansch通过研究lg P和药物浓度对数的关系,发现其呈类似抛物线的关系,所以Hansch认为:
lg A=-a(lg P)2+blg P+c(6-3)
不过Kubinyi通过研究发现,相比于抛物线,lg P和lg A之间的关系更接近于双线性曲线,即抛物线仅仅出现在lg A的最大值附近,而两端则类似于直线,这一模型称为双线性模型:
双线性模型和抛物线模型的区别如图6-1所示。
图6-1 双线性模型(实线)与抛物线模型(虚线)(引自Kubinyi)
6.2.1.2 Hansch法中常用的分子参数
1)疏水参数
最常用的疏水参数是lg P,其中P是分子在有机溶液(通常是正辛醇)和水中的平衡浓度之比。
分子的lg P值:
式中:lg PH是母体化合物的脂水分配系数;πXi是组成分子的第i个取代基的疏水常数。不过,更通常的做法是通过模型预测化合物的脂水分配系数,目前各类软件求算的lg P值都是采用这种方法。首先将数千个lg P值已知的分子作为训练集,基于原子贡献加和法或者片段贡献加和的方法,再加上若干修正因子,通过PLS回归得到一个线性模型,再将待求算lg P的分子代入该模型得到lg P的预测结果。
目前可用于计算lg P的方法多种多样,各有优劣,常用的如Hansch的CLOGP方法、Convard的SMILOGP、Klopman的KLOGP、Ghose的ALOGP等。
2)电子效应参数
常用的电子效应参数是Hammett常数,以及F和R常数。
1940年,Hammett提出了Hammett方程:
式中:k H是苯甲酸在25℃丙酮水溶液中的解离常数;k X是具有取代基的苯甲酸在25℃丙酮水溶液中的解离常数;σX称为取代基常数,其值取决于取代基种类和位置;ρ为反应常数。由于邻位取代基涉及立体效应,通常不采用这种公式描述;间位取代和对位取代的影响可以假定是纯粹的电子效应,可以采用这种公式描述。通常间位取代的时候,σX写成σm,仅仅反映诱导效应;对位取代的时候,σX写成σp,是诱导效应和共轭效应之和。若σ大于零;则是吸电子基;反之则是斥电子基。
1953年,Taft提出酯水解的酸式反应与碱式反应的区别是由于取代基的诱导效应导致的,因此定义参数σ*:
式中,下标b表示碱式水解,下标a表示酸式水解。
1968年,为了统一各种不同种类的取代基常数,Swain和Lupton提出,所有的σ都可以分为场效应和共振效应:
σ=f F+r R (6-8)
式中:F和R分别是场取代基常数和共轭取代基常数;f和r为其权重。
3)立体参数
Taft Es值是由上文中提到的σ*导得的,是较早使用的立体参数:
式中:k H是乙酸酯在酸性溶液中的解离常数;k X是具有取代基的酸酯在酸性溶液中的解离常数。氢的Es值是0,取代基体积越大,则Es值越小。
另一个常用的立体参数是摩尔折射率(Molarrefractivity),通常用MR表示:
式中:n为液体折射率;MW为相对分子量;d是密度。
4)其他参数
除了疏水参数、电子效应参数、立体参数外,还有越来越多的其他参数引入到QSAR模型中。例如,通过量子力学计算的量子化学参数(如HOMO和LUMO能量)、反应分子拓扑结构的拓扑参数(最常用的如分子连接性指数)、与分子构象或形状相关的几何参数(如溶剂可及化表面积)、部分电荷参数等。
使用以上参数建立QSAR模型时,如果模型包含多种类型的参数,其可靠性可能更好。不过同类参数之间存在相关性,因此同一类参数不宜过多。
6.2.2 Free-Wilson法
Free-Wilson方法在1964年由Spencer M.Free和James W.Wilson提出,几乎与Hansch法同时出现。这种方法认为分子的活性主要是由各个取代基的活性加和而成,此外再加上同一系列分子共有的骨架结构的贡献,即
式中:δjk表示在分子公共骨架的j位置上是否有取代基k,若有则赋值为1,无则赋值为0;ajk是j位置上的取代基k对生物活性的贡献,可正可负,通过回归计算得到。μ是分子公共骨架本身对生物活性的贡献。
为了使模型能够达到较好的统计学意义,药物分子样本的数量不应少于取代基数目的5倍;同时,每个取代位置上每个取代基至少应出现2次,且各取代基在同一位置上出现的频率应当相仿(见图6-2)。由于对于训练样本的这种复杂要求, Free-Wilson法有时无法处理现成的实验数据,而是要根据这种要求有选择性地选取分子进行实验。
1971年,藤田对Free-Wilson法做出修正,将所有位置的氢取代基的活性贡献作为零值,即用所有取代位均是氢的母体化合物贡献μ0代替所有取代位空缺的母体化合物贡献μ。这样,各个取代位置上的取代基的贡献均变为以氢为标准。这种方法比原方法计算更为简便,称为Fujita-Ban改良模型。
此外,由于Hansch-Fujita法和Free-Wilson法均为线性模型,因此也可以将两者结合运用,即在Free-Wilson模型公式的末尾加上Hansch-Fujita法的若干理化参数作为修正项,称为Hansch-Fujita法和Free-Willson法混合模型。
图6-2 十种四环素的取代位置R,X,Y及其取代基(引自Free等)
Free-Wilson法无须计算Hansch法的各种分子参数,只须组合药物分子的化学结构。但如果待预测的分子中包含训练样本中没有的取代基,Free-Wilson法显然就无能为力了。再加上Free-Wilson法的模型中的结构参数没有明确的物理意义,很难指导新药物分子的设计,因此Free-Wilson方法的应用远不及Hansch法那么广泛。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。