作者:戴益民 李浔 梁波 杨道武 曹忠 黄可龙
【摘要】 用新颖的原子拓扑矢量YC、原子平衡电负性qe、结构信息参数[NiH(i=α,β)]和γ校正参数对63个无环饱和脂肪醇的局部化学微环境进行了结构表征,并对化合物13C NMR化学位移进行了QSSR研究。采用偏最小二乘回归得到模型的复相关系数R和标准偏差S分别为0.9915和2.4827; 对353个碳原子13C NMR化学位移的实验值与计算值的平均绝对误差仅为2.01×10-6。同时,采用留分法(Leavemoleculeout)和外检验方法测试模型的内部稳定性和外部预测能力。与文献结果比较,本研究所用参数少,且计算简便。
【关键词】 醇, 碳13核磁共振, 化学位移, 分子结构参数,定量结构波谱关系
1 引言
有机分子的波谱特征是表征分子结构的重要参数,通过研究化合物结构与其化学位移的关系进而对波谱模拟和预测,不仅可以提供有机化合物“骨架”的信息,利用自动解析可确认候选化合物的结构,加深对分子结构与性能关系的认识,尤其是13C NMR谱在有机物的分子构型、构象、反应机理等方面的作用越来越大[1~3]。碳谱模拟始于1964年Grant和Paul提出的GP方法[4]及1971年Lindeman和Adams用LA方法[5]对烷烃的研究。化学位移受多种屏蔽效应,包括核外电子云密度大小和各向异性效应等因素的影响,其理论计算一直是一个难题。由于生物多样性和分子复杂性,并且缺乏标准物质,实验测定成本高、费时,使得大量复杂结构信息至今还不为人知,因此将有机分子中处于不同化学环境的碳、磷等原子进行结构参数表征,利用有限的测定数据建立定量结构模型预测未知化合物的化学位移显得尤为重要 [6~16]。Bosque等[6]从膦类化合物708个结构描述子中筛选出7个,分别用多元线性回归和人工神经网络法建立了31P NMR谱化学位移模拟模型;许禄等[7]用数学模型法对脂肪族胺的13C NMR化学位移进行了较准确的预测;刘树深等[8]用原子距离边数矢量模拟了无环醇分子中13C NMR化学位移;文献[9~11]提出表征分子局部化学微环境的结构描述子分别对氨基酸、脂肪胺、饱和醇类化合物中的碳原子进行结构表征,建立了满意的定量结构波谱关系(QSSR)模型; 聂长明等[12]采用离子性指数和基团诱导效应参数描述烷烃和饱和醇中碳原子的化学环境,并对它们的13C NMR化学位移进行计算和预测。本研究组采用诱导效应指数、取代基电负性的和差值等参数用于卤代甲烷的13C NMR谱化学位移的研究,取得了较好结果[13]。
本研究以原子的平衡电负性和相对键长校正含有杂原子的有机化合物,引入新的拓扑矢量YC和原子平衡电负性qe表征等价碳原子的化学环境,结合结构信息参数[NiH(i=α,β)]及γ校正参数,对63个无环醇中353个碳原子的化学位移进行偏最小二乘回归分析。结果表明,分子结构描述符YC,qe,[NiH(i=α,β)]及γ校正参数与13C NMR化学位移显著相关,在模型检验过程中,除使用留分法做交互检验外,同时使用外检验,使得结果具有更高的可信度。
2 原理与方法
根据核磁共振的基本原理,自旋核在静磁场中自旋能级产生分裂,共振时由能量较低的基态跃迁至能量较高的激发态,化学位移的大小决定于所处的化学环境。因此,应当建立能有效表征原子化学微环境的结构参数。由于分子隐氢图中每条边都是由化学键构成的,键的强度因成键原子的电负性不同而异,并且化合物中同种原子在不同化学环境中的电负性不同,因而导致不同碳原子(如伯、仲、叔碳原子)性质上的差异。为了表征不同原子或同一原子在不同分子中所处化学环境不同的结构特征,对拓扑距离(dij)和分子隐氢图的各个顶点(v)作如下修正:(1)用相对键长度代替分子图中相邻两顶点间的拓扑距离。一个化学键的相对长度定义为该键长与碳碳单键键长的比值。具体方法是将CC键的键长视为1,其它各相邻顶点间的距离则定义为相应键长与CC键键长的比值,例如CO键的相对键长为0.143/0.154=0.9286。(2)通常,同一化学键在不同的化学环境中键长稍有变化,为此采用原子的平衡电负性对分子隐氢图的各个顶点进行着色。作者认为原子形成分子是伴随原子电负性改变的过程,分子一旦形成,分子中各原子与相邻原子的电负性不再改变即达到电负性平衡,这种电负性可称之为原子的平衡电负性[17],分子中编号为i原子的平衡电负性定义为:qi=(χiA+∑χG)/(1+∑l)(1)式中∑χG表示与i原子直接相连基团电负性之和, χiA表示i原子的Pauling电负性[18], ∑l表示与i原子直接相连的基团个数。其中χG按下式进行计算:χG={1n1l∑n1ll=1[1n2l∑n2ll=1…(1nil∑nill=1χil)…]}(2)
为此将相应顶点平衡电负性定义为电负性矩阵(X)。同时考虑分子中每一原子的成键情况、原子之间的联结关系,建立分子距离矩阵(D)、顶点距离加和矩阵(S)、顶点度矩阵(R)。
D=d11d12…d1n
d21d22…d2n
… …… …
dn1dn2…dnm S=S1
S2
…
Sn Si=∑nj=1dij R=r1
r2
…
rn X=χ1
χ2
…
χn
在矩阵S,R,X的基础上,提出一个新的原子拓扑描述符YC:
YC=log∑Nj(Sjrjχj)(3)
由式(3)可见,YC蕴涵如下结构信息:(1)反映分子大小及其支化度。分子中所含非氢原子数越多,分子中碳原子的支化度越大,其YC越大,即与分子的体积正相关; (2)揭示原子的固有电性。原子的平衡电负性大小近似反映原子的价电子密度,其值越大吸引电子的能力越强; (3) 反映原子在分子中的局部化学微环境。顶点距离加和矩阵、顶点度矩阵和平衡电负性矩阵均反映原子的成键情况。
在13C NMR化学位移分析过程中,一般认为周围原子或基团对中心碳原子的影响主要位于相距4个化学键的范围内,因此中心碳原子13C NMR化学位移与NiH(i=α,β,γ)相关[8]。考察了4个键以内氢原子对中心碳原子化学位移的影响。结果发现,距离目标碳原子2个键以外的氢原子对其核磁共振化学位移贡献可以忽略不计,因此仅考虑NiH(i=α,β)。研究发现,由于醇中羟基的电负性较大,对碳原子的电子云有强吸引作用,引起位于该原子α和β位的碳原子的化学位移向低场移动,但γ位影响特殊,其影响可以使所研究碳原子的化学位移向高场移动2~6[19]。为了表征γ位羟基效应对化学位移的影响,通过分析发现,模拟时5为最佳值。本研究的63种脂肪醇类化合物353个碳原子的13C NMR化学位移数据取自文献[20,21],其中包括24种伯醇、32种仲醇和7种叔醇。
3 结果与讨论
3.1 醇13C NMR化学位移波谱模拟
将63种脂肪醇化合物中353个碳原子的化学位移值与原子拓扑矢量YC、原子平衡电负性qe、结构信息参数[NiH(i=α,β)]及γ校正参数进行偏最小二乘回归分析,其结果如式(4)所示:
CS=-817.5592+2.0672YC+359.8650qe-0.2153NαH+1.7239NβH-0.5957γ
n=353,R=0.9915, S=2.4827,F=4042.88,p<0.0000(4)
从以上结果可知,模型复相关系数R=0.9915,表明用分子结构描述符YC,qe,[NiH(i=α,β)]及γ校正参数对脂肪醇13C NMR化学位移建立QSSR模型解释了变量98.31%方差,用式(4)估算脂肪醇13C NMR化学位移与实验值非常接近,样本平均绝对误差仅为2.01×10-6,结果列入附表1(http://www.analchem.cn/fujian/N090018.pdf);并将353个碳原子化学位移的计算值与实验值进行比较,如图1所示。所有样本都均匀分布于过原点45°直线周围,没有特别明显的异常点。
图1 353个碳原子化学位移实验值与计算值比较(略)
Fig.1 Plot of observed values vs calculated values of chemical shift for 353 carbon atoms
图2 模型(4)估计值的误差分布散点图(略)
Fig.2 Residual distribution of PLS model(4) for 353 samples
为了更加直观地观测误差的分布情况,由模型的估计误差分布图(图2)可见,绝大多数样本的误差分布在±2倍总体均方根误差以内。另外,用353个样本的Cook距离对中心化杠杆值作图也得到类似的结论,仅8个样本稍显异常。
李美萍等[22]采用离子性指数、极化效应指数以及分子结构信息参数作为描述子,用多元线性回归分析方法对64个脂肪醇348个碳原子的13C NMR化学位移建模得到6参数8变量模型,其相关系数为0.9914;标准偏差为2.7260;平均绝对误差为2.06 ×10-6。刘树深等[8]以原子电性距离矢量描述无环醇化合物中不同等价碳原子的化学环境,结合γ效应校正碳原子类型,分别建立了4类等价碳原子的5参数线性相关模型。比较而言,本研究中式(4)采用6参数提取5个分子结构描述符建立了4类等价碳原子的统一模型,其相关系数为0.9915;标准偏差为2.4827;平均绝对误差为2.01×10-6。
3.2 模型检验
模型外部预测能力和真实有效性检验是定量构效关系研究中非常重要的一环。本研究采用留分法(Leavemoleculeout,LMO)交互检验和外检验相结合的方法。留分法是指每次留下一分子所含碳原子不参与建模,再用剩下样本所建回归模型对该分子中碳原子进行交互验证预测。对63个脂肪醇化合物而言,留分法交互检验为63次即可将所有碳原子逐一预测。检验结果表明,留分法交互检验的复相关系数(RLMO=0.9911)与模型(4)的复相关系数(R=0.9915)非常接近。图3和图4分别为留分法交互检验估计值与观测值相关以及它们的误差分布情况,说明所构建模型具有良好的稳定性和估计能力。
图3 353个碳原子实验值与留分法预测值比较(略)
Fig.3 Plot of observed values vs predicted values of leavemoleculeout(LMO) for 353 carbon atoms
图4 模型(4)估计值的误差分布散点图(略)
Fig.4 Residual distribution of PLS model(4) of LMO cross validation for 353 samples
为了进一步验证模型的预测能力,从文献[23]获得3甲基2戊醇和1癸醇共计16个碳原子的化学位移值。分别计算相应的分子结构描述符YC,qe,[NiH(i=α,β)]及γ校正参数,代入式(4)中得到这16个碳原子化学位移的预测结果,并将相关效果分别绘于图5中。可见利用式(4)预测训练集以外脂肪醇化合物的13C NMR化学位移同样具有较高的精度。
图5 3甲基2戊醇(a)和癸醇(b)的实验值()与计算值()比较(略)
Fig.5 Plot of observed values() vs calculated values() for 3Me2pentanol(a) and decanol(b)
3.3 公式系数的物理意义
根据核磁共振的基本原理可知,化学位移的大小是根据核外电子云球对称效应或最小球半径原理所决定的,主要与周围键合原子的电性和距离密切关联。本研究构建的拓扑矢量较全面地反映了中心碳原子的体积大小和拓扑结构信息,是一个与分子的分支情况及体积大小密切相关的参数。原子拓扑矢量越大,中心碳原子的体积越大,则使得其周围的电子云密度分散,从而化学位移升高,因此拓扑矢量YC前面的系数为正值。另外由于烷基的电负性大于氢,烷基的引入使得中心碳原子周围的电子云密度降低,平衡电负性增大,对外加磁场的屏蔽作用减小,化学位移向低场移动,因此原子平衡电负性qe前面的系数为正值。中心碳原子周围α位取代基立体效应对中心碳原子产生屏蔽作用,化学位移向高场移动。对于β位而言,由于β位CHσ键与中心碳原子的同共轭效应,降低了原子前沿电子云的屏蔽作用,相应NβH前面的系数为正值。γ位影响特殊,化学位移值减小,其系数为负值[8]。另外,YC, qe, NαH, NβH和γ前系数的大小反映该因素对脂肪醇化合物13C NMR化学位移影响程度的大小。
3.4 小结
采用拓扑矢量YC、原子平衡电负性qe、结构信息参数[NiH(i=α,β)]以及γ校正参数能较好地反映处于不同化学微环境中原子核受到的屏蔽效果的影响,将其应用于模拟和预测63个脂肪醇中353个碳原子的13C NMR化学位移,取得满意的结果。定量相关模型不仅对内部样本具有良好的估计能力,对外部样本同样具有良好的预测能力。同时,所选参数不仅计算简单,计算结果精度高,而且物理意义明确。
参考文献
1 Witkowski S,Maciejewska D,Wawer I. J. Chem. Soc. Perkin Trans., 2000, (2): 1471~1476
2 Nohair M, Zakarya D. J. Chem. Inf. Comp. Sci., 2002, 42(3): 586~591
3 Ning YongCheng(宁永成). Structure Identifying of Organic Compound and Organic Spectroscopy(有机化合物结构鉴定与有机波谱学). Beijing(北京):Science Press(科学出版社), 2000: 1~2
4 Grant D M, Paul E G. J. Am. Chem. Soc., 1964, 86(15): 2984~2990
5 Lindeman L P,Adams J Q. Anal. Chem., 1971, 43(10): 1245~1252
6 Bosque R, Sales J. J. Chem. Inf. Comp. Sci., 2001, 41(1): 225~232
7 Xu Lu(许 禄), Hu JianQiang(胡建强). Chinese J. Anal. Chem.(分析化学), 2001, 29(8): 936~940
8 Liu ShuShen(刘树深), Xia ZhiNing(夏之宁), Yu BanMei(余般梅), Li ZhiLiang(李志良). Chinese J. Magn. Reson.(波谱学杂志), 1999, 16(5): 429~440
9 Zhou Peng(周 鹏), Zhou Yuan(周 原), Mei Hu(梅 虎), Tian FeiFei(田菲菲), Li ZhiLiang(李志良). Chinese J. Anal. Chem.(分析化学), 2006, 34(2): 200~204
10 Tong JianBo(仝建波), Zeng Hui(曾 晖), Zhang ShengWan(张生万), Zhou Peng(周 鹏), Yang ShengXi(杨胜喜), Feng YanLin(冯彦琳), Zhang QiaoXia(张巧霞), Li ZhiLiang(李志良). Chinese J. Anal. Chem.(分析化学), 2006, 34(7): 1007~1010
11 Yang G C, Tong J B, Liu S L. J. Mol. Struct., 2008, 891(13): 129~131
12 Nie ChangMing(聂长明), Jiang SaiHong(姜赛红), Lin Da(林 达), Li ZhongHai(李忠海), Wu YaXin(武亚新), Wen SongNian(文松年). Chinese J. Magn. Reson. (波谱学杂志), 2008, 25(3): 379~390
13 Dai YiMin(戴益民), Deng XiaoQing(邓小清), Yang DaoWu(杨道武), Zhou HongMing(周宏明). Chinese J. Magn. Reson.(波谱学杂志), 2008, 25(1): 110~116
14 Ghavami R, Najafi A, Sajadi M, Djannaty F. J. Mol. Graph. Model., 2008, 27(1): 105~115
15 JalaliHeravi M, Shahbazikhah P, Zekavat B, Ardejani M S. QSAR Comb. Sci., 2007, 26(6): 764~772
16 Jaiswal M, Khadikar P. Bioorg. Med. Chem., 2004, 12(7): 1793~1798
17 Nie ChangMing(聂长明), Dai YiMin(戴益民), Wen SongNian(文松年), Li ZhongHai(李忠海), Zhou CongYi(周丛艺). Acta Chim. Sinica.(化学学报), 2005, 63(15): 1449~1455
18 Li ZhongHai(李忠海), Dai YiMin(戴益民), Wen SongNian(文松年), Nie ChangMing(聂长明), Zhou CongYi(周丛艺). Acta Chim. Sinica.(化学学报), 2005, 63(14): 1348~1356
19 Chang JianHua(常建华), Dong QiGong(董绮功). Theory and Analysis of Spectroscopy(波谱原理及解析). Beijing(北京):Science Press(科学出版社), 2003: 186~190
20 Sadtler Standard Carbon13 NMR Spectra. Sadtler Research Laboratories pision of BioRad Laboratories, INC. Printed in the United States of America, 1980
21 Yu DeQuan(于德泉), Yang JunShan(杨峻山), Xie JingXi(谢晶曦). Handbook of Analytical Chemistry: Nuclear Magnetic Resonance(分析化学手册:核磁共振波谱分析). Beijing(北京):Chemical Industry Press(化学工业出版社), 1989
22 Li MeiPing(李美萍), Zhang ShengWan(张生万), Kou JianRen(寇建仁), Wang Lei(王 磊), Wang Yu(王 钰). Chinese J. Magn. Reson.(波谱学杂志), 2005, 22(2): 173~179
23 Roberts J D, Weigert F J, Reich H. J. Am. Chem. Soc., 1970, 92(5): 1338~1349