关于通过动态关联度系数聚堆的临床证候要素提取方法初探

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw2023111640 日期:2025-08-09 来源:论文网

     作者:刘强,陈建新,陈静,高颖,西广成

【关键词】 动态关联度系数;复杂系统;信息熵;证候要素;中风病

许多学者对基于证候要素的辨证体系进行了充分的阐释和探讨[1-2],证候要素是证候的分解。证,是指对疾病所处一定阶段的病机状态的概括;候,是指这种病机状态可被观察到的外在表现,二者的关系是“以候为证”[3],即通过观察各种外在表现来确定内在的病机状态。这就使得从证候分解而来的证候要素和“证候”一样,有着自己的临床外在表现,即:证候要素的外候。

  证候要素假说的提出为证候的规范化研究开辟了一个崭新的领域,而证候要素概念的检验和完善需要从文献学与临床各学科两个方面进行[1],并根据研究情况进行调整与修正。目前,基于理论探讨和文献整理的证候要素提取工作已经逐步的展开[4-5],但从复杂的临床数据当中对证候要素进行提取的前瞻性工作鲜有报道。可见,从实际的临床数据中进行证候要素信息的挖掘提取是证候要素研究工作中一个亟需的补充。

  目前,证候诊断模型的建立采取的各种多元统计方法,都因为各自所蕴含的数学思想和方法的不同、模型的差异,不能准确地揭示证候和症状之间的内在关联。聚类分析对四诊信息的“刚性”分割在实际临床的群体中很难找到和定义。而统计学中以多维空间的空间距离作为四诊二元变量的相似或相关度量仍然值得商榷[6]。

  信息学中在信息熵的基础上给出的互信息定义可以度量变量之间的任意统计相关性,已被广泛应用到各个领域。在互信息的基础之上,我们提出了动态关联度系数概念克服了关联度系数对称和不能直接比较的缺点[7]。

  动态关联度系数是刻画复杂系统相关性的一种很好很重要的方法,不需要数据的一致性。在动态关联度系数的基础上,我们尝试使用更为灵活的聚堆的方法从临床四诊信息数据中进行证候要素的提取。

  1 对象与方法

  1.1 观察对象

  1.1.1 诊断标准

  采用1995年中华医学会第四次全国脑血管病学术会议通过的脑梗塞诊断标准[8]和1995年国家中医药管理局脑病急症协作组制定的“中风病诊断与疗效评定标准”[9]。

  1.1.2 纳入标准

  ①符合缺血性中风诊断;②经头颅CT或头颅MRI确诊为脑梗死;③发病在72 h以内。

  1.1.3 排除标准

  ①短暂性脑缺血发作;②脑出血或蛛网膜下腔出血;③因血液病、肿瘤等原因所致的脑卒中;④合并有肝、肾、造血系统、内分泌系统等严重疾病及骨关节病;⑤精神障碍或严重痴呆;⑥发病超过72 h;⑦有明显的中风后遗症。

  1.2 一般资料

  符合上述条件者共288例。其中男182例,女106例。年龄最小34岁,最大89岁,平均年龄(66.6±12.0)岁。全部病例来源于北京中医药大学东直门医院、北京中医药大学东方医院、北京宣武医院和广州中医药大学第二临床医学院神经内科的住院患者。

  1.3 研究方法

  1.3.1 资料收集

  按照国家重点基础研究发展计划课题“缺血性中风病证结合的诊断标准与疗效评价体系研究”的科研设计方案,制定统一的标准和统一的调查表。由专门的中医和神经内科医师负责,对住院患者进行了90 d的调查和随访,以发病前14天(连续每天采集)、第28天、第90天为代表,多时点采集中医四诊信息、辨证和有关检查(包括CT或MRI的检查)的临床数据,按统一要求填写调查表格,最后经过二次录入将全部资料输入电子计算机,使用专用的检查软件将2组数据校对更正,共得到4 215条有效的四诊信息记录。

  1.3.2 数据处理方法

  为了叙述我们的方法,下面先介绍几个定义。
  
  对于一个复杂系统,可以表示为矢量:s=(X1,X2,∧,Xi,∧,Xp)T (1)其中, (i=1,2,∧,p,a=1,2,∧,q)是描述系统特征的变量。令Ci(i=1,2,∧,p)为Xi分类的集合,Ci的第a个元素 ,则有 ,并令 为事件Xi属于Ci第a类的数量,则变量Xi的熵定义为:(2)Xi和Xj的联合熵定义为:(3)其中nab表示事件Xi属于Ci的第a类同时Xj属于Cj的第b类的数量。式(2)、(3)可分别表示成:(2)’(3)’有了上述熵的定义,
  下面给出基于互信息的关联度的定义。

  定义1:假设 ,则称熵μ(Xi,Xj)=H(Xi)+H(Xj)-H(Xi,Xj)(4)
为Xi和Xj之间的关联度。定义2:假设 ,则称μ(Xi,Xj)=H(Xi)+H(Xj)-H(Xi,Xj)(5)H(Xj)
  
  为Xi和Xj之间的关联度系数。

  通过计算每2个四诊变量之间关联度系数,作为临床四诊信息之间的关联性度量。但临床四诊信息的相关有两种情况:同时出现和不出现(正相关);不能同时出现(负相关)。由于关联度系数只能是非负值,无法区分变量间正相关与负相关的差别,所以必须改进关联度系数以使得正相关和负相关能够分开。

  从基于Shannon熵的关联度μ(Xi,Xj)=H(Xi)+H(Xj)-H(Xi,Xj)的定义可以看出,两负相关的症状,同时出现的概率为0,我们重新定义改进的关联度系数为,如果2个四诊信息同时为阳性的频率,记作Po(i,j),大于某个数值δ,那么就保持原来的定义式不变,如果小于δ,则分子增加惩罚项H(Xi,Xj),将关联度系数定义式改为:

  于是,改进的动态关联度系数就可以写成:
  
  这样,两个负相关的症状之间的关联度系数就变小了,甚至可能变负。
  
  计算每一个四诊变量与其它变量之间的关联度系数,对于每一个变量,我们根据与其它变量关联度系数的大小关系,将系数最大的前M个变量称为该变量的“亲密变量”。我们记N为全部的变量数。如果2个变量互为“亲密变量”,那么我们说这两个变量是正相关的。如果3个变量之间任意两个变量都是正相关的,那么这3个变量就聚成一堆,依次类推,直到算法收敛,即不能再往堆里加任何元素了。根据以上算法,在Matlab 7.0平台上编写程序,进行运算处理,得出最常见的四诊信息组合,进而分析证候属性,作为证候要素存在的依据。

  2 结果

  通过对4 215例次四诊信息记录的分析,取δ=15/4215,考虑到临床最少通过3~4个症状体征就能判断证候,取M=6,得到该组病例最常见的四诊信息组合。见表1。表1 4 215例次四诊信息最常见的信息组合(略)

  可见,记录16(目赤、步履不稳、目眩)和记录17(步履不稳、目眩、恶心)表现出较明显的风证的特征;记录8(失音、裂纹舌、燥苔)为热证津伤的表现;记录19~23的一系列症状(表情淡漠、情绪低落、神疲、乏力、寡言少语、神情呆滞、反应迟钝、语声低微、代脉)为典型的气虚表现;记录24、27(短气、心悸、胸闷、憋气、短气、呃逆、憋气)表现出气滞的特征;记录28、29、32~35的一系列症状(痰易咳出、痰质清稀、痰色白、痰量、肥胖、胖大舌、痰难咯出、痰质粘稠、痰色黄)提示痰证的存在;记录38~42(口唇紫黯、紫舌、口唇、舌生瘀斑、肌肤甲错、舌生瘀点、舌下脉络曲张)提示血瘀证的存在;记录43、44(面色萎黄、口唇淡白、便初硬后软、小便清长、畏寒、舌麻、渴喜热饮)提示阳虚的存在;而记录45、46(身热夜甚、五心烦热、盗汗、无苔、左细脉、左滑脉)为典型的阴虚症状。另外,记录2和36(口张、目偏不瞬、呼吸急促、口张、呼吸急促、喉中痰鸣、舌短缩)表现出一定脱证的特征。可见,通过数据的分析,基本上能够确定在中风病患者中风证、火证、痰证、气虚证、气滞证、血瘀证、阳虚证、阴虚证甚至脱证9个证候要素的存在。

  3 讨论

  前辈学者们将中风病的主要证候归纳为风、火、痰、虚、瘀五端,而《中风病专家经验辨证量表》[10]及在此基础之上完成的“中风病证候诊断标准”[11],沿用了“风、火、痰、瘀、气虚、阴虚阳亢”6个证候要素的辨证模式。但这些证候要素的提出主要基于临床经验和古籍文献的调研整理,缺乏临床数据的支持。本研究提出的方法和研究结果,作为一种无监督的数据处理方法,减少了主观和经验对数据分析的干扰,有力的补充和支持了这些传统观点和假说。

  由于典型的证候表现在临床上不容易完全出现,同一个证候的临床表现因人、因时、因地都会有所不同,而且不会全部出现。聚类分析的方法只能控制类数,不能控制每一分类中的变量数,得到的症状组合要么因为分类过粗,无法将典型证候区分开;要么分类过细,将相互关联的变量打散。而“亲密症状群”的方法很好的避开了这些问题,指定每一类中的变量数而不去考虑类数,每一个变量可以出现在不同的群里,能够将联系紧密的变量群全部找出来。而通过对变量群的证候属性分析,能够帮助判断证候要素的存在,并进一步探讨对堆相应证候要素诊断意义较大的的四诊表现。

  另外,传统经验认为不具备辨证意义的一些四诊信息之间的相互关系也在聚堆中体现出来。例如:以往认为,目偏不瞬为风的表现,而记录2和3提示,口张和目偏不瞬关系密切,结合记录2中另一个症状呼吸急促,是否提示目偏不瞬与气脱有一定的关系?是否目偏不瞬为脱证的一个表现症状?益气固脱的治法是否能够对目偏不瞬症状有一定的改善作用?这些内容,值得进一步研究验证。
  

【参考文献】
 [1] 张志斌,王永炎.证候名称及分类研究的回顾与假设的提出[J].北京中医药大学学报,2003,26(2):1-5.

  [2] 朱文锋.辨证统一体系的创立[J].中国中医基础医学杂志,2001,7(4):4-6.

  [3] 曹克刚,程先宽,高 颖.“候”论[J].中国中医基础医学杂志,2005, 11(2):105-106.

  [4] 于春光,王天芳,万 霞,等.慢性乙型肝炎常见中医证候及证候要素的分析[J].北京中医药大学学报,2005,28(6):70-73.

  [5] 张启明,王永炎,张志斌,等.外感病因中证候要素的提取[J].山东中医药大学学报,2005,29(5):339-341.

  [6] 袁世宏,王天芳.多元统计方法在建立证候诊断模型研究中存在问题的思考[J].北京中医药大学学报,2004,27(4):9-11.

  [7] 西广成.复杂系统分划的熵方法[J].自动化学报,1987,13(3):216-220.

  [8] 中华神经科学会,中华神经外科学会.脑血管病疾病分类[J].中华神经科杂志,1996,26(6):376.

  [9] 国家中医药管理局脑病急症协作组.中风病诊断与疗效评定标准[J].北京中医药大学学报,1996,19(1):55.

  [10] 孟家眉,梁宝华,张树懿.脑血管病临床辨证规范化定量化初探[J].西医结合">中西医结合杂志,1988,8(3):173-175.

  [11] 国家中医药管理局脑病急症科研组.中风病辨证诊断标准[J].北京中医药大学学报,1994,17(3):42.

转贴于
如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100