关联规则在中医药领域的应用分析

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw2023112476 日期:2025-08-17 来源:论文网

     作者:童元元,赵英凯,于静,胡艳敏,潘艳丽

【关键词】 数据挖掘;关联规则;中医药;文献分析

数据挖掘又称数据库中的知识发现,是随着数据库和人工智能发展起来的一门新兴技术,是从大量数据中发现有效的、新颖的、潜在有用的并且最终可理解的知识的过程[1]。利用数据挖掘技术进行中医药海量数据的知识发现,对中医药的继承发展具有现实意义。

  关联规则(Association Rules)是数据挖掘的重要研究方法之一,由R.Agrawal等人[2]于1993年首先提出,用于从大量数据中发现满足一定条件的项集之间隐藏的关联。其中,关联有简单关联、时序关联、因果关联。关联规则的挖掘一般分成两个子问题:①找出所有支持度≥最小支持度阈值的频繁项集;②由频繁模式生成满足可信度阈值的关联规则。笔者旨在通过对以关联规则为主要方法进行中医药研究的文献报道进行整理分析,寻找关联规则应用于中医药研究的特点、规律,以期为相关研究人员提供参考。

  1 资料与方法

  1.1 检索源

  以中国中医科学院中医药信息研究所的《中医药期刊文献数据库》(1949-2008年),以及中国医学科学院医学信息研究所的《中国生物医学文献数据库(CBM)》(1978-2008年)为检索源(注:2008年为不完全收录)。

  1.2 检索策略

  检索入口选取“关键词”、“篇名”、“主题词”、“摘要”,检索式为“关联or Apriori算法or频集算法or购物篮分析”进行检索。

  1.3 统计方法

  获取检索题录的全文,排除重复、综述性文献和非中医药研究文献。提取文献的发表年份、机构等内容录入Access数据库,进行数据处理,并对关联规则的具体应用情况进行分析。

  1.4 分析内容

  分别对文献的年度分布、机构发文量、资助情况、算法使用、研究内容等进行统计分析,进一步分析关联规则在中医药领域的应用情况。

  2 结果与分析

  2.1 文献量

  检索得到以关联规则为主要研究方法的中医药文献共44篇,文献量呈逐年递增走势(见表1)。其中属于评述性文献5篇,应用性文献39篇。注明接受立项资助的文献35篇(见表1)。表1 各年度文献量及资助情况(略)

  2.2 机构分布

  根据文献第一作者所在机构统计,发文量居前3位的单位分别是:成都中医药大学,发文6篇,占总文献的13.64%;北京中医药大学,发文5篇,占11.37%;中国中医科学院广安门医院,发文4篇,占9%。发文2篇以上的单位有10个,发文31篇,占所有文献的70.45%。

  2.3 关联规则应用情况
  
  在44篇文献报道中,注明所采用具体算法的文献17篇,其中应用Apriori及Apriori改良算法的报道13篇;FP-Growth算法4篇。以关联规则作为唯一研究方法的文献16篇,与其他方法联合应用的文献28篇,其中,两种方法联用的研究17篇,3种或3种以上方法的11篇,在与关联规则联合使用的方法中,应用最多的为频数分析和聚类分析。
  
  文献分析发现,关联规则应用最多的研究依次为:药物之间;症之间;药与症、证、病以及症证之间;病因、病机、病位、治法与药之间(见表2)。此外,尚有进行中药不良反应影响因素[3]及中医药效、植物科属、化学成分的活性、中药提取物现代药理等数据维间关联规则挖掘的研究[4]。表2 关联规则使用情况(略)注:*包含2篇关于中医症状与西医生物学指标之间的关联研究

  3 讨论

  3.1 关联规则在中医药领域的应用尚处于起步阶段

  关联规则于1993年提出,至2002年应用于中医药领域的文献首次出现,之后,虽然文献量呈逐年增长趋势,但总的说来,关联规则在中医药领域的应用尚处于起步阶段,而且,进行相关研究的机构较少,主要集中于成都中医药大学、北京中医药大学、中国中医科学院广安门医院。

  3.2 Apriori算法为主要应用算法

  关联规则常见的算法包括Apriori算法、FP-Growth算法等。其中,Apriori是一种找频繁项集的基本算法,是关联规则的经典算法,现在大部分的算法都基于该算法的框架。本研究发现,在中医药领域多采用经典Apriori或者其改良算法。

  3.3 关联规则在中医药研究中的应用热点集中于方剂配伍规律的挖掘
  
  目前关于关联规则在中医药领域的研究多侧重于方法应用,热点则主要集中于方剂配伍规律、用药特点的发现,具体有以下方面。①用于药物配伍的研究[5-6]。例如姚氏等[5]以数据挖掘系统Enterprise Miner为平台,对治疗消渴的中药复方在单味药、2味药、3味药层次上进行了药物组成之间的关联模式研究,结果在一定程度上反映出历代中医在消渴治疗方面认识和治疗的整体规律性。②用于方-证、药-证的关联研究[7-8]。朱氏等[7]以名中医治疗哮喘的医案数据为分析对象,对药物与症状、证候分别进行了关联规则研究,发现四诊信息的组合与相应药物组合有对应规律;药物组合与病因、病位、证候对应,认为中医医案中的用药、四诊信息、证候之间存在一定关联性,可通过关联规则分析获取其中规律。除此之外,也有关联规则应用于辨证规范研究[9]、药物不良反应因素探讨[3]等方面的报道。

  基于辨证论治的个体化施治方案是中医临床特色之一,在临证诊疗过程中,专家对病、证的认识,以及用药习惯上可能存在着差异,使得在治疗药物的选择和配伍方面呈现出多样化。通过采用关联规则分析方法,对名医医案、病历中复方的配伍规律进行探索,既有必要性,又具可行性。当然,方剂配伍不只是药味的组合,还包含着药味剂量比例的搭配,这也是临床组方的关键,目前,有关进行药物剂量关联规则的研究较少,仅偶有报道[10]。

  关联规则在应用过程中,可能会存在诸如支持度和置信度较高的规则,而实际并无应用意义之类的问题,这就需要在运算时,保证高质量的数据进行规则验证,以及多次反馈修正。

  4 小结

  中医药海量的信息资源为挖掘工作提供了很好的研究基础,而以关联规则为代表的数据挖掘技术其擅长从海量的数据中寻找有意义的模式、知识的特点又为进行中医药知识发现提供了有力的技术支持。因此,我们有理由相信,随着数据库、人工智能等技术的发展,关联规则、数据挖掘技术在中医药研究中的运用将会逐步得到推广,也必将促进中医药信息化的发展。

参考文献


  [1] Usama Fayyad, Gregory Piatetsky-shapiro. Knowledge Discovery and Data mining:Towards a unifying framework[A]. Proceedings of the second international conference on knowledge discovery and Data mining (KDD96)[C]. Oregon:AAAI Press,1996.

  [2] Rakesh Agrawal, Tomasz Imielinski, arun Swami. Mining association rules between sets of items in large databases[A]. Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data[C]. Washington DC:1993.207-216.

  [3] 吴嘉瑞,张 冰.鱼腥草注射液不良反应的文献数据挖掘研究[J].药物警戒,2007,4(6):360-369.

  [4] 陆爱军,刘 冰,刘海波,等.中药化学数据库关联规则的挖掘[J].计算机与应用化学,2005,22(2):108-112.

  [5] 姚美村,艾 路,袁月梅,等.消渴病复方配伍规律的关联规则分析[J].北京中医药大学学报,2002,25(6):48-50.

  [6] 张承江,闫朝升,宋立群.中医肾病治疗信息中关联规则的挖掘算法[J].黑龙江大学自然科学学报,2005,22(6):842-845.

  [7] 朱立成,林色奇,薛汉荣,等.名中医哮喘医案445例关联规则分析[J].江西中医学院学报,2007,19(5):83-87.

  [8] 李文林,赵国平,陆建峰,等.关联规则在名医临证经验分析挖掘中的应用[J].南京中医药大学学报,2008,24(1):21-24.

  [9] 马玉慧,王 波,张 斌,等.数据挖掘技术在中医小儿肺炎辨证规范中的应用[J].中医儿科杂志,2006,2(6):11-15.

  [10] 宋姚屏,李 昆,吴孟旭,等.药对剂量的关联分析初探[J].辽宁中医杂志,2006,33(9):1095-1096.

转贴于
如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100