【关键词】 数据库建设;中医药
随着计算机网络技术和数据库技术的飞速发展,本所中医药数据库的建设至今也有20多年的历史了。数据库的规模日益扩大,数据库的品种从单一型发展到多样型,内容从文献型发展到事实型,结构从单表型发展到关系型,数据类型从只有文本型、数字型、日期型和逻辑型,发展到支持巨型对象的CLOB、BLOB等多媒体型。建库形式也从单机建设,发展到现在全国30家单位近300人通过Internet网络平台,远程异地进行数据库建设。多类型的中医药数据库,以其充实的中医药数据信息成为中医药在线网雄厚的信息基础。
中医药在线网以多个大型数据库与检索应用平台为支撑,利用先进的计算机技术,构建了一个能够在Internet环境下融合各个自治、异质异构的中医药数据资源的,并能为用户提供一个统一的全局范围内数据检索环境的信息共享平台,以支持中药数据库资源的共享、综合利用与开发。目前中医药在线网数据平台拥有以下数据资源及检索通道。
1 单表型数据库
1.1 多库融合检索平台
多库融合检索平台是将多个不同类型、不同结构、不同软件支持的本地及异地数据库置于一个统一的检索平台上,使您可以同时从各个不同的数据库中检索所需要的信息,也可以只选择其中的一个数据库进行查询。到目前为止,多库融合检索平台上收录了69个数据库。
1.2 中国中医药期刊文献数据库
收录了1949年以来国内出版的近900种生物医学期刊及其它相关期刊中涉及中医药学、针灸、气功、按摩、保健等方面内容的文献题录约73万余篇,其中1988年以后的期刊文献中,50%以上附有文摘。著录内容包括:中文文题、英文文题、作者、第一作者单位、第一作者所在地、期刊名称、出版年、卷、期、页码、文献类型、特征词、医学史、资助类型、主题词、关键词、分类号、语种、中文文摘、英文文摘等共50余项。该数据库采用美国国立医学图书馆的《医学主题词注释表》(MeSH)及中国中医科学院的《中国中医药学主题词表》进行规范的主题词标引,用以进行精确检索和扩展检索。该数据库每季度更新1次,2000年以后,每年文献量为4~5万余篇。
该数据库还提供15个专题数据库形式,分别为:中药文献数据库、中药化学文献数据库、中药药理学文献数据库、中药不良反应和毒理学文献数据库、针灸文献数据库、肿瘤文献数据库、中医性疾病文献数据库、艾滋病中药数据库、中医老年病文献数据库、中医名医经验数据库、中医临床诊疗文献数据库、中医临床试验文献数据库、中医药学历史文献数据库、中医药研究课题数据库、中医药学文摘数据库。
1.3 中国中医药期刊文献数据库(英文版)TCMLARS
主要收录中国国内出版的生物医学期刊中的中医药文献题录,同时也收录了少量国外中医药文献英文题录,其中30%的题录附有英文文摘。该数据库内容覆盖中医、中药、针灸、推拿等中医药各个领域,但主要集中在中药与针灸的临床研究及实验研究方面。目前数据库已收录1984年以来的文献12万余篇。
1.4 民国期刊文献数据库
收录了1898-1949年期间的150余种中医药期刊文献题录信息67 737篇。著录内容包括:文题、作者、期刊名称、出版年限、卷、期、页码、栏目、馆藏地、索取号、出版地、出版者等共14项。
1.5 有毒中药古籍文献数据库
收录有毒中药古籍文献1 755篇,著录内容包括:中药名称、异名、释名、产地、性味、归经、药物形态、品种考证、养植栽培、采收、加工、鉴别、贮藏、炮制、质量鉴定、主治、功用、用法、用量、毒副作用、临证应用、配伍应用、配伍禁忌、使用注意、附方、医案、药用机理、全文、语义等共33项。
1.6 海外中医古籍书目数据库
资料来源于世界各地图书馆、博物馆收藏的中医古籍目录,共有记录20 004条。著录内容包括:联目号、类号、著作年、藏书号、正书名、修饰语、别名、卷、册、国别朝代、著者姓名、著作方式、版本项、原丛书名、原丛书类号、子目编号、丛书子目、馆代号、备注等共34项。
1.7 中国中医药新闻数据库
收录了1989年以来报刊及新闻中的中医药信息6万余条,含中医药政策法规、中药市场信息、新药开发、科研进展、疾病诊疗、养生保健等方面的相关内容。著录内容包括:题名、关键词、内容、栏目分类、出处等共8项。
1.8 疾病诊疗数据库
参考多种中西医学权威著作书制作而成,从中、西医学两种角度全面详述了疾病的临床诊疗和基础研究的信息,共收录疾病3 776种。内容涉及疾病的中英文名称、定义、中西医病因、病机、诊断、鉴别诊断和治疗等,共54个字段。
1.9 中医临床诊疗术语国家标准数据库
根据《中华人民共和国国家标准-中医临床诊疗术语疾病部分》、《中华人民共和国国家标准-中医临床诊疗术语证候部分》、《中华人民共和国国家标准-中医临床诊疗术语治法部分》编制而成,提供了有关疾病、证候、治法的中医诊疗标准术语,共有记录2 795条。
1.10 中国医院数据库
收录了全国12 000余家医院的信息,内容涉及医院联系方式、门诊量、床位数、等级、特色专科、设备等方面。
1.11 中国中药数据库
资料来源于《中华人民共和国药典》、《中药大辞典》、《中华药海》、《中国药材学》、《常用中药成分与药理手册》、《中华本草》等权威工具书及专著,共收录中药8 173种。著录内容包括:药名、别名、英译名、药材拉丁名、药材基原、动植物形态、资源分布、药用植物栽培、采收和储藏、药用部位、生药材鉴定、中药化学成分、理化性质、炮制方法、剂型、中药制药工艺、药理作用、药理学、药代动力学、毒理学、药物配伍、性味、归经、功效、主治、用法用量、用药禁忌、不良反应、科属分类等共43项。
1.12 中国中药数据库(英文版)TCDBASE
资料来源于《中华人民共和国药典》及权威教材,共收录545种中药材的全面介绍。著录内容包括:英文名称、中文名、拉丁名称、性味、归经、功效、主治、用法用量、产地、化学成份、药理作用、毒理学、药材基原、资源分布、栽培或养殖、采集加工、炮制方法、药材鉴别等共44项。
1.13 中国藏药数据库
资料来源于藏医药名著《月王药诊》、《四部医典》、《祖先口述》、《(四部医典)蓝琉璃》、《晶珠本草》等,并参考了近年藏药研究的成果。共收录包括植物、动物、矿物药材在内的526种藏药。著录内容包括:正名、异名、拉丁名、中药材基原、动植物形态、资源资源分布、药用部位、有效成分、炮制方法、性味、功效、主治、用法用量、用药忌宜、考证、临床应用等共38项。
1.14 中国瑶药数据库
根据《中国瑶药学》、《中华本草》、《中药大辞典》、《中草药学》等书籍编辑而成。共收录药物967种。著录内容包括:名称、异名、药材基原及形态、分布、动植物生态环境、栽培养殖、采收与贮藏、性味、功效、主治、用法用量等共21项。
1.15 中国方剂数据库
资料来源于《中药方剂大辞典》、《中药方剂》等工具书,收录中药方剂84 464首方。著录内容包括:名称、别名、处方来源、药物组成、功效、主治、用法用量、用药禁忌、药理作用、制备方法、临床应用等共15项。
1.16 方剂现代应用数据库
资料来源于《中华人民共和国药典》、《卫生部部颁药品标准—中药成方制剂》及期刊文献中的中药方剂,主要介绍古今方剂及其现代应用和研究,到目前共有记录9 651条。著录内容包括:方剂名称、别名、处方来源、剂型、药物组成、功效、主治、制备方法、用法用量、用药禁忌、不良反应、临床应用、药理作用、毒性试验、化学成分、理化性质、生产厂家、各家论述等共21项。
1.17 中国中药药对数据库
资料来源于《中医临床常用药对手册》、《中药药对190种》、《中药药对大全》、《施今墨对药》等书籍,共收录中医临床常用药对917对。著录内容包括:药对名称、性味、归经、功效、主治、作用分类、配伍机制、用法用量、临床应用、药对出处、各家论述、注意事项等共13项。
1.18 中药成方制剂标准数据库
资料来源于1989-1998年中华人民共和国卫生部发布的中药成方制剂国家标准,共收录4 052种。著录内容包括:方名、别名、标准号、药物组成、处方来源、剂型、性状、功效、主治、用法用量、用药禁忌、制备方法等共22项。
1.19 中国藏药药品标准数据库
资料来源于中华人民共和国药典委员会编(1995年)《药品标准——藏药》第一册,收录了卫生部颁布的藏药药品标准366种。著录内容包括:标准号、药名、藏方药名、藏方药分类(藏药材、藏成药)、药材基原、药物组成、性状、炮制、性味、制备方法、剂型、功效、主治、用法用量、注意事项、用药禁忌等共25项。
1.20 中药新药品种数据库
收录了自1985年以来国家批准的中药新药品种五类共2 150种。著录内容包括:名称、药品类型、药物组成、剂型、研究单位、生产单位、申请日期、新药证书编号、批准文号、批准号、保护期、批件号、功效、主治、用法用量、不良反应、用药禁忌、注意事项、包装、贮藏、有效期等共33项。
1.21 中药非处方药数据库
收录了中国实施处方药与非处方药分类管理以来政府发布的第1批至第6批共2 852种中药非处方药的详实信息。著录内容包括:药物的名称、药物组成、药理作用、性状、功效、剂型、用法用量、用药禁忌、不良反应、制备方法等共26项。
1.22 中国中药化学成分数据库
根据《中药现代药物活性成分》、《中药药理》、《中华本草》等专业工具书编制而成,收录中药化学成分4 599种。著录内容包括:品名、英文名、化学名称、异名、分子式、分子量、理化性质、药化作用、毒性、不良反应、化学成分分类、用途分类、来源等共19项。
1.23 中国国家基本药物数据库
资料来源于国家药品监督管理局编写的《国家基本药物-西药(第二版)》及《国家基本药物-中成药》2002年版,共收录药物2 262种,其中西药815种,中成药1 447种。著录内容包括:药名、别名、药物组成、性状、功效、主治、用途、方解、药理作用、体内过程、剂型、规格、用法用量、不良反应、注意事项、贮藏等共22项。
1.24 中国药典数据库(2005版)
资料来源于国家药典委员会编2005年版《中华人民共和国药典》第一、二、三部,共收录3 270条。著录内容包括:名称、异名、药物组成、处方来源、基原、性状、用途、炮制方法、性味、归经、功效、主治、用法用量、用药禁忌、不良反应、药物制法、提取物、中西药分类、化学成分、药理作用、有效期、注意事项等共40项。
1.25 国家药品标准化学药说明书数据库
资料来源于2002年由统一药品说明书及批准文号专项工作小组编写的《国家药品标准化学药说明书内容汇编》第1-7册,共收录1 914条。著录内容包括:药品名称、别名、化学成分、分子式、分子量、性状、药理毒理、药代动力学、适应症、用法用量、不良反应、禁忌症、注意事项、各类人群用药、药物相互作用、药物过量、规格、贮藏、包装、有效期等共26项。
1.26 国家药品标准藏、维、蒙药、中成药说明书数据库
资料来源于2002年由统一药品使用说明书及批准文号专项工作小组编写的《国家药品标准藏、维、蒙药说明书(主要成分)内容汇编》及《国家药品标准中成药说明书(主要成分)内容汇编》。共收录4 785条。著录内容包括:药品名称、曾用名、主要成分、药物分类等共5项。
1.27 药物不良反应数据库
资料来源于张鉴等主编的《药物不良反应与合理应用》(2001年出版),共收录1 362条。著录内容包括:名称、英文名、别名、作用与注意、不良反应、不良反应机制、不良反应防治、治疗与解救、功效、药物过量、药物相互作用、中西药分类等共34项。
1.28 临证用药配伍指南数据库
资料来源于杨济、季绍良、冀春茹主编《临证用药配伍指南》(中国医药科技出版社出版,1996年,第1版),共收录525条,全部为中药单味药配伍方法。著录内容包括:名称、异名、处方用名、基原、动植物形态、毒理学、采收、炮制、用药宜忌、化学成分、性味、归经、功效、主治、用法用量、配伍等共27项。
1.29 中国医药产品数据库
收录中国国内医药市场上中成药、西药7 000余种,包括产品名称、市场、使用和产品批件等多方面信息。共设50余个字段,其中:产品名称信息包括产品名称、汉语拼音、英文名称、异名和终产品名;产品市场信息包括注册商标、监制单位、年生产量、年销售量、批发价、零售价、参考价、生产厂家、原料药生产厂、制剂生产厂、专利、包装、规格、质量标准、产品鉴定、产品获奖、产品类目、出口权限、耗用主要原料、批准文号和批准单位;产品使用信息包括:性状、药性分类、药理作用、药物组成、化学成分、功能、主治、适应症、用法与用量、不良反应、禁忌症、注意事项、药代动力学、贮藏和使用期限。
1.30 中国中成药主要产品产量数据库(1999-2002年)
资料来源于国家经贸委1999- 2002年中国医药统计年报,共有记录4 042条。著录内容包括:报表年度、药名、企业名称、省市、剂型、规格、计量单位、本企业当年产量、本产品当年全国总产量、本产品当年全国销售收入、本产品当年全国销售收入排位序号、本产品当年全国产值等共13项。
1.31 中国医药企业数据库
收录国内4 044家医药企业(以化学药品工业、中成药工业与中药饮片工业为主)的主要信息,著录内容包括:企业名称、地址、邮编、电话、省市、工业分类、企业登记注册类型、企业规模等共9项。
1.32 中国药品企业年度报表数据库(1999-2002年)
根据国家经贸委1999-2002年中国医药统计年报编制而成。1999年收录了3 587家药品企业的相关信息,2000年收录了3 819家药品企业的相关信息,2001年收录了552家中成药及中药饮片企业的相关信息,2002年收录了543家中药生物制药企业的相关信息。著录内容包括:企业名称、企业分类、企业规模、地址、省市、邮政编码、电话号码、企业登记注册类型、各独立核算企业的工业增加值、资产总额、销售收入、利润总额、按工业增加值排名序号、按资产总额排名序号、按销售收入排名序号、按利润总额排名序号等内容。
1.33 中国GMP认证企业数据库
资料来源于国家食品药品监督管理局药品认证管理中心1999-2005年发布的GMP认证公告。介绍了9 173家获得国家食品药品监督管理局药品生产质量管理规范(GMP)认证的药品生产企业的相关信息。著录内容包括:企业名称、省市、证书编号、认证范围、公告日期、公告号、认证机构等共8个字段。
1.34 国外传统医学机构数据库
收录了美国、加拿大、日本、德国等50多个国家的1 670个机构,包括中医、中药(植物药)、针灸、气功、推拿按摩、替代疗法等的生产机构、经营机构、科研机构、教学机构、医疗机构、学术机构、出版机构等。著录内容包括:国别省别、机构译名、机构原名、机构地址、电话、传真、机构级别、机构性质、主要工作、主要产品、机构简介、成立时间、负责人名、主要成员、出版刊物、附属关系、资料来源等共17项。
2 关系结构型数据库
本类型数据库根据中医药学科特点,全面采集了大量的中药基础知识信息和20世纪90年代以来的国内期刊上公开发表的中药实验和临床研究信息,利用先进的数据库技术与网络技术,专为中医药学科领域新药开发、科研、临床以及教育等人员制作的信息与知识应用型数据库。
用户可以通过网络直接登录中医药在线数据库平台,按照专题或者知识需求,进行数据的扩展与精确检索、主题关联导航查询、排序与统计等,还可以直接获取实验研究和临床研究的全文信息。为数据挖掘与分析人员提供了个性化应用数据统计与分析的途径。
2.1 中药基础数据库
中药基础数据库是以中药基础科技数据为依据而建立的关系结构型数据库。数据来源于《中华人民共和国药典》、《中华本草》等权威工具书及普通高等教育中医药类规划教材,其目的是提供有关中药单味药、中药品种、中药化学成分等的中药生药材鉴定、中药药理、中药毒理、中药临床药理、常用剂量、用法等方面的权威公认基础数据。在建立了严格的数据筛选原则与标准的基础上,主要按中药单味药、品种、生药材鉴定、一般药理、一般临床药理、一般毒理、化学成分、中药炮制品8个部分建表,共227个字段,对基础数据进行了筛选与加工。目前包含11 013种中药单味药,8 199种中药品种,375个中药炮制品,5 944个中药化学成分的相关信息。
数据库以单味药为切入点,依次展开形成了一个大型中草药系统。每个部分即可成为一个独立的个体,又与各表间有着一定的内在联系,使之成为一个有机的整体。
数据库通过中医基础数据平台提供服务。用户可以从单味药、品种、化学成分、炮制、药理作用等主要入口途径,通过不同层次的数据关联查询,实现了相关数据的归类与相关检索。适用于数据发掘、知识再现、新药开发。
2.2 中药药理实验数据库
数据资源来自1990年以来公开出版的中文医学期刊上的有关中药单味药、方剂、化学成分在药理、临床药理、毒理方面的一次实验文献。根据中药药理学科特点,抽取了15个中心主题数据(文献出处、单味药、化学成分、方剂、剂型、疾病、证候、症状、病理生理、效应部位、微生物、药理分类、临床药理分类、毒理分类、指标),采用计算机数据仓库技术,建立了15个空间维,按一定规律的数据组合形式,将实验数据进行加工与处理,基本全面表达了中药实验药理与毒理的数据内涵值,用以支撑中药药理数据统计与分析。为配合数值的应用,本系统提供了数据来源文献的原文图片。到目前为止,数据已经做到2004年,收集实验项目24 000余项,原文图片81 000余张。
数据库通过中药药理实验数据平台提供服务。主要适用于中药新药研究的高层次人员,用户可以通过任意扩充与限定检索,查询中药化学成分、药理作用进展、治疗疾病、主要作用部位、观察的指标等,也可以根据药理研究频次与统计数据、方剂的组合等,观察与提示新的方剂的组合。同时还可以根据对某种方剂和单味药及其组分的统计,了解中药研究的新领域和研究进展。是实现中药深层次的数据挖掘与利用的工具。可以为科学研究提供思路,为新药研发提供依据。
2.3 中药化学实验数据库
数据资源来自1990年以来公开出版的中文医学期刊上的有关中药化学实验研究方面的一次实验文献。按照化学研究特点,按化学成分分离、化学成分合成、化学成分纯化、化学成分提取、化学成分鉴定、含量测定等划分为9张表,共140个字段,对文献内容进行编辑和结构化分析处理。到目前为止,数据已经做到2004年,收集实验项目达到40 000余项,原文图片45 000余张。数据库通过中药化学实验浏览平台、化学实验统计平台提供服务。
2.3.1 中药化学实验浏览
用户可从实验对象、实验室、实验方法、实验结果4个入口,输入单一条件或者组合条件进行精确或者模糊查询。为使查询更准确,还为每个入口提供辅助选词功能。通过检索结果可以浏览实验步骤、主要方法、结果,并可以直接查询全文图片。可以直接获取每个实验的实验对象、实验室、实验方法和实验步骤(方法名称、方法类型、步骤计数)、实验结果、实验名称的信息;点击进入实验信息后,可以了解实验的详细信息与简介。
根据查询需求,还可以进行实验室、实验对象、实验方法的关联检索,关联结果显示后,可以根据需要进行主题变更的多次检索。
2.3.2 化学实验统计
可以进行实验对象、实验室、实验方法为主要因素的多种实验相关信息统计排序,为科研工作者提示化学实验研究的进展与研究方向。
2.4 中医临床数据库
中医临床数据库是为中医临床与科研从业人员提供中医临床科学及其应用的结构型数据库。数据来自1999-2004年公开出版的中文医学期刊上的有关临床研究方面的一次文献。广泛采集国内临床研究与治疗的科学与医疗实践项目,以疾病为中心,建立流行病学信息(病因、传染源、传染途径、地区)、疾病、证候、症状信息(疾病名称、原发病、并发症、病证、症状),诊疗信息表(诊断标准来源、疗效标准来源、疗效观察指标表:变化指标)以及治疗信息(治疗方法与步骤)等相关内容,以及数据来源文献的原文图片。到目前为目,收集临床研究近145 000项,原文图片163 000余张。
数据库通过临床医学平台提供服务,用户可以通过简单搜索、高级搜索和统计3种方式实现疾病相关数据的检索、统计与数据挖掘。其中简单搜索可按疾病、症状、证候中某个单一条件对疾病相关数据进行查找。高级搜索可按疾病、症状、证候、年龄组、性别、病因、专题分类等条件组合对疾病相关数据进行查找。另外,还提供了相关数据的关联通道,方便用户按照提示进行查询和浏览,以及得到各种疾病的病因、证候、症状、诊疗等多方面的相关统计信息,为进行中医药数据的深度挖掘和充分利用奠定了基础。
3 结语
近年来,我们在上述单表型与关系结构型数据库的基础上,尝试进行了以科研为导向的综合数据集成平台的研制,初步建立了“有毒中药数据平台”、“公共卫生突发事件救治方案辅助决策平台”,以及“各种临床疾病研究平台”等。今后我们将进一步开发研制以本体为基础、以数据网格为支撑的中医药信息应用体系,更有效实现科学数据的服务与共享。