周一至周五 | 9:00—22:00

期刊论文网 > 医学论文 > 临床医学论文 > 临床医学 临床生物信息学学科在临床医学教学的作用研讨

临床医学 临床生物信息学学科在临床医学教学的作用研讨

2019-05-14 10:32:59来源:组稿人论文网作者:婷婷

  摘要:生物信息学是一门整合计算机科学及生命科学的穿插学科, 已有30余年历史, 但仍方兴未艾。21世纪以来, 生物医学已逐步进入大数据时期, 海量的以测序为代表的基因组、转录组、蛋白质组数据将为深入提醒人类疾病发作机制及寻觅治疗药物提供了史无前例的契机。目前, 在临床医学研讨及教学中, 生物信息学办法及应用尚未得到足够注重。作者分离临床生物信息学开展现状及将来趋向, 讨论了临床生物信息学学科在临床医学教学及转化研讨中的作用。

  关键词:临床生物信息学; 医学教育; 基因组学; 数据库;

  生物信息学是20世纪80年代兴起的一门新的应用生物学学科, 在过去的30年里有了长足的开展, 在生物学、根底医学、农学和法医学等范畴都有了深化和普遍的应用, 但在指导临床医学教学和临床转化研讨方面应用相对缺乏。

  临床生物信息学与经典生物信息学不同, 偏重于临床亲密相关的生物信息学内容, 包括疾病的诊断、治疗、预后评价等组学数据库、剖析平台详细应用, 是一门生物信息学与临床医学的穿插学科, 是大数据研讨的一个新分支。一言以蔽之, 临床生物信息学是将组学大数据作为研讨对象, 分离临床详细问题, 经数据发掘, 取得可以指导临床诊断、治疗及预后评价的学问。当前, 随着计算机科学的进步, 呈现包括数据库剖析、机器学习以及人工智能等一系列新技术, 极大的丰厚了临床生物信息学办法学。我们自2003年以来, 应用临床生物信息学办法停止了一系列临床转化研讨, 并在国内多所医学院校主讲了有关临床生物信息学办法及应用的课程, 在这些理论根底上, 阐述临床生物信息学在临床医学教育中的作用。

  1 临床生物信息学的教育现状和迫切需求

  随着根底研讨的不时深化, 基因组学、转录组学、表观基因组学和蛋白质组学的数据不时增加, 全球范围内每天产生海量的DNA、RNA、蛋白质以及由此产生的二级数据库等生物信息数据。临床医生如何应用这些根底研讨的数据, 处理临床理论过程中诊断、治疗和预后评价的疑问问题, 为患者效劳, 这是每一个根底研讨和临床工作者所面临的难题。高效适用且容易控制的生物信息学办法, 是打破这些数据快速转化为临床信息的桥梁。临床生物信息学就是在此背景条件下应运而生的一门新的学科。

  在当今转化医学逐步惹起学者们普遍关注, 国外在这方面研讨起步较早, 办法相对成熟, 而国内则刚刚起步, 研讨办法欠缺, 且多数学者对此并不理解。为此, 尽早展开有体系的临床生物信息学教学, 以处理目前临床医生科研办法单一、临床研讨缺乏创新性以及适用性等理想问题火烧眉毛。

  2 高效临床生物信息学数据库

  在经典的生物信息学教学当中, 对计算机技术的控制常常请求很高, 一个优秀的生物信息学学者应当控制大量的生物信息学数据库, 可以纯熟应用多种计算机编程言语停止数据的建库、清洗、处置等工作。但是, 对医学生或临床医生而言, 在学习深邃的生物医学学问、处置冗杂的临床工作的同时, 纯熟控制计算机技术显然是很难的。因而, 关于生物医学工作者更重要的是控制大量的生物信息学数据库及在线剖析平台等工具, 并可以应用这些工具对本人的医学研讨、临床科研以至于临床疑问病症的诊治停止指导, 尤为重要。

  临床生物信息学数据库依据其数据源能够分为一次数据库、二次数据库和在线剖析工具。其中, 存储有DNA序列、蛋白质序列、构造等信息的数据库构成了一次数据库。二次数据库是在一次数据库的根底上经实验考证及数据剖析得到的, 其中局部二次数据库还具有特有的剖析工具。在线剖析工具是以一次数据库和二次数据库为背景参照, 运用自主设计的算法来提供在线剖析功用。普通而言, 一次数据库具有品种多样、数据更新和增长快、构造复杂且层次深、高度计算机化和网络化等特性;二次数据库则针对性强, 大多提供检索及开源下载, 运用便当;在线剖析工具除具有一定的在线剖析功用外, 还具有原始数据检索和可视化功用, 同时可供用户下载剖析结果。

  2.1 一次数据库

  Gen Bank数据库 、欧洲分子生物学实验室 (The European Molecular Biology Laboratory, EMBL) 核酸库和日本的DNA数据库 (DNA Data Bank of Japan, DDBJ) 是著名的核酸序列数据库。Gen Bank数据库是美国国立生物技术信息中心树立的, 包含一切已知的DNA和蛋白质序列, 以及与其相关文献和注释。EMBL核酸库是由欧洲生物信息学研讨所维护的。DDBJ数据库可与Gen Bank数据库、EMBL核酸库交互, 也是一个十分全面的DNA序列数据库。

  蛋白质序列数据库有Swiss-Prot 、PIR-PSD和蛋白质数据库 (Protein Data Bank, PDB) 等。Swiss-Prot是欧洲最大的蛋白质序列数据库, 它的序列精确率高, 注释完善, 但与其他数据库相比数据量较小, 如今已整合进Uni Prot数据库中。PIR-PSD是国际上最大且有注释信息的开源蛋白质序列数据库。PDB是国际上独一的生物大分子构造数据库, 其数据来源于X光晶体衍射和核磁共振, 经过整理和确认后存档而成。

  2.2二次数据库

  二次数据库数量很多, 如基因表达综合数据库是目前完整公开的最大的高通量基因表达数据库;人类基因综合数据库Gene Cards提供了全部基因、蛋白质在转录、遗传和功用上一切已知信息。Gene Cards中的信息功用包括某一基因与疾病的关系, 基因多态性、表达、功用、散布, 蛋白质与蛋白质互相作用等, 且提供各数据库及剖析工具链接, 操作简单;miRBase数据库是一个提供包括miR-NA序列数据、注释、调控基因等信息的数据库;蛋白质数据库, 它包含提供全部24 000种人类蛋白质的组织和细胞散布信息。

  此外, 尚有一些关于化合物或代谢物数据库, 如代谢物、药物和毒性分子数据库fragmentstore ;在实验根底上树立的, 提供与癌症有关的蛋白和化合物互相作用的Cancer Resource数据库等。

  2.3 在线剖析工具

  在一切在线剖析数据库当中, DAVID (the Database for Annotation, Visualization and Integrated Discovery, http://david.ncifcrf.gov/) 是临床生物信息学最常用的聚类剖析数据库, 它整合了生物学数据和剖析工具, 协助用户从中获取有用的生物学信息。该工具在2003年发布, 目前版本是v6.8。与其他剖析工具类似, 都是应用统计办法, 在数千个基因关联的注释中, 找出关联度最高的的生物学注释, 最主要是功用注释和信息链接。

  Reactome 是一个开源的、开放的、手动筹划和同行评议的途径数据库, 是一个直观的生物信息学工具。用于可视化、解释和剖析通路学问, 以支持根底和临床研讨、基因组剖析、建模、系统生物学和教育。用户可从中直接检索生物学通路, 查看生物学进程中发作的详细事情, 也能够对用户输入的基因列表停止聚类, 查看输入基因在各通路中的详细作用。

  3 应用临床生物信息学办法指导根底研讨与临床理论

  随着各品种型和层次大数据的不时呈现, 基因组学和二代测序技术的开展, 组学大数据以指数级增长。各品种型、功用各异的数据库层出不穷。关于一个医学生、医学科研和临床工作者来说, 如何选择适宜的数据库和办法指导医学研讨, 如何从数据库中冗杂的信息中提取出有价值的学问, 是每一个医学生、医学科研和临床工作者应当具备的才能。

  3.1 应用生物信息学数据库对序列停止检索

  关于许多未知生物学功用的新序列, 研讨人员从数据库中检索出与新序列同源的已知序列, 依据已知同源序列揣测出新序列生物学功用。而临床工作者则需求晓得该序列在不同组织, 不同状态下的表达状况。这也是二者面对同一序列, 但研讨目的截然不同的主要缘由。前者属于经典生物信息学的研讨内容, 然后者则是临床生物信息学的研讨方向。在分子生物学中, DNA或蛋白质的类似性是多方面的, 可能是构造类似, 也可能是功用类似。所以在停止序列类似性剖析时, 希望从一些普遍规律中揣测出新序列的构造或功用, 从而发现生物分子的新内涵。这种办法在大多数状况下是胜利的, 当然也有例外, 因而这种基于类似性的剖析办法依然需求不时改良。

  3.2 应用生物信息学数据库停止转化研讨的浅层次数据发掘

  数据发掘就是从大量、不完整、有噪声、含糊的数据中, 提取隐含在其中未知但又有效、新颖、有潜在价值、并且最终转化为信息和学问的过程。目前, 随着多种组学的呈现, 数据量不时增加, 数据库日益增加, 组学大数据剖析办法的呈现为序列剖析、基因表达剖析、蛋白质构造预测以及新药研发等范畴的数据发掘提供了宽广的应用前景。应用数据发掘技术, 将协助人们更好地认识组学大数据所蕴涵的生命信息, 探求生命的奥妙, 并将此应用于临床, 为更多患者解除病痛的折磨, 为医学的进步注入新的生机。

  对此, 本研讨团队早在2003年就开端了探究。早期, 我们经过应用简单的临床生物信息学办法对基因组及转录组学数据停止数据发掘, 取得了一系列喜人的原创成果, 且多数成果已胜利应用于临床, 为后续临床研讨提供珍贵经历。例如, 挑选并剖析了急性淋巴细胞白血病复发相关基因;预测并考证了去甲基化和组蛋白去乙酰化转移酶抑止剂对肿瘤细胞的影响;察看氨磷汀结合重组人红细胞生成素对高龄骨髓增生异常综合征的疗效;分离中医“辨证施治”思想应用临床生物信息学剖析对免疫性血小板减少性紫癜停止分型施治。

  3.3 应用生物信息学数据库停止转化研讨的深层次学问发现

  随着组学数据的日渐增加, 简单的临床生物信息学发掘办法已不能顺应大数据量、大运算量、多层次组学数据的深层次剖析。随着计算机技术的不时进步, 国内外先后有研讨团队将机器学习、人工智能等办法应用于临床生物信息学研讨, 完成对多组学数据的更深层次剖析, 以期指导医学研讨、临床诊治和新药研发。机器学习的目的是完成在海量数据中由计算机自动的对潜在学问停止发掘, 因而, 海量数据是完成机器学习以及确保所获取学问精确性的必要前提。

  为此, 本研讨团队树立了疾病多组学数据库、药物多组学数据库以及医学文献数据库, 以此为根底应用机器学习等大数据剖析技术自主树立了“疾病-药物多组学大数据临床生物信息学平台”, 停止血液病及肿瘤治疗药物和计划的系列研发, 并胜利应用于临床。应用这种办法, 我们最先对依硫磷酸结合计划治疗骨髓增生异常综合征停止优化。随后, 陆续在国际上, 率先报道6种创新治疗技术体系: (1) 重复多疗程自体免疫细胞治疗技术体系; (2) 超低剂量表观遗传药物结合免疫治疗技术体系; (3) 含祛脂向分化药物的再生障碍性贫血结合治疗技术体系; (4) 靶向活化性免疫细胞治疗技术体系; (5) 靶向细胞周期素D1阳性肿瘤的治疗技术体系; (6) 泛细胞维护剂结合造血生长因子计划治疗骨髓增生异常综合征及免疫性血小板减少症的技术体系。此外, 本研讨团队在多所医学院校停止临床生物信息学教学中发现: (1) 各类疾病指南过多, 限制医学生创新思想; (2) 生物医学数据量大, 但被应用转化为临床可用的信息少, 不利于大数据时期下医学教育的开展。正如古人所说, 授人以鱼不如授人以渔, 作者以为, 燃眉之急在临床医学教育中展开临床生物信息学教学及办法研讨。

  4 结语

  随着人类基因组方案的完成和二代测序技术的开展, 运用机器学习等前沿技术针对爆炸式增长的组学大数据停止深度发掘成为可能。面对传统治疗计划难以处理临床疑问重症的严峻理想, 医学本科毕业生有必要展开临床生物信息学教学, 有体系地学习临床生物信息学办法, 理解并纯熟控制临床生物信息学常用的数据库。使得每一位临床医学研讨生、医学工作者对现有医学研讨和临床工作中难以处理的医学问题停止合理剖析并能有效处理。最终使临床生物信息学能满足现代医疗和医学研讨开展的需求, 促进临床转化, 为现代医学的开展提供新途径。

栏目分类