周一至周五 | 9:00—22:00

期刊论文网 > 医学论文 > 肿瘤学论文 > 肿瘤学 生物信息学办法挑选miRNA用于原发性肝癌的早期诊断办法探求

肿瘤学 生物信息学办法挑选miRNA用于原发性肝癌的早期诊断办法探求

2019-05-15 10:41:46来源:组稿人论文网作者:婷婷

  摘要:目的 生物信息学办法挑选miRNA用于原发性肝癌的早期诊断。办法 从肿瘤基因组数据库TCGA下载原发性肝癌组织miRNA表达状况数据, 成组t检验停止miRNA表达程度的比拟, 取得表达程度差别2倍以上的miRNA。靶点预测工具miRWalk2.0剖析上述miRNA的靶基因, c-Bioportal数据库获取原发性肝癌常见突变基因, miRNA靶基因中含有肝癌突变基因者定为备选, 分离文献报道肯定目的miRNA。结果 TCGA数据包含原发性肝癌组织372例, 正常对照肝组织50例, 共有1 881条miRNA序列, 肝癌组织中表达升高至2倍以上的miRNA有41个, 降低至1/2以下的miRNA有115个。c-Bioportal数据库取得原发性肝癌突变基因68个 (发作率>5%) 。结论 基于TCGA数据库的生物信息学办法可烦琐而牢靠地挑选目的miRNA停止后续研讨, 有较高的推行价值。

  关键词:生物信息学; 原发性肝癌; 早期诊断; 微小RNA;

  miRNA是高度激进、19~25核苷酸长度的单链非编码RNA, 参与调控机体发育、细胞增殖/分化、细胞死亡、代谢等生物学过程。miRNA品种众多, 数据库miRBase 2014年数据标明, 仅在人 (homo sapiens, HSA) 中经测序肯定的成熟miRNA序列就有2 588条。miRNA经过与信使RNA调控区的3'或5'非编码区序列特异性互补分离, 阻断mRNA翻译或促进mRNA降解, 使相应靶基因缄默或低表达, 发挥基因抑止作用。一种miRNA可作用于多个靶基因, 同一个基因也可受多种miRNA调理, 这种网络式互相作用增大了miRNA生物学功用研讨的难度, 目前主要应用miRNA缺失、低表达和过表达的动物模型和细胞系研讨miRNA确实切功用。随着miRNA生理功用研讨的持续深化, 更多新的发现协助人们了解生命活动, 辅助人类疾病诊疗的根底研讨。

  鉴于miRNA普遍、多样地参与生理、病理过程, 近年来越来越多的相关研讨聚焦于miRNA在疾病发作、开展、诊断、治疗及预后中的作用。体外实验、动物实验及患者体内miRNA表达程度变化等研讨发现, miRNA在许多疾病的发病过程中发挥重要作用, 如恶性肿瘤、心血管疾病、糖尿病、瘦削、神经系统疾病等。如何将miRNA与疾病的临床管理联络起来是研讨热点, 主要方向是恶性肿瘤的早期诊断、慢性疾病的治疗监测、预后预测等。近年来, miRNA作为原发性肝癌无创诊断标志物的研讨很多, 显现出良好的临床前景, 但不同miRNA的诊断效能上下不一, 选择适宜的miRNA非常重要。本文拟应用生物信息学剖析, 树立一套烦琐而牢靠的办法, 挑选适宜的miRNA用于原发性肝癌的早期诊断。

  1 资料与办法

  1.1 资料网络在线数据库:

  miRNA根本信息数据库miRBase , miRNA靶点预测数据库miRWalk 2.0 , 肿瘤基因组数据库TCGA。工具网站:癌症基因数据剖析的可视化工具c-Bioportal , TCGA数据库RNA数据可视化及生存剖析工具Onco Lnc 。数据剖析及辅助工具:统计学剖析软件SPSS22.0 (美国IBM公司) , 文献搜索引擎Pub Med 。

  1.2 办法

  1.2.1 原发性肝癌相关miRNA开掘:

  (1) miRNA数据下载:从TCGA数据库获取原发性肝癌组织miRNA表达状况数据; (2) 挑选差别表达的miRNA:TCGA数据库的原发性肝癌患者miRNA表达状况由新一代测序技术 (next-generation sequencing, NGS) 得到, 样本分为两组, 一组为原发性肝癌癌组织中miRNA新一代测序结果, 另一组为癌旁正常肝组织miRNA新一代测序结果。成组t检验停止miRNA表达程度的比拟, P<0.05为差别有统计学意义, 取得表达程度差别2倍以上的miRNA。

  1.2.2 原发性肝癌相关突变基因剖析:

  c-Bioportal上获取原发性肝癌常见突变基因, 分离文献报道, 挑选动身生频率高于5%的突变基因。

  1.2.3 肯定目的miRNA:

  将上述得到的miRNA在靶点预测工具miRWalk 2.0分别停止剖析, 得到一系列可能与miRNA发作互相作用的基因, 与上一步骤挑选出的原发性肝癌相关高频突变基因比拟。关于原发性肝癌中miRNA表达变化2倍以上者, 若其靶基因中含原发性肝癌高频突变基因, 则定为目的miRNA。

  2 结果

  2.1 原发性肝癌组织中表达程度显著变化的miRNA

  剖析TCGA数据库中得到的原发性肝癌miRNA表达谱数据, 共有1 881条miRNA序列, 原发性肝癌癌组织372例, 正常对照肝组织50例。NGS检测得到的miRNA表达程度数据数值变异很大, 动摇于0至107之间, 数值散布不对称, 不利于组间比拟。将一切数据停止以10为底的对数转换 (lg X) , 散布对称性明显改善。与正常肝组织相比, 原发性肝癌组织中表达升高至2倍以上的miRNA有41个, 降低至1/2以下的miRNA有115个 (见表1) 。

  2.2 原发性肝癌相关突变基因

  原发性肝癌相关突变基因以c-Bioportal数据库为主, 分离相关参考文献停止查找, 表2罗列了发作率5%以上的原发性肝癌相关突变基因。

  表1 差别表达的miRNA Tab 1 Deregulated miRNAs

  注: (1) miRNA表达差别为原发性肝癌组织与癌旁组织相比拟; (2) 表中有“/”衔接者表示多个前部相同的miRNA。

  2.3 miRNA靶点预测与目的miRNA肯定

  在miR-Walk 2.0中剖析上述表达差别2倍以上的miRNA, 得到其靶基因。挑选所得的靶点需求经至少一种检测办法的检验并有正式发表文献支持, 其中高等级证据包括报告基因剖析、蛋白质免疫印迹实验、q PCR, 证据较弱的检测办法有基因芯片检测、NGS等。miRNA靶基因中含有原发性肝癌相关突变基因者初步作为候选miRNA。将候选miRNA在Pub Med逐一检索, 分离检索结果确认候选miRNA作为待研讨miRNA的牢靠性。

  表2 原发性肝癌相关高频突变基因Tab 2 High-frequency gene mutations associated with primary liver cancer

  3 讨论

  miRNA与原发性肝癌的关系一向是抢手课题, 每年均有大量文献发表。miRNA品种繁多, 普遍参与机体生理功用、病理变化, 但仅有局部miRNA表现出明显组织或细胞特异性。研讨原发性肝癌早期诊断相关的miRNA, 首先需求寻觅目的miRNA。适宜的目的miRNA普通需具备以下特性: (1) 在原发性肝癌组织中表达程度显著异于正常肝组织; (2) miRNA直接参与或间接触及原发性肝癌发病机制、侵袭或转移过程; (3) 对肝癌细胞系中miRNA表达程度人为干预可抑止或促进癌细胞生长、增殖或恶性表现。其中, 第一条最为重要, 也是挑选目的miRNA的第一步。

  寻觅新的miRNA普通运用高通量的检测办法如NGS, 可极大进步工作效率, 但费用昂扬, 数据剖析复杂, 普通需求大型项目支持。选择原发性肝癌诊断相关miRNA时, 很多研讨者参考已有miRNA信息, 运用高通量检测办法微芯片技术从肝癌细胞系或患者癌组织、体液中挑选目的miRNA, 获取一个或多个miRNA用于后续分子机制或诊断实验等研讨。但该研讨方式缺陷显而易见。首先, 微芯片技术本钱不低, 资金不富余的状况下很难停止大样本筛查, 得到的miRNA差别表达结果牢靠性不高。其次, 微芯片技术灵活性高, 但假阳性亦很常见, 挑选实验中常常得到大量差别表达的miRNA, 需求对结果停止合理取舍及进一步挑选。第三, 原发性肝癌发病机制复杂, 触及的突变基因众多, 上下游受影响的miRNA数量难以预估, 每一个原发性肝癌患者或每一株肝癌细胞系的miRNA表达谱均可能互不相同。因而, 寻觅烦琐、牢靠的挑选目的miRNA的办法在miRNA临床研讨中意义严重。

  TCGA是美国国立癌症研讨所 (National Cancer Institute, NCI) 和美国国立人类基因组研讨所 (National Human Genome Research Institute, NHGRI) 结合推进的癌症基因组图谱方案, 经过大范围的基因组测序和剖析技术, 获取多种癌症的基因表达、DNA甲基化、基因突变、miRNA表达等信息, 以期全面了解恶性肿瘤发病、停顿的分子机制。TCGA有一套完善而严谨的工作流程, 包括样本及入组患者或安康意愿者临床信息的搜集、分类、处置、质检和贮存, 高通量技术办法停止基因组审定、测序, 特地的数据整理和剖析中心, 全流程保证取得数据的精确、牢靠。包括原发性肝癌在内, TCGA目前曾经搜集了61个部位的恶性肿瘤的基因组数据材料, 且相当多的数据公开无偿运用, 在国际上知名度相当高。除数据质量过硬以外, 大样本量、含细致临床材料和持续随访也是TCGA数据的典型特性。但是, NGS技术产生的数据量大而复杂, 通常需生物信息学专业人士处置, 无编程根底的非专业人员普通难以剖析应用NGS原始数据。近年来, 基于TCGA数据停止二次开发的可视化在线工具大量涌现, 如c-Bioportal、Onco Lnc和MEXPRESS等, 使得无生物信息学学问背景的研讨者也可轻松运用TCGA数据停止课题研讨。目前, 应用TCGA公开数据挑选原发性肝癌相关miRNA也是较常用手腕, 我们以为, 该办法可能比用小样本肝癌患者或多种肝癌细胞系停止miRNA挑选中更有效率、更精确。

  在探究miRNA对原发性肝癌诊断价值的研讨中, 挑选相关性强、特异性好的miRNA作为血清学诊断标志物至关重要。为使挑选的miRNA与原发性肝癌相关性更强, 除请求miRNA在肝癌组织中表达程度较正常肝组织变化2倍以上, 尚需其与至少一个原发性肝癌突变基因发作互相作用, 而这种互相作用需求较强的证据支持。为此, 我们在应用TCGA数据得到差别表达的miRNA后, 进一步在miRNA靶点预测在线工具miRWalk 2.0上大范围寻觅备选miRNA的可能作用靶点, 并将靶点与原发性肝癌高频突变基因停止比对, 有重合者列为重点思索miRNA, 以期找到与原发性肝癌有强相关性的miRNA。miRWalk 2.0是一个miRNA靶点预测工具, 除本身的算法工具以外, 其整合了其他12个miRNA靶点预测项目的资源[DIANA-micro Tv 4.0、DIANA-micro T-CDS、miRandarel2010、mir Bridge、miRDB4.0、miRmap、miRNAMap、doRi NA (Pic Tar2) 、PITA、RNA22v2、RNAhybrid2.1和Targetscan6.2], 提供miRNA在启动子、编码序列、5'非翻译区和3'非翻译区上分离位点的计算和预测, 并从miRTar Base、PhenomiR、miR2Disease和HMDD获取miRNA-靶点互相作用的实验考证证据。在miR-Walk 2.0上将前述差别表达2倍以上的miRNA停止检索, 若得到的靶点中包含原发性肝癌相关高频突变基因且得到高强度实考证据, 则确以为候选miRNA。将候选基因miRNA在Pub Med逐一检索, 阅读文献摘要, 确认候选miRNA作为原发性肝癌无创诊断标志物的可行性。

  目前已发表的关于miRNA诊断原发性肝癌的研讨较多, 且在持续增加, 由于单个miRNA对原发性肝癌的诊断敏理性较差, 精确性也不尽如人意, 目前研讨者越来越倾向于运用多种miRNA结合诊断, 且常常结合血清AFP, 以进步诊断灵活性和特异性。综合思索临床应用的经济性和减少实验操作误差, 早期诊断模型中miRNA数量不宜过多, 参考既往研讨结果, 结合3~4种miRNA树立原发性肝癌诊断模型比拟理想。本文应用网络数据库TCGA中原发性肝癌相关miRNA数据停止生物信息学剖析, 分离肝癌突变基因及miRNA-靶基因互相作用数据, 挑选miRNA停止后续原发性肝癌的早期诊断研讨, 办法烦琐, 触及统计学技术不复杂, 值得推行。缺陷在于TCGA数据来自于原发性肝癌组织, 据此挑选的miRNA能否在循环中的表达程度也有显著差别, 需求在临床样本中进一步确认。

栏目分类