文章标题
 
大数据和衰老机制
作者:Mark Wanner 2019年5月14日
文章内容
 
Genetics, big data, aging, geneweaver
近来,已有诸多文章报道了生物医学研究数据的激增。到目前为止,基因组测序数据只是其中的冰山一角。研究人员也会不断产生 RNA 测序数据、蛋白质组学、单细胞分析、表型(性状)数据及其他更多类型数据。从人类患者本身,到酵母、蠕虫和果蝇等多种物种,数据从无数的课题和条件中(例如,癌症中的 RNA 剪接、涉及阿尔茨海默症 tau 纺锤体、2 型糖尿病中的胰岛功能障碍等)累积。对于小鼠来说,当然也有这种大量数据的累积。
 
不幸的是,每个孤立的数据集都无法完全解决研究人员的大多数问题,尤其是对于那些需要更多研究信息的复杂的过程、条件和疾病来说,更是如此。为了加速问题研究进程,有必要从研究跨物种特定问题的不同实验室收集实验数据。不幸的是,现实中存在着各种各样的障碍,如从共享意愿的阻碍因素到不兼容的数据格式,这些障碍都使我们无法充分利用大量涌现的现代数据。
 
GeneWeaver 是一套可以克服这些障碍的系统。研究人员可通过该系统整合数据,并使用各种分析工具来解析结果。GeneWeaver 整合和存储了实验性基因组数据,包括主要的发表文章、外部数据库以及用户提交的数据集等。该数据库可促进研究人员对跨物种和数据格式的数据以大数据分析的方式进行分析。杰克森实验室的 Elissa Chesler 教授(博士)研究员 Jason Bubier 博士领导的研究小组利用GeneWeaver分析了几个与老年学问题相关的衰老研究数据,展示了该系统的强大能力。在发表于 PLoS One 的一篇文章“Integration of heterogeneous functional genomics data in gerontology research to find genes and pathways underlying aging across species”中,研究人员发现了影响长寿的信号通路和新的保守基因。
 

       GeneWeaver
 
GeneWeaver是一个异质性功能基因组数据综合分析平台,可在全球功能基因组学分析中,对多个物种生物功能相关的基因、基因产物和基因变异,支持用户比较和对比这些生物功能。

 

在研究人员已开展的衰老相关研究中,包括热量限制延长寿命的信号通路(已被证明可以延长多种物种的寿命),以及延长特定物种寿命的药物。将基因组研究中发现的跨物种基因(同源基因)与受 Sirolimus-雷帕霉素(小鼠)和 3,4,4 ' -三羟基二苯乙烯白藜芦醇(果蝇)影响的基因进行结合分析,得到了一个涉及所有通路的常见基因 HSPA1A。HSPA1A 是 HSP70 复合体的一部分,之前已被证明与衰老和寿命相关。关注这个特殊的基因将会获得进一步的研究进展。
 
该研究小组还整合了来自6个物种(酵母、蠕虫、果蝇、大鼠、小鼠、人类)的73个衰老相关基因的数据,用于分析高度保守的衰老相关基因。研究发现,与衰老联系最紧密的基因 (Cd63) 存在于4个物种的12个基因集中,这为它在衰老机制中的作用提供了强有力的证据。在与研究人员的合作中,在蠕虫中敲除了它的同源基因以验证这一发现,结果观察到蠕虫的平均寿命延长了10.5%。尽管尚没有该基因的变异对人类衰老影响的记录,但这个结果提示Cd63的作用有待进一步研究。
 
随着更多可用数据的产生(包括本文中分析的与衰老相关的功能性基因组数据),大数据的整合和分析将变得越来越重要。随着GeneWeaver 数据库中纳入数据集数量和种类的持续增长,其实用性和功能性也在不断增长。未来,数据资源聚合和分析方面的进展将为研究人员对衰老及其他健康和疾病相关过程发现新机制的趋同性分子证据提供便利。
 
搜索分组