南方科技大学 EN

南科大生物系翟继先研究团队首次发布包含20,000+拟南芥公共RNA-seq文库的在线搜索平台

日期:2020-08-07

      在过去的十年里,随着测序成本的降低和文库构建方法的发展,RNA-seq已成为继microarray之后研究基因表达的黄金标准。到目前为止,公共数据库释放的拟南芥相关的RNA-seq文库数目已经超过20,000个。这些海量数据资源对研究基因的转录调控,组织特异性,胁迫处理以及不同发育阶段的基因表达是十分宝贵的资源。然而,如何高效地利用如此庞大的高通量测序数据资源,对于研究者来说是一个巨大的挑战,特别是对于缺少编程基础的实验人员或者计算资源短缺的研究团队。

       2020年8月4日,南方科技大学生物系植物与食品研究所翟继先课题组在植物学领域知名学术期刊Molecular Plant在线发表了可以方便快速查询超过两万个公共RNA-seq文库的在线资源,论文题为“A comprehensive online database for exploring ~20,000 public Arabidopsis RNA-Seq libraries”。该数据库(Arabidopsis RNA-seq database, ARS)整合了来自GEO、SRA、ENA和DDBJ数据库的20,068个拟南芥RNA-seq数据,提供了一个在线的“Google-style”查询工具。该研究对所有文库进行了基因表达水平定量和共表达网络分析,并将所有文库进行分类,总共涉及1176个突变体,1102种处理条件,12个组织和176个发育时期,同时也对突变体和处理条件分别同对应的对照组进行差异表达分析。

1.png 

图1: 网页数据集与功能说明(上图),网站首页及部分button说明(下图)

 

      为提高实验人员搜索海量数据的效率,ARS不仅支持基因的搜索,同时还提供文库、项目编号、关键字以及任意不同组合的查询方式。ARS具有快速查找基因表达量、组织特异性、突变体和处理响应的功能,并以多种图表返回搜索结果,同时支持对搜索结果下载。用户可根据自己的需求在搜索前和搜索后对表格结果进行过滤,在画图区域单击获取相应文库的信息。此外,网站部署了online基因组浏览器(IGV),实验人员可更加便捷的查看每个文库的详细比对情况。为便于研究者之间快捷地分享最新搜索结果,ARS提供了网页共享功能,并定期更新文库资源,研究者可通过共享按钮来共享当前结果。

2.jpg

3.jpg

 

图2: 基因表达量结果展示(上图),IGV查看序列比对情况(下图)

 

      南方科技大学生物系翟继先副教授为该论文的通讯作者,课题组研究助理张洪,研究助理张飞,博士研究生于义溟为共同第一作者。生物系郭红卫教授和李博生研究助理教授参与了本研究的部分工作。该研究得到了基金委,广东省创新创业团队,以及深圳市科创委的资助。

 

原文链接:https://www.cell.com/molecular-plant/fulltext/S1674-2052(20)30257-4

翟继先课题组主页集贤斋链接: www.jixianzhai.org

 

供稿:翟继先课题组

文字、图片:张洪、于义溟

通讯员:付文卿