日前,Simons基金会和明码生物科技宣布,其制作的世界最大自闭症数据库SSC上线。SimonsSimplexCollection(SSC)是全球最大的自闭症数据库,包含来自自闭症患儿家庭的1万个外显子数据可通过普通的网络连接查询。同时,SSC数据能与世界上其他主要数据库无缝对接。
目前已有来自美国、加拿大、中国、法国、冰岛、澳大利亚、爱尔兰、巴西和卡塔尔等17国家相关机构的自闭症研究人员,通过云端查询等方式使用了这一数据库。
SSC包含近2600个家庭的基因组序列数据和详细的临床表型数据,所有这些家庭均包含有一个患一种自闭症(ASD的儿童、正常的父母和兄弟姐妹。它是深化理解ASDs的重要资源,也是全球最大的专业性基因组序列数据库。明码生物科技凭借其优秀的数据库架构计算效率,使得如此大规模的数据运算成为可能。SSC用户可直接查询个人基因组数据、家系数据或者整个数据库。人们不需要移动或下载数据文件,就可以挖掘所有样本的GATK和FreeBayes突变;可以通过由归一化的全球标准序列数据在后台支持的、始终处于运行状态的可视化工具查看运算结果;或者与同行开展合作。数据存储于可弹性扩展的兼容HIPAA规则的明码生物科技云端,由DNAnexus提供后台技术支撑。
SSC包含接近2600个ASD先征者以及他们的父母和表型正常的兄弟姐妹的全外显子测序数据和大于2000种表现型数据。客户端的特征包括:
·所有SFARIGene和其他主要的ASD基因及其突变列表
·所有主要的公开标准数据库
·原始BAM测序数据的即时图形化展示
·突变类聚以强化罕见突变的统计关联性
·新生同源基因检测
·携带者分析
·预测的基因突变效应和等位基因频率过滤
·定义表现型的性状选择器和报告生成器
·其他来源数据的输入与功能整合
“SSC的设计初衷是成为大规模、开放性查询的发现引擎,并且取得了成功。我们很高兴与明码生物科技开展合作,进一步挖掘SSC的潜力,使它能够被全球自闭症研究者直接查询。”SimonsFoundationAutismResearchInitiative(SFARI)主任LouisReichardt博士说,“数据上线便于它成为主要自闭症数据库网络的中枢,便于研究者构造更大规模的虚拟队列。我们邀请该领域的所有人使用它。”
“能与Simons基金会开展合作,我们感到非常激动和自豪。对于更好地理解、诊断和治疗ASD而言,我们认为这是翻开了全球合作的新一页。”明码生物科技COOHannesSmarason先生说,“对于创建一个DNA互联网而言,把SSC导入WuXiNextCODEExchange是一个里程碑式的事件,必将促进自闭症治疗研究的进展。而要解决这一复杂的难题,我们必须创建真正巨大的数据库。我们期待着与Simons基金会和自闭症团体的合作,来使这一资源变得更加完善,导入全基因组数据,持续扩大其规模、范围,以达成这一目标。”
“这是一个规则改变者。我们已经在使用明码生物科技客户端来验证和拓展新的发现、确认临床诊断,”波士顿儿童医院神经病学医生及助理教授TimothyYu博士说,“这是大基因组学投资促进我们理解自闭症和其他种类复杂疾病的正确方式。由于我们以及越来越多的合作者拥有GOR格式的研究和诊断数据,我们已经感受到了大规模虚拟队列对于加快研究进度的影响,并且我们正在邀请我们的合作者也加入进来。”
张sc的建立,为自闭症儿童的早期干预和科学研究提供了十分宝贵的第一手资料和详实的基础数据,希望这一数据库能够为广大自闭症患者带来福音!
SimonsSimplexCollection(SSC)是设计用于支持发现增加自闭症风险的罕见及新生遗传事件的专业、严谨的数据库,包括2,600个“单一”家系,所有这些家系均包括一名自闭症孩子、正常的父母以及至少一名表现正常的兄弟姐妹。经过批准的研究者可以通过SFARIBase或者写邮件给collections@sfari.org来获得SSC生物学样本和表现型数据和遗传数据。SSC测序数据已经获得了100种自闭症候选基因。
SSC由SFARI(SimonsFoundationAutismResearchInitiative)提供支持。SFARI的使命是通过为最高质量的相关创新研究提供基金支持来改进对于自闭症的理解、诊断和治疗。
SSC的建立是为了改进对于自闭症的理解、诊断和治疗,目前已有近2600个家庭的基因组序列数据和详细的临床表型数据,希望以后能有更多的数据资源,让我们更接近自闭症真相!