你的位置:风暴娱乐 > 关于风暴娱乐 > 孟德尔随机化常用数据库
孟德尔随机化常用数据库
发布日期:2024-10-14 14:22    点击次数:136

💡专注R语言在🩺生物医学中的使用

设为“星标”,精彩不错过

今天介绍下孟德尔随机化常用的数据库,这些数据库存储了很多可免费下载使用的GWAS数据,可以方便大家白嫖,使用这些免费的数据进行孟德尔随机化分析。有些综合性的网站的数据是重合的。

ieu open gwas project

网址:https://gwas.mrcieu.ac.uk/

图片

目前最简单也是用的最多的一个综合性的GWAS网站。

该资源网站由布里斯托大学的MRC综合流行病学部门(Integrative Epidemiology Unit,IEU)开发,人工整理了超多的GWAS摘要数据。可用于免费下载、查询、分析等。

该项目最初是作为 MR-Base 和 LD Hub 项目的基础数据库,现在可通过官方API提供给更多的工具使用,比如R、Python等。

TwoSampleMR可直接通过官方API查询、下载、分析其中的数据,只要解决了网络问题,真的是非常好用。

该数据库所有的GWAS摘要数据都通过VCF格式存储,官方提供了专门的R包用以处理这些数据。如果你的网络问题无法解决,那么可以考虑直接下载VCF格式的原始文件进行处理,可以得到和在线获取一模一样的结果。但是这样做对电脑的内存又有要求。。。

FINNGEN

网址:https://www.finngen.fi/en

图片

FinnGen(Finnish Genetics)研究于 2017 年秋季在芬兰启动,是一项将基因组信息与数字医疗保健数据相结合的独特研究。FinnGen研究是一个前所未有的全球研究项目,代表了此类研究中规模最大的研究之一。该项目旨在通过基因研究改善人类健康,并最终确定治疗多种疾病的新治疗靶点和诊断方法。

Finngen计划是芬兰学术机构、医疗机构和公司的合作成果。该研究由芬兰国家商务促进局和13家国际制药公司资助:艾伯维、阿斯利康、渤健、勃林格殷格翰、百时美施贵宝、罗氏集团成员基因泰克、葛兰素史克、杨森、Maze Therapeutics、默沙东、诺华、辉瑞和赛诺菲。

FINNGEN中的GWAS数据可用于孟德尔随机化研究中,这些数据都是可以免费下载使用的。而且还在不断更新中,截止到写这篇文章时(2024.1.3)更新到了第10版(2023.12.18更新)。

biobank

网址:http://www.nealelab.is/uk-biobank

图片

Neale实验室的UK Biobank数据库是一个大型、长期的生物医学研究项目,旨在探讨基因与健康状况之间的关系。这个数据库的设计和实施得到了英国国家医学研究理事会(MRC)等机构的支持。

UK Biobank项目收集了来自50至70岁之间的约50万名英国居民的广泛数据,包括基因型、临床测量、调查问卷、生物样本等。UK-Biobank项目采用了长期追踪的设计,以便能够跟踪参与者的健康和疾病状况,从而更好地理解基因与疾病之间的关系,以及基因与环境之间的相互作用。

在孟德尔随机化研究中,UK-Biobank的GWAS数据可以用作工具变量,帮助研究者评估特定因素对于疾病或其他生物学特征的因果效应。

目前免费版的uk biobank数据更新到2018年8月,这部分数据可以免费下载使用。如果要获得更新更多的数据,需要付费。

所有的官方分析数据的代码都可以直接在github找到。

除此之外还有个PAN-UKB:https://pan.ukbb.broadinstitute.org/

这是一个跨越6个大陆的多人种研究,对7228 个表型进行了多血统分析,总共进行了 16,131 项全基因组关联研究。

图片

这些数据也是可以免费下载使用的。

GWAS Catalog

网址:https://www.ebi.ac.uk/gwas/

图片

该网站由NHGRI(National Human Genome Research Institute)于2008年创立,以应对已发表的全基因组关联研究(GWAS)数量的快速增长。这些研究为研究常见变异对复杂疾病的影响提供了前所未有的机会,但是识别已发表的GWAS数据是很困难的,如果不对这些数据进行系统的总结,研究人员实际上无法访问这些出版物中包含的大量数据。

GWAS目录提供了一个一致的、可搜索的、可视化的和免费提供下载的SNP性状关联数据库,可以很容易地与其他资源集成,并可供世界各地的科学家、临床医生和其他用户访问。

在该网站中,所有符合条件的已发表的GWAS研究都通过文献搜索进行识别,并由工作人员进行评估,然后由他们提取文献中涉及的性状、重要的 SNP 性状关联和样本元数据。目标是在文章发表后 1-2 个月内根据文献的可用性策划符合条件的研究,并且数据每周发布一次。2020年以后还接受了未发布的GWAS数据的提交。

已发布的GWAS数据可通过网站的搜索页面进行搜索查看,也可直接下载,还可以通过API调用。GWAS的汇总数据也可通过FTP进行下载。

1000 Genomes Project

网址:https://www.internationalgenome.org/

图片

千人基因组计划在2008年~2015年期间实施,创建了最大的人类变异和基因型数据公共目录。随着项目的结束,EMBL-EBI的数据中心获得了Wellcome Trust的资助,并创建IGSR(International Genome Sample Resource)网站,以确保千人基因组计划数据的可访问性。

1000G的数据中除了有欧洲人的数据,还有很多亚洲人(包括中国人)的数据。这些数据都可在线查询或者下载使用。

PGC

网址:https://pgc.unc.edu/

图片

PGC(PSYCHIATRIC GENOMICS CONSORTIUM)是有史以来最大的精神病学生物学调查网站。

官网介绍:自2007年以来,PGC一直致力于揭示遗传学在精神疾病中的作用。归根结底,我们希望改善那些患有精神疾病的人的生活。精神病学基因组学联盟是精神病学史上最具创新性的实验之一。我们已经统一了该领域的大部分内容,以便在阐明精神疾病的遗传基础方面取得快速进展。我们有来自36个国家的800+研究人员和>400K受试者。

PGC和下面介绍的SSGAC、CTG都是以文献为主进行整理的,相当于是它帮你把文献整理好了,你可以直接下载使用其中的数据进行MR分析,不用自己再一篇篇的找了。

SSGAC

网址:https://www.thessgac.org/

图片

全称是:Social Science Genetic Association Consortium

SSGAC 于 2011 年 2 月 12 日在波士顿与 CHARGE(基因组流行病学心脏和衰老研究队列)联盟会议共同成立。在研讨会上,来自不同学科的50多名研究人员齐聚一堂,讨论成立一个研究联盟以研究社会科学成果遗传学的必要性和可行性。

SSGAC成立的一个主要推动力是人们越来越认识到,社会科学中现有的基因发现方法往往无法产生可复制的发现。SSGAC关于教育程度的试点项目已经证明了对社会科学遗传学采取替代性、严格的大数据方法的可行性。该联盟正在进行和未来的项目将继续采用这种基因发现方法,并致力于将这些发现的见解整合到医学和社会科学研究中。

CTGLAB

网址:https://ctg.cncr.nl/

图片

CTGlab(Complex Trait Genetics Lab)的研究探索了大脑相关健康和疾病个体差异的遗传和环境原因。该网站整合了来自不同领域(遗传学、神经科学、生物信息学、生物学、机器学习)的知识,使用和开发分析工具来分析和理解复杂性状的基因组数据,并与神经科学联系起来,以证明湿实验室实验中的因果关系。

CTGlab 由 Danielle Posthuma 于 2008 年成立,是 VU 和阿姆斯特丹大学医学中心 CNCR 内的一个小型研究小组。自 2014 年以来,CTGlab 是 CNCR 和 Amsterdam-UMC 的一个子部门。

除此之外,还有很多的其他的数据库没有介绍到,比如MiBioGen、GTEx,这些数据库是用来做肠道菌群MR、药物靶点MR的;

此外还有许多文献中的数据也是可以使用的,很多文献中还会介绍一些不太常见的数据库,等我收集好了再分享一波~

联系我们,关注我们

免费QQ交流群1:613637742免费QQ交流群2:608720452公众号消息界面关于作者获取联系方式知乎、CSDN、简书同名账号哔哩哔哩:阿越就是我 本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。

下一篇:没有了