WGS单菌组装分析
- 组装分析
- 单菌基因预测、去冗余和定量
- 原核生物基因组注释

全基因组组关联分析GWAS简介

GATK4.0数据分析实战
- 从Fastq到VCF
- GVCF 模式
- VCF质控

plink、gemma及可视化

GATK4.0 理论
- GATK4 HaplotypeCaller

变异分析文件和工具
- bcftools 工具介绍
- VCF详细介绍
- 变异位点基因注释

变异注释
- VEP

variant discovery
- pipleline
- Variant Annotation
  - Annovar
  - SnpEff
- Joint Calling
- Somatic CNV
- Germline CNV
- germline structure variation
- Somatic SNV Indel
- Germline SNV Indel
- GATK3.0 WGS 分析
- Coursera基因组课程

GWAS、MWAS、mGWAS、eQTL、miQTL

单体型(Haplotype)

GWAS 与宏基因组数据整合

public GWAS summary statistics for AD

The microbiome GWAS was performed on ES-Ana relative abundance in the discovery cohort

APOE4 的 rs429358 与 rs7412是连锁不平衡吗

GWAS 基因型填充的流程

AsA芯片数据经过genomestudio处理后得到并经过plink 样本和基因型的质控后的map和bed文件如何使用 Michigan Imputation 分析

基因型填充FQA

HRC.r1-1.GRCh37.chr20.shapeit3.mac5.aa.genotypes.bcf 与 HRC.r1-1.GRCh38.chr1.shapeit3.mac5.aa.genotypes.msav 的区别 Reference Panel 的 Phasing 和 Imputation 必须选择一样吗都是HRC或 1000G 吗，位点列表只能用 HRC.r1-1.GRCh37.wgs.mac5.sites.tab.gz 吗没有对应的1000G

如何从 551S.bim 中获得常染色体SNP的原始基因分型数据

Minimac4 imputation 输出 VCF 文件

minimac4 结束后得到 23个文件,后续 gwas分析如何操作需要合成一个文件吗,需要格式转换吗

dosage是什么，在GWAS分析中的作用是什么，填充后关联分析使用 PLINK 1.9 不使用 dosage 使用什么

细解释 GT 的 0|0 这个位点的REF 和ALT 是 A G 为什么表示 REF/REF A/A ，为什么说是 phasing 过的，GP代表 A/A A/G G/G 等位基因出现的概率吗 DS 为什么 DS = 0×P(0/0) +1×P(0/1) +2×P(1/1) 这样计算

GWAS pheno.txt格式解释

.fam 如何在一开始填充表型与性别

GWAS --covar-name --pheno-name

LD clumping

Github开源生信云平台 DEMO

Brave Github开源生信云平台

全基因组思维导图

: wangyang
: 联系作者

GWAS 与宏基因组数据整合

最后发布时间 : 2026-06-12 11:40:35 浏览量 :

不能直接把“每个 SNP 的 P 值”和“每个菌群丰度”做相关性分析

GWAS：每个 SNP 对应一个统计量（β、OR、P 值）
宏基因组：每个样本对应一个菌群丰度

而真正可以建立联系的是样本级(genotype × microbiome) 数据

Sample	rs123	rs456	rs789	Bacteroides	Prevotella	Blautia
S1	AA	GG	CC	0.12	0.03	0.15
S2	AG	GT	CT	0.08	0.20	0.10
S3	GG	TT	TT	0.25	0.01	0.30

实际上就是把 SNP 当作自变量：

菌群丰度 ~ SNP + Age + Sex + BMI + PCA

例如：

 Bacteroides ~ genotype + age + sex + PC1 + PC2

$\text{abundance}=\beta_0+\beta_1\text{Genotype}+\beta_2\text{Age}+\cdots+\epsilon$

那么生成的 890S.fam 不是 PLINK 自己创造 FID，而是直接复制 .ped 文件前 6 列

1 XJSCZ002 0 0 1 -9
2 XJSCZ003 0 0 2 -9

1       XJSCZ002        0       0       1       0       D       D       G       G       C       C       I       I       G       G       C       C       D       D       C       C       D       D       I       I       C >
2       XJSCZ003        0       0       2       0       D       D       G       G       C       C       I       I       G       G       C       C       D       D       C       C       D       D       I       I       C >

ped文件的第六列是0 fam文件的第六列变成-9

这是因为 PLINK 将 0 和 -9 都视为“缺失表型（missing phenotype）”，在某些转换过程中会统一规范化为 -9

单体型(Haplotype)

社交账号： 哔哩哔哩知乎微信公众号小红书淘宝店铺

站内资源： 文献管理淘宝商品

联系方式： 邮箱：1749748955@qq.com 电话：13892078448 微信号：bioinfo_online

本系统源代码： gitee

© 2020-2022 WANG YANG 陕ICP备20004121号-1

bioinfo