m6A文章解读
数据下载及整理
- 从TCGA数据库中下载了317份OSCC样品和32份正常样品的RNA表达谱及其相应的临床数据
鉴定13个m6A相关基因的差异表达分析
- METTL3,METTTL14,WTAP,KIAA1429,RBM15,ZC3H13,YTHDC1,YTHDC2,YTHDF1,YTHDF2,HNRNPC,FTO,ALKBH5
(A) 基于TCGA数据库的317个OSCC样品和32个正常对照m6A表达水平。N代表正常对照,而T代表肿瘤样品。
p <0.05 *; p <0.01**; p <0.001***
代表差异显著水平
(B) 13个m6A相关基因的差异表达分析。蓝色代表正常控制,红色代表OSCC采样。
m6A相关基因相关性分析
- HNRNPC与13个m6A相关基因中的7个相关,包括METTL3,METTL14,WTAP,KIAA1429,RBM15,YTHDC1,YTHDF1,YTHDF2。METTL14与YTHDC1的相关性最强。
(C) 13个m6A相关基因之间的相关性
基于M6A的聚类(肿瘤分型)
- 根据m6A相关基因的表达谱,进行了聚类分析来自TCGA数据库的317个OSCC样品,并确定了2个亚型(图2A – 2C)
- 主成分分析(PCA)的结果表明m6A相关基因可以区分OSCC患者(图2D)
- 临床特征的相关性分析(图2E)
(A,B) 聚类分析表明,TCGA中的317个OSCC样本可以分为2组
(C) 聚类1和2之间的生存分析。
(D) 在聚类分析的基础上进行主成分分析。PCA1代表主成分分析1,而PCA2代表主成分分析2。
(E) 聚类分析与临床特征的相关性(等级,p = 0.0352)。N代表TNM系统中的N分类,T代表TNM系统中的T分类。
预后模型的建立(风险模型构建)
所有m6A相关基因均纳入单因素和多因素cox回归研究,筛选预后相关基因
(A,B)基于13个m6A相关基因的单变量和多变量cox回归
Hazard ratio >1
,说明该基因是高风险基因,反之为低风险基因。高风险是指随之基因表达量的增加,患者死亡风险提高。
进行了LASSO cox回归和10倍交叉验证来确定变量
- lasso回归可以过滤掉相相关性比较高的基因,防止模型的过拟合
- 构建模型,计算病人的风险值
- 根据风险模型的中位数,将OSCC患者分为高风险组和低风险组(图3A)
根据lesso回归得到两个基因作为预测因子
-
使用R软件中的生存软件包对两组进行分析。低风险组倾向于经历更长的生存时间(图3B)
-
临床特征与风险水平之间的相关性分析表明,高风险组意味着较低的分化等级(图3C)
-
独立的预后分析表明,风险评分可能是独立的预后生物标志物(图3D,3E)
## 肿瘤分型及检验
#### 肿瘤分型
#### 主成分分析检验分型是否成功
## 临床信息提取
#### 分型生存分析
#### 分型与临床相关性热图
## 生存模型
#### 单因素的COX分析
#### lasso回归
#### 风险生存曲线
#### ROC曲线
参考
M6A-related bioinformatics analysis reveals that HNRNPC facilitates progression of OSCC via EMT
Comprehensive Analysis of the PD-L1 and Immune Infiltrates of m6A RNA Methylation Regulators in Head and Neck Squamous Cell Carcinoma