第一天理论部分高通量测序原理高通量测序基础测序方法及数据二代测序数据分析流程实操内容R语言基础R(4.1.3)和Rstudio的安装R包安装和环境搭建数据结构和数据类型R语言基本函数数据下载数据读入与输出第二天理论部分多组学基础常用生物组学实验与分析方法常用组学数据库介绍批量处理组学数据生物功能分析基于转录组学的差异基因筛选,疾病预测组学数据可视化实操内容Linux操作系统Linux操作系统的安装与设置网络配置与服务进程管理Linux的远程登录管理常用的Linux命令在Linux下获取基因数据利用Linux 探索基因组区域Shell script与Vim编辑器基因组文件下载与上传Linux权限管理文件的身份修改文件的所有者和所属组修改文件权限第三天理论部分介绍转录组学的基本概念和研究流程RNA-seq数据的预处理和质量控制序列比对和对齐评估基因表达量估计和差异表达分析实操内容转录组测序数据质量控制转录组数据比对RNA-seq数据原始定量主成分分析原始定量结果差异分析差异结果筛选及可视化GO和KEGG通路富集分析GSEA基因集富集分析第四天理论部分表观遗传学的基本概念和技术介绍DNA甲基化和组蛋白修饰的分析方法表观组数据的预处理和质量控制差异甲基化和差异修饰分析甲基化和修饰的功能注释和富集分析甲基化数据的整合分析和基因调控网络构建表观组数据的可视化方法和工具介绍其他表观组学技术(如染色质构象捕获)实操内容测序数据质量控制和检查数据比对和多匹配问题计算结合峰位置IGV中组学结果可视化差异peaks分析结合程度矩阵计算富集热图和曲线图绘制第五天理论部分机器学习概述线性模型决策树支持向量机集成学习模型选择与性能优化实操内容决策树算法实现随机森林算法实现支持向量机(SVM)算法实现朴素贝叶斯算法实现Xgboost算法实现聚类算法实现DBSCAN算法实现层次聚类算法实现第六天理论部分基因功能注释和富集分析WGCNA(Weighted Gene Co-expression Network Analysis)网络分析转录因子分析和调控网络构建转录组数据的可视化方法和工具转录水平预测蛋白翻译水平实操内容创建Seurat对象数据质控测序深度差异及标准化单细胞数据降维批次效应去除数据整合亚群注释GSVA通路活性分析单细胞富集分析