机器学习转录组学与表观组学

最后发布时间:2023-08-11 08:22:40 浏览量:

第一天
理论部分
高通量测序原理
高通量测序基础
测序方法及数据
二代测序数据分析流程
实操内容
R语言基础
R(4.1.3)和Rstudio的安装
R包安装和环境搭建
数据结构和数据类型
R语言基本函数
数据下载
数据读入与输出
第二天
理论部分
多组学基础
常用生物组学实验与分析方法
常用组学数据库介绍
批量处理组学数据
生物功能分析
基于转录组学的差异基因筛选,疾病预测
组学数据可视化
实操内容
Linux操作系统
Linux操作系统的安装与设置
网络配置与服务进程管理
Linux的远程登录管理
常用的Linux命令
在Linux下获取基因数据
利用Linux 探索基因组区域
Shell script与Vim编辑器
基因组文件下载与上传
Linux权限管理
文件的身份
修改文件的所有者和所属组
修改文件权限
第三天
理论部分
介绍转录组学的基本概念和研究流程
RNA-seq数据的预处理和质量控制
序列比对和对齐评估
基因表达量估计和差异表达分析
实操内容
转录组测序数据质量控制
转录组数据比对
RNA-seq数据原始定量
主成分分析
原始定量结果差异分析
差异结果筛选及可视化
GO和KEGG通路富集分析
GSEA基因集富集分析
第四天
理论部分
表观遗传学的基本概念和技术介绍
DNA甲基化和组蛋白修饰的分析方法
表观组数据的预处理和质量控制
差异甲基化和差异修饰分析
甲基化和修饰的功能注释和富集分析
甲基化数据的整合分析和基因调控网络构建
表观组数据的可视化方法和工具
介绍其他表观组学技术(如染色质构象捕获)
实操内容
测序数据质量控制和检查
数据比对和多匹配问题
计算结合峰位置
IGV中组学结果可视化
差异peaks分析
结合程度矩阵计算
富集热图和曲线图绘制
第五天
理论部分
机器学习概述
线性模型
决策树
支持向量机
集成学习
模型选择与性能优化
实操内容
决策树算法实现
随机森林算法实现
支持向量机(SVM)算法实现
朴素贝叶斯算法实现
Xgboost算法实现
聚类算法实现
DBSCAN算法实现
层次聚类算法实现
第六天
理论部分
基因功能注释和富集分析
WGCNA(Weighted Gene Co-expression Network Analysis)网络分析
转录因子分析和调控网络构建
转录组数据的可视化方法和工具
转录水平预测蛋白翻译水平
实操内容
创建Seurat对象
数据质控
测序深度差异及标准化
单细胞数据降维
批次效应去除
数据整合
亚群注释
GSVA通路活性分析
单细胞富集分析

快捷入口
机器学习 思维导图 浏览PDF 下载PDF
分享到:
标签