基于云计算和生成式AI的生信数据挖掘系统
项目介绍
随着测序技术的日益成熟,从海量基因数据输中洞察其真正的价值,已成为亟待解决的问题。处理测序数据的流程主要分为上游分析和下游分析两个部分,上游分析主要是将fastq数据转化为表,下游主要是对表数据的可视化展示。目前国内外对于上游和下游数据分析都有一些解决方案,例如处理上游分析的自动化流程管道的软件包括:nextflow、cromwell、snakemake、cwltool等;处理下游可视化的软件包括:hiplot、cloudtutu、chartcube
开发动机
开源做什么?《基于云计算和生成式AI的生信数据挖掘系统》,我想将云计算和人工智能带到普通科研工作者的身边,他们只需要支付云计算上计算资源的费用,就可以完成数据分析,随后结合大模型的推理能力对分析结果进行解读。
快速体验
第一步
打开:https://bioinfo.online/pipeline-proj
注:为保证数据的安全,这里前端项目会访问本地localhost的api服务,因此需要第二步,在本地运行后端服务
第二步
在本地运行以下命名,启动后端服务
注:需要安装docker
# 创建网络
docker network create pipeline
# 启动mongo数据库
docker run --rm -d \
--name mongo \
--network pipeline \
--hostname mongo \
-p 27018:27017 \
registry.cn-hangzhou.aliyuncs.com/wybioinfo/mongo
# 启动后端程序
docker run --rm \
--name service-pipeline \
--network pipeline \
-e MONGO_HOST=mongo \
-e MONGO_PORT=27017 \
-e MONGO_DB=pipeline_db \
-p 30001:30001 \
registry.cn-hangzhou.aliyuncs.com/wybioinfo/service-pipeline-boot-1.0.jar
开发进展
项目地址
- 可视化:https://github.com/bioproj/pipeline-proj
- 业务处理:https://github.com/bioproj/pipeline-ui-proj
- 分析引擎:https://github.com/bioproj/nextflow-proj
联系
如果小伙伴对这个开源项目感兴趣,请联系我
参考
galaxy、nextflow、snakemake、nf-tower、dockstore