基于云计算和生成式AI的生信数据挖掘系统

  1. 系统整体设计思路
  2. snakemake
  3. nextflow
  4. Cromwell

项目介绍

随着测序技术的日益成熟,从海量基因数据输中洞察其真正的价值,已成为亟待解决的问题。处理测序数据的流程主要分为上游分析和下游分析两个部分,上游分析主要是将fastq数据转化为表,下游主要是对表数据的可视化展示。目前国内外对于上游和下游数据分析都有一些解决方案,例如处理上游分析的自动化流程管道的软件包括:nextflowcromwellsnakemakecwltool等;处理下游可视化的软件包括:hiplotcloudtutuchartcube

开发动机

开源做什么?《基于云计算和生成式AI的生信数据挖掘系统》,我想将云计算和人工智能带到普通科研工作者的身边,他们只需要支付云计算上计算资源的费用,就可以完成数据分析,随后结合大模型的推理能力对分析结果进行解读。

快速体验

第一步

打开:https://bioinfo.online/pipeline-proj

注:为保证数据的安全,这里前端项目会访问本地localhost的api服务,因此需要第二步,在本地运行后端服务

第二步

在本地运行以下命名,启动后端服务

注:需要安装docker

  # 创建网络
  docker network create pipeline
  # 启动mongo数据库
  docker run --rm -d \
    --name mongo \
    --network pipeline \
    --hostname mongo \
    -p 27018:27017 \
    registry.cn-hangzhou.aliyuncs.com/wybioinfo/mongo
  # 启动后端程序
  docker run --rm \
    --name service-pipeline \
    --network pipeline \
    -e MONGO_HOST=mongo \
    -e MONGO_PORT=27017 \
    -e MONGO_DB=pipeline_db \ 
    -p 30001:30001 \
    registry.cn-hangzhou.aliyuncs.com/wybioinfo/service-pipeline-boot-1.0.jar

开发进展

项目地址

联系

如果小伙伴对这个开源项目感兴趣,请联系我

参考

galaxynextflowsnakemakenf-towerdockstore

灵感