본문 바로가기
메뉴 바로가기

클라우드 서비스

  클라우드 서비스

국가생명연구자원정보센터(KOBIC)에서는 대용량 분석 서버나 분석 기술이 필요한 연구자들을 위하여 Bio-Express 대용량 유전체 데이터 분석 클라우드 서비스를 제공합니다.

Bio-Express는 다음과 같이 구성됩니다.

  • (1) 대용량 바이오데이터를 효율적으로 저장, 관리 및 활용 하기 위한 빅데이터 플랫폼,
  • (2) 편리한 인터페이스와 분석 환경을 제공하는 CLOSHA 통합 자동 분석 시스템,
  • (3) 대용량 데이터를 고속 전송하는 고속 전송 시스템 KoDS 3.0

자체 기술로 구축된 빅데이터 플랫폼은 분산 파일 시스템(HDFS)을 기반으로 현재 많이 사용되는 일반 분석 프로그램과 Hadoop 기반의 빅 데이터 분석 프로그램을 동시에 사용할 수 있습니다. 또한 연구자들이 최신의 공용 유전체 데이터를 곧바로 이용할 수 있도록 1000 Genomes 데이터, TCGA 데이터 등을 포함한 다양한 공용 데이터를 함께 제공하고 있습니다.

Bio-Express 바로가기

CLOSHA 통합 자동 분석 시스템

  • • 워크플로우 기반 분석 작업 수행
  • • 빅데이터 분석 프로그램을 사용 가능
  • • 파이프라인 실행 상태 및 결과 모니터링 기능
  • • 다양한 종류의 분석 프로그램/파이프라인 제공

고속 전송 시스템 KoDS 3.0

  • • 대용량 바이오데이터의 고속 전송
  • • 높은 신뢰성과 안정성 제공
  • • 편리한 사용자 인터페이스
  • • 네트워크 대역폭의 효율적인 사용

분석서비스

  • 파이프라인 이름

    454 시퀀싱 미생물 군집 분석 파이프라인 with QIIME

    바로가기 ▶
  • 파이프라인 사용 분야

    454 시퀀싱 결과를 이용한 미생물 군집 분석 분야

  • 파이프라인 기능요약

    454 플랫폼으로 시퀀싱한 16S rRNA 시퀀스에 대해 QIIME 기반 미생물 군집 분석 환경을 제공하는 파이프라인

  • 파이프라인 모식도 설명

    Pre-processing, OTU clustering, Sequence alignment, Taxonomic assignment, α-diversity analysis, β-diversity analysis 총 6단계의 모듈로 구성된다. 각 단계에서 진행되는 분석 과정은 다음과 같다. 첫 번째 분석 단계인, Pre-processing은 454 시퀀싱 리드에 대한 전처리 과정으로 demultiplexing과 quality filtering을 차례대로 진행하며, 결과 파일은 FASTA 포맷으로 제공된다. 두 번째 분석 단계인, OTU(Operational Taxonomic Unit) clustering은 preprocessing 과정을 거친 서열들의 유사도를 분석하여 유사도가 높은 서열끼리 묶는 과정으로 OTU clustering 후 각 OTU의 대표 서열(representative sequence)을 제공하여 이후 분석에서 활용할 수 있도록 한다. 세 번째 분석 단계인, Sequence alignment는 OTU간 phylogeny 분석을 위해 각 OTU의 대표 서열간 alignment를 진행하고, 서열간 alignment 결과에 대한 filtering을 거친 후 OTU간 phylogenetic tree를 구성하는 과정이다. 네 번째 분석 단계인, Taxonomic assignment는 OTU 별 대표 서열과 미생물 서열을 모아놓은 레퍼런스 데이터베이스 사이의 비교를 통해 각 서열이 어떤 미생물인지를 판별하는 과정으로 판별 결과를 텍스트 파일, 그림 파일로 제공한다. 다섯 번째 분석 단계인, α-diversity analysis는 각 샘플에 대한 미생물 군집 분포를 분석하는 과정으로 샘플에 얼마나 많은 미생물이 분포하는지에 대한 richness와 샘플에 존재하는 미생물 군집 개체수의 균등성을 의미하는 evenness에 대한 다양한 분석 결과를 제공한다. 여섯 번째 분석 단계인, β-diversity analysis는 샘플간 미생물 군집 분포를 비교 분석하는 것으로 샘플간 미생물 군집 분포를 비교하기 위해 사용되는 UniFrac distance matrix(weighted, unweighted)와 PCoA plot을 분석 결과로 제공한다.

  • 파이프라인 구성 모식도

  • 파이프라인 구성 분석 도구

    열기/닫기
    이름 사이트주소 기능요약 옵션 설명
    이름 설명
    QIIME http://www.qiime.org Pre-processing
    (Demutiplexing,
    Quality filtering)
    -i 서열 파일(FASTA)
    -q Quality score 파일
    -m 분석 샘플 정보 파일
    -mo 분석 샘플 정보 검증
    결과 저장 디렉토리
    -o 결과 저장 디렉토리
    Chimera filtering -i 서열 파일(FASTA)
    -m Chemera filtering method
    -o 결과 저장 디렉토리
    OTU clustering -i 서열 파일(FASTA)
    -m OTU clustering method
    -o 결과 저장 디렉토리
    α-Diversity analysis -i OTU table 정보 파일(BIOM)
    -m 분석 샘플 정보 파일
    -t Phylogenetic tree 파일
    -o 결과 저장 디렉토리
    β-Diversity analysis -i OTU table 정보 파일(BIOM)
    -m 분석 샘플 정보 파일
    -t Phylogenetic tree 파일
    -o 결과 저장 디렉토리
    PyNAST http://biocore.github.io/
    pynast/
    Sequence alignment -i 서열 파일
    -o 결과 저장 디렉토리
    FastTree http://www.microbesonline.
    org/fasttree/
    Phylogenetic tree -i Sequence alignment 파일
    -o 결과 저장 디렉토리
    RDP https://rdp.cme.msu.edu/ Taxonomic assignment -g Reference database
    -c Cutoff value
    -o Classification 결과 파일
    -h Classification 결과를 계층구조로
    표현한 결과 파일
    Mothur www.mothur.org/ Chimera filtering fasta
    서열 파일
    template Reference database
위로