최근 차세대염기서열결정법(NGS)이 각 생물학 연구에서 주요한 도구로 활용됨에 따라 생물정보 분석 서비스를 위한 하드웨어 및 소프트웨어 일체를 NGS에 맞출 필요가 있습니다. NGS는 기존 염기서열결정법에 비해 짧은 서열을 대규모로 생산하므로 이에 맞춰 메모리 활용이나 병렬 계산법이 적극적으로 적용된 소프트웨어가 개발되고 있고, 따라서, 최적의 성능을 발휘하기 위한 하드웨어의 구성도 함께 필요한 것입니다.
최근 발간된 보고서(The Global Outlook for Next Generation Sequencing: Usage, Platform Drivers & Workflow, October 31, 2011. BioInformatics, LLC. See on YouTube)에 따르면 NGS를 이용하는 연구자들의 이슈 중에서 가장 어려운 문제로, 분석 소프트웨어의 성능 개선으로 조사되었음. 또한 플랫폼 관리 및 스토리지 문제를 포함하면 생물정보 관련 문제가 29%나 차지하고 있습니다.
이러한 경향은 NGS 고유의 문제라기보다는 소프트웨어의 일반적인 경향으로 파악할 수 있으며(그림 2, from www.geospiza.com), 우수한 품질의 소프트웨어 서비스를 개발하기 위해서는 하드웨어, 소프트웨어, 휴먼웨어의 상생적 역할이 중요하다고 생각합니다. 게다가 NGS는 새로운 분석 프로토콜이 다양하게 공개되고 있으므로 신속하게 수용하고 서비스할 수 있는 체계가 필요합니다.
최근 발간된 보고서(The Global Outlook for Next Generation Sequencing: Usage, Platform Drivers & Workflow, October 31, 2011. BioInformatics, LLC. See on YouTube)에 따르면 NGS를 이용하는 연구자들의 이슈 중에서 가장 어려운 문제로, 분석 소프트웨어의 성능 개선으로 조사되었음. 또한 플랫폼 관리 및 스토리지 문제를 포함하면 생물정보 관련 문제가 29%나 차지하고 있습니다.
또한 이 보고서에 따르면, 현재의 연구 환경에서 연구자들이 느끼는 가장 큰 병목 지점으로 워크플로우(work flow)의 투명한 관리에 있다고 합니다. 즉, 워크플로우를 이용한 여러 단계의 심층 분석의 결과와 각 단계별 결과의 이력을 투명하게 관리하는 정보공학적 플랫폼이 가장 큰 병목 문제로 지목하였습니다. 이와 함께 워크플로우의 아웃소싱을 전략적으로 수행하기 위한 체계 구축도 중요한 이슈로 부각되었습니다. 오믹스 프로젝트가 생물학자, 시스템관리자, 개발자, 생물정보학자 등 다양한 유형의 인력이 협업을 해야하고 문제를 해결하기 위한 워크플로우 자체가 복잡하게 얽혀 있어서 어떤 부분을 나누어서 아웃소싱을 해야할 지 업무를 분장하기 어려운 것입니다.
이러한 경향은 NGS 고유의 문제라기보다는 소프트웨어의 일반적인 경향으로 파악할 수 있으며(그림 2, from www.geospiza.com), 우수한 품질의 소프트웨어 서비스를 개발하기 위해서는 하드웨어, 소프트웨어, 휴먼웨어의 상생적 역할이 중요하다고 생각합니다. 게다가 NGS는 새로운 분석 프로토콜이 다양하게 공개되고 있으므로 신속하게 수용하고 서비스할 수 있는 체계가 필요합니다.
다음 글에서는 오픈소스와 상용 소프트웨어어 프레임워크에 대해서 다뤄 보겠습니다.
그림 2. 소프트웨어 빙산, 편리한 화면요소와 신뢰성 높은 알고리즘을 위해서는 내제된 많은 요소기술이 뒷받침되어야 함 (www.geospiza.com) |
Comments