한동수 교수팀, 지난 10년 사용힌 기법보다 3.4배 빠른 방법 제시

KAIST 전기및전자공학부 한동수 교수
KAIST 전기및전자공학부 한동수 교수

[중부매일 나인문 기자] KAIST(한국과학기술원) 전기및전자공학부 한동수 교수와 정영목 박사과정이 참여한 연구팀이 머신러닝(기계학습)에 기반한 '유전체 정렬 소프트웨어'를 최초로 개발했다.

유전체(genome)는 생명체가 갖고 있는 염기서열 정보의 총합이며, 유전자는 생물학적 특징을 발현하는 염기서열들을 지칭한다. 통상적으로 유전체를 '한 권의 책'이라고 비유하면 유전자는 '공백을 제외한 모든 글자'라고 비유할 수 있다.

연구팀에 따르면, 차세대 염기서열 분석은 유전체 정보를 해독하는 방법으로 유전체를 무수히 많은 조각으로 잘라낸 후 각 조각을 참조 유전체에 기반해 조립하는 과정을 거친다. 조립된 유전체 정보는 암을 포함한 여러 질병의 예측과 맞춤형 치료, 백신 개발 등 다양한 분야에서 사용된다.

또한 유전체 정렬 소프트웨어는 차세대 염기서열 분석 방법으로 생성한 유전체 조각 데이터를 온전한 유전체 정보로 조립하기 위해 사용되는 소프트웨어를 일컫는다.

특히 유전체 정렬 작업에는 많은 연산이 들어가며, 속도를 높이고 비용을 낮추는 방법에 관한 관심이 계속해서 증가하고 있다. 한 교수팀이 머신러닝(기계학습) 기반의 인덱싱(색인) 기법을 유전체 정렬 소프트웨어에 적용한 사례는 이번이 최초다.

한 교수는 "유전체 정렬 작업은 유전체 조각의 양이 워낙 많고 참조 유전체의 길이도 길어 많은 연산량이 요구되는 작업이고, 유전체 정렬 소프트웨어에서 정렬 결과의 정확도에 따라 추후의 유전체 분석의 정확도가 영향을 받는다"며 "이러한 특성 때문에 유전체 정렬 소프트웨어는 높은 정확성을 유지하며 빠르게 연산하는 것이 중요하다"고 강조했다.

이어 "이번 연구를 통해 기계학습 기술을 접목해 전장 유전체 빅데이터 분석을 기존 방식보다 빠르고 적은 비용으로 할 수 있다는 것을 보여줬다"며 "앞으로 인공지능 기술을 활용해 전장 유전체 빅데이터 분석을 효율화·고도화할 수 있을 것이라 기대된다"고 말했다.

저작권자 © 중부매일 - 충청권 대표 뉴스 플랫폼 무단전재 및 재배포 금지