■ 무작위 프로모터 서열으로부터 유전자 발현량을 예측하는 알고리즘 개발
■ 인간 유전자 조절 원리(Cis-regulatory logic)를 이해하는 데 기여할 것으로 기대
김선 교수 연구진(연구원: 이도훈, 김나연, 김도현, 김상엽, 신여진, 이단영)이 유전자의 전사를 조절하는 프로모터의 서열이 임의로 주어졌을 때 유전자 발현량을 예측하는 인공지능 기술로 'DREAM Challenge 2022'에서 2위를 수상하였다.
'DREAM Challenge'는 의.생명 분야 국제 대회로서, 본 연구진은 약 110 bp의 프로모터 서열로부터 유전자 발현량을 예측하는 기술을 개발하여 올해 참가하였으며, 전세계 293개 팀 중 최종 2위를 기록하는 성과를 냈다. 또한 미국 라스베가스에서 개최된 2022년 국제 조절시스템유전체학회(RECOMB/ISCB RSG with DREAM)에 수상자 자격으로 초청되어 연구내용을 발표하는 영예를 안았다.
김선 교수 연구진은 해당 연구실에서 개발한 DeepFam(Deep learning based alignment-free method for protein family modeling and prediction) 및 기존 생물정보학 분야에서 유전자 발현량 예측에 사용되는 여러 모델들을 조합 및 개량하여 고성능 알고리즘인 DeepGXP(Deep learning model for the prediction of Gene eXpression using Promoter sequence)를 개발하였다. 해당 알고리즘은 전사 인자(Transcription factor)와 같은 도메인 지식(Domain knowledge)이 활용되었으며 이를 성공적으로 반영한 결과 대회에서 입상할 수 있었다. DeepGXP는 이후에도 인간 유전자 조절 원리(Cis-regulatory logic)를 이해하고 다양한 질병의 근원을 이해하는데 적극적으로 활용이 될 것으로 예상된다.
해당 챌린지의 주최자인 de Boer Lab(UBC)과 다른 수상자들과 함께 'Regulatory DNA 서열을 학습하는 딥러닝 모델 구조에 대한 가이드라인'을 제시하는 논문을 작성할 예정이다. 이를 통해 유전자 발현 조절에 대해 깊은 이해를 할 수 있을 것으로 기대된다.