[BARO-Tech] 디지털 바이오 산업에서 활약중인 AI 연구

2023.11.03


2023년부터 2027년까지 총 360억의 예산이 데이터기반 디지털 바이오 선도산업에 지원될 예정입니다. 올해는 37억의 예산이 투입되었으며, 바이오 빅데이터와 AI기술 접목을 통해 난치질환 극복에 기여할 선도 기술 개발될 예정입니다.


✏️ AI 는 디지털 바이오 산업에서 얼마나 활약하고 있을까?  

대표적인 예시로는 50년 난제를 해결한 ‘AlphaFold2’가 있습니다. AlphaFold2 란, 단백질의 3D 구조를 예측하는 딥러닝 모델이자 인간 게놈 단백질 약 1만 9천여 종과 20종의 아미노산 서열으로 단백질 구조를 예측하는 딥러닝 모델입니다. 수천개의 아미노산 변수와 구조와 *단백질 접힘 문제를 90%의 정확도로 짧은 시간에 계산해내 주목을 받았습니다.

작년에는 단백질 구조 예측 능력 평가 대회인 CASP 에서 평균 92.4점, 2등과의 격차는 최대 25점을 기록하며 타 경쟁자들과 비교 불가한 압도적인 성능을 보였죠. 생물학계의 패러다임을 바꿨습니다. 이제 난치성 질환의 원인을 빠르게 찾을 수 있어, 신약 개발 시간은 2배 이상 단축될 것으로 예상됩니다. 의약품 산업은 혁신적인 발전을 이끌고 있습니다. 인공지능과 빅데이터 분석을 결합하여 생물학 연구의 고도화와 혁신도 가능해질 것입니다.

* 단백질 접힘 : 아미노산이 분자간 상호작용으로 특정한 형태를 갖추는 복잡한 3차원 단백질 구조. 생명체의 기능을 이해하는 데 중요한 역할을 한다. 


🔎 그 외에는 대표적으로 다음과 같은 모델들이 주목받고 있습니다. 

  • MoFlow : 분자를 처음부터 생성하여 다양한 화학 구조를 제시하여 분자 최적화와 소분자 생성에 사용된다.
  • EMS2 : 단백질 구조 예측, 속성 예측, 분자 도킹 등 다운스트림 작업에 유용한 단백질 기계 표현을 추론한다.
  • DiffDock : 분자의 방향과 도킹 상호작용을 예측하여, 질병의 원인이 되는 표적 단백질과 약물 분자가 결합하는 방법 이해에 도움을 준다.
  • ProtGPT-2 : 새로운 단백질 서열을 생성해 고유한 구조, 특성, 기능을 가진 단백질을 설계하는 생성형 모델이다. 천연 단백질에서 중요한 아미노산 성향과 2차 구조 함량을 보존한다.



⏰ 연구의 속도를 ‘6배 이상’ 단축할 수 있습니다.

이러한 바이오 AI 는 고성능 GPU 로 학습 속도를 6배 이상 단축해, 17시간이 걸리는 연구도 2시간 30분 만에 학습할 수 있습니다. 바이오 인공지능 모델들을 효과적으로 연구에 적용하기 위해서는 대규모의 데이터 처리와 복잡한 계산을 하는 고사양의 Multi-GPU 서버가 필수적입니다. 





연구 성능을 최적화하는 POSEIDON Line-up ➜

www.baroai.com/Poseidon

#바로AI #바로에이아이 #baroai #ai서버 #스타트업 #AI회사 #IT회사 #IT #NVIDIA #엔비디아 #인공지능 #CPU #GPU #Poseidon #포세이돈 #workstation #워크스테이션 #server #GPU서버 #서버 #서버실구축 #aiworkstation #알파폴드2 #AI #의료AI #바이오AI #디지털바이오 #연구 #예산 #국가과제 #데이터 #인프라 #연구실 #사무실 #대학교 #H100 #Ada6000 #RTX4090