[BARO-Tech] LLM 모델 연구 트렌드, 이렇게 발전했습니다.

2023.11.20


거대 언어 모델, LLM Large Language Model?
방대한 데이터를 바탕으로 인간의 언어를 이해하고 생성하도록 훈련된 인공지능입니다. 대표적인 모델로는 GPT, LLama2 등이 있으며, 기계 번역, 텍스트 요약, 자동 작문, 질문 응답 등 다양한 자연어 과제에 활용됩니다. LLM 시장의 규모는 2022년 105억 달러(약 13조원)에서 2029년에 408억 달러(약 53조원)까지 이를 예정입니다. 



✏️ LLM 의 대중화를 이끈 이유, 파운데이션 모델 Foundation Model.

AI 연구의 새로운 패러다임이 열렸습니다. 더이상 많은 기업과 연구소들은 데이터 학습에 시간을 쏟아 새로운 AI 모델을 처음부터 구축하지 않습니다. 범용적으로 사용할 수 있도록 방대한 양의 데이터를 학습한 파운데이션 모델을 기반으로, 연구 목적에 맞춰 미세 조정(Fine-tuning)하면 최소한의 자원을 들여 AI 서비스를 쉽게 개발할 수 있습니다. 예를 들면, 파운데이션 모델의 일종인 Chat GPT 로 이용한다면 Chat GPT API 를 이용하여 사용자의 분야에 맞는 데이터로 조정하여 AI 서비스를 제작할 수 있습니다.

파운데이션 모델은 사전에 학습되어 있는 모델을 사용함으로 개발시간과 비용이 절감됩니다. 특정 도메인이나 산업에 맞게 추가적인 학습을 통해 튜닝이 가능하다는 점도 장점으로 손꼽히고 있습니다.


🔎 그 외에는 대표적으로 다음과 같은 모델들이 주목받고 있습니다. 

  • [금융] 삼쩜삼 : 세무 AI 챗봇으로서, 기업 문서, 메뉴얼을 업로드하면 질문에 대한 답을 문서에 찾아 요약, 답변, 출처까지 보여줍니다.
  • [여행] 마이리얼트립 : 여행계획을 GPT 와 연동하여 대화를 통해 여행 일정, 맛집, 날씨를 추천합니다.
  • [의료] 굿닥 : 건강 관련 의료 AI 로서, 건강, 시술 질문에 답변 및 사실과 다른 답변을 차단하여 답변의 정확도를 높였습니다.





✏️ LLM 의 대중화를 이끈 이유, 파운데이션 모델 Foundation Model.


대형멀티모달모델, LMM Large Language Model.

최근 LLM 의 다음 세대가 등장했습니다. 인간은 세상을 이해하는 데 언어뿐만 아니라 다른 다양한 매체를 사용하듯이 이제 AI는 인간처럼 무언가를 생각할 때, 텍스트만 인식하지 않습니다. LMM 은 이미지, 음성, 영상 등 다양한 형태(multi modal)의 정보를 학습하여 답변을 내놓는 모델입니다. 옷 이미지를 질문하면 어느 브랜드의 옷인지 답변하거나, CCTV 화면으로 교통상황을 정리하여 알려주는 등 이미지를 분석하여 텍스트로 말하는 다양한 성질의 데이터와 상호작용 합니다. 글로벌 기업들 이 기술을 선점하기 위해 경쟁하며 발빠르게 따라가고 있습니다. 현재 메타의 카멜레온과 LG 의 엑사원2.0이 출시되었으며, 오픈 AI 의 GPT -4V 와 구글의 제미니가 발표 예정입니다.





⏰ 적합한 GPU 를 통해 연구 속도를 9배 가속할 수 있습니다.


방대한 데이터를 처리하기 위해서 뛰어난 컴퓨팅 성능이 필수적입니다. H100 과 트랜스포머 엔진이 탑재된 서버 사용 시 7일 걸리는 학습을 20시간만에 진행하여, 9배 이상 연구효율을 향상시킬 수 있습니다.



9배 성능으로 LLM 구축한 연구사례 ➜ 

연구 성능을 최적화하는 POSEIDON Line-up ➜

#바로AI #바로에이아이 #baroai #ai서버 #스타트업 #AI회사 #IT회사 #IT #NVIDIA #엔비디아 #인공지능 #CPU #GPU #Poseidon #포세이돈 #workstation #워크스테이션 #server #GPU서버 #서버 #서버실구축 #aiworkstation #알파폴드2 #AI #의료AI #바이오AI #디지털바이오 #연구 #예산 #국가과제 #데이터 #인프라 #연구실 #사무실 #대학교 #H100 #Ada6000 #RTX4090