2023.11.20
거대 언어 모델, LLM Large Language Model?
방대한 데이터를 바탕으로 인간의 언어를 이해하고 생성하도록 훈련된 인공지능입니다. 대표적인 모델로는 GPT, LLama2 등이 있으며, 기계 번역, 텍스트 요약, 자동 작문, 질문 응답 등 다양한 자연어 과제에 활용됩니다. LLM 시장의 규모는 2022년 105억 달러(약 13조원)에서 2029년에 408억 달러(약 53조원)까지 이를 예정입니다.
✏️ LLM 의 대중화를 이끈 이유, 파운데이션 모델 Foundation Model.

AI 연구의 새로운 패러다임이 열렸습니다. 더이상 많은 기업과 연구소들은 데이터 학습에 시간을 쏟아 새로운 AI 모델을 처음부터 구축하지 않습니다. 범용적으로 사용할 수 있도록 방대한 양의 데이터를 학습한 파운데이션 모델을 기반으로, 연구 목적에 맞춰 미세 조정(Fine-tuning)하면 최소한의 자원을 들여 AI 서비스를 쉽게 개발할 수 있습니다. 예를 들면, 파운데이션 모델의 일종인 Chat GPT 로 이용한다면 Chat GPT API 를 이용하여 사용자의 분야에 맞는 데이터로 조정하여 AI 서비스를 제작할 수 있습니다.
파운데이션 모델은 사전에 학습되어 있는 모델을 사용함으로 개발시간과 비용이 절감됩니다. 특정 도메인이나 산업에 맞게 추가적인 학습을 통해 튜닝이 가능하다는 점도 장점으로 손꼽히고 있습니다.
🔎 그 외에는 대표적으로 다음과 같은 모델들이 주목받고 있습니다.
- [금융] 삼쩜삼 : 세무 AI 챗봇으로서, 기업 문서, 메뉴얼을 업로드하면 질문에 대한 답을 문서에 찾아 요약, 답변, 출처까지 보여줍니다.
- [여행] 마이리얼트립 : 여행계획을 GPT 와 연동하여 대화를 통해 여행 일정, 맛집, 날씨를 추천합니다.
- [의료] 굿닥 : 건강 관련 의료 AI 로서, 건강, 시술 질문에 답변 및 사실과 다른 답변을 차단하여 답변의 정확도를 높였습니다.
✏️ LLM 의 대중화를 이끈 이유, 파운데이션 모델 Foundation Model.
대형멀티모달모델, LMM Large Language Model.
최근 LLM 의 다음 세대가 등장했습니다. 인간은 세상을 이해하는 데 언어뿐만 아니라 다른 다양한 매체를 사용하듯이 이제 AI는 인간처럼 무언가를 생각할 때, 텍스트만 인식하지 않습니다. LMM 은 이미지, 음성, 영상 등 다양한 형태(multi modal)의 정보를 학습하여 답변을 내놓는 모델입니다. 옷 이미지를 질문하면 어느 브랜드의 옷인지 답변하거나, CCTV 화면으로 교통상황을 정리하여 알려주는 등 이미지를 분석하여 텍스트로 말하는 다양한 성질의 데이터와 상호작용 합니다. 글로벌 기업들 이 기술을 선점하기 위해 경쟁하며 발빠르게 따라가고 있습니다. 현재 메타의 카멜레온과 LG 의 엑사원2.0이 출시되었으며, 오픈 AI 의 GPT -4V 와 구글의 제미니가 발표 예정입니다.
⏰ 적합한 GPU 를 통해 연구 속도를 9배 가속할 수 있습니다.

방대한 데이터를 처리하기 위해서 뛰어난 컴퓨팅 성능이 필수적입니다. H100 과 트랜스포머 엔진이 탑재된 서버 사용 시 7일 걸리는 학습을 20시간만에 진행하여, 9배 이상 연구효율을 향상시킬 수 있습니다.
9배 성능으로 LLM 구축한 연구사례 ➜
연구 성능을 최적화하는 POSEIDON Line-up ➜
#바로AI #바로에이아이 #baroai #ai서버 #스타트업 #AI회사 #IT회사 #IT #NVIDIA #엔비디아 #인공지능 #CPU #GPU #Poseidon #포세이돈 #workstation #워크스테이션 #server #GPU서버 #서버 #서버실구축 #aiworkstation #알파폴드2 #AI #의료AI #바이오AI #디지털바이오 #연구 #예산 #국가과제 #데이터 #인프라 #연구실 #사무실 #대학교 #H100 #Ada6000 #RTX4090
2023.11.20
✏️ LLM 의 대중화를 이끈 이유, 파운데이션 모델 Foundation Model.

AI 연구의 새로운 패러다임이 열렸습니다. 더이상 많은 기업과 연구소들은 데이터 학습에 시간을 쏟아 새로운 AI 모델을 처음부터 구축하지 않습니다. 범용적으로 사용할 수 있도록 방대한 양의 데이터를 학습한 파운데이션 모델을 기반으로, 연구 목적에 맞춰 미세 조정(Fine-tuning)하면 최소한의 자원을 들여 AI 서비스를 쉽게 개발할 수 있습니다. 예를 들면, 파운데이션 모델의 일종인 Chat GPT 로 이용한다면 Chat GPT API 를 이용하여 사용자의 분야에 맞는 데이터로 조정하여 AI 서비스를 제작할 수 있습니다.
파운데이션 모델은 사전에 학습되어 있는 모델을 사용함으로 개발시간과 비용이 절감됩니다. 특정 도메인이나 산업에 맞게 추가적인 학습을 통해 튜닝이 가능하다는 점도 장점으로 손꼽히고 있습니다.
🔎 그 외에는 대표적으로 다음과 같은 모델들이 주목받고 있습니다.
✏️ LLM 의 대중화를 이끈 이유, 파운데이션 모델 Foundation Model.
대형멀티모달모델, LMM Large Language Model.
최근 LLM 의 다음 세대가 등장했습니다. 인간은 세상을 이해하는 데 언어뿐만 아니라 다른 다양한 매체를 사용하듯이 이제 AI는 인간처럼 무언가를 생각할 때, 텍스트만 인식하지 않습니다. LMM 은 이미지, 음성, 영상 등 다양한 형태(multi modal)의 정보를 학습하여 답변을 내놓는 모델입니다. 옷 이미지를 질문하면 어느 브랜드의 옷인지 답변하거나, CCTV 화면으로 교통상황을 정리하여 알려주는 등 이미지를 분석하여 텍스트로 말하는 다양한 성질의 데이터와 상호작용 합니다. 글로벌 기업들 이 기술을 선점하기 위해 경쟁하며 발빠르게 따라가고 있습니다. 현재 메타의 카멜레온과 LG 의 엑사원2.0이 출시되었으며, 오픈 AI 의 GPT -4V 와 구글의 제미니가 발표 예정입니다.
⏰ 적합한 GPU 를 통해 연구 속도를 9배 가속할 수 있습니다.
방대한 데이터를 처리하기 위해서 뛰어난 컴퓨팅 성능이 필수적입니다. H100 과 트랜스포머 엔진이 탑재된 서버 사용 시 7일 걸리는 학습을 20시간만에 진행하여, 9배 이상 연구효율을 향상시킬 수 있습니다.
9배 성능으로 LLM 구축한 연구사례 ➜
연구 성능을 최적화하는 POSEIDON Line-up ➜
#바로AI #바로에이아이 #baroai #ai서버 #스타트업 #AI회사 #IT회사 #IT #NVIDIA #엔비디아 #인공지능 #CPU #GPU #Poseidon #포세이돈 #workstation #워크스테이션 #server #GPU서버 #서버 #서버실구축 #aiworkstation #알파폴드2 #AI #의료AI #바이오AI #디지털바이오 #연구 #예산 #국가과제 #데이터 #인프라 #연구실 #사무실 #대학교 #H100 #Ada6000 #RTX4090