'GPU 효율 높이고 AI 학습 비용 낮추는' 기술, 국내 연구진 개발 작성일 03-13 148 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">카이스트 유민수 교수 연구팀<br>삼성종합기술원, 공동연구로 vTrain 개발<br>GPU 사용률 10% 향상·학습 비용 5% 절감<br>학습 시간 측정 데이터 등 오픈소스 공개</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="4MpRQYhLhV"> <figure class="figure_frm origin_fig" contents-hash="51842eb43264d1d33145e910dcebae2d2ad259ef82da3fbd541804fba020d5f2" dmcf-pid="8RUexGloT2" dmcf-ptype="figure"> <p class="link_figure"><img alt="사진=이미지 투데이" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202503/13/seouleconomy/20250313093029321fnby.jpg" data-org-width="640" dmcf-mid="tYmAaU5rTp" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202503/13/seouleconomy/20250313093029321fnby.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 사진=이미지 투데이 </figcaption> </figure> <div contents-hash="d51cc20f1b77326a30dedd0a7c336ab7d55dab8e09b1eabb7684b9bcd6b88a95" dmcf-pid="6eudMHSgl9" dmcf-ptype="general"> [서울경제] </div> <p contents-hash="80ae07a9106bc3849dcecc87847ad451748f039b4d907b1d6b80a3324d1ec57a" dmcf-pid="Pd7JRXvaCK" dmcf-ptype="general">최근 챗GPT나 딥시크(DeepSeek) 같은 생성형 인공지능(AI) 프로그램은 수많은 데이터를 학습해 비로소 최적의 정보를 도출해낸다. 이를 위해서는 GPU(고성능 그래픽 처리 장치)가 들어 있는 거대한 컴퓨터 시스템이 필요한데, 가장 널리 쓰이는 ‘GPT-4’를 학습시키기 위해서는 약 1400억 원의 비용이 소요된다. 이런 이유로 현재 많은 기업들은 GPU를 100% 활용하지 못하고, 몇 가지 경험적으로 검증된 소수의 전략만 활용하고 있다. 이는 결국 GPU 활용의 비효율성과 불필요한 비용 증가라는 또 다른 문제로 이어진다. </p> <p contents-hash="35c5dd42ad675806bd2549326e9684a5886deb092334278aab0c462d87fb7890" dmcf-pid="QJzieZTNWb" dmcf-ptype="general">최근 한국 연구진은 이같은 문제를 극복하고자, GPU 사용의 효율성을 높이고 학습에 드는 비용을 획기적으로 줄이는 기술을 개발해 공개했다. 특히 연구진은 관련 데이터를 오픈 소스로 공개해 관심이 쏠린다. </p> <p contents-hash="2527b5b983a5202d6fabad5d0792ddf35f322b4cb6d420fc4dca535c185892bc" dmcf-pid="xiqnd5yjCB" dmcf-ptype="general">카이스트(KAIST)는 유민수 전기및전자공학부 교수 연구팀이 삼성종합기술원과 공동연구를 통해, 대규모 분산 시스템에서 대형 언어 모델(LLM)의 학습 시간을 예측하고 최적화할 수 있는 시뮬레이션 프레임워크(이하 vTrain)를 개발했다고 13일 밝혔다. </p> <p contents-hash="f84df7a31785037035d23de8a142874d4f196a30930cb17ccbd47596b8119868" dmcf-pid="yZD5Hnxphq" dmcf-ptype="general">LLM의 학습 효율을 높이려면 최적의 분산 학습 전략을 찾는 것이 필수적이다. 그러나 가능한 전략의 경우의 수가 방대하고 실제 환경에서 각 전략의 성능을 테스트 하는 데 막대한 비용과 시간이 들어간다. 이에 카이스트 연구팀은 ‘vTrain’이라는 기술을 개발해 대형 언어 모델의 학습 시간을 정확히 예측하고, 다양한 분산 병렬화 전략을 빠르게 탐색할 수 있는 길을 열었다. </p> <p contents-hash="191851ae242b0f695b2b760502cb7c005af3997d2ffa84aa36df47cf1351278e" dmcf-pid="WtmF5ge7hz" dmcf-ptype="general">‘vTrain’은 AI 모델을 훈련할 때 걸리는 시간을 예측하는 기술로, 여러 개의 GPU를 사용할 때, 얼마나 효율적으로 분산해서 학습할 수 있는지 예측한다. 연구팀은 다양한 GPU 환경에서 ‘vTrain’을 활용해 실험을 진행했다. 그 결과 단일노드(8개 A100 GPU)의 오차율은 8.37%, 다중 노드(최대 512개 A100 GPU) 오차율은 14.73%로 나타났다. </p> <p contents-hash="e52fc31fbcecf2f9ecf3e4a3e6ca0e7e54c79dd3eaeefebbf91a7ffeef9a2920" dmcf-pid="YFs31adzh7" dmcf-ptype="general">연구진은 또한 특정 대형언어모델의 기존 학습 전략과 ‘vTrain’을 이용한 최적화 학습 전략을 비교했다. 그 결과 기존 경험적 방식 대비 GPU 사용률을 10% 이상 향상시키면서도 학습 비용을 5% 이상 절감할 수 있다는 사실을 확인했다. </p> <p contents-hash="abda43a21ae276089219829864c6fe85bad3996684a71842dbbc78c93ec2b307" dmcf-pid="G3O0tNJqTu" dmcf-ptype="general">연구팀은 이번 연구를 삼성전자 삼성종합기술원와 공동으로 진행했으며, ‘vTrain’ 프레임워크와 1500개 이상의 실제 학습 시간 측정 데이터를 오픈소스로 공개해 AI 연구자와 기업이 이를 자유롭게 활용할 수 있도록 할 예정이다. </p> <figure class="figure_frm origin_fig" contents-hash="d43b85554ff004f71c319fb46664f439b5702b57d763fca13a183055d5c3b0fd" dmcf-pid="H0IpFjiBSU" dmcf-ptype="figure"> <p class="link_figure"><img alt="유민수 KAIST ㅈㅓㄴㄱㅣㅁㅣㅊㅈㅓㄴㅈㅏㄱㅗㅇㅎㅏㄱㅂㅜ ㄱㅛㅅㅜ. 사진제공=카이스트" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202503/13/seouleconomy/20250313093030732hzxs.jpg" data-org-width="640" dmcf-mid="3bwNo0XDy3" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202503/13/seouleconomy/20250313093030732hzxs.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 유민수 KAIST ㅈㅓㄴㄱㅣㅁㅣㅊㅈㅓㄴㅈㅏㄱㅗㅇㅎㅏㄱㅂㅜ ㄱㅛㅅㅜ. 사진제공=카이스트 </figcaption> </figure> <div contents-hash="ef7155bf18f5bc4daa74be5d5ece1bc0568ba24a9f7a304c457fb1976a386ab5" dmcf-pid="XpCU3Anbhp" dmcf-ptype="general"> <p>유민수 교수는 “vTrain은 프로파일링 기반 시뮬레이션 기법으로 기존 경험적 방식 대비 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 학습 전략을 탐색했으며, 오픈소스를 공개했다"며 "이를 통해 기업들은 초거대 인공지능 모델 학습 비용을 효율적으로 절감할 것이다”라고 말했다. </p> 서지혜 기자 wise@sedaily.com </div> </section> </div> <p class="" data-translation="true">Copyright © 서울경제. 무단전재 및 재배포 금지.</p> 관련자료 이전 [메타엠 AICC 시리즈 ①] 메타엠, 국내 최초로 AICC 서비스를 현실화시키다 03-13 다음 LGU+·ICTK, 고객이 안심하는 양자보안 개발 03-13 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.