"AI 학습 설계 최적화, AI개발 비용 줄인다", 국내 연구진 기술 개발 성공 작성일 03-13 158 목록 <div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="V76ksU5rtp"> <figure class="figure_frm origin_fig" contents-hash="b6ef68cd17d5cfd60b5c56df394f6a5d453edbe96ed5afdfbbbda52b41c136ee" dmcf-pid="fzPEOu1m10" dmcf-ptype="figure"> <p class="link_figure"><img alt="vTrain 시뮬레이터 구조 모식도 /사진제공=KAIST" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202503/13/moneytoday/20250313151252082zemi.jpg" data-org-width="643" dmcf-mid="90zJaGloGu" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202503/13/moneytoday/20250313151252082zemi.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> vTrain 시뮬레이터 구조 모식도 /사진제공=KAIST </figcaption> </figure> <p contents-hash="8acb955bb6adad6e3a5b336f6bb0dc469ab22765d16c2d6e3a3ea59b1ecc61ee" dmcf-pid="4qQDI7ts53" dmcf-ptype="general"><br>LLM(거대언어모델) 등 AI(인공지능) 개발을 위한 학습 비용을 줄일 수 있도록 도와주는 기술이 국내 연구진에 의해 개발됐다.</p> <p contents-hash="9df1469fc310a89e50631ac52a8398f92105326d411acd9b3266812286020da1" dmcf-pid="8BxwCzFO1F" dmcf-ptype="general">KAIST는 유민수 교수 연구팀(전기전자공학부)이 삼성전자 삼성종합기술원과 공동 연구를 통해 대규모 분산 시스템에서 LLM의 학습 시간을 예측하고 최적화할 수 있는 시뮬레이션 프레임워크(vTRAIN)를 개발했다고 13일 밝혔다.</p> <p contents-hash="b614b69104e56ed246f1e48daa88138c5292f447f1cdefee00912874c1beca7d" dmcf-pid="6bMrhq3I1t" dmcf-ptype="general">챗GPT나 딥시크와 같은 LLM 모델은 수만 개의 데이터센터용 GPU를 갖춘 대규모 분산 시스템에서 학습된다. 예컨대 GPT-4 모델을 학습하는 데 드는 비용은 약 1400억원에 이르는 것으로 추산된다. GPU 클러스터를 어떻게 구성·활용하는지, 학습 과정을 어떻게 병렬화하고 분산시키는지에 따라 학습 시간과 비용이 크게 달라진다.</p> <p contents-hash="b4a9244731ccca76d788443c61ea17ee6b7c05852bd9c50ee99d2d670241a14b" dmcf-pid="PKRmlB0C51" dmcf-ptype="general">이같은 분산 학습 전략의 수는 매우 많지만 현재 대형 언어 모델을 학습하는 기업들은 일부 경험적으로 검증된 소수의 전략만 사용한다. 다른 전략이 효율적일지 알아보다가 자칫 실패했을 때 더 큰 비용이 들 수 있다는 것을 우려하기 때문이다. 이에 KAIST와 삼성전자 삼성종합기술원이 시뮬레이션 프레임워크 개발에 나섰다.</p> <p contents-hash="b2030589007c8f6f7adb8b203b27fea93aaf687572d307b56635c82af1dbb2e6" dmcf-pid="Q9esSbphH5" dmcf-ptype="general">이들 연구진이 개발한 vTRAIN은 실행 그래프를 기반으로 학습 과정을 연산 단위로 표현하고, 각 연산의 실행 시간을 프로파일링해 전체 학습 시간을 예측한다. 연구진은 vTrain의 예측 정확도를 검증하기 위해 실제 다중 GPU 시스템에서의 학습 시간을 측정하고 비교한 결과, 단일 노드(8개 A100 GPU) 환경에서는 평균 절대 오차(MAPE) 8.37%, 다중 노드(최대 512개 A100 GPU) 환경에서는 14.73%의 오차 범위를 나타냈다. vTrain이 대규모 LLM 학습에서 신뢰할 수 있는 시뮬레이션 도구로 활용될 수 있다는 뜻이다.</p> <p contents-hash="a61c126ba06aee47c3d9a473bc91a0fa5129e39462a061e224fe01cc57b0ffca" dmcf-pid="x2dOvKUlYZ" dmcf-ptype="general">연구진은 또 특정 대형 언어모델의 기존 학습 전략과 vTRAIN을 이용한 학습전략을 비교한 결과 GPU 사용률이 10% 이상 향상되면서도 학습 비용이 5% 이상 줄어드는 것을 확인했다고 밝혔다. 이외에도 클라우드 환경에서 다중 테넌트 GPU 클러스터 운영 최적화 및 주어진 컴퓨팅 자원 내에서 최적의 LLM 크기와 학습 토큰 수를 결정하는 문제와 같은 사례에서도 vTrain이 활용될 수 있음을 보였다.</p> <p contents-hash="98d75700b037c29c9ab482b83d25bf24ad96a86a53b3ba8011bfa2032e129b71" dmcf-pid="yxNyZP9HHX" dmcf-ptype="general">연구진은 vTRAIN 프레임워크와 1500개 이상의 실제 학습시간 측정 데이터를 오픈소스로 공개해 AI 연구자와 기업이 이를 자유롭게 활용할 수 있도록 했다. 유민수 교수는 "vTrain은 프로파일링 기반 시뮬레이션 기법으로 기존 경험적 방식 대비 GPU 사용률을 높이고 학습 비용을 절감할 수 있는 학습 전략을 탐색했다"며 "공개된 오픈소스를 통해 기업들은 초거대 인공지능 모델 학습 비용을 효율적으로 절감할 것"이라고 했다.</p> <p contents-hash="36ccc760118cfc12fe74a4b293483a4282278f59f064ef215c4cdf704e321a42" dmcf-pid="WMjW5Q2XXH" dmcf-ptype="general">이 연구 결과는 방제현 박사과정이 제 1저자로 참여했고 컴퓨터 아키텍처 분야의 최우수 학술대회 중 하나인 미국 전기전자공학회(IEEE)·전산공학회(ACM) 공동 마이크로아키텍처 국제 학술대회(MICRO)에서 지난해 11월 발표됐다. 이번 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단, 정보통신기획평가원, 그리고 삼성전자의 지원을 받아 수행됐다. </p> <p contents-hash="e02229b418fe02fef874d9e5a058df52f61de1e9bb492fab2029f8762ce29232" dmcf-pid="YRAY1xVZ1G" dmcf-ptype="general">황국상 기자 gshwang@mt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지</p> 관련자료 이전 주총 앞둔 삼성전자, 근원적 경쟁력 답 내놓을까 03-13 다음 전지희 남편, 성폭행 혐의로 10년 간 출전 정지 03-13 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.